IPB

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Ответить в данную темуНачать новую тему
> Автоматическое исправление орфографии, Разговорная письменная речь против литературной :)
Zkir
сообщение 3.8.2009, 10:11
Сообщение #1


Нефурайто
***

Группа: Пользователи
Сообщений: 1373
Регистрация: 16.7.2009
Из: Темного Королевства
Пользователь №: 4405
Сайт инфа: vi-lenin.iii.ru


Не помню, озвучивал ли я эту идею в отдельной теме или нет, потому предложу снова.
Не секрет, что устная речь отличается от письменной, а книжная – от разговорной. Даже больше, в аське и с инфами разговаривают на совершенно особой разновидности языка, которую можно назвать разговорной письменной речью. Ее особенности – большое количество отклонений от орфографических норм, презрение к знакам препинания. Многие инфоводы составляют шаблоны под типичные опечатки, но это путь тупиковый, потому что всех возможных опечаток все равно не предусмотришь. Как итог, шаблоны, написанные правильно ("грамотно") не срабатывают.

Поэтому предлагаю: добавить в инфов предварительную проверку и исправление орфографии, и исправлять ошибки и опечатки в реплике гостя до того, как сравнивать ее с шаблонами.

Примечание:
возможность создать шаблоны на неправильное написание должна сохраниться.
Например $Что должно реагировать и на что и на че, и на што, если нет шаблона $че. А если шаблон $че есть, то он должен реагировать на "че".


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Anfisa
сообщение 3.8.2009, 10:54
Сообщение #2


Clean Big Enthusiast
***

Группа: Пользователи
Сообщений: 1960
Регистрация: 2.6.2009
Из: любви к искусству. Cайты инфов: Анфиса belochka.iii.ru ________ Майкл Джексон: michaeljackson.iii.ru _____ Бог: mygod.iii.ru ______ Зло: nazlo.iii.ru _______ Переводы Гоблина: g0blin.iii.ru
Пользователь №: 3295
Сайт инфа: belochka.iii.ru


Отличное предложение, поддерживаю.

Сообщение отредактировал папа Карло - 10.7.2011, 17:56
Перейти в начало страницы
 
+Цитировать сообщение
ванёк
сообщение 3.8.2009, 11:04
Сообщение #3


Инфмастер
***

Группа: Пользователи
Сообщений: 49
Регистрация: 2.8.2009
Пользователь №: 4685



я тоже поддерживая


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Ak47RA
сообщение 3.8.2009, 11:32
Сообщение #4


ПОЗИТИВ!!!
***

Группа: Пользователи
Сообщений: 1902
Регистрация: 25.4.2009
Пользователь №: 898
Сайт инфа: walya.iii.ru


Цитата(Zkir @ 3.8.2009, 13:11) *
Поэтому предлагаю: добавить в инфов предварительную проверку и исправление орфографии, и исправлять ошибки и опечатки в реплике гостя до того, как сравнивать ее с шаблонами.

Не совсем понял: Инф проверяет фразу и выбирает вариант или Инф проверяет и дает варианты исправления?


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
ванёк
сообщение 3.8.2009, 11:39
Сообщение #5


Инфмастер
***

Группа: Пользователи
Сообщений: 49
Регистрация: 2.8.2009
Пользователь №: 4685



Цитата(Ak47RA @ 3.8.2009, 12:32) *
Не совсем понял: Инф проверяет фразу и выбирает вариант или Инф проверяет и дает варианты исправления?



инф как в асе ты написал слово неправильно,а он его исправляет на правильное


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Ak47RA
сообщение 3.8.2009, 12:04
Сообщение #6


ПОЗИТИВ!!!
***

Группа: Пользователи
Сообщений: 1902
Регистрация: 25.4.2009
Пользователь №: 898
Сайт инфа: walya.iii.ru


Цитата(ванёк @ 3.8.2009, 14:39) *
инф как в асе ты написал слово неправильно,а он его исправляет на правильное

Мои слова в асе не исправляются


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Вася
сообщение 3.8.2009, 12:56
Сообщение #7


Инфмастер
***

Группа: Пользователи
Сообщений: 208
Регистрация: 20.6.2009
Из: Россия, Санкт-Петербург
Пользователь №: 3826
Сайт инфа: lopush.iii.ru


Я ЗА! Только предлагаю сделать галочку "без исправления орфографии", а то кто-нибудь захочет сделать проверку знаний русского языка у гостя...


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Zkir
сообщение 3.8.2009, 13:44
Сообщение #8


Нефурайто
***

Группа: Пользователи
Сообщений: 1373
Регистрация: 16.7.2009
Из: Темного Королевства
Пользователь №: 4405
Сайт инфа: vi-lenin.iii.ru


Вася, может быть не галочку, но согласен, возможность создать шаблоны на неправильное написание должна сохраниться.
Например $Что должно реагировать и на что и на че, и на што, если нет шаблона $че. А если шаблон $че есть, то он должен реагировать на "че", разумеется. Но над правильным алгоритмом пусть разработчики думают smile.gif


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Voron_holoda
сообщение 3.8.2009, 14:53
Сообщение #9


Инфмастер
***

Группа: Пользователи
Сообщений: 347
Регистрация: 28.7.2009
Из: Самара
Пользователь №: 4575
Сайт инфа: doctorglasha.iii.ru


Я за! А то чк чн с мягким знаком напишут, а Глаша не понимает, что ей написали! И тупит. И ее обзывают. Она огрызается в ответ. И все, скандал!


--------------------
http://oka-ono.iii.ru/ -инопланетяне уже тут.
Психонутый и озлобленный на весь мир врач. Слушает русский рок, подрабатывает методами нетрадиционной медицины, терпеть не может начальника и тащится с доктора Хауса. Не наезжай на ее любимые тапочки! Просто спросите у нее, что она умеет. Не пожалеешь. ОСТОРОЖНО! Хамство. Кстати, она заняла 2-ое место в конкурсе на "Лучшего тематического инфа"
Перейти в начало страницы
 
+Цитировать сообщение
Прохожий
сообщение 4.8.2009, 1:32
Сообщение #10


Инфовод
***

Группа: Пользователи
Сообщений: 570
Регистрация: 14.4.2009
Из: Тульская область
Пользователь №: 415
Сайт инфа: prohoji.iii.ru


Совершенно не представляю, что бы возможно было бы создать эффективную систему подобного типа, если "всех возможных опечаток все равно не предусмотришь". Что касается Что-Чё, Привет-Прювед, Меня-Мну... и подобных "неологизмов", то, мне кажется, что проще и достаточно эффективно все же применить уже упоминавшиеся словари синонимов.


--------------------
Похожий

В меру воспитанный мужчина в полном расцвете лет.
Перейти в начало страницы
 
+Цитировать сообщение
Zkir
сообщение 4.8.2009, 1:45
Сообщение #11


Нефурайто
***

Группа: Пользователи
Сообщений: 1373
Регистрация: 16.7.2009
Из: Темного Королевства
Пользователь №: 4405
Сайт инфа: vi-lenin.iii.ru


Создать эфективную систему подобного типа очень легко. Достаточно лицензировать модуль проверки орфографии МС Ворд. smile.gif

Создать же систему которая бы исправляла одиночные ошибки в словах, по словарю - вообще задача даже не для курсовой, а для лабораторной работы первого курса.


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Прохожий
сообщение 4.8.2009, 3:07
Сообщение #12


Инфовод
***

Группа: Пользователи
Сообщений: 570
Регистрация: 14.4.2009
Из: Тульская область
Пользователь №: 415
Сайт инфа: prohoji.iii.ru


Цитата(Zkir @ 4.8.2009, 2:45) *
Создать эфективную систему подобного типа очень легко. Достаточно лицензировать модуль проверки орфографии МС Ворд. smile.gif
Создать же систему которая бы исправляла одиночные ошибки в словах, по словарю - вообще задача даже не для курсовой, а для лабораторной работы первого курса.

Zkir, MS Word не располагает вариантами ни слова "малако", ни слова "Превед", ни многими и многими другими вариантами. Следовательно, все упирается не просто в подключение модуля Word, а в создание базы всех возможных опечаток, что ты и сам назвал невозможным. Поэтому и думаю, что предлагаемая система все равно не сможет эффективно исправлять недостатки малограмотных гостей. Вот применить систему проверки орфографии (как в Word) при написании гостем сообщения, действительно было бы эффективно. В этом случае, по крайней мере, гость понимал бы, что он написал слово неправильно и дальше уже действовал в зависимости от того, что для него важнее - что бы его поняли, или просто дурака валять.


--------------------
Похожий

В меру воспитанный мужчина в полном расцвете лет.
Перейти в начало страницы
 
+Цитировать сообщение
Anfisa
сообщение 4.8.2009, 7:07
Сообщение #13


Clean Big Enthusiast
***

Группа: Пользователи
Сообщений: 1960
Регистрация: 2.6.2009
Из: любви к искусству. Cайты инфов: Анфиса belochka.iii.ru ________ Майкл Джексон: michaeljackson.iii.ru _____ Бог: mygod.iii.ru ______ Зло: nazlo.iii.ru _______ Переводы Гоблина: g0blin.iii.ru
Пользователь №: 3295
Сайт инфа: belochka.iii.ru


Автоподстановка как в яндексе - упрощает скорость набора пользователем уже знакомых системе фраз. Мне нравится ваша идея.

Сообщение отредактировал папа Карло - 10.7.2011, 17:56
Перейти в начало страницы
 
+Цитировать сообщение
viu-piu
сообщение 4.8.2009, 8:22
Сообщение #14


Инфмастер
***

Группа: Команда А-я-яй
Сообщений: 2356
Регистрация: 29.3.2009
Пользователь №: 40
Сайт инфа: viu-piu.iii.ru


а у меня в дипломе есть статистические данные по заменам букв в словах в интернет-общении))
и шаблоны получаются нормальными, потому что знаю, как могут исковеркать каждое слово.
боже, кто мог знать, что мне это пригодится. smile.gif
Перейти в начало страницы
 
+Цитировать сообщение
Anfisa
сообщение 4.8.2009, 8:58
Сообщение #15


Clean Big Enthusiast
***

Группа: Пользователи
Сообщений: 1960
Регистрация: 2.6.2009
Из: любви к искусству. Cайты инфов: Анфиса belochka.iii.ru ________ Майкл Джексон: michaeljackson.iii.ru _____ Бог: mygod.iii.ru ______ Зло: nazlo.iii.ru _______ Переводы Гоблина: g0blin.iii.ru
Пользователь №: 3295
Сайт инфа: belochka.iii.ru


Цитата
Dirty Little Linguist

Ко мне прицепилась эта фраза... в ней что-то есть smile.gif

Сообщение отредактировал папа Карло - 10.7.2011, 17:57
Перейти в начало страницы
 
+Цитировать сообщение
Zkir
сообщение 4.8.2009, 12:08
Сообщение #16


Нефурайто
***

Группа: Пользователи
Сообщений: 1373
Регистрация: 16.7.2009
Из: Темного Королевства
Пользователь №: 4405
Сайт инфа: vi-lenin.iii.ru


Прохожий, не хотелось бы устраивать дискуссию по вопросу, ответ на который давно и хорошо известен, т.е. риторическому. Тема исправления ошибок в компьютерной лингвистике давно и хорошо изучена. Если хочется почитать на эту тему, нужно юзать гугл можно начать здесь http://roinet.livejournal.com/2706.html
или здесь:http://www.gelbukh.com/CV/Publications/1995/Thesis.htm#_Toc14100895

Большая часть ошибок - это однобуквенные опечатки, а остальная - неграмотность, основанная на игнорировании школьных норм орфорграфии, но сохраняющая фонетический облик слова. Карова произносится ровно также как и корова, а малако ровно также как и молоко. Черт, начал таки дискуссию. smile.gif


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
Anfisa
сообщение 4.8.2009, 12:20
Сообщение #17


Clean Big Enthusiast
***

Группа: Пользователи
Сообщений: 1960
Регистрация: 2.6.2009
Из: любви к искусству. Cайты инфов: Анфиса belochka.iii.ru ________ Майкл Джексон: michaeljackson.iii.ru _____ Бог: mygod.iii.ru ______ Зло: nazlo.iii.ru _______ Переводы Гоблина: g0blin.iii.ru
Пользователь №: 3295
Сайт инфа: belochka.iii.ru


Всё это вполне решаемые задачи. А не решают их думаю потому что пеар важнее. На подходе "Удобная функция вставки логов в ЖЖ" - сами понимате, тут не до лингвистики. wink.gif

Сообщение отредактировал папа Карло - 10.7.2011, 17:57
Перейти в начало страницы
 
+Цитировать сообщение
Прохожий
сообщение 5.8.2009, 5:09
Сообщение #18


Инфовод
***

Группа: Пользователи
Сообщений: 570
Регистрация: 14.4.2009
Из: Тульская область
Пользователь №: 415
Сайт инфа: prohoji.iii.ru


Цитата(viu-piu @ 4.8.2009, 9:22) *
а у меня в дипломе есть статистические данные по заменам букв в словах в интернет-общении))
и шаблоны получаются нормальными, потому что знаю, как могут исковеркать каждое слово.
боже, кто мог знать, что мне это пригодится. smile.gif

Цитата(Zkir @ 4.8.2009, 13:08) *
Прохожий, не хотелось бы устраивать дискуссию по вопросу, ответ на который давно и хорошо известен, т.е. риторическому. Тема исправления ошибок в компьютерной лингвистике давно и хорошо изучена. Если хочется почитать на эту тему, нужно юзать гугл можно начать здесь http://roinet.livejournal.com/2706.html
или здесь:http://www.gelbukh.com/CV/Publications/1995/Thesis.htm#_Toc14100895

Zkir, спасибо за ссылки (в самом деле любопытно и познавательно). Признаюсь, что сам бы я гуглить по гуглам в поисках чего-то подобного не стал бы. Вы с viu-piu меня убедили, в чем и признаюсь, посыпая голову пеплом сигареты (другого нету).
Раз принципиальная техническая возможность имеется и проект претендует на связь с понятием "искусственного интеллекта", а, кроме того, рассчитан (как минимум, в значительной части) на применение инфов в рабочей обстановке, то предложенная идея в самом деле заслуживает серьезного внимания и реализации (хотя бы в перспективе).

Но все же добавлю несколько слов еще tongue.gif (а иначе кто поверит, что этот пост я написал, а не сам Zkir под моим именем). laugh.gif
Думаю, что предлагаемая функция должна быть либо факультативной (включаться-отключаться по желанию инфовода), либо в текстах разговоров должны выкладываться реплики гостя не в том виде, в котором их воспринимает инф, а в том, в котором их ввел гость (что бы инфовод имел возможность корректировать и составлять шаблоны в соответствии с тем, что на самом деле пишется инфу).

Цитата
Anfisa
Всё это вполне решаемые задачи. А не решают их думаю потому что пеар важнее. На подходе "Удобная функция вставки логов в ЖЖ" - сами понимате, тут не до лингвистики.

Как мне кажется, проблема не только (и не столько) в расставляемых авторами проекта приоритетах, а в том, что осуществить идею, которую предлагает Zkir совсем не так просто, как он об этом высказался (если конечно говорить об эффективной системе, а не о том, что бы она слово "карова" рандомно заменяла на слова "караван", "сарафан" "короба", "боров" или "корова"). Для ее осуществления необходимо наличие высококлассных программистов и лингвистов, которыми, видимо, Наносемантика пока еще не очень богата. sad.gif


--------------------
Похожий

В меру воспитанный мужчина в полном расцвете лет.
Перейти в начало страницы
 
+Цитировать сообщение
Anfisa
сообщение 5.8.2009, 6:24
Сообщение #19


Clean Big Enthusiast
***

Группа: Пользователи
Сообщений: 1960
Регистрация: 2.6.2009
Из: любви к искусству. Cайты инфов: Анфиса belochka.iii.ru ________ Майкл Джексон: michaeljackson.iii.ru _____ Бог: mygod.iii.ru ______ Зло: nazlo.iii.ru _______ Переводы Гоблина: g0blin.iii.ru
Пользователь №: 3295
Сайт инфа: belochka.iii.ru


Думаю у них есть спецы. Просто мы же с вами гости тут и гости которые почти ничего не платят. Поэтому наши предложения не являются приоритетными. Главное бизнес-инфы в которых есть память, может и проверка, но если сделать это доступным, то кто же будет заказывать бизнес-инфов? Так что, как говорила Блабла: "расслабь анус и продолжим общение"... в нашем случае продолжим ждать очередных пеар-новшеств. О, жестокий мир, где правят деньги...

Сообщение отредактировал папа Карло - 10.7.2011, 17:58
Перейти в начало страницы
 
+Цитировать сообщение
sonya7019
сообщение 5.8.2009, 17:19
Сообщение #20


Новичок
*

Группа: Пользователи
Сообщений: 5
Регистрация: 30.7.2009
Пользователь №: 4627



клёвая идея!!! она пригодится тем, кто очень быстро печатает и не успевает исправлять ошибки)


--------------------

мой пароль... ха-ха!!! купились!!!
Перейти в начало страницы
 
+Цитировать сообщение

2 страниц V   1 2 >
Ответить в данную темуНачать новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



RSS Текстовая версия Сейчас: 15.12.2019, 7:35