|
|
Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 18:43
|
Коллеги! Есть такая задачка: Есть набор предложений (пусть - 100) со словом "Вася", всячески этого самого Васю характеризующий. Задача: вытащить из этого набора несколько предложений, про которые можно точно сказать, что они про васю говорят хорошо и аналогично несколько плохих предложений. Порядка 90% предложений могут остаться нераспознанными, это нормально. Очевидно, нужно работать с языком, иметь словарь "хороших" и "плохих" в понимании системы речевых конструкций. Кто-нибудь подскажет, какими методами тут работать? Может у кого есть близкий опыт?
|
|
|
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 19:53
|
максимум, что вам могут тут насоветовать здешние "корифеи" это занести в список плохих слов слова типа Дурак, дибил и пр., а потом проверять, на сколько эти слова удалены от слова Вася.
увы, но другого оне не могуть.
далее, по сложности : "вася не умеет думать", "вася совершенно не понимает то, что пишет"
это следующаяя фаза до которой они могут додуматья через неделю после постановки задачи, предложив список глаголов с предлогом НЕ, и также оценить расположение васи в тексте относительно этих словосочетаний. В общем, для вашей задачи это вполне преемлемое решение, учитывая ваши запросы.
если вам необходимо получить более качественные семантические распознавания, то алгоритм многократно усложняется, здесь могу помочь только я.
|
|
|
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 19:58
|
Вася - молодец, т.к. украл из соседского сада яблоко и дал его мне. Это хорошо или плохо? Вася убил человека, было это весной 1945 г. и звали убитого - А.Гитлер. А это как? Иначе говоря возникает вопрос критерия. Или критерий - величина переменная? Могу изменить критерий как захочу - тогда в каких пределах? Т.е. что(или кто) может выступать в качестве критерия? А вообще задача сводится к формированию интегральной оценки контекста (фона). В живой природе такая оценка имеет свое название - это эмоции. Насколько мне известно, подобная задача до сих пор не решалась. Попробуйте
|
|
|
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 20:05
|
вот и все, на что они способны.
между тем задача имеет решение, но стоит ли вам его реализовывыть, вот в чем вопрос. Для моего решения у вас не хватит времени и бюджета. Я все таки думаю, что у вас это не хобби...
|
|
|
| |
| |
| |
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 20:54
|
"Невнятные предложения можно и пропустить. Именно это условие делает задачу решаемой"
вы зашли на форум в надежде, что вам скинут готовую рыбу подобной работы? Возможно, это имело бы смысл, если бы тут тусовалось человек 200. но здесь к сожалению всего три калеки... так что мимо кассы.
наверное по всему тырнету таких калек не более сотни наберется. Невостребованная тематика.
|
|
|
| |
| |
| |
| |
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 19 мар 08 21:42
|
если серьезно, если вам действительно это надо, то вам надо мне это доказать, чтобы я согласился с вами работать.
все, что вам нужно, по этому вопросу есть на форуме. Если порыться в моих темах, то вы все найдете, а если в этом процессе у вас отпадет желание иметь со мной дело, то и лишите меня ненужных напрягов.
|
|
|
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 20 мар 08 0:01
|
Какойто придурь> максимум, что вам могут тут насоветовать здешние "корифеи" это занести в список плохих слов слова типа Дурак, дибил и пр., а потом проверять, на сколько эти слова удалены от слова Вася. Чего же Вы Тарасов так слабо о здешних корифеях то? Здешние корифеи вполне могут также послать Вас, Евгений, нахрен и посоветовать никогда оттуда не вылезать А еще порекомендовать Baschу не обращать внимания на бредни которые оставляет некоторый общественно известный идиот ака гость 89.208.11
|
|
|
|
На: Распознавание положительного и отрицательного контекста
Добавлено: 20 мар 08 0:43
|
Автор: basch Virtual_Graph, ну у меня по условию надо распознать то, что смогли распознать. Невнятные предложения можно и пропустить. Именно это условие делает задачу решаемой |
|
Это существа дела не меняет, т.к. все равно необходима интегральная оценка распознанных предложений. Дело даже ухудшится, т.к. в нераспознанных предложениях м.б. важная информация. Поэтому вероятность правильного ответа будет меньше. А потом, что значит "не смогли распознать"? Т.е. кроме ответов "да", "нет" должен быть ответ "не знаю"? Не проще ли на выходе системы иметь вероятность правильного ответа в диапазоне [0 ; 1]?
|
|
|
|