Автор: Virtual_Graph А потом, что значит "не смогли распознать"? Т.е. кроме ответов "да", "нет" должен быть ответ "не знаю"? Не проще ли на выходе системы иметь вероятность правильного ответа в диапазоне [0 ; 1]? |
|
Не проще. Но грамотнее
.
Кроме той проблемы, о которой сказал ВГ, есть и еще одна.
(Кстати, то о чем сказал ВГ... ну на первых порах, и эвристика может помочь. Что-то типа того списка "хороших" и "плохих" слов, о котором говорил гость. Ну конечно не просто списки, а надо подумать над чем-то посерьезнее, но принцип тот же. Сложные случае это КОНЕЧНО не охватит, но большую массу примитива, надеюсь да.)
Как распознать в тексте о ком идет речь в предложении? На сколько я знаю, это не тривиальная задача, по ней люди диссертации пишут.
как простой пример:
"Вася убил Гитлера. Потому как, он бы жестокий убийца".
Вопрос: кто был "жестокий убийца"?
Не смотря на то что в русском языке эта задача немного упрощается падежами и проч., но в общем, проблема все равно остается.
И вообще, я думаю эта задача наиболее приоритетная для вашей.