GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.51 (51)<< < Пред.   Поиск:  
 Автор Тема: На: Об одном подходе к решению задачи создания СИИ
NO.
Сообщений: 9941
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 1:17
Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает. Вроде бы ничего другого и нельзя. Или вопрос какую выбрать стратегию выбора места куда ставить трафарет? Можно случайно или последовательно. Может быть там не текст, а есть области где зависимости определеннее и есть где мусор.
[Ответ][Цитата]
Траян
Сообщений: 436
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 23 фев 18 1:21
Цитата:
Автор: NO.

Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает. Вроде бы ничего другого и нельзя.


Хороший ответ. Очень по делу, спасибо.

Цитата:
Автор: NO.
Или вопрос какую выбрать стратегию выбора места куда ставить трафарет?


Нет, трафарет ставим не мы. Его ставит крупье. Некоторые крупье любят ставить случайно, некоторые последовательно.

[Ответ][Цитата]
Траян
Сообщений: 436
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 1:32
Изменено: 24 фев 18 1:47
Цитата:
Автор: NO.
Просто собираем две статистики и потом в конкретном случае выбираем в которой больше информации, то есть она лучше предсказывает.


Если мы попробуем проанализировать несколько реально существующих текстов (написанные на русском языке), то достаточно скоро убедимся в том, что более значимым является "ближний" признак.
Если при прогнозировании отталкиваться от буквы непосредственно предшествующей неизвестной, то правильность наших прогнозов будет на 5-15%% выше, нежели было бы при использовании "дальнего признака".

В общем-то, предположить подобный результат можно было бы и заранее, исходя из самых общих соображений.

Казалось бы, ничего лучшего, чем пользоваться стратегией использования ближнего признака придумать нельзя и классический теорвер (насколько мне известно) тоже не предлагает каких либо иных решений.

А вот если исходить из БМП, то мы можем поступить следующим образом - произвести сравнение между собой средних вероятностей (средних между вероятностями предлагаемыми ближним и дальним признаком) - и найти среди этих средних максимальную. По ней и ориентируемся выбирая букву для своего прогноза.

Как показывают эксперименты проведенные с парой десятков текстов (книги и статьи по ИИ тематике) точность наших прогнозов при такой стратегии повышается еще на 1-5%% по сравнению с применением только ближнего признака.

Что примечательно, выигрыш в правильности прогнозов получается только на осмысленных/структурированных текстах. Если мы попробуем поиграться с текстом сгенерированным чисто случайно, то никакого выигрыша мы не получим.

Можно предположить, что данная стратегия прогнозирования может рассматриваться как способ нахождения ответа на вопрос: является ли данный текст содержательным или же он представляет собой случайный набор букв.

(По понятным причинам этот метод будет работать только на достаточно объемных текстах.)
[Ответ][Цитата]
NO.
Сообщений: 9941
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 2:27
В сочетании ЧА более значим дальний.
[Ответ][Цитата]
Траян
Сообщений: 436
На: Об одном подходе к решению задачи создания СИИ
Добавлено: 24 фев 18 3:51
Цитата:
Автор: NO.
В сочетании ЧА более значим дальний.


Речь идет о статистическом преобладании, т.е. о том, что случаев когда это правило работает больше.
[Ответ][Цитата]
 Стр.51 (51)1  ...  47  48  49  50  [51]<< < Пред.