GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.1 (3)

След. > >>

Поиск:

Автор

Тема: к вопросу о распознавании текста

гость
89.208.11.*

к вопросу о распознавании текста

Добавлено: 21 фев 08 12:43

http://stat4.blog.ru/lr/0808d885e630021becbf43c1297eed40

[Ответ][Цитата]

Mad_God
Сообщений: 545

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 14:51

Молодец, нашёл

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 16:20

все это подтверждает мою модель распознавания смысла текста.

[Ответ][Цитата]

Mad_God
Сообщений: 545

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 16:26

Какую модель? Схему в студию.

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 16:41

на самом деле происходит следующее:

берется слово и запускается алгоритм, целью которого расставить буквы по своим местам и синтезировать слоги. Естесственно, что беруться 2 предела, которые играют в этом алгоритме роль констант, и относительно них, методом перебора, навстречу друг другу подыскиваются буквы, образующие с этими константами слоги. Затем константой становится третья по счету буква и слог составляется для нее. если и там и там слоги есть а смысла все равно нет, то идет замена и соответствие ищется заново. если есть множество разных по смыслу синтезированных слов, то идет проработка смыслового содержания с рядом стоящими словами слева и весовые коэффициенты дают сигнал остановиться именно на определенном синтезированном варианте..

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 16:49

конечно же, слоги бывают и из 3-х букв, но это не меняет сути, значит, следующая константа будет 4-я буква.
надо заметить, что если слова длинные, то процесс распознавания резко затруднится поскольку вариантов синтеза будет много и роль контекста и глубина проработки слов от исходного возрастет.

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:18

весьма интересным в этом свете выглядит распознавание смысла двойных слов, составных. хорошо если слова такие : ржунимагу, пацталом. Хуже, когда
отдельные слова в них обрублены и оставлены лишь корни: профсоюз, самолет, пароход.

попробуйте сделать эксперимент и поменять расположение букв в них

порфюсозыне бссоы слеи в сломает.

(профсоюзные боссы сели в самолет)

тут уже посложнее задачка... тут надо контекст всего предложения смотреть...глубина проработки до ближайших слов недостаточна.

[Ответ][Цитата]

Corwin
Сообщений: 1324

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:21

С программной точки зрения - нерациональный алгоритм. т.е. Бред.
Впрочем эта тема уже обсуждалась и даже были приведены соответствующие программные решения.

[Ответ][Цитата]

Mad_God
Сообщений: 545

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:37

Тут штука вот в чём.

перебором букв и увеличением количества букв в слове можно построить словарь всех мыслимых слов. (я когда то писал такую програмку, большой словарь получился

Но словарь реально существующих слов значительно меньше.

Между словами, стоящими в алфавитном порядке в этом словаре может уместиться куча слов из первого словаря.

Так что тут всё значительно проще можно сделать, экономичнее. И называется эта вещь "спелчекер".

Берётся длина слова - количество букв в слове. Сортируется таблица словаря - отбираются слова с такой же длиной.

Отбираются слова, содержащие все буквы данного слова и не содержащие других, лишних букв. И Вы не поверите, как мало вариантов останется.

Чем длинее слово - тем труднее придумать ещё одно из тех же самых букв. Чем короче - тем проще.

И вот там, где проще (спелчекеры исправляют только незначительные орфографические ошибки) и применяется человеческий интеллект - способность понимать, какое из вариантов слова, составленное из данных букв должно стоять ПО СМЫСЛУ в данном предложении.

И это налагает отпечаток интеллектуальности на данную задачу.
1. Надо восстановить исходное предложение
2. Предложение ДОЛЖНО иметь смысл.
3. Исходное предложение должно быть единственным
4. Другие варианты должны быть отсеяны по каким-то критериям

Что же может сделать человек? Может составить все доступные предложения в данном случае, подставляя на место неизвестных слов, слова, подобранные из даных букв.

Ах, да, последний пункт.
5. Слова расположенные рядом в предложении не должны противоречить здравому смыслу.

Таким образом, восстановить новую инормацию, которая нигде ранее не встречалась, будет невозможно.

Соответственно, при распознании можно опираться только на человеческий опыт о взаимном расположении слов в предложении, принадлежности слов к классам и взаимном расположении классов в предложении. (Отношениях классов)
Эту информацию можно получить и в электронном виде, что требует чтения текстов, определения класса слова, определения членов класса, и небольшого кода по определению, является ли написанное правдой, то есть реально в нашем мире и при каких условиях.
Или же эти данные могут забить в компьютер милиарды китайцев

[Ответ][Цитата]

Corwin
Сообщений: 1324

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:51

Ссылки где это обсуждалось:
http://gotai.net/forum/Default.aspx?postid=3404#3404
http://gotai.net/forum/Default.aspx?postid=3479#3479

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:55

к решению задачи Корвин, нужно подходит в общем, а не в частном, как это всегда и везде пытаетесь сделать вы.
Ясен пень, что частный случай может иметь более короткое решение. Эта проблема (оптимизации) другого класса и относиться к ОПЫТУ человека. И конкретный опыт может не подойти к другим проблемам распознавания в тексте.

Вам бы помолчать, да послушать, что говорят люди, обладающие гораздо большим опытом обобщения и алгоритмизации чем вы.
Когда речь идет об алгоритмах ИИ, следует решать ОБЩИЕ задачи в первую очередь, иначе вы просто уйдете в алгоритмические дебри.

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 17:58

ваши ссылки оставьте при себе, они не имеют отношения к последовательности, с которой следует подходить к проблеме. Учитесь корвин, учитесь.
Когда дело касается методик, вам ВСЕГДА следует затыкаться по определению, потому что это не ваша компетенция. Я вам уже говорил, что методики оставьте разрабатывать людям с другой структурой понятийного множества, которая приспособлена для обобщения и классификации, создания методик.

вы можете создавать только конкретные алгоритмы по уже готовым мтодикам.

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 18:09

Цитата:

Автор: Corwin

Поиск по дереву: слово в базе данных представляется в форме дерева состоящего из букв. Соответственно такой поиск хорошо подходит если нужно найти точную копию слова или его части.

слабак.
слово в БД представляется в форме дерева, но не из букв, а из расклассифицированных слов.

а предложения, тоже классифицируются и записываются в виде мыслеформ, т.е. последовательности координат слов БД.

так что оставьте корвин оставьте ваши бездарные попытки мыслит в этих направлениях.

[Ответ][Цитата]

Corwin
Сообщений: 1324

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 18:19

Очередной бред типа "Я самый умный Вы все дураки". Доказать то ничего не можете, так что уж лучше Вы тарасов молчите...

[Ответ][Цитата]

гость
89.208.11.*

На: к вопросу о распознавании текста

Добавлено: 21 фев 08 18:44

"слово в БД представляется в форме дерева, но не из букв, а из расклассифицированных слов.

а предложения, тоже классифицируются и записываются в виде мыслеформ, т.е. последовательности координат слов БД."

это надо вам выучить НАИЗУСТЬ болван!
и многое другое тоже.

не надо тут ничего доказывать, за вас уже все доказали и воплотили в самом совершенном компьютере-в голове. все работает на булевых принципах, ошибок нет.

мне сложно вам объяснить ощущение работоспособности модели в голове.
вот вы можете проверить работоспособность программы на С в голове?
наверняка можете, причем с уверенностью говорите, что она будет работать.

Вот также и я. все работает. И язык на котором я моделирую свои алгоритмы-булевский, а это значит, что он совместим с С и с любым вообще.

я не умный, я способный и мой мозг СПЕЦИАЛЬНО предназначен для построения таких алгоритмов и систем.
Объяснять вам отличия вашей мозговой структуры от моей я не хочу, все равно не поймете.

У нас с вами противоположные системы. Ваша НЕ предназначена длч такой работы.

И не надо классифицировать на дурак не дурак.
у вас просто принципиально на вашей структуре не достичь такого КПД, также, как и мне, принципиально не достичь успехов в вашей специфике.
Поэтому каждый должен смириться со своей специализацией и слушать мнение другого в вопросах, где ничего из себя не представляет.

Вы ничего из себя не представляете в методологическом плане. вот и заткнитесь. а я буду затыкаться в конкретных алгоритмах.

[Ответ][Цитата]

Стр.1 (3): [1] 2 3

След. > >>

Форум: Проблемы искусственного интеллекта