GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.10 (18)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Распознование текста
Павел Фоменко
Сообщений: 1081
На: Распознование текста
Добавлено: 21 янв 08 13:52
Цитата:
Автор: Тарасов

фоменко? кто такой фоменко? Иди в жопу фоменко!



Невнимательно читает, Тарасов: вы ужЕ в жопе.

P.S. Уважаемые, позвольте пару слов сказать на понятном ему языке.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 13:54
поконструктивнее господа поконструктивнее
[Ответ][Цитата]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 21 янв 08 14:11
Тарасов
Цитата:
вычислительная сложность-понятие относительное.

ага, она относительно занимаемой памяти и скорости выполнения! И уж точно, она относительна знания и не знания теории выч. сложности.

Цитата:
не видите алгоритмов оптимизации?

нет, не вижу. Что вы подразумеваете под оптимизацией? Я просто спрашиваю, так как у нас с вами разные понятия об оптимизации (у вас вон сложность понятие относительное).
Если у вас алгоритм экспоненциальный, то оптимизация к нему должна быть принципиальной для всего алгоритма!

И еще важный момент в этом плане. Я вообще не обсуждал ваше дерево!!! Я прикидывал сложность для сравнения матриц. Это типа уже известно с чем сравнивать.
Так что ваш "путь" совершенно не помогает.

И еще. Ну есть у вас путь. посмотрите как вы его строите!!! посмотрите, что начинаете вы его с
Цитата:
с://чб/шрифт таймс/кегль 8/нижний регистр/символ j/исходная матрица 128*64/ матрица фрагмента 2*2/координаты фрагмента 1А,1B,2А,2B.

Т.е. что бы добраться до самой матрицы, мне надо УЖЕ знать что я распознаю черно-белый рисунок (ну это не страшно), определенный шрифт и кегль (ну знаете, это уже подыгрывание), что он написан в нижнем регистре (ээ... и как вы это узнаете?), и что это символ "j" (опа!!!).
Вам это не напоминает вопрос типа : Кто написал стихотворение Пушкина "Я вас любил..."?


Цитата:
вес это процент соответствия по ХОР, если мы сравниваем 2 фрагмента матрицы между собой попиксельно.
когда мы сравнили 1 пару фрагментов матриц i и1, то появляется другой весовой коэффициент, который касается этой пары символов уже не относительно одного из них, а относительно внешней системы (которая включает в себя все множество символов и для которой оба символа являются выделенными системами).

Так веса к чему относятся? к пикселям, к парам или еще к чему? Вы написали как появляется весовой коэффициент (т.е. не как, а почему, как вы не написали). А я спрашивал как вы его используете. Ну есть веса, и что дальше? Где хранятся? Где применяются? и т.д.

Цитата:
Тут 2 системы отсета (ведь операция ХОР всегда касается только одной из них. Вот и всплыло в очередной раз ваше неумение разделять системы!). в одной системе отсчета совпадение 30%, а в другой системе отсчета, по закону инверсии причинности, НЕ совпадение 70%.
Поэтому относительно общей системы отсчета несовпадение уже 100% т.е. однозначная идентификация различий символов в паре. Поэтому какой бы уровень шумов бы ни был!!!!!!
отличить один символ от другого ВСЕГДА можно ОДНОЗНАЧНО!

Опять какая-то фигня про системы полезла. Компу на ваши системы наплевать. Конкретно, как что и когда преобразовывается. Мне не интересно сколько это будет в системе Х если я в ней не буду эти веса использовать.

Цитата:
"Вы сильно много на это ссылаетесь (это практически становится ответом на все вопросы). Совершенно не понятно как вы подразумеваете их использование." жевать
еще?

Не жевать и даже не объяснять, а всего-лишь описывать свою идею, Так как вы ее еще даже не описали. Уверяю вас, что веса вы применяете как-то раком (достаточно того, что почему то веса и проценты у вас разумеется одно и тоже, хотя веса иногда могут быть даже отрицательными, и это все надо сразу оговаривать).

Цитата:
просто не можете выделить то общее, что отбросите по умолчанию. Это не значит, что ваш мозг этого не делает. Я утверждаю-делает, и имею на то все основания. Вы-никаких.

Какая компьютеру разница, что делает мой мозг??? Или мне в алгоритме так и написать: "мой мозг это умеет, так будь добр и ты справляйся"? Хороший выходит алгоритм!

Цитата:
Цитата:
Автор: daner
"Во втором, вы ссылаетесь на то, что человек делает так. Это очень плохой аргумент. Обычно на такие аргументы внимания вообще не обращают, но допустим."

это можно проверить экспериментально.

Во-первых, вы экспериментально не проверяли, но разговор не об этом.
Во-вторых, сама ссылка, что "человек делает так а не иначе" есть плохой аргумент почему это должно быть в программе.

Цитата:
потому что преобразования в этом случае симметричны, меньше искажений, выбирается по умолчанию (если нет соответствующих причин применить иное)

Преобразования симметричны.... меньше искажений.... неее, не могу понять. А как причины применить иное узнать?
Я то знаю ответ почему . и он простой.

Цитата:
мыслите приметивно. мы не знаем какой символ, у нас есть выделенный объект и его размер.
Не с символами сначала сравнивается, а подбирается для объекта матрица соответствующего размера. Для i есть узкая матрица и i в ней определиться именно как i, а не как j или 1.

Ага... хороший ответ, в смысле что сразу куча узких мест показывает.
1 - КАК объекты выделяются????? в принципе?
2 - КАК подобрать нужную матрицу?????
2.1 - у вас размеры матриц, почти в конце пути стоят
Цитата:
с://чб/шрифт таймс/кегль 8/нижний регистр/символ j/исходная матрица 128*64/ матрица фрагмента 2*2/координаты фрагмента 1А,1B,2А,2B.

Т.е. вам надо все дерево на глубине 6-7 облазить! Тяжело, если програму реально применять, а не для одного шрифта и 10 цифр.
2.2 - а если шрифт деформирован? вы как его размер будете определять? деформацию то, вы еще не знаете! что если "i" приплюснута? откуда вы это будете знать? или вы вообще на все возможные на свете деформации будете в БД пример хранить? Вам нужно объяснять, что это не реально, или сами догадываетесь?

Я все-таки так и не пойму где же новизна??? пока абсолютно ничего нового (ну а если еще учесть, что ОНО и не работает... )
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 15:48
"Т.е. что бы добраться до самой матрицы, мне надо УЖЕ знать что я распознаю черно-белый рисунок (ну это не страшно), определенный шрифт и кегль (ну знаете, это уже подыгрывание), что он написан в нижнем регистре (ээ... и как вы это узнаете?), и что это символ "j" (опа!!!)."

это показана конкретная координата, показана СТРУКТУРА БД.
она и является новшеством.

а вы зачем то требуете от математической точки ее свойства. У точки нет никаких свойств, у нее одно свойство-координата. ВСЕ.
Чего вы от нее хотите-не понятно.

"Так что ваш "путь" совершенно не помогает."
не помогает чему?
Он должен помочь только одному: найти нужную матрицу по известным параметрам.

При распознавании образов задаются пределы поиска, т.е. некоторое множество матриц, совокупность которых соответствует распознаваемому объекту.
Вот эти пределы можно уже задать, используя эту структуру.
Если вы распознаете шрифт, причем латинский, то зачем вам обрабатывать матрицы кирилицы?
Вы, почему то не видите в этом оптимизации. Целый подкласс матриц из предстоящего анализа выпал, а вы не видите оптимизации? Оптимизировалось количество матриц из имеющейся коллекции. Мне кажется, что вы задаете слишком тупые вопросы...а точнее не вопросы, а какие то претензии.
Тогда мы не одинаково понимаем понятие оптимизации вообще...

"Так веса к чему относятся? к пикселям, к парам или еще к чему?"

Смотря для чего в данный момент вы эти веса используете, естесственно.


"Вы написали как появляется весовой коэффициент (т.е. не как, а почему, как вы не написали). А я спрашивал как вы его используете. Ну есть веса, и что дальше? Где хранятся? Где применяются? и т.д.
"
исходный фрагмент матрицы определенного размера, сравнивается по очереди со всеми (обратите внимание) имеющимися матрицами этого же размера в этом же координатном фрагменте.

Для каждого сравнения образуется весовой коэффициент. Затем, среди всех весов находится матрица с наибольшим коэффициентом соответствия, матрицы проранжированы по весовым коэффициентам.

предположим, что исходный участок распознаваемой матрицы-нижний сектор символа 1.
весовые коэффициенты оказались одинаковые и соответствуют 2-м матрицам: Фрагмент первой имеет отношение к символу i, а фрагмент фторой матрицы имеет отношение к символу 1.
Оба этих шаблонных фрагмента располагаются по соответствующим координатам в структуре, как показано.
Далее, идет распознавание верхнего сектора символа 1 (для простоты примера будем считать, что распознавание символа 1 и i загрублено и символ разделен матрицами всего на 2 части, верхнюю и нижнюю).
Теперь мы уже срвниваем не все оставшиеся матрицы (как в первый раз), а только те, чей фрагмент показал в первом сравнении нижнего сектора высокий вес. Т.е. мы соптимизировали количество матриц для этого сравнения. Если глубина анализа выбрана маленькая, то мы будем проверять только 2 матрицы, для которых веса оказались равными, но это в идеальном случае, когда нет никаких помех. если мы хотим провести более глубокий анализ, то мы будем делать сравнение согласно проранжированным весам по убыванию.
Допустим, что у нас идеальный случай и мы проверяем 2 матрицы (точнее, соответствующие их фрагменты-верхнюю часть символов 1 и i). И находим, что вес для фрагмента матрицы, являющуюся 1/2 частью матрицы для 1, имеет больший вес, чем для соответствующего фрагмента i.
Вот теперь анализ окончен. мы имеем 2 одинаковых веса для нижних фрагментов и 2 разных веса для верхнего сектора. Методом исключения, отбрасываем ненужную матрицу вместе с тем фрагментом, который совпал по весам. Идентификация нужной матрицы завершена. Символ, который за ней стоит идентифицирован.

Вот интересно, если все, что я сейчас рассказываю элементарно и не ново с вашей точки зрения, почему вы никак не можете в это въехать и задаете такие глупые вопросы, более того, не понимаете как путь к матрице здесь используется?
если бы не было этой структуры пути, то как бы мы отсеяли ненужную матрицу интересно? Да никак. все дело как раз в возможностях структуры.
Вот это батенька и есть НОВОЕ, и мне приходится вам объяснять все и разжовывать, причем безуспешно.
"1 - КАК объекты выделяются????? в принципе?
2 - КАК подобрать нужную матрицу?????"

это я уже объяснял. я не могу жевать за вас вообще все!
"2.1 - у вас размеры матриц, почти в конце пути стоят"
да, здесь ошибочка, символ в самом конце должен быть

с://чб/шрифт таймс/кегль 8/нижний регистр/исходная матрица 128*64/ матрица фрагмента 2*2/координаты фрагмента 1А,1B,2А,2B/символ j

"а если шрифт деформирован? вы как его размер будете определять?"

определять я буду размер матрицы, а не размер символа. Подберу матрицу, в которую входит весь объект.

" деформацию то, вы еще не знаете! что если "i" приплюснута? откуда вы это будете знать? "

какая мне разница, что там приплюснуто i или K? есть размер объекта, все.
для каждого размера свой набор шаблонов, естесственно. Поэтому я сразу сказал, что это все для одного кегля. применять другие способы-не рационально и себе дороже. Это только кажущаяся рациональность, для таких чудо программистов как вы, которые не видят подводных камней и на расстоянии 20 см.

"или вы вообще на все возможные на свете деформации будете в БД пример хранить? Вам нужно объяснять, что это не реально, или сами догадываетесь?"
учитывая то, что вы не видите оптимизирующих алгоритмов, то ваши тезисы мало чего стоят...

"Я все-таки так и не пойму где же новизна???"

гы-гы-гы, самому то не смешно?

вы как Ури , который у Электроника кнопку искал.

а вообще, вы на редкость тупой.
Интересно, а как вы понимаете слово новизна?
если вы никак не можете въехать в то, что вам объясняют, это как то связано с понятием новизны?
бгыыыы
Я замечаю закономерность. там где вы ничего не понимаете, там вы не можете найти новизну, прежде всего потому, что вообще ничего найти не можете, не новизну не старшизну, вы вообще тупенький похоже. Меня эта шутка больше не веселит. Можете думать как вам вздумается, а умный народ, если заглянет в топик сам решит, что ново, а что старо, разобраться не трудно, особенно, учитывая тот факт, что я уже 20 раз конкретизировал этот момент. Надеюсь, что таких тупых как вы будет не так много.
[Ответ][Цитата]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 21 янв 08 17:14
Ах, ну мы еще и ошибки делаем, и при этом все вокруг все равно тупые!
Ну у вас и чувство юмора!
Заметьте, снова перешли на оскорбления! когда сказать нечего.
А ведь я верно ваш алгоритм понял. Хреновый он. И об оптимизации, у вас хреновые понятия! Оптимизировать руками, это у таких хреновых программистов как я, не называется оптимизацией. Вот если бы программа сама отметала большую часть дерева! а не потому что вы ей сказали, что это не подходит, а это подходит.
Ну так сразу говорите ей. "Вот угадай какая буква нарисована на карточки с буквой А".
Дааа это революционны и оптимизированный подход!
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 17:36
сдается мне, что вы тупой...сказать то нечего именно вам.

"Вот если бы программа сама отметала большую часть дерева! а не потому что вы ей сказали, что это не подходит, а это подходит."
ха-ха-ха, да она только этим и занимается, вы просто не в курсах. га-га-га. дурилка картонная.
Вообще, смешно от вас слышать, что вы что то поняли (а тем более правильно). Не говорите больше таких фраз.
Одна радость-надежда на то, что поймут другие.
подожду ка я более конструктивных постов от кого-нибудь еще, вы мне надоели, жевать по третьему разу одно и то же тяжело.
[Ответ][Цитата]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 21 янв 08 17:48
Цитата:
Автор: гость

сдается мне, что вы тупой...
"Вот если бы программа сама отметала большую часть дерева! а не потому что вы ей сказали, что это не подходит, а это подходит."
ха-ха-ха, да она только этим и занимается, вы просто не в курсах. га-га-га. дурилка картонная.

Только этим и занимается? правда, правда?
Ну вы уж мне тупому повторите пожалуйста в каком месте программа САМА понимает, какой шрифт, размер и т.п. нужно брать? Потому что ДО ЭТОГО, вы утверждали совсем другое!
Цитата:
Он должен помочь только одному: найти нужную матрицу по известным параметрам.
При распознавании образов задаются пределы поиска, т.е. некоторое множество матриц, совокупность которых соответствует распознаваемому объекту.
Вот эти пределы можно уже задать, используя эту структуру.
Если вы распознаете шрифт, причем латинский, то зачем вам обрабатывать матрицы кирилицы?

Ну и где здесь САМА, если вы ей задаёте! Или у вас трудности с термином САМА?
Умната железобетонная вы наша.

P.S. i
даже от вас не ожидал такой глупости, что бы решить, что все возможные деформации надо хранить в памяти! Наверное это и есть гениальное решение!

P.S. ii
Прямо удивляюсь, и как до вашего рев.метода вообще что-то по заданным параметрам искали. Фантастика, ей богу!

P.S. iii
А как объекты выделяете, так и не написали...
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 18:12
"Вот угадай какая буква нарисована на карточки с буквой А".

Я думаю, что вы не понимаете главного:

принцип распознавания чего либо вообще.
вы не понимаете смысла слова распознавание объекта. точнее, понимаете его как то извращенно и абстрактно, некорректно, соответственно, также некорректно и мыслите и алгоритмы делаете (с нулевым результатом есессно).

Рискну предположить, что таких граматеев всепонимающих (в меру своего слабоумия) достаточно много, поэтому я приведу эти основные принципы:

1) Никакая задача не может быть поставлена, если у нее нет конкретной цели. Это общее правило вообще для всех задачь, в т.ч. естесственно, для распознавания объекта среди множества похожих.
2) Для распознавания (нахождения соответствия) требуется эталон этого соответствия.
3) Чем конкретнее определен эталон, тем и сама задача распознавания может быть решена конкретнее.
4) Если задача поставлена не корректно, то ее решение будет таким же не корректным, т.е. решений истинных будет множество. Говорить о 100% распознавании при не корректном эталоне (объекте с нечеткими характеристиками), вообще не логично по определению.

Данер просто не понимает всех этих принципов. Ему кажется, что программа должна посмотреть на каптчу и сама решить, что в ней следует найти, а что не следует находить. Сие заблуждение дорогие форумчане, от недостатка аналитических способностей. Людям, со слабыми аналитическими способностями, нужно быть кодерами, стенографистами, и пр.

Дилетанство, с которым Данер подходит вообще к проблеме распознавания образов, выявляется в его тупейших воросах и в абсолютном непонимании методик решения этих задачь.
Не обращайте внимания на этого несчастного, который всеми своими постами см. выше. неоднократно показал свой уровень, а точнее, уровень буржуйских университетов по ИИ...
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 18:14
"Ну вы уж мне тупому повторите пожалуйста в каком месте программа САМА понимает, какой шрифт, размер и т.п. нужно брать? "

вот именно, я вам должен ПОВТОРИТЬ еще раз то, что уже описывал. Идите в баню. Ответ на этот вопрос есть в топике, значит он просто не для вас.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 18:28
"Ну и где здесь САМА, если вы ей задаёте! Или у вас трудности с термином САМА?
Умната железобетонная вы наша."

Этот вопрос просто не рассматривался, он по иерархии выше стоит. Рассматривались низшие уровни, в которых программа откидывает классы более низкого порядка. все описание, я тем и занимался, что показывал, как именно это происходит. Но вам этого не хватило (просто вы не поняли ничего), вы полезли в более высокую иерархию, а я этого вопроса даже не затрагивал, и не собираюсь кстати, там в принципе, все то же самое, только эти вопросы зависят уже от другой системы, которая и будет решать по своим весовым коэффициентам, какой подкласс выбрать, латиницу или кирилицу, или вообще искать следует вовсе не шрифт, а рожу.

"P.S. i
даже от вас не ожидал такой глупости, что бы решить, что все возможные деформации надо хранить в памяти! Наверное это и есть гениальное решение!"

нет, оно просто неизбыточное, если говорить об общем принципе распознавания образов, а не о конкретной каптче, естесственно.
Безусловно, для локальной узкой задачи, применение оптимизирующих алгоритмов в виде компрессии матриц, будет наилучшим решением, кто же с этим спорит? Но мне не интересны такие алгоритмы, мне интересна проблема распознавания образов в общем виде, и я ее решил.

"P.S. iii
А как объекты выделяете, так и не написали..."

появится более умный собеседник-дожую, если попросит. Хотя все и так написано.
[Ответ][Цитата]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 21 янв 08 19:39
слов нет, одни слюни .
И это называется революционным алгоритмом! wow!!!!

Ну что же, посмотрим когда появиться такой-же умный как и вы собеседник пока таковых не нашлось.
[Ответ][Цитата]
Павел Фоменко
Сообщений: 1081
На: Распознование текста
Добавлено: 21 янв 08 19:42
Цитата:
Автор: гость

"Ну и где здесь САМА, если вы ей задаёте! Или у вас трудности с термином САМА?
Умната железобетонная вы наша."

Этот вопрос просто не рассматривался, он по иерархии выше стоит.



Так вот именно! Мы рассматриваем вопрос расспознавания, но он по иерархии стоит выше, поэтому мы его НЕ рассматриваем, а изучаем глюк в матрице г-на Тарасова

Цитата:
Автор: гость

появится более умный собеседник-дожую, если попросит. Хотя все и так написано.



Тамбовский волк тебе собеседник, собака дикая.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 21 янв 08 19:48
тьфу на тэбэ.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 24 янв 08 9:45
лох ты Юни.

ваше утверждение относительно неменяющегося соотношения сигнал/шум, относится к системе отсчета МАТРИЦЫ, которые вы сравниваете между собой и весовые коэффициенты получаете относительно системы отсчета МАТРИЦА.

Однако брать то надо другую систему отсчета-СИМВОЛ, и сравнивать надо не матрицы, а СИМВОЛЫ в матрице!
Матрицы-это только координатная система для символа.
Надо сравнивать СИМВОЛЫ, а исключать уже МАТРИЦЫ, к которым относятся сравниваемые объекты.
Весовые коэффициенты надо брать не для матриц, а символов.

"Если же такое произойдет, то оставшаяся часть, которую придется выкинуть не будет соответствовать ни одному из шаблонов, коэффициент соответствия окажется крайне низким, что говорит об ошибочном разделении объекта.

От чего же "не будет"?"

А если это тоже шум? "

в том то и дело, что это шум, а шумы я не сравниваю, я их исключаю вместе с матрицей, в которой они оказались.

Весовые пороги символов, которые управляют разделением матриц, полученные в результате первичного сравнения фрагментов символов или целых символов, в свою очередь, зависят от алгоритмов более глубокого анализа, которые работают с такими понятиями, как грамматика, семантика. Т.е. если это не каптча, а текст, то прибегается к анализу сочетаний букв. Еще глубже- по иерархии-сочетание слов.

Но мы с вами взяли очень простой пример-каптчу. Там нет грамматики (правильность написания слова в каптче может не быть по умолчанию) ни тем более семантического смысла. Поэтому распознавание символа в каптче на затрагивает эти алгоритмы. Откат действия (разделение матриц) с целью выявления более высоких весов по отдельности (в случае с фиаско), даст однозначный ответ для конкретного символа.
И здесь, как видите, помехи роли не играют, поскольку сравниваются только ПОЛЕЗНЫЕ пикселы, т.е. те, из которых состоят сами символы в оригинале шаблона.

Ваше неумение разделять системы отсчета и пользоваться простейшими, на мой взгляд, хитростями (сравнивать символ а исключать матрицу), является общим деффектом мышления всех вас здесь...

Непонимание , как влияет разделение систем отсчета на конечный результат (выявление соответствия), характерно для вас.
Почитайте топик про логику, вот цитата:


"в логике вообще нет обратных функций, есть только прямые и это связано с тем, что процессы в инерциальных системах (а логика именно ИСО) не обратимы.
Существуют модели обратимых функций (автор Эдвард Фредкин, наделавший много шума в математике. "бильярдная модель"), однако физически она не реализуема.

Обратные функции, например вычитание, реализуются в компьютере теми же сумматорами. При этом используется закон инверсии причинности. Т.е. принудительно осуществляется переход в другую систему отсчета путем изменения исходных критериев истинности для вычислительной системы:
исходно 1=истина, 0= ложь.

Инвертируем сигналы на входе сумматора, получаем

0=истина, 1= ложь

в результате, для исходных критериев истинности процесс сложения преобразуется автоматически по закону инверсии причинности в обратную функцию-вычитание, несмотря на то, что сумматор, физически выполняет ту же операцию сложения.
Вот вам физическая констатация факта работы этого закона, который, как видите, широко используется в калькуляторах и вообще компьютерах.
"



ВОТ ЮНИ ключевая фраза: "Т.е. принудительно осуществляется переход в другую систему отсчета путем изменения исходных критериев истинности для вычислительной системы:
исходно 1=истина, 0= ложь."

если в сравнении матриц, мы сравниваем единицы и нолики, принимая обоих как полезный сигнал, то в сравнении символов мы сравниваем в матрицах ТОЛЬКО единички (которыми в матрице нарисован символ), а саму матрицу используем как координатную систему, связывающую шаблонный сектор и соответствующий сектор исходной картинки.

Если до меня это никто не применял по слабоумию, то можете записать на мой счет еще одно ноу-хау, хотя я на него особо не претендую. На мой взгляд, это элементарные вещи, просто вы о них не знаете и вряд ли еще кто то об этом знает. Поскольку вы задаете просто НАИТУПЕЙШИЕ вопросы и тезисы типа : "поделитесь источником своих знаний"

Естесственно, что при таком подходе, я и говорю об увеличенном соотношении сигнал/шум.
А вы даже не в состоянии врубиться, о какой системе отсчета идет речь.
И теперь вам, дураку, должно быть понятно, что фрагментация матриц в сочетании с методом исключения этих матриц (это и есть сравнительный анализ) дает 100% теоретический результат при идентификации (отличении) одного объекта от другого в матрице.
И человеческий механизм обработки образов работает по той же системе. Вы что, смотрите на 2 фотографии и сравниваете матрицы в которых они находятся? Нет конечно. Вы сравниваете изображения, а матрицы остаются за кадром, хотя и принимают в этом процессе самое непосредственное участие, просто вы о нем ничего не знаете.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознование текста
Добавлено: 24 янв 08 18:04
[QUOTE=юни;2837627]Откуда Вы знаете, где в матрице символы, а где шум? Об этом речь и идёт."

не знаю, да и не нужно мне это. Это нужно потом, когда пополнять БД шумов надо будет. механизм описан в прдыдущем посте.


"Это простая детализация сама собой разделяет шум от символов?"

нет, переход из одной системы отсчета в дргую. Изменение критериев истинности это делает, написано же как, и даже показан пример, как та же фича работает в компьютере, когда из операции сложения делают операцию вычитания.


"На какой стадии Вы их отделили от символов?"

как только принял за полезный сигнал тело символа, а не тело матрицы.


"Не вижу."

очки наденьте.


" Вы не указываете перехода от матрицы, как набора точек в растре, к разделению его на полезную информацию и помехи."

указываю. читайте внимательно как изменяются критерии истинности.



"Рано или поздно, предполагаемый алгоритм наткнётся на такую вариацию символов и шумов, "веса" которой в равной степени распределятся между полузатёртой "Ж", сильноискажённой "К" и слабоискажённой "Х". И, поскольку требуется однозначное решение, то точность распознавания составит не 100%, а 30%."

"Вы такой вариант предполагаете? Как с ним бороться?"

также, как и человек. Я же пояснял, как это делается для текста. Используется косвенная информация. В каптче ее нет. Человек столкнется с теми же проблемами, с тем же результатом по коэффициенту распознаваемости, что и мой алгоритм.
Поймите, мой метод точно такой же, как и у человека реализован.


"Предложенные Вами переходы между координатными системами не решают этой принципиальной проблемы:"

переход не между координатными системами, координатная система та же остается.

"Откуда взялись эти критерии? Из воздуха?"

нет, просто они по умолчанию находятся в аналитической системе. Вы и не подозреваете об их существовании.

например, принято, что 1= истина
0=ложь

на этом строятся математические операции сложения в компьютере.
меняют критерии истинности-получают операцию вычитания.

если сравниваются матрицы, то этот критерий по умолчанию заключается в том, что истинность касается всей матрицы, поскольку операция ХОР устанавливает истинность совпадения для каждого бита в матрице отдельно.
Т.е. сравнивается не смысловое содержание 0 и 1, а по умолчанию сравнивается "системный смысл" на физическом уровне, т.е. напряжения сравниваются, приведенные ко входам ХОР.

Логике абсолютно по барабану, какой смысл в какой системе отсчета вы будете вкладывать в 1 и 0.

Наша задача, как раз ВЛОЖИТЬ смысл в них для своей собственной системы отсчета, человеческой, понимаете.
Т.е. Мы вкладываем мысленно этот смысл в 1 и 0, и вот какой:
Единички у нас будут отображать в матрице те пикселы, из которых складывается символ, а ноликом у нас будет помеха.

Вот эти критерии истинности, несущие смысловую нагрузку матрицы, мы и будем дальше обрабатывать. НО мы их НИГДЕ в программе не записываем, это не нужно.

Логика будет все делать для нас теперь сама.

Зато теперь мы можем сравнивать уже не сами матрицы, а то содержание, которое мы им придали.
Т.е. как и прежде, мы обрабатываем те же матрицы, но помехи в них мы уже не учитываем, понимаете? Мы сравниваем шаблонную матрицу уже не как всю матрицу, а сравниваем только те части шаблона, которые мы считаем нужным сравнивать, т.е. сравниваем мы только соответствие единичек с тем местом, где они должны находиться в исходной каптче для этого шаблона. Т.е. мы сравниваем соответствие координат, по которым располагаются в шаблоне и в каптче единички, несущие смысловую нагрузку в ЧЕЛОВЕЧЕСКОЙ системе отсчета.

Таким образом, мы заставляем компьютер сравнивать не матрицы, а смысл, который мы в них заложили. Сам переход из одной системы нигде не зафиксирован, он содержится в том, как мы начинаем интерпретировать (обрабатывать) полученные результаты с ХОР.

Мы начинаем определять веса соответствий уже совсем по другому алгоритму, мы считаем только те совпадения, которые нужны нам, и тем самым, получаем другие результаты уже количественно.

Именно так мы и осуществили переход из одной системы отсчета в другую, и вот ТЕПЕРЬ уже, зафиксировали РЕЗУЛЬТАТ этого прехода в весовых коэффициентах.


"Если алгоритм сравнивает исходные нолики и единички части матрицы, то почему именно одной конкретной части? Если всей матрицы, то почему единицы, переходящие в новую систему отсчёта являются априори полезным сигналом?"

пожалуйста, сделайте полезным сигналом нолик, а не единицу, дело вкуса.

[Ответ][Цитата]
 Стр.10 (18)1  ...  6  7  8  9  [10]  11  12  13  14  ...  18<< < Пред. | След. > >>