GotAI.NET - Форум - Искусственный интеллект

Все темы | Новая тема

Стр.5 (12)

<< < Пред. | След. > >>

Поиск:

Автор

Тема: На: распознавание каптчи 2

гость
94.25.174.*

На: распознавание каптчи 2

Добавлено: 15 май 09 12:17

такс, шу у нас там по плану?

"4.1. Исходный шаблон для сравнения максимальный по размеру, статический из базового набора, промассштабированного до размера матрицы.

То есть, про растяжение шаблона весь размер исследуемой матрицы я прав?"

в корне не прав. Шаблон не должен растягиваться по матрице. Он должен массштабироваться пропорционально, даже если по одному из размеров он выходит за рамки исходной матрицы для распознавания.

4я

"Хм... Это больше похоже на команды для синтеза шаблона, типа "повернуть шаблон на N градусов по часовой стрелке и приложить к исследуемой матрице"."

это и есть команды.

"Я же интересовался тем, исходя из чего выработается команда."

есть АСУ, принципы давно известны.
Всякая команда вырабатывается для достижения некоторой цели (в данном случае это подцель распознавания).

"4.3. Как логично следуя сигналу рассогласования выбрать правильный шаблон (если допустить, что на начальном этапе у нас имеется НЕ функция, а таблица типа:
аргумент (сигнал рассогласования) => следующий шаблон для рассмотрения."

ну, во-первых, сначала все имеющиеся стандартные шаблоны перебором подставляются к исходной матрице. Из всей кучи шаблонов выбирается самый подходящий (наименьший сигнал рассогласования) и если совпадений в нем меньше 50%, исходная матрица разбивается пополам. Если совпадений менее 30%, то исходная матрица разбивается на 3 части и т.д. Далее к каждой части матрицы применяется тот же алгоритм, а шаблоны автоматически перемассштабируются согласно новым размерам.
Таким образом, паралельно решаются 2 задачи: определение границ объектов, их числа, и распознавание объектов.

Если совпадений больше 50%, то применяются генерированные шаблоны.
Сигналы рассогласования для каждого из шаблонов ранжируются. Сначала используются для генерации смещенных шаблонов только того символа, который подошел больше всего, затем который меньше (следующий по убыванию). Если сходимость при переборе вариантов первого символа больше сходимости второго, значит символ получает флаг, который будет использован при решении о том, что символ выбран верно.
Другой флаг получается из поворотных сравнений. В зависимости от глубины анализа, количество факторов и флагов может быть увеличено, каждому флагу соответствует свой вес.
В рассматриваемом упрощенном примере мы берем только 2 флага, вес которых равнозначен: поворот,позиционирование.
Если флаги соответствуют разным символам, то глубина анализа увеличивается (из ранжированного списка). Проверяется другая пара символов. У кого больше сходимость получиться, за тем и будет приоритет у первой пары.

Таким образом, мы получаем грубую оценку символам и центруем объекты. Теперь матрица у нас разбита не на равные части, а по размерам отцентрованных шаблонами. Излишки исходной матрицы не выкидываются, поскольку вероятность, что придется все переделывать сохраняется до конца. Если по итогам сходимость не покажет положительную динамику, придется делать откат операции и использование других символов из проранжированного списка.

Следующая итерация не использует вырезанные куски исходной матрицы. части матрицы, разграниченные шаблонами делятся на 2 равные части. Шаблон этого символа также дробится на 2 части, верхнюю и нижнюю.
Далее из базовых шаблонов генерируются верхние половинки и подставляются.
Создается проранжированный список из сходимостей этих частей, далее все также, как и при первой итерации.
В итоге может получиться, что сходимости верхних половинок покажут положительную динамику, а нижние не покажут. В этом случае ничего страшного нет. Другое дело, если одна из половинок покажет отрицательную динамику.
Это говорит либо о намеренных искажениях в каптче (либо помехе), либо о схожести символов, к примеру 1 и I (которые в проранжированном списке предыдущей итерации стоят рядом).
В этом случае, нет оснований делать откат, а есть основания увеличить глубину проверки, накапливать флаги и хранить их до следующей итерации.

После окончания этой итерации, границы объектов в матрице корректируются, шаблоны опять центруются, независимый объект "контур объекта (граница)" корректируется: участки, содержащие максимальное количество пикселов от границ шаблона до границ объекта в шаблоне, удаляются. Места, в которых граница шаблона совпадает с границей объекта в матрице не попадает в объект "контур". Координата разрыва контура является приоритетным и решающим флагом при решении отката итераций у соседнего объекта. Если эта координата совпадет с соседней зоной другого объекта, в которой динамика итераций привела к отрицательной сходимости, то отката не будет.

"Я же и не тороплю. А вот немаловажные пункты, оставшиеся без ответа:

4.4. Можно ли сказать, что шаблон для сравнения является частью конкретного символа, определённым образом искаженного?"

генерированный шаблон зависит от его характеристик, но частью символа на каптче он не является. Изображенный на каптче символ-объект независимый и безусловный, его нельзя подвергать никакой обработке. он объект для сранения и не более того.

"4.4.1. Если п. 4.1. правильный, то какой исходный символ брать - какой тип шрифта, размер, цвет и т.д. ?"

написал выше.

тип шрифта не рассматривается в данном случае, как и цвет, но в общем случае все эти параметры являются надстройкой к основным и имеют меньший вес.

Исходная задача подразумевала наличие нескольких базовых шрифтов в коллекции.

для работы с надстройками необходимо вводить дополнительные факторы в обратную связь.

т.е. кроме позиционирования и верчения, нужны факторы рассогласования КЛАССОВ.

Определять нужно соответствие класса изображения: ЧБ, контурное, жирное, графити.

Каптча яндекса имеет одинаковый класс: средняя жирность, контурный, ЧБ.

Сие можно определить, замерив коэффициент заполнения матрицы. У контурного класса, заполнение черными пикселями минимальное, относительно белых. С фоном однотонным сложнее, проще с цветным.
Однотонные помехи (пятна, кляксы, того же цвета, что и объекты) будут приняты за полезные объекты. Нужно вводить ограничения по величине объекта (я об этом сразу упоминал). если объекты окажутся сопоставимы размерами с кляксами, то ситуацию разрулит флаг контура. Достаточно сравнить контур с контуром кляксы, чтобы выкинуть объект из анализа. Алгоритм сравнения контуров отдельная тема и она не кажется мне сложной.

Форум: Проблемы искусственного интеллекта