GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.6 (12)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: распознавание каптчи 2
гость
89.208.11.*
На: распознавание каптчи 2
Добавлено: 15 май 09 20:02
"Тарасов пока ещё не осознал эту пропасть вариантов/расположений/вращений..."

да хоть миллиард вариантов...

фишка в том, что все перебирать ведь не нужно. алгоритм построен синтезирующий нужное, а не выбирающий.
[Ответ][Цитата]
гость
89.208.11.*
На: распознавание каптчи 2
Добавлено: 15 май 09 20:30
Продолжаю редактировать и задавать вопросы.

4.1. Исходный шаблон для сравнения максимальный по размеру, статический из базового набора. Шаблон должен массштабироваться пропорционально, даже если по одному из размеров он выходит за рамки исходной матрицы для распознавания.

4.2...

4.3. Как логично следуя сигналу рассогласования выбрать правильный шаблон (если допустить, что на начальном этапе у нас имеется НЕ функция, а таблица типа:
аргумент (сигнал рассогласования) => следующий шаблон для рассмотрения."

я ответил, по наибольшей сходимости.

4.3.1. Задача подразумевает наличие нескольких наборов шрифтов для генерации на их основе шаблонов (Так?).

в данном случае так.

" Все имеющиеся стандартные шаблоны перебором подставляются к исходной матрице."

да, их количество невелико.


"...все эти параметры являются надстройкой к основным и имеют меньший вес." - это я понимаю так, что тип шрифта при распознавании роли не играет?"
играет, но на первоначальном грубом этапе играет мало. Чем больше итераций, тем больше играет роль.
вначале большую роль играет класс шрифта. контурный или заполненный.


"То есть распознание шрифтонезависимое? Тогда какими должны быть "все имеющиеся стандартные шаблоны"?

задача ставиться для конкретного класса, поэтому стандартный набор включает в себя шаблоны, приближенные к задаче распознавания.

в общем случае, задача определения класса шаблонов многоступенчатая и может решиться после нескольких итераций с приемлемым качеством.

4.3.2. Из набора шаблонов выбирается самый подходящий (наименьший сигнал рассогласования) и если совпадений в нем меньше 50%, исходная матрица разбивается пополам.
P.S. Ты понимаешь, что шаблон можно прилепить в любое место исследуемой капчи? И даже если мы взяли НУЖНЫЙ шаблон, то он может быть просто НЕ ТАМ размещён. Понимаешь?"

конечно.
даже нужный шаблон может показать одинаковую сходимость в нескольких местах. Однако это выясняется при следующих итерациях и откатах. В конечном счете шаблон встает на нужное место.

4.3.3. Из набора шаблонов выбирается самый подходящий (наименьший сигнал рассогласования) и если совпадений менее 30%, то исходная матрица разбивается на 3 части и т.д.
4.3.4. Далее к каждой части матрицы применяется тот же алгоритм, а шаблоны автоматически перемассштабируются согласно новым размерам.

Заметка:
а) Изначально берётся шаблон с символом, так сказать, в полную величину.
б) При совпадении к примеру 50% исходный шаблон мы делим пополам - вдоль или поперёк? Или как вообще?
не имеет значения.
Или имеется ввиду что именно МАТРИЦА делится на части и уже на ЭТИ части мы пытаемся прикладывать шаблон?

матрица делиться на части и шаблон тоже.
50% попадания говорит о том, что и шаблон и матрица нуждаются увеличении глубины детализации.

4.3.5. Если совпадений больше 50%, то применяются генерированные шаблоны.
То есть? Почему при меньшем проценте совпадения мы упорно пользуем "стандартные" шаблоны, а при бОльшем начинаем их генерировать? о_О

потому что если совпадений больше 50, то можно рационально результат улучшить, а если меньше, то уже не рационально. это увеличит количество откатов.

4.3.6. Сигналы рассогласования для каждого из шаблонов ранжируются...

4.4. Генерированный шаблон зависит от характеристик исследуемого объекта.
но спрашивал я вот что:
За ОСНОВУ шаблона берётся стандартный символ из какого-то шрифта?

да.

в каждом классе шрифтов найдется шрифт с усредненными характеристиками, он и берется.
[Ответ][Цитата]
Павел Фоменко
Сообщений: 1081
На: распознавание каптчи 2
Добавлено: 16 май 09 11:22
Вобщем и целом замечу:
метод сырой, и для алгоритмизации совершенно не годится на даном этапе.

Честно говоря, я даже суть всех этих делений шаблонов не могу уловить.
Поптыаюсь в общих чертах набросать алгоритм, а потом сделаю выводы.

1. К исходному изображению "прикладывается" шаблон, который представляет собой неискаженный стандартный символ, шрифт которого соответствует неискаженному символу на исходной картинке. То есть, нам надо заранее знать какой именно шрифт используется для генерации капчи Яндексом.
2. Получаем сигнал рассогласования в виде отношения кол-ва совпавших пикселей (на картинке и на шаблоне) к общему количеству пикселей на шаблоне.
3. В зависимости от процента совпадения пикселей, делим рассматриваемую область на меньшие участки и проводим рассмотрение уже внутри их.
Мля... Но как именно проводится рассмотрение внутри этих меньших областей??
4. Рассмотрение в меньшей области проводится сравнением этого участка с частью исходного шаблона.
5. Опять же, получаем сигнал рассогласования и опять выбираем ещё меньшую область на исходной картинке и ещё меньшую часть шаблона.
В итоге, съезжаем до шаблона 2х2 и получаем сходство 100%, которое НИКАКОЙ ПОЛЕЗНОЙ ИНФОРМАЦИИ о том ЧТО же мы расспознали не несёт!

Моё мнение. Поясни, что я не так понял.
[Ответ][Цитата]
гость
89.208.11.*
На: распознавание каптчи 2
Добавлено: 16 май 09 15:40
"Вобщем и целом замечу:
метод сырой, и для алгоритмизации совершенно не годится на даном этапе."

ну батенька, синтез только начался...



"Честно говоря, я даже суть всех этих делений шаблонов не могу уловить."
а вот это уже плохо...

"Поптыаюсь в общих чертах набросать алгоритм, а потом сделаю выводы."

какой алгоритм на этом этапе? вы с ума сошли?

"1. К исходному изображению "прикладывается" шаблон, который представляет собой неискаженный стандартный символ, шрифт которого соответствует неискаженному символу на исходной картинке. То есть, нам надо заранее знать какой именно шрифт используется для генерации капчи Яндексом."

если не знать, то задача усложняется добавлением надстроек, а не переделкой методики. это важно.


"2. Получаем сигнал рассогласования в виде отношения кол-ва совпавших пикселей (на картинке и на шаблоне) к общему количеству пикселей на шаблоне."
с учетом оговоренных надстроек: поворот, массштабирование, позиционирование.

"3. В зависимости от процента совпадения пикселей, делим рассматриваемую область на меньшие участки и проводим рассмотрение уже внутри их."
если исчерпаны все надстройки.

"Мля... Но как именно проводится рассмотрение внутри этих меньших областей??

шаблон делится на 2 и соответствующая его часть сравнивается с соответствующей частью поделенной матрицы. все пределы (поворотов, масштабирования и позиционирования) уменьшаются в 2 раза.

"4. Рассмотрение в меньшей области проводится сравнением этого участка с частью исходного шаблона."

ну и что тут не ясно?

"5. Опять же, получаем сигнал рассогласования и опять выбираем ещё меньшую область на исходной картинке и ещё меньшую часть шаблона."
не забываем про откаты. Это как раз и позволяет избавиться от гигантского кол-ва вариантов перебора.

"В итоге, съезжаем до шаблона 2х2 и получаем сходство 100%, которое НИКАКОЙ ПОЛЕЗНОЙ ИНФОРМАЦИИ о том ЧТО же мы расспознали не несёт!"

"съезжание" происходит ТОЛЬКО с повышением вероятности распознаваемого образа.

поэтому до 2*2 может и вообще не дойти, поскольку общая сходимость в 98% может наступить гораздо раньше.

"Моё мнение. Поясни, что я не так понял."

вы не уловили принцип управления синтезом. Вы не поняли, как обратная связь отсекает ненужные варианты перебора и задает вектор перебора в нужном направлении.

Дальнейшие ваши вопросы не могут участвовать в конкретизации методики и моя работа на этом заканчивается, поскольку с вами, дальнейший синтез методики становится очень трудозотратным.
Мне нужны вопросы дальше и глубже, полученные от вас ТОЛЬКО при услвии, что вы разобрались в принципе управления вектором синтеза шаблонов.
ТОлько в этом случае, совместная работа по созданию методики может быть эффективной.
[Ответ][Цитата]
гость
217.199.228.*
На: распознавание каптчи 2
Добавлено: 16 май 09 16:52
Цитата:
Автор: гость

"Поптыаюсь в общих чертах набросать алгоритм, а потом сделаю выводы."

какой алгоритм на этом этапе? вы с ума сошли?


В самом деле, какой алгоритм?
Это только методика писать методики по построению ИИ (в лучшем случае).
[Ответ][Цитата]
гость
89.208.11.*
На: распознавание каптчи 2
Добавлено: 17 май 09 0:18
методика писать алгоритм.

вы опять никак не поймете, чем отличается сырой алгоритм от методики. это не одно и то же.
[Ответ][Цитата]
Павел Фоменко
Сообщений: 1081
На: распознавание каптчи 2
Добавлено: 18 май 09 10:55
Цитата:
Автор: гость
Дальнейшие ваши вопросы не могут участвовать в конкретизации методики и моя работа на этом заканчивается, поскольку с вами, дальнейший синтез методики становится очень трудозотратным.

Ясен пень - вопрос трудозатратный и весьма напряжный для мозга.
Цитата:
Автор: гость
Мне нужны вопросы дальше и глубже, полученные от вас ТОЛЬКО при услвии, что вы разобрались в принципе управления вектором синтеза шаблонов.

Вот тоже вопрос... ЗАЧЕМ мне разбираться в этом принципе, если у ТЕБЯ есть готовая методика касательно синтеза шаблона? Просто расскажи и всё.
[Ответ][Цитата]
гость
94.25.175.*
На: распознавание каптчи 2
Добавлено: 18 май 09 19:07
откуда это она у меня готовая?

она синтезируется по ходу ваших вопросов...

то, что есть сейчас, лишь каркас (это все, что с ВАМИ удалось сделать).
[Ответ][Цитата]
shuklin
Сообщений: 2053
На: распознавание каптчи 2
Добавлено: 18 май 09 19:21
Халявы не будет. Кто купился - жестко обломится )))
[Ответ][Цитата]
гость
94.25.175.*
На: распознавание каптчи 2
Добавлено: 18 май 09 19:26
я не предлагал халявы. я оцениваю работу в паре.

есть люди, с которыми КПД меньше, и есть те, с которыми больше.
[Ответ][Цитата]
daner
Сообщений: 4593
На: распознавание каптчи 2
Добавлено: 18 май 09 23:11
Цитата:
Автор: гость

я не предлагал халявы. я оцениваю работу в паре.

есть люди, с которыми КПД меньше, и есть те, с которыми больше.

точно. Вы тот, кто КПД понижает.
[Ответ][Цитата]
Павел Фоменко
Сообщений: 1081
На: распознавание каптчи 2
Добавлено: 19 май 09 9:04
Цитата:
Автор: гость
откуда это она у меня готовая?
она синтезируется по ходу ваших вопросов...
то, что есть сейчас, лишь каркас (это все, что с ВАМИ удалось сделать).

Тарасов, так не пойдёт.
Изначально ты говоришь:
Цитата:
Автор: гость
я обращаюсь к тем, кого эта проблема реально интересует, более того, к тем, кто согласен реализовать в коде решение проблемы по моей методике за достойное вознаграждение

Я готов - ГДЕ методика?
Цитата:
Автор: гость
шаблон делится на 2 и соответствующая его часть сравнивается с соответствующей частью поделенной матрицы. все пределы (поворотов, масштабирования и позиционирования) уменьшаются в 2 раза.

Какая часть шаблона в даном случае соответствующая? Верхняя, нижняя, правая, левая?
Цитата:
Автор: гость
>В итоге, съезжаем до шаблона 2х2 и получаем сходство 100%, которое НИКАКОЙ ПОЛЕЗНОЙ ИНФОРМАЦИИ о том ЧТО же мы расспознали не несёт!"

"съезжание" происходит ТОЛЬКО с повышением вероятности распознаваемого образа.

Позвольте! Если совпадение меньше 50%, то шаблон делится. Так?
Так что быстрее совпадёт - шаблон и участок матрицы 100х100, или шаблон и участок матрицы 2х2?
Кстати, единичная точка совпадает с любой другой точкой МИНИМУМ на 50%

Ладно. В принципе - какую фишку, какой выигрыш мы получим от ДЕЛЕНИЯ шаблона по ходу итераций сравнения?

[Ответ][Цитата]
гость
94.25.175.*
На: распознавание каптчи 2
Добавлено: 19 май 09 17:48
"кто согласен реализовать в коде решение проблемы по моей методике за достойное вознаграждение"
речь шла о создании методики за приличное вознаграждение, где реализация занимает сумму в 500 долларов максимум.

"шаблон делится на 2 и соответствующая его часть сравнивается с соответствующей частью поделенной матрицы. все пределы (поворотов, масштабирования и позиционирования) уменьшаются в 2 раза.


Какая часть шаблона в даном случае соответствующая? Верхняя, нижняя, правая, левая?"

не принципиально. важно, что рассматриваются теперь соответствующие куски более детально.


"Позвольте! Если совпадение меньше 50%, то шаблон делится. Так?"

так.


вот когда вы нихрена не видите, вы подходите в 2 раза ближе?

также и здесь.
"Так что быстрее совпадёт - шаблон и участок матрицы 100х100, или шаблон и участок матрицы 2х2?"
заранее неизвестно сколько итераций и откатов потребуется.


"Кстати, единичная точка совпадает с любой другой точкой МИНИМУМ на 50%"
вы нихрена не поняли. с чем вас и поздравляю.

прежде, чем хаять деление шаблона, опровергните факт того, что при человеческом алгоритме, по факту, происходит УВЕЛИЧЕНИЕ детализации, если вам трудно решить, мальчик это или девочка на горизонте. Так вот, если девочка, то вы подойдете ближе, а если мальчик, то и нахер он не уперся-дальше пойдете. Впрчем, кто вас знает, может вы этот, как его, чужой во...
[Ответ][Цитата]
гость
94.25.175.*
На: распознавание каптчи 2
Добавлено: 19 май 09 17:49
"Ладно. В принципе - какую фишку, какой выигрыш мы получим от ДЕЛЕНИЯ шаблона по ходу итераций сравнения?"

увеличиваем соотношение сигнал-шум дубина!
[Ответ][Цитата]
гость
94.25.175.*
На: распознавание каптчи 2
Добавлено: 19 май 09 17:51
раньше то сравнения не попиксельно были, а покластерно, а с увеличением детализации кластеры уменьшаются.

если ты будешь всю матрицу сразу попиксельно смотреть, то это ты дооолго будеш варианты перебирать...
[Ответ][Цитата]
 Стр.6 (12)1  2  3  4  5  [6]  7  8  9  10  ...  12<< < Пред. | След. > >>