GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.7 (8)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Распознавание символов
гость
85.25.151.*
На: Распознавание символов
Добавлено: 15 мар 08 21:59
Собственно, вы в своём репертуаре Вообще, помощи просил не я, а автор темы Что касается частностей - мне с "частным" подходом неплохо живётся - над частностью я подумаю, грубо говоря, месяц и реализую, получу деньги и буду работать дальше, а маяться с отлаживанием глобальной идеи буду лет 20, а когда всё, что нужно сделаю, окажется, что мой труд не актуален и я буду находиться там, куда вы предположили, что я тычусь. Так-то Я вот только одного понять не могу, Евгений - нашиша вы везде пытаетесь ткнуть оппонента в грязь лицом? Мы, а конкретно я, не хуже вас, а в своём скромном сознании считаю себя даже лучше, только времени не так много, да и желания везде рассказывать о том, чего я добился и как в пять лет слетал на Луну... Это характеризует вас отнюдь не с лучшей стороны, например, как очень неуверенного в себе человека.
[Ответ][Цитата]
гость
77.109.34.*
На: Распознавание символов
Добавлено: 15 мар 08 22:32
Цитата:
Автор: гость
Это характеризует вас отнюдь не с лучшей стороны, например, как очень неуверенного в себе человека.

А еще это характеризует его как сексуально неудовлетворенного индивида. Похоже что ему не дают и приходится здесь сублимировать и само удовлетворятся.
[Ответ][Цитата]
gAMLET
Сообщений: 11
На: Распознавание символов
Добавлено: 16 мар 08 0:12
Цитата:
Автор: гость
Вообщем, наилучшим вариантом будет увеличение всей капчи SmartFilter''''ом

Спасибо за эту информацию) Действительно интересно. Вот только из-за того, что мои символы очень маленькие (некоторые по 8 пикселей в высоту), бикубическая интерполяция мне подходит лучше. Смотрите пример http://webfile.ru/1805886.

Цитата:
Автор: гость
Как вариант, чтобы долго не прыгать в разные стороны, поищи в инете исходник программки Neuro40.

Так же весьма полезная программка. Пока не вдавался в подробности, надеюсь пригодится.

Цитата:
Автор: гость
Чтобы обучить программку нужно будет ~100-200 капч (то бишь выборка в 400-800 шаблонов)

Хм... Т.е. в качестве шаблонов будут символы с капчи? Мне казалось правильней будет использовать "идеальные" сиволы. Тут вполне можно подобрать шрифты. Или я что-то не понимаю?
[Ответ][Цитата]
гость
192.251.226.*
На: Распознавание символов
Добавлено: 16 мар 08 0:23
Извиняюсь, запамятовал. Я использую модификацию SF, у меня качество несколько лучше. Впрочем, бикубическая интерполяция вполне нормальный результат показала, так что не суть
Насчёт шаблонов - не имеет смысла использовать идеальный вариант, так как именно он мало вероятен, в живой природе Шаблоны, извлечённые из самой капчи, многократно ближе к реальной ситуации (ЧТО именно вам нужно будет распознать), нежели неискажённый вариант. Взять даже ваш вариант, интерполированного изображения. После обработки (хотя смотря какое представление изображения вы будете использовать - бинарное, либо 8-битное, но в любом случае эта часть будет искажённой), небольшая часть символа b пропадёт. На идеальном шаблоне, если вы сами не будете создавать ситуаций при обучении, сие отображено не будет, что может сыграть злую шутку с конечным % распознавания. То бишь, вам в любом случае нужно будет имитировать "реальные" искажения, что имеет место быть на капче, так зачем же их создавать искусственно, если можно просто взять шаблоны с капчи?
[Ответ][Цитата]
gAMLET
Сообщений: 11
На: Распознавание символов
Добавлено: 16 мар 08 0:54
Дело в том, что на капче используются несколько шрифтов, символы разного размера и с разным углом поворота. Я к тому, что сложно подобрать шаблоны для всех случаев. И еще возникает один вопрос: для чего тогда нужно масштабировать символы?
Я просто смутно понимаю что значит "научить" программу...
[Ответ][Цитата]
гость
66.230.230.*
На: Распознавание символов
Добавлено: 16 мар 08 1:07
Ну, это не проблема, на самом деле. Когда я распознавал капчу на AOL, мне пришлось выкачивать около 1000 картинок, в конечном же итоге получил именно благодаря этому 80% распознавания (к тому же шрифты там частенько используются редкие). Так как символов на капче всего 4, то ваш набор, предположительно, будет гораздо меньше. Масштабировать нужно, чтобы иметь возможность выделить какие-то уж очень мелкие по размеру признаки. Ваше же капча характерна своими малюсенькими размерами и точность распознавания при стандартном разрешении будет ниже, чем на том же интерполированом изображении.
Насчёт понятия "научить".. Я к сожалению не наделён учительским даром и объяснить доходчиво не смогу (это скорее даже из разряда "знаю, как сделать и сделаю, но объяснить не смогу" ), но вполне вероятно, что всё необходимое может подсказать вам гугл
[Ответ][Цитата]
gAMLET
Сообщений: 11
На: Распознавание символов
Добавлено: 16 мар 08 1:15
Значит алгоритм получается примерно таким: отделяем символ, увеличиваем его в 4 раза. Далее берем 1 шаблон, так же увеличиваем его в 4 раза, и сравниваем, запоминая разницу. После чего берем след. шаблон и все повторяется... В итоге символ разница с которым минимальна и есть искомый.
[Ответ][Цитата]
гость
89.208.11.*
На: Распознавание символов
Добавлено: 16 мар 08 9:34
ваши предположения глупы, как и вы сами, а человек все таки делает как я советую...
так что, мелите языками дальше.
[Ответ][Цитата]
гость
208.72.168.*
На: Распознавание символов
Добавлено: 16 мар 08 12:04
Более эффективно с точки зрения производительности увеличить всю картинку разом (увеличивая каждый символ по отдельности вы потратите в N раза больше времени на этап "инициализации" процедуры интерполяции. Учитывая, что размер сегментов всё же меньше, нежели целая картинка, то потери времени будут конечно не в 4 раза больше, но не менее, чем в 1,5-2), а после чего сегментировать её. Какой смысл увеличивать шаблон не понимаю, у вас ведь база будет не 4 Гб и более весить, сл-но всё в памяти можно держать, и сразу увеличеные шаблоны на диске. Если уж размер так критичен, ужать никто не воспрещает. Грешно думать, что нынешним компьютерам пофигу, если они выполнят на 2-3 сотни инструкций больше.. Именно так рождаются Висты.
Насчёт сравнения, тут опять же лучше использовать то, на что я вам дал ссылку ранее - Neuro40. Думаю, не проблема будет разобраться, как обучать, и чему именно учить.

"ваши предположения глупы, как и вы сами, а человек все таки делает как я советую...
так что, мелите языками дальше."
Не тебе судить, кто глуп, а кто нет. Человек делает не так, как ты сказал, читай внимательней. То, что он решил увеличивать шаблоны характеризует его просто как начинающего программиста, который пока не имеет возможности задумываться об оптимизации времени исполнения программы. Ты же конкретно показываешь, что сам об оптимизации не задумвался. Что вполне закономерно - программированием ты не занимаешься, так что всё в порядке. Только вот молодых людей не смущай, не стоит строить из себя всезнайку, по крайней мере в программировании ты не разбираешься и можешь своими советами оказать медвежью услугу ненароком. И всё же ты не ответил на мой вопрос об унижении оппонентов. Что это? Комплекс неполноценности или же, предположение другого форумчанина с Украины?
[Ответ][Цитата]
gAMLET
Сообщений: 11
На: Распознавание символов
Добавлено: 16 мар 08 12:28
То что символы лучше хранить сразу в увеличенном виде, стало очевидно как только я отправил сообщение) Просто редактировать лень было)
[Ответ][Цитата]
гость
89.208.11.*
На: Распознавание символов
Добавлено: 16 мар 08 16:53
"Ты же конкретно показываешь, что сам об оптимизации не задумвался."

оптимизация хороша только там, где есть проработанная и решенная методика в общем виде.
В противном случае (а здесь именно так), вы рискуете на оптимизации зайти в тупик, из которого вы не вылезете.
Да, я не спорю, что оптимально для решения конкретно этой задачи именно такое, как вы говорите, но предупреждаю, что делать этого не следует...
[Ответ][Цитата]
гость
208.72.168.*
На: Распознавание символов
Добавлено: 16 мар 08 17:02
"оптимизация хороша только там, где есть проработанная и решенная методика в общем виде.
В противном случае (а здесь именно так), вы рискуете на оптимизации зайти в тупик, из которого вы не вылезете.
Да, я не спорю, что оптимально для решения конкретно этой задачи именно такое, как вы говорите, но предупреждаю, что делать этого не следует..."
Это как раз проработаная и решённая методика, благодаря которой можно сломать 90% существующих капч. В чём будет выражаться тупиковость ситуации? Оптимизация времени исполнения, всего-то делов. Общие принципы, отнюдь не хардкорный вариант оптимизации с применением MMX/SSE инструкций. Хотя даже с таким вариантом проблем, при знании ассемблера, не будет. Почему делать этого не следует? Что же тогда следует делать? Годами мусолить распознавание, а потом вдруг окажется, что капчи давно умерли и никому это распознавание даром не нужно? И опять-таки, вы не ответили на мой вопрос!
[Ответ][Цитата]
гость
89.208.11.*
На: Распознавание символов
Добавлено: 16 мар 08 17:43
если бы вопрос распознавания образов был решен методологически, проблем с распознаванием бы не было...
понимаете, совсем не было...ни с каким его подвидом. И каптчи бы исчезли...
однако, эта проблема не решена в общем виде (я естесственно не в счет). так что не надо ля ля...


и почему годами? я решил эту проблему за 2 месяца.
[Ответ][Цитата]
гость
208.72.168.*
На: Распознавание символов
Добавлено: 16 мар 08 19:38
А зачем её решать в общем виде, если при частном подходе ломаются большинство каптч? Те, что являются сложными (gmail, hotmail, т.д.) решаются также частным способом. Вполне успешно решаются и люди получают за них деньги. Здесь на форуме есть пользователь Alarm, мы с ним вместе работали над распознаванием и созданием универсального движка для подавляющего большинства текстовых капч. Отнюдь, ля-ля я не даю, но вот так называемый общий ваш подход у нас материализовался в рабочую программу, в которой 6 разных алгоритмов сегментации, для того большинства капч. Само распознавание по сути ничего не значит - главное это правильно сегментировать картинку. Проблему как раз составляют сложные варианты, но и их можно до ума довести теми же частностями. Вот из всех этих частностей, вполне вероятно, что какую-то методику вывести и можно, только нафига - непонятно. Научная проблема распознавания гораздо глубже и зиждется впервую очередь на гипотезах, а не механике...
[Ответ][Цитата]
гость
89.208.11.*
На: Распознавание символов
Добавлено: 16 мар 08 21:14
вот именно на гипотезах, рожденных при обобщениях, анализируя и сравнивая множество факторов.
Я именно это и сделал...
[Ответ][Цитата]
 Стр.7 (8)1  ...  3  4  5  6  [7]  8<< < Пред. | След. > >>