GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.11 (18)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Распознование текста
гость
89.208.11.*
На: Распознование текста
Добавлено: 24 янв 08 19:08
[QUOTE=юни;2837991]Откуда она берётся? Где источник?"
в семантическом смысле, который имеет вид записи мыслеформы, конечно. (используя упомянутую структуру БД, хе-хе)
"Что значит "по умолчанию"?"
не понимаете смысла слов?
по умолчанию, значит безусловно, т.е. информация введена в систему при ее построении извне, конструктором системы.
"Кто создал эти критерии"
схемотехник, разработчик процессоров, создатель непосредственных чипов.
", на базе чего, по каким законам и алгоритмам?"
на базе булевых функций: ХОР
00=0
01=1
10=1
11=0
а мог бы и наоборот
00=1
01=0
10=0
11=1
а сама операция ХОР сравнивает сигнал на одном входе относительно сигнала на другом входе по умолчнию.
и это уже не зависит от разработчика, логику как систему функций придумал не разработчик процессоров, и даже не Буль. читайте тему про логику.
"Что такое вообще "аналитическая система"?"
система, выполняющая анализ, сравнение чего то с чем то с некой целью.
"Ещё раз - кто решает, что единички безошибочно описывают именно символ? Вы заранее знаете, что так и будет? Или опять перебором?"
ну у нас же есть шаблонная матрица. в ней уже все представлено. Или вы до сих пор не можете понять, что такое шаблонная матрица с символом внутри, отрисованный черными пикселами на белом фоне? черные пикселы-единицы, белые пикселы-нули.
"Опять нету переходной точки, Вы её теряете. "
это вы ее н там ищете.
"Априори даёте, что к этой стадии помехи отделены, и есть что сравнивать - но этого не произошло."
это произошло в вашей голове, а потом записалось в виде весовых коэффициентов соответствия.
"В реальности, произвольному набору точек, схожих по непонятно каким критериям"
очень понятно
",... задан флаг "истинно", а другому произвольному набору - флаг "ложно""
почему произвольному? работаем с шаблоном, критерии истинности устанавливаем для уже известного символа в матрице шаблона.
", причём нет даже намёка на решение проблемы возможного пересечения этих двух множеств, по части совпадающих критериев."
Ну почему?
пример с 1 и i описывает работу со схожими кластерами в середине символов.
"Но Вам уже нетерпится перейти к разделению "матрица - выделенный из матрицы символ", так и не решив проблему первоначального отсева шумов."
я ее решил, это вы никак не въедите почемуто.
проблема решена именно в тот момент, когда мы смотря на шаблон, заносим в категорию "шум" всякую лишнюю или отсутствующую 1 в соответствующей части каптчи.
вы этого не понимаете да?
вы хотите избавиться от шумов на каптче, а от них нужно избавляться на шаблоне, экий вы тормознутый, однако.
[
Ответ
][
Цитата
]
Alarm
Сообщений: 24
На: Распознование текста
Добавлено: 24 янв 08 22:05
Эх, надеюсь не обижу, но заставлю задуматься. Сначала в шуточной форме. Пишите дальше, Евгений. Если бы вы это начали делать ранее и я имел возможность дать это всё почитать некоторым людям... Конкурентов бы у меня вообще не было. А теперь серьёзно. В целом, хочется сказать, что я не хочу и не могу критиковать ваши идеи последние - ибо не понимаю их описания. Вполне вероятно, что вы придумали что-то действительно революционное и абсолютно новаторское, вот только очень-очень сложно это будет реализовать. Чтобы что-то сделать нужно будет дать чёткое ТЗ работнику... Учитывая, что гениев очень мало, а, предположим, что вы таковым и являетесь, то вероятность появления другого гения, только в программировании, рядом с вами - практически нулевая. И ещё - очень бы хотелось увидеть дискуссию без ругани. Всё же не дети-геймеры здесь собрались, как я понимаю? Всем хорошего настроения
added
P.S. Кстати по поводу мусора... Очень полезно понаблюдать за самим собой, когда, например, распознаете капчу хотмейла... Иными словами - ложки не существует
(с) Матрица
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 24 янв 08 23:13
"то вероятность появления другого гения, только в программировании, рядом с вами - практически нулевая."
есть такой человек...и он мой друг. я считаю его гением в программировании.
но проблема в том, что он не понимает меня больше всех. гы-гы.
собсно, так и должно быть...
[
Ответ
][
Цитата
]
daner
Сообщений: 4605
На: Распознование текста
Добавлено: 24 янв 08 23:48
"но проблема в том, что он не понимает меня больше всех"
Ну значит он и правда не такой уж дурак!
[
Ответ
][
Цитата
]
Corwin
Сообщений: 1324
На: Распознование текста
Добавлено: 25 янв 08 2:58
>то вероятность появления другого гения, только в программировании, рядом с вами - практически нулевая.
Действительно. Я ни одного такого программиста не знаю. Наверное он должен бегать с бубном вокруг компьютера, при этом что-то напевая
Вымерший вид программистов однако....
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 25 янв 08 9:08
поправка:
после выделения объекта в каптче, преобразовывать (поворачивать) объект и приводить его в горизонтальное положение в этой матрице НЕЛЬЗЯ. Следует только выяснить угол поворота и применить его к шаблону, т.е. крутить надо шаблон!
Интересно и выделение самих объектов:
Человек, прежде чем выделить объект, ЗНАЕТ, что нужно выделять в общих чертах.
Это легко можно подтвердить экспериментально, наблюдая за выделением простых, а затем и сложных объяетов: крест, звезда давида, более сложные симметричные фигуры, где мозг выделяет сначала одну палку в иксе, потом один треугольник в звезде давида и т. далее. В этих опытах возникают достаточно интересные эффекты, позволяющие судить об алгоритме выделения объектов человеком. Связь между пониманием, что ищем, с алгоритмом выделения ОЧЕВИДНА. позже распишу более подробно.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 25 янв 08 9:09
по поводу программиста
судьба не лишена иронии...(с) морфиус
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 25 янв 08 9:45
вот когда вы напишете скрипт идентификации компьютера пользователя для IE, сохраняющий работоспособность при наивысшем уровне выставленной в браузере конфеденции, при этом не используя активХ, дырок в ОС и пр. туфту, вызывающую сообщение безопасности, и сохраняющие куку при стандартном их обнулении в браузере. Вот тогда и сравним вас Корвин с тем программистом, которого я имею в виду.
Для справки: JS блокируется при высоком уровне конфиденции.
Лично я давал это задание в виде теста, при подборе программистов на проект. Не справился НИКТО...даже крупные конторы не справились. Выбор происходил среди десятков частных и юридических лиц. Присылали в основном туфту.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 25 янв 08 13:14
выделение объекта:
исходными данными следует считать цель поиска.
в катче мы ищем символы. Следовательно, нужно обозначить общие признаки текста:
размер объектов, толщина линий, количество объектов.
Все эти характеристики либо определяются с некоторой точностью, либо известны заранее с некоторой точностью. Четкие пределы увеличивают степень распознавания образа в целом.
Исходную матрицу каптчи следует просканировать попиксельно и выделить эти общие признаки из всех данных, кроме количества символов (мы его знаем точно. Рассмотрение варианта, когда это не известно, рассмотрим позже)
Определение толщины линии здесь уже описывалось. Рассмотрим определение размера объекта (кегля).
Для этого воспользуемся плавающим окном матрицы, превышающее размерность толщины линии на 10% и запустим скан уже не попиксельно, а покластерно, перемещая окно по диагонали с шагом, равным толщине линии, а затем по столбцам с тем же шагом.
После сканирования, по краям сетки пересечения с указанным шагом, имеем зоны перекрытия.
Эти зоны будут буферизироваться в памяти и участвовать в алгоритме распознавания границ объектов.
10% зона перекрытия нужна для выделения объектов каптчи, которые заходят друг за друга (каптча яндекс). По идее, каптча, выполненная в стиле графити, требует зону перекрытия до 40%, дальше уже графити с перекрытием 50% и человек хрен разберет.
Сканирование осуществляется методом последовательного приближения. Сначала вся матрица сканируется с шагом, равным толщине линии вдоль и поперек, а потом по итогам весов, относящихся к степени центровки окна на части символа, шаг сканирования уменьшается вдвое, затем еще вдвое и до предела (1 пиксел). Таким образом, окно четко фиксирует часть объекта в себе и фиксируются координаты этого кластера и размер окна.
Если объект не шрифт и у него нет такого понятия, как ширина линий, то по умолчанию, последовательное приближение начинается с максимального размера матриц из имеющихся в БД.
Далее, осуществляется поиск соответствия того, что находится в окне с соответствующими по размеру шаблонами. Если совпадений с достаточными весами не находится, осуществляется поворот шаблонных матриц также по методу обратного последовательного приближения, т.е. сначала не на 180, потом 90 град, потом на 45, потом на 24 и т.д, а в обратной последовательности. пока не отыщется наибольшее множество подходящих матриц соответствующего угла наклона. Это и есть весовой коэффициент наклона.
Все выделенные фрагменты с соответствующим углом поворота шаблонов взвешиваются и определяется среднее арифметическое этого угла по отношению к вертикальному. Таким образом, каждый выделенный целый объект (символ) имеет четкое значение угла поворота, которое примениться ко всем шаблонам при дальнейшем распознавании как описывалось в топике.
если угол поворота целого объекта по весам определить не удалось (т.е. веса при повороте оказываются одинаковыми), значит объект считается круглым и остается в исходном виде., при этом классе точности, при ЧБ и при бинарном контрасте. Цветные объекты значительно увеличивают сложность этого алгоритма, поскольку поворот пикселов будет менять веса, не совпадая или совпадая с шаблонными пикселами по цвету.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 25 янв 08 15:44
поправка.
при выделении объекта, сканирование окном, производится не по всей каптче вдоль и поперек, а от центра, двигаясь по вектору, найденного по максимальным весовым значениям внутри окна по его краям. Т.е. если соответствие в нижней части окна больше, то вектор перемещения окна показывает, что окно переместиться вниз. Как только веса резко падают (что говорит о границе объекта или его фрагмента), окно возвращается в исходную точку и следующий вектор соответствует более низкому весу в одном из 3-х оставшихся направлений. После последнего кластера, окноперепрыгивает через шаг и направление определяет уже вес одного из 12 степеней свободы.
Таким образом, в общем случае, поиск границ объектов и определение целого в рамках всей каптчи, происходит последовательно, а не параллельно, как ранее предполагалось.
Основанием для этй существенной поправки явилось дальнейшее индуктивное представление о реализации по старой методике выделения сложных объектов разных форм и дальнейший синтез из них макрообъектов, (например лицо). Эта ветвь оказалась тупиковой (неспособность работы с макрообъектами. требуется слишком большая вычислительная сложность).
Подтверждением неправильности методики стал анализ человеческого синтеза макрообъектов (пейзажей, к примеру), где очевидным образом, общее мнение о смысле картины складывается при помощи анализа всех объектов по отдельности и последовательно, с последующим анализом уже связей между выделенными объектами.
Скажем так, предполагаемый ранее вариант, характерен для математического склада ума, отличающийся паралелизмом алгоритмов и анализа всех объектов картины одновременно. Такую методику следовало бы оставить для моделирования ИИ именно с математической понятийной структурой.
Там тупик, поскольку распознавание целого резко теряет КПД на макрообъектах, поскольку невозможно применить фильтры смыслового контекста (как в случае доп. возможностей определить букву по смыслу контекста в книге), но зато там есть и другие преимущества: скорость, увеличение КПД распознавания при работе с маленькими матрицами, за счет применения закономерностей и математических фильтров. Смысловой контекст при обработке не может быть использован. эти алгоритмы взаимоисключающие.
В подтверждение к поправке, обращаем внимание на статистические данные:
Математики не видят в картине всего смыслового содержания и не получают от живописи всего пакета ощущений. Это известный факт. Теперь он получил достойное объяснение в ходе проработки методики распознавания образов и сравнительном анализе обоих методик.
Круто.
кто не въехал я не виноват.
вот так ребята и делаются методики...
[
Ответ
][
Цитата
]
daner
Сообщений: 4605
На: Распознование текста
Добавлено: 25 янв 08 16:40
Цитата:
Автор: гость
Круто.
кто не въехал я не виноват.
вот так ребята и делаются методики...
[
Ответ
][
Цитата
]
Alarm
Сообщений: 24
На: Распознование текста
Добавлено: 29 янв 08 9:41
Интересно, ваша идея, Евгений, позволит полностью (или хотя бы с 80% вероятностью) определить все символы на капчах из архива
http://rapidshare.com/files/87468832/hard8_test10.rar.html
? Если да, то каким образом? По-подробней, пожалуйста. Мне до гения, как Бушу до Шанхая пешком, но чем чёрт не шутит, а вдруг получится
P.S. Пароль на архив 0987654321
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 29 янв 08 13:11
с вероятностью в 99%
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 29 янв 08 13:14
стучите, 432-722-890
[
Ответ
][
Цитата
]
гость
91.77.152.*
На: Распознование текста
Добавлено: 06 фев 08 23:43
Я чего то упустил в этом мире? Лет десять уже проблем с распознаванием текста вроде вообще нет. Или просто важно сделать свой собственный велосипед?
[
Ответ
][
Цитата
]
Стр.11 (18)
:
1
...
7
8
9
10
[11]
12
13
14
15
...
18
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net