GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.6 (18)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Распознование текста
Алхимик
Сообщений: 315
На: Распознование текста
Добавлено: 16 янв 08 10:24
Я все больше убеждаюсь, что с г. Тарасовым мы на разных языках разговариваем, хотя врооде оба русских.
Цитата:
Автор: гость
Скромно назову этот метод революционным в распознавании образов.
Мне интересно, а как будет по вашему этот метод называться, если отбросить "ложную скромность"?
И как будет называться, если "слегка приукрасить"?
ps. Вот еще один вариант ответа на мой же вопрос, почему на Тарасова не обижаются: Во всех королевствах шутам дозволялось говорить все. И не важно, настоящими дураками они были, или умело притворялись. Евгений так часто велелит меня, что ему дозволяется говорить все.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 10:33
аналогов этой методике нет, если вы решили что есть, значит вы не поняли ее. В любом случае, ваше недоверие исходит не от того, что вы готовы предоставить ссылку на аналогичный метод, а потому, что в принципе не верите в то, что я что то новое открыл.
Но меня это мало интересует. А вам следовало бы привести такую ссылку, если вы не хотите выглядеть голословным.
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 16 янв 08 14:50
Да нет никаких ссылок
это
сильно тривиально
на самом деле.
Все векторные алгоритмы так или иначе работают именно с такой структурой, только не обзывают это так как вы.
А скажите г.Тарасов, что для вас "семантическое дерево", ну или "семантический граф" (кстати, вы разницу знаете?)
Приведите, пример из двух-трёх отрезков (ну скажем для букв D,O,T. буквы специально даю именно эти), вашей структуры.
. Вот и будет о чем говорить
.
А то "революционный", "если его таким не считаете, значит не поняли".
Вы на языке нормальных людей алгоритм напишите и тогда все станет ясно, кто и что именно понял
.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 15:24
вы совершенно не о том говорите. т.е. вы вообще ничего из сказанного не поняли. соответственно "тривиальность" неуместна.
между буквами D J Т, равно как и между всеми всеми остальными нет и не может быть графических векторов.
"вашей структуры"???? это в вашей воспаленной голове такие структуры, не приписывайте их мне.
Графические векторы это как бы кванты смысла, связывающие пиксел или кластер из них с готовым стандартизированным шаблоном, в виде соответствующей части цифрового шрифта того же кегля, в данном случае. Причем координаты этого тега должны располагаться в той же части матрицы, что и исходного шаблона.
Именно это и дает уникальную возможность идентификации, потому что нижняя закорючка J (как кластер)должна быть в нижней части матрицы. Именно это свойство и фиксируется тегом.
Т.е. свойства кластеров, классифицируется таким образом на множество подклассов:
в какую именно сторону смотрит закорючка геометрически по отношению к матрице шаблона, в какой именно части матрицы она находиться, какой коэффициент заполнения (это позволяет даже определять КАКИМ ИМЕННО ШРИФТОМ написан символ! не то, чтобы распознать его самого).
И вы говорите о тривиальности? Да вы просто чайник, делающий космичесие глупости космического ж масштаба. Вы откровенный бездарь, пытающийся указать мне на то, что в этом подходе нет ничего нового.
Сами по себе подходы эти применяются по отдельности, но бессистемно.
Основное то мое предложение вовсе даже не в этих тегах, а в том, что сами эти теги во всем своем многообразии оказываются систематизированными и представляют собой ту же древовидную структуру по типу семантической, т.е. крючки в одном каталоге на ветви этого дерева, точки в другом каталоге, углы в следующем каталоге и все эти каталоги находятся в папке "шрифт тайм нью ромманс", который в своюочередь входит в подкаталог шрифты, а тот в другой, более общий каталог...
Семантические теги могут быть только для отдельных гласных, которые имеют смысл, восклицания, например.
А вообще, понятия семантического дерева подробно рассмотрено на примерах в другой теме на этом форуме, посвященной записи мыслеформы в виде последовательности координат.
Подобные методики уникальны.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 17:08
"Приведи хотя бы один пример твоей "МАТРИЦЫ" Где у нее нижняя часть?
Где верхняя? Как записываются координаты???
как записываются координаты?
А ты видел в тексте фразу про построчный сканер?
А он как раз для того, чтобы связать понятия начала матрицы и конца, соответственно верха и низа в соответствии с тем оригинальным расположением, которое имеется и которое имеется в шаблоне. Это координатная привязка обоих объектов к одной системе координат, к координатам матрицы шаблона.
координаты соответственно записываются в строчку.
для матрицы 16/9 верхняя строка в 1-16 пикселей образует верх матрицы, а последние 128-144 пикселей это нижняя грань матрицы.
Т.е. координаты должны записываться в той последовательности, в которой происходит их сканирование, иначе потом будут проблемы с навигационным поиском по БД.
[
Ответ
][
Цитата
]
Alarm
Сообщений: 24
На: Распознование текста
Добавлено: 16 янв 08 19:54
Автор постов про хомтейл-капчу.
daner
Извиняюсь, насчёт "гостя", мне это не доставляло сильных неудобств, посему даже не задумывался. Насчёт всего остального - я согласен с вами, просто до недавнего времени у меня не стояла задача обсуждать мои разработки, сейчас же стало интересно пообщаться с людьми, знания которых хорошо структуированы. По мере возможностей буду наверстывать упущенное.
Гость, он же, как я понял, г-н Тарасов
По поводу графического тега. Если я правильно вас понял, то что вы предлагаете имеет прямую аналогию с векторными системами из k составляющих (векторов), имеющих n общих параметров из m возможных (при k {2..n-1}, n << m)? Надеюсь не криво сказал
Вобщем, если это так, то ничего революционного я не вижу - все будет сводиться к тому же векторному анализу, вероятно более быстрому (из-за уменьшения количества анализируемых структур, хотя не факт, что это ускорение будет возможно в конкретной реализации). Если я верно помню реализацию Corwin, то это будет напоминать его семантическую сеть из точек (Corwin, я не ошибаюсь?). Но даже не учитывая этой работы, революции здесь нет, это, по-моему, базовый подход к проблеме распознавания в векторных движках (кстати, при должнем уровне качества работы, нормальный векторный движок также позволяет понять какой именно шрифт используется, ещё на этапе анализа). К сожалению, дальше первого поста я не читал ваших рассуждений, вероятно, мне не хватает знаний, либо я глуп, но я не понимаю ваш слог, отчего у меня начинает болеть голова
Если что-то понял не так, не серчайте.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 20:46
"По поводу графического тега. Если я правильно вас понял, то что вы предлагаете имеет прямую аналогию с векторными системами из k составляющих (векторов), имеющих n общих параметров из m возможных (при k {2..n-1}, n << m)? "
вы поняли только принцип, который является классическим и не поняли саму идею тегов, потому что не представляете себе устройство семантических тегов и их роль в образовании смысловой конструкции фраз и записи ее смыслового значения. Речь идет о манипуляции смысловыми конструкциями при помощи тегов, а не морфологическом.
Такая технология только у меня.
Распознавание текста, при помощи морфологии на порядок хуже, чем при разборе смысла фраз.
Распознавание образов по приведенному вами классическому способу без тегов, так же не эффективна, потому что это тот же по сути "морфологический разбор" а не смысловой.
речь не о том, что сравниваются соответствующие множества, а о том, что сами теги можно структурировать используя совершенно другую координатную систему, отличную от тех матриц, к которым они ведут, и это позволяет сделать СМЫСЛОВУЮ ЗАПИСЬ графического образа понимаете? Именно смысловую, т.е. что именно означает эта картинка, ее смысловое наполнение. И эта запись существует уже не в виде привычного комментария к картинке "фонарный столб", а в виде соответствующего этому образу уникального цифрового кода. Т.е. если вы возьмете 2 таких электронных образа разных фонарных столбов, и присвоите им один и тот же семантический тег, то машина отличит один столб от другого по этому образу.
Т.е. из всех фотографий Василиев Сидоровых, вы отыщите именно ту рожу, которую вам нужно, совместив поиск с качественными данными о нужном вам Василии, потому что в образе будет доступен поиск и можно будет проанализировав электронный образ, узнать, старый Василий или молодой, к примеру. Т.е. при структуризации тегов, возможен поиск отдельных свойств изображения по запросу.
И естесственно, это факт дает чудовищьный рывок при распознавании образов, делая задачу капчи в частности, тривиальной процедурой, почти со 100% результатом.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 22:45
голова болит именно потому, что такие понятия, как "смысл" вы не можете четко себе представить.
смысл, это информация заключенная в форму. Получается что информация модулируется формой. Т.е. смысл, это информация в информации.
Если модулирование не производить, то смысл, как понятие ИСЧЕЗНЕТ.
например, возьмем буквы Д У Р А К, и произнесем их в указанной последовательности, но с часовыми интервалами между собой.
Такого шаблона у нормалного человека нет, он не сможет найти взаимосвязь между буквами, если его не предупредить. Получается, что информацию он получил поностью в виде букв, а смысла не получил, т.е. для этого человека буквы оказались непромодулированными по форме. Он не нашел форму, это равносильно, что ее для него нет.
человек понимает смысл чего либо, как сравнение поступающей формализированной информации с имеющимся у него шаблоном.
например, слово "дурак", формализовано (модулировано) порядком расположения букв, ударением, интонацией, все это различные формы модуляции, которые соответствуют соответствующим шаблонам.
Мозг все время выполняет задачу распознавания образов, когда воспринимает поток данных и с помощью фильтров выделяет ту, которая имеет смысл.
например, если выразительно и с интонацией произнести слово "угнке", то некоторые формы совпадут, а смысла самого слова не будет, и придется его моделировать по контексту.
Т.е. содержание, смысловое значение слова, содержится в формах, в которых присутствуют буквы. Буквы могут быть те же, а формы разные, уже другой язык получиться. Т.е. буквы, ами по себе ничего не значат, они имеют только одно важное свойство-они все разные, т.е. их можно друг от друга отличить. На смысл это не влияет НИКАК. Поэтому морфологический разбор (по буквам) СМЫСЛА НЕ СОДЕРЖИТ поопределению.
Смысл находится в форме, которой промодулированы эти буквы.
Сами понимаете, что для того, чтобы записать этот смысл, нужно записать не что иное, как алгоритм модуляции, т.е. записать ее форму, причем в порядке, обратном кодированию.
Именно эту задачу и решает моя методика записи мыслеформ.
Так вот примерно то же самое делается и с графическими образами, смысл в которых также заключен не в самих пикселах, а в структуре их расположения, т.е в форме.
Чтобы эту структуру вытащить из картинки, необходимо делать то, что я предложил. Ясно?
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 16 янв 08 22:57
Мысль-это еще одна модуляция, модулируется уже сами слова по отдельности. Т.е. модуляция происходит уже не букв (у которых смысла нет), а слов (у которых уже есть смысл). Такая конструкция из нескольких слов, т.е. фраза, также имеет соответствующий алгоритм записи, которая называется ЗАПИСЬ МЫСЛЕФОРМЫ.
Мыслительный процесс, есть логические манипуляции с этими мыслеформами.
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 16 янв 08 22:58
Надо же, уже и проценты оценили
. забавный вы малый.
Да и я и Alarm (и скорее всего все остальные) вас прекрасно поняли.
Я вас попросил привести пример для O, D, T. И не между ними связь, а по отдельности.
Что-то, от вас ответа не последовало!!! А только продолжение демагогии, об вашей уникальности.
Вы что, не в состоянии предметно разговаривать?
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 17 янв 08 17:51
с вами нет смысла разговаривать предметно, потому что вы даже вопрос не можете предметно задать. посмотрите на ваш вопрос...
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 17 янв 08 18:54
Цитата:
Автор: гость
с вами нет смысла разговаривать предметно, потому что вы даже вопрос не можете предметно задать. посмотрите на ваш вопрос...
Да уж куда предметнее?
попросил вас конкретные примеры привести, для конкретных 3-ех букв, а вы вот начинаете отмазываться.
слабо с примерами-то?
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 17 янв 08 20:37
вопрос не корректен. а примеры и так приведены в общем виде. Вы хотите частных примеров.
Но я говорил о методике, а не о примерах, хотя пример в данном случае, привести сложно, нужно код писать. А в общем виде вас не устраивает. Методика, это и есть общее представление. Я привел ИМЕННО МЕТОДИКУ.
Вы никак не врубитесь как работает дедуктивное мышление. От методики идут к алгоритму, а не наоборот балбес. (от общего к частному. Т.е. конкретный алгоритм неизвестен еще по определению!!!!). Это ваша тупая голова в состоянии промыслить?
ваша же позиция приемлет только индуктивный метод и вы требуете сначала привести код, потом объяснить зачем он нужен и саму методику по всему этому вам объяснить.
Да вы просто ограниченный человек, тупой чайник, что с вас взять.
Не признавать дедуктивную методику познания мира, это так же тупо, как отрицать законы логики. Тем более печально, что самообучающиеся алгоритмы ИИ как раз и используют дедуктивную методику для добавления в БД понятий, которых раньше не было (так же как и человек, собсно). Поэтому вам НИКОГДА даже на чуть чуть не приблизиться к пониманию этих алгоритмов. Вы просто не умеете так мыслить.
Я думаю, смог бы объяснить вам и конкретику, мне кажется, что я уже способен детализировать на алгоритмическом уровне конкретно эту задачу, но пока не считаю нужным этого делать.
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознование текста
Добавлено: 17 янв 08 21:29
хамлоооо!!!
А я алгоритм у вас не просил. Я просил пример структуры привести, для конкретных знаков.
Вы это сделать не можете, а я почему-то балбес?
забавно.
Я с самого начала сказал, что ваша методика настолько общая, что толку в ней НОЛЬ, и абсолютно ничего нового.
И перестаньте всюду пихать умные слова типа "дедукция" не понимая их смысла!
П.С.
кстати, а что именно "не корректного" в моей просьбе/вопросе? Наверное то, что он заставляет вас сказать "не знаю"? Судя по всему, для вас это ооочень "не корректно"
.
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознование текста
Добавлено: 17 янв 08 21:50
"Я просил пример структуры привести, для конкретных знаков."
структура попиксельная.
что тут непонятного? берется матрица, в ней точками рисуется символ. Если вы спрашивали про это, то вот вам ответ. Это классический способ отображения объекта в матрице. Я его не придумывал.
"Я с самого начала сказал, что ваша методика настолько общая, что толку в ней НОЛЬ, и абсолютно ничего нового."
если вы не видите нового, это не значит, что его нет. Я указывал что конкретно является новым, вы даже этого не поняли.
"И перестаньте всюду пихать умные слова типа "дедукция" не понимая их смысла!"
дедукция, это методика поиска истины путем выявления общих признаков для частностей используя факт абсолютного детерменизма.
Если бы мир не был детерменирован, этой методики не могло бы существовать.
Не знать этого-позор.
П.С.
кстати, а что именно "не корректного" в моей просьбе/вопросе? Наверное то, что он заставляет вас сказать "не знаю"? Судя по всему, для вас это ооочень "не корректно"
я знаю, но могу допустить ошибку. Я приведу описание тогда, когда оно примет еще более структурированный вид и будет затрагивать еще более глубокие частные вопросы..
[
Ответ
][
Цитата
]
Стр.6 (18)
:
1
2
3
4
5
[6]
7
8
9
10
...
18
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net