GotAI.NET
Форум: Проблемы искусственного интеллекта
Регистрация
|
Вход
Все темы
|
Новая тема
Стр.4 (14)
<<
< Пред.
|
След. >
>>
Поиск:
Автор
Тема: На: Распознавание смысла
Юрий Федорченко
Сообщений: 119
На: Распознавание смысла
Добавлено: 03 сен 08 14:34
Я вот подумал - а ведь уже есть какой-то практический результат! С помощью того что я описывал, мы можем найти одинаковые текста, которые написанны разными словами, переписанные сказки. Например есть народная сказка и литературная. Думаю с неплохой точностью можно будет определить что это одно и то же. Так как графики должны более-менее совпадать. И кстати, не важно на каком языке написана сказка, и какого объема два образца (например, одна из них - сокращенная версия).
Интересно, можно ли это использовать к своей выгоде, при распознавании?
Например, у нас есть база сказок. Если мы видим, что графики очень похожи, хотя бы на каком-то участке, то, возможно совпадают и микроо-сюжеты. Нужно найти только, правила проверки, чтобы подтврдить или опровергнуть гипотезу.
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознавание смысла
Добавлено: 03 сен 08 14:53
Цитата:
Автор: Юрий Федорченко
Я вот подумал - а ведь уже есть какой-то практический результат! С помощью того что я описывал, мы можем найти одинаковые текста, которые написанны разными словами, переписанные сказки. Например есть народная сказка и литературная. Думаю с неплохой точностью можно будет определить что это одно и то же. Так как графики должны более-менее совпадать. И кстати, не важно на каком языке написана сказка, и какого объема два образца (например, одна из них - сокращенная версия).
Интересно, можно ли это использовать к своей выгоде, при распознавании?
это всего лишь тезис. Не надо делать тезисы, а после начинать их обсуждать так как будто они уже доказаны. Докажите ваше предположение, тогда и будет о чем говорить.
[
Ответ
][
Цитата
]
Юрий Федорченко
Сообщений: 119
На: Распознавание смысла
Добавлено: 03 сен 08 14:58
Цитата:
Автор: daner
Докажите ваше предположение, тогда и будет о чем говорить.
Для этого нужно написать программу, а мне еще далеко не все ясно, с тем, как ее писать. Еще есть большие пробелы. А что, можно обсуждать только готовые и доказанные проекты?
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознавание смысла
Добавлено: 03 сен 08 16:07
Цитата:
Автор: Юрий Федорченко
Для этого нужно написать программу, а мне еще далеко не все ясно, с тем, как ее писать. Еще есть большие пробелы. А что, можно обсуждать только готовые и доказанные проекты?
строить дальнейшие предположения лучше на доказанных (хотя бы эмпирически) фактах. А то одно предположение накапливается на другом и в конце получается одна большая демагогия где уже не найдешь ни концов ни краев.
[
Ответ
][
Цитата
]
Юрий Федорченко
Сообщений: 119
На: Распознавание смысла
Добавлено: 04 сен 08 21:18
Цитата:
Автор: daner
это всего лишь тезис. Не надо делать тезисы, а после начинать их обсуждать так как будто они уже доказаны. Докажите ваше предположение, тогда и будет о чем говорить.
А что нужно доказывать? То, что графики будут совпадать?
Во-первых имена главных героев в разных переводах будут распределены по тексту одинаково. Если имя Петр исчезает в русском переводе, на половине текста, то и во французском переводе оно исчезнет на половине текста и в любом другом переводе. А так как в книге вообще-то множество героев, и упоминаются они каждый раз по разному, то и график для каждой книги будет уникальный.
Кроме того, если один из документов, сокращенная версия, все равно имя Петр исчезнет на половине книги. А если имя Кузьма, присутствует вначале книги, потом на долго исчезает и появляется под конец, то это не может не отразиться и в сокращенной версии. А за счет того, что графики распределения имен уникальны, даже не важно как зовут персонажей.
--------
И потом - при переходе к новой сцне, автор вводит массово новые персонажи, обстановку, новые события. Это надо доказывать? Ну представте, автор описывает что некто иван с друзьями играет в баскетбол. Будут фигурировать постоянно слова - мяч, кольцо, бросок, пасс, 3 очка и т.д. Потом, герой идет домой и делает уроки. Тут уже идут новые термины - учебник, уроки, ручка, тетрадь, писал. и т.д. и т.д.
Ну и мы просто берем делаем графики каждого второго слова в тексте (кроме общеупотребительных) и смотрим, что в некоторых участках идет массово всплеск частот. То есть вдруг
массово появляются новые термины, а те которые только что были на пике - угасают
. То есть чем дальше от сцены с баскетболом, тем меньше упоминаний об этом событии, что отражается на графике. В связи с этим, мы во-первых можем разбить книгу на сцены, а во-вторых - использовать этот график для поиска этого текста на другом языке или в сокращенной версии, например.
Если это не является доказательством, то как тогда доказать? Что для этого нужно сделать? Показать на конкретном примере текста? Построить математические модели?
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознавание смысла
Добавлено: 05 сен 08 0:26
Новые термины появляются... это сильно звучит, но сложно отслеживается. С более конкретными терминами интереснее (т.е. с именами).
Доказывать можно по разному (иногда такие результаты получаются, что и не ожидал). Так что пока у вас строкой модели нет, где такое совпадение имен можно доказать, проще всего на экспериментах (но с очень большим кол-вом книг).
Проверять надо будет сколько раз система ошиблась, сколько раз угадала и т.д. Переводы все-равно не дословно. Совсем интереснее с плагиатом. когда имена разные... тут уже совсем не тривиально и т.д.
КАк я уже сказал, мне лично эта тема не интересна.
Так что, сваливаю с этой темы (только так... буду иногда поглядывать)
[
Ответ
][
Цитата
]
Юрий Федорченко
Сообщений: 119
На: Распознавание смысла
Добавлено: 05 сен 08 1:28
Ну все - пошел писать код.
Кстати, интересно что проверить на очень большом количестве книг не проблема. Даем на вход книгу, программа составляет уникальный график для нее, проверяет нет ли в базе похожего графика, и сохраняет его где-то. При повторном "прочтении", программа заново строит график и проверяет нет ли похожего (плагиата), или точного совпадения: о, есть!
Вручную ничего не придется делать вообще.
[
Ответ
][
Цитата
]
daner
Сообщений: 4633
На: Распознавание смысла
Добавлено: 05 сен 08 1:45
Цитата:
Автор: Юрий Федорченко
Ну все - пошел писать код.
Кстати, интересно что проверить на очень большом количестве книг не проблема. Даем на вход книгу, программа составляет уникальный график для нее, проверяет нет ли в базе похожего графика, и сохраняет его где-то. При повторном "прочтении", программа заново строит график и проверяет нет ли похожего (плагиата), или точного совпадения: о, есть!
Вручную ничего не придется делать вообще.
неужели были какие-то другие варианты?
[
Ответ
][
Цитата
]
tommycknocker
Сообщений: 1
На: Распознавание смысла
Добавлено: 07 мар 09 21:03
понравился ваш текст. вы исходите из посылок, которые мне близки.
сначала наверно самое интересное - в чём ошиблись.
2 утверждения, характеризующих человечество:
а)на земле всего 4 расы людей.
б)на земле все люди всего 2х полов.
ваше утверждение про ограниченность сюжетов - то же что а), только информационных действий больше чем людей на много порядков. и рас по сути не существует - внутри расы разнообразие генов в сотни раз больше чем отличия усреднёно между расами.
имеют смысл лишь смысловые проекции типа б) - есть причины и следствия и чёткая граница.
вообще смысловых проекций бесконечность, и над ней нужно строить такое же смысловое пространство следующего порядка. если это будет в виде фракталов - суперкруто, можно свести к чемуто понимаемому...
мои мысли схожи. общение людей происходит в обыденной жизни часто по очень примитивным протоколам - привет, привет, как жись, да ничо, пить будеш, не откажусь...
линейная схема без вариаций. тут смысл нулевой.
[
Ответ
][
Цитата
]
e-Drew
Сообщений: 221
На: Распознавание смысла
Добавлено: 08 май 09 4:42
Цитата:
Автор: Юрий Федорченко
Ну все - пошел писать код.
Кстати, интересно что проверить на очень большом количестве книг не проблема. Даем на вход книгу, программа составляет уникальный график для нее, проверяет нет ли в базе похожего графика, и сохраняет его где-то. При повторном "прочтении", программа заново строит график и проверяет нет ли похожего (плагиата), или точного совпадения: о, есть!
Вручную ничего не придется делать вообще.
Итак.. что написано.. чем обогатились попутно кодироваию?
[
Ответ
][
Цитата
]
antol
Сообщений: 370
На: Распознавание смысла
Добавлено: 11 янв 10 13:49
Цитата:
автор: Юрий Федорченко
Откуда взялось 50 сюжетов?
На личном опыте все знают, что, например, разные фильмы, художественные книги (это относится и к жизни) имеют в целом, одинаковые сюжеты, или одинаковые части – микро-сюжеты. Так вот таких микро-сюжетов – 50. Это, конечно, не строгая классификация. Их можно разделить на подвиды, или объединить в более общие группы. Но 50, с моей точки зрения, наиболее оптимальное число – при этом, в процессе обобщения, не теряется важная информация, и с другой стороны, количество подвидов не разрастается до не контролируемых размеров.
Цитата:
автор: Андрей
А конкретнее? Я уже слышал об ограниченности числа сюжетов, но списка до сих пор не найдено.
Вот у меня, например, как ни кручу, всегда получается только два сюжета Либо кто-то что-то где-то берёт, либо кто-то что-то куда-то отдаёт. А если ещё хорошенько абстрагироваться, то вообще один сюжет получается: что-то управляет направлением движения чего-то.
Цитата:
автор: Андрей
Нету в уме никаких 50 сюжетов, есть только направления, в которых можно двигаться или не двигаться. Больше ничего.
Откуда взялось 50 сюжетов? Где наличествует список сюжетов?
На мой взгляд, число 50, для количества возможных сюжетов, очень велико.
Сюжетов меньше. Количество сюжетов, возможно, ограничено числом различающихся фонем конкретного естественного языка.
От себя, к сюжету Андрея - "дать-брать" и сюжету Юрия Федорченко - "дар", могу добавить сюжеты основанные на других полярных позициях:
"цель и ее реализация"; "противостояние личного и общественного"; "выбора: принятие и сохранение нового или отказа от него; взаимотношение полов; ...
[
Ответ
][
Цитата
]
Андрей
Сообщений: 3944
На: Распознавание смысла
Добавлено: 11 янв 10 20:55
Цитата:
Автор: antol
к сюжету Андрея - "дать-брать" и сюжету Юрия Федорченко - "дар", могу добавить сюжеты основанные на других полярных позициях:
"цель и ее реализация"; "противостояние личного и общественного"; "выбора: принятие и сохранение нового или отказа от него; взаимотношение полов;
Названные "дополнительные" сюжеты являются разными только на словах, если же углубиться в детали
взаимодействий
для конкретных примеров этих доп-сюжетов, то мы увидим один и тот же механизм (сюжет) - управление движением.
Юрий Федорченко - интересный собеседник, но, к сожалению, он забросил данный форум и вряд ли сюда вернётся.
[
Ответ
][
Цитата
]
Capt.Drew
Сообщений: 4179
На: Распознавание смысла
Добавлено: 11 янв 10 20:59
Я уж и тебя вычеркнул из моего большого доброго сердца.. типа злостный эггоист
[
Ответ
][
Цитата
]
Валентин
Сообщений: 4536
На: Распознавание смысла
Добавлено: 11 янв 10 22:19
Сюжет всегда один: "ОХОТНИК _ ЖЕРТВА"!
[
Ответ
][
Цитата
]
гость
89.208.11.*
На: Распознавание смысла
Добавлено: 11 янв 10 22:22
а при чем здесь распознавание смысла?
опыты и вектор идиотичны. уже ДАВНО ясен правильный (представьте себе), но идиоты форумлятся в пустое...
жаль их...
[
Ответ
][
Цитата
]
Стр.4 (14)
:
1
2
3
[4]
5
6
7
8
...
14
<<
< Пред.
|
След. >
>>
Главная
|
Материалы
|
Справочник
|
Гостевая книга
|
Форум
|
Ссылки
|
О сайте
Вопросы и замечания направляйте нам по
Copyright © 2001-2022, www.gotai.net