Всем привет!
Хочу рассказать о разработанной нами технологии. Около 5 лет я занимался теоретическими разработками искусственного интеллекта. В конце 2008 года мы приступили к реализации разработанного. В марте 2009 получили подтверждение жизнеспособности основных идей заложенных в механизм хранения информации. Ниже по тексту приведены ссылки для скачивания демо-версии - простого поисковика по текстовым документам, там же в архиве будет дано краткое описание технологии, философии и концепции заложенной в этот механизм. Программа под Linux (32 бит). Прошу не забывать что это всего-лишь демо-версия, никаких окошек, командная строка и хелп, только для демонстрации возможностей. Также к программе прилагаются текстовые файлы для тестирования – это разного рода энциклопедии и тексты. Никто не мешает использовать свои.
Сыылка для скачивания:
http://vrtp.ru/std/search.tgz Просто описание
http://vrtp.ru/std/doc.tgzОтмечу, что представленный проект, скорее всего, не имеет ничего общего ни с одной существующей поисковой технологией. В описании упоминается нейронная сеть, но называть это нейронной сетью будет не совсем верно, т.к. слишком много отличий от известных нейронных сетей. Но мы не найдя лучшей аналогии называем ее так.
Теперь главное, чего такого особенного мы сделали.
1. Поиск идет не по ключевым словам, а по смысло - содержащим предложениям и фразам.
2. Чем больше обучаешь сеть, тем выше качество поиска. При этом обучая сеть текстами по физике, улучшаешь качество поиска среди текстов по медицине.
3. У нас нет никаких словарей синонимов, нам не нужно приводить все буквы в тексте к нижнему регистру, и в конечном счете сети все равно на каком языке ее обучать. Мы не отметаем предлоги, все делает свой вклад в результат.
4. Программа устойчива к ошибкам, перестановкам букв, т.е. если к примеру написать слово «перевернулся» как «пеервенурлся», то программа его поймет вероятнее всего именно как «перевернулся» или словоформы этого глагола в зависимости от контекста.
5. Программа не создает индекс текстов, а создает базу понятий, образов и знаний. Т.е. хранящаяся информация о прочитанном никак не разделяется, а напротив дополняет другую.
6. Наверное, еще можно много написать, но не в этом цель.
7. Если загрузить в программу кучу медицинской литературы и энциклопедий по болезням, то можно очень хорошо ставить диагнозы по описанию болезни, кто может покажите медикам, они будут в восторге (а может и нет -
О насущном. Основная причина того, что мы выкладываем результаты нашей работы – это невероятные возможности, которые представляет эта технология. Мы физически не в состоянии справиться и развить все направления. К счастью поиск это лишь самое примитивное применение нашей разработки, причем далеко не самое лучшее, т.к. можно в относительно короткие сроки сделать систему дающую ответы на вопросы.
Уже сделаны теоретические наработки и частично практические по следующим направлениям:
1. Перевод с языка на язык. Мы сделаем качеством перевода любой существующий переводчик и скорее всего человека. Для обучения нужны всего лишь словарь и много текстов.
2. Сравнение смысла текстов. Это можете проверить уже сейчас на существующей программе, но для этого ей нужно будет скормить много текстов на разные тематики.
3. Распознавание речи и изображений.
4. Предсказание будущего, как бы странно это не звучало, но это факт от которого никуда не деться. Модель хранения данных и концепция позволяют это делать.
5. Поскольку про искусственный интеллект говорить сейчас неприлично, ничего говорить и не буду.
Мы приглашаем к сотрудничеству всех заинтересованных людей. И готовы рассмотреть любые интересные предложения по сотрудничеству. Вопросы касающиеся каких-либо аспектов работы системы можно задавать в этой теме, я по возможности готов на них ответить, разумеется всю подноготную выкладывать не собираюсь, поэтому задавая вопросы не забывайте про скромность :-)
Мыло для контакта dr_dax@mail.ru
Находимся в г. Воронеж, Воронежский Государственный Университет, физический факультет, кафедра электроники.