GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.5 (6)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: автоматический перевод текстов.
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 6:10
Это текст автора проекта Дмитрия Анисимова:

История создания словарей(http://prawda.newmail.ru/mhistory.tar.bz2). Рассказ о том, как один человек за два года может сделать такой проект. Присутствует ради следующих целей:

* Как пример нашей молодежи как из нудной и неинтересной работы можно сделать творческую задачу.
* Как ответ копирайтам и тем, кто любит искать криминал там, где его нет.
* Ну и памятник себе, любимому, разумеется :-)

C уважением,
ignat
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 6:20
В Prawda сделаны словари. Всё открыто. Каждый может добавлять своё через меню словарей. На это ушёл не один год :-)
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 6:37
В том то и дело, что у нас нет словарей! Словарный перевод - это обычный подход, существующий уже много-много лет и принесший в целом, неплохие, но неудовлетворительные результаты. И как я посмотрел, по качеству перевода prawda не стоит на первом месте среди переводчиков этого типа (например, translate.ru переводит, на мой взгляд, куда лучше). Единственная заслуга проекта prawda - его открытость.

Что же касается OpenTrans, еще раз повторю: у нас другой подход. Мы переводим без словарей. Дабы не описывать все нюансы, советую посмотреть с самого начала всю тему обсуждения. Насколько мне известно, на сегодняшний день существует еще только один переводчик по сходному принципу - гугловый переводчик (который сейчас тоже находится в стадии разработки).

Цель обоих проектов - сделать качество перевода текстов значительно выше, чем у словарных переводчиков и максимально приблизить его (если даже не превысить) к качеству ручного перевода. Причем, особый акцент делается на редких направлениях (для которых не существует приемлемого качества словарных переводчиков): русско-китайский, арабо-сербский и т.п.
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 6:44
Я знаю Непальский, Корейский, Lojban. В Prawda есть Esperanto.
А может делать переводчик распределённым, есть отработанные алгоритмы.
Разрабатывали протокол Netsukuku около 5 лет. Сейчас всё работает. Презентацию я выслал.

С уважением,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 6:54
> А может делать переводчик распределённым, есть отработанные алгоритмы.

Я не против других подходов к автоматическому переводу. В OpenTrans он - статистический.

Насчет презентации - не совсем понял, какое отношение этот протокол имеет к переводам. Не могли бы Вы запостить ссылку на презентацию в форум, чтобы и другие участники могли посмотреть?

Да, я все же настоятельно рекомендую Вам прочитать данную тему целиком.
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 7:18
Netsukuku - протокол является (протоколом) динамической распределённой системы ЭВМ с радио-интерфейсами. IMHO эта система может стать основой распределённой нейросети. В нём решены технические проблемы такой сети. На основе её IMHO можно сделать систему перевода, по сути ИИ.

Если Вас Аnatoli не затруднит, выложите, plz, презентацию и опубликуйте ссылку на форуме (я думал у Вас есть такая возможность на местном хранилище).

Спасибо за фокус вашего внимания на этом сообщении,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 8:01
> Если Вас Аnatoli не затруднит, выложите, plz, презентацию и опубликуйте ссылку на форуме (я думал у Вас есть такая возможность на местном хранилище).

Данная имплементация форума не позволяет загружать файлы, так что Вам придется залить презентацию на какой-нибудь сервера и дать сюда ссылку.

Почитал статью на википедии по поводу этого протокола, http://ru.wikipedia.org/wiki/Netsukuku

У меня возник вопрос - а Вы не пробовали запостить эту идею куда-нить типа на sysadmins.ru, в раздел "Сеть", дабы получить народное мнение о технической валидности идеи? А то что-то меня терзают смутные сомнения - как будет осуществляться доступ к мегасайтам, типа загрузки апдейтов microsoft'а и порталам, вроде гугла и яху.. У каждого из них есть прямое подключение к трансатлантическим кабелям и центральным распределительным узлам штатов. В Netsukuku этот трафик пойдет через WiFi модем тети маши? И как будет осуществляться идентификация ресурсов, если не будет администрируемого DNS?

Я думаю, идея пойдет, когда физический лимит передачи данных отдельного узла будет значительно выше сумарного трафика интернета. Но учитывая то, что этот сумарный трафик постоянно увеличивается с увеличением физических лимитов, идея вряд ли станет валидной в ближайшее время.
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 8:06
Вот как раз я и попросил Вас залить презентацию на какой-нибудь сервера и дать сюда ссылку.

Эта сеть имеет международное признание и уже 4 года работает.

С уважением,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 9:13
Вот презентация: http://opentrans.sourceforge.net/other/p2p_comm.zip

Извините за скептицизм, а нельзя ли ссылки на статьи в крупных журналах о "международном признании и 4 годах работы"? Да и работа - в каком она виде? В гараже у создателей или по всей планете? Еще раз, извините за скептицизм..
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 9:48
http://www.amsterdam-wireless.nl/front/
ANDNA QSPN Amsterdam OR Seattle
Вообщето его называют теневым интернетом.
Generally it they call the shadow Internet.
;-)
Как спецсвязь не рекламируется.
As special-connection it is not advertised.

C уважением,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 10:08
Понятно, на уровне города значит максимум. Я к чему - вряд ли на сегодняшний день удастся подключить по этому протоколу хотя бы небольшую европейскую страну целиком (без использования обычного интернета). Не говоря уж о России или вообще о всем мире. Т.е. как о тени интернета говорить пока не приходится.

А каким образом Вы предлагаете использовать эту систему для ИИ и, в частности, для перевода? Если только как платформа для распределенных вычислений, то таких существует уже много. Хотелось бы знать преимущества этой системы над остальными.
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 10:23
В NTK есть возможность туннелирования трафика по обычным каналам (работа вместе с обычным Inet).

Преимущества:
1. Реально децентрализованная (Даже имена узлов могут совпадать).
2. Возможно подключение в одну сеть огромного числа узлов 2^(2^7) (Как в IPv6).
3. Встроенное шифрование групп узлов.
4. Самоуправляемая сеть.
5. Пиринговая.
6. Включает в себя все необходимые протоколы, не требует маршрутизаторов и точек доступа, хотя работает и на D-Link.
7. Очень маленький размер требуемой памяти (ОЗУ и ПЗУ).
8. Открытая и свободная.
9. Встроенный волновой алгоритм.
10. Очень маленькие задержки маршрутизации по сравнению с аналогичными сетями (2.5с)

Видимо что то ещё забыл,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 05 май 07 10:30
Вообще-то, я спрашивал о том, как все это использовать для ИИ и, в частности, для переводов.
[Ответ][Цитата]
гость
82.179.191.*
На: автоматический перевод текстов.
Добавлено: 05 май 07 10:57
Доброе утро, Анатолий!

Я не владею в достаточной степени терминологией.
К сожалению нет времени чтобы познакомиться со всей необходимой литературой по нейросетям.
Возможно Вы мне подскажете подходящую книгу.

Идея перевода на распределённой сети такая:

Получаем входной текст.
Вместо морфологического анализа переводим в Деванагари алфавит.
Что то вроде слогового письма или индексов марковских цепей. (0) уровень.

Формируем домен или кластер для каждой фразы. (1) уровень

Потом засыпаем и во время сна проверяем домены более высокого(>0) уровня (например слова).
Достраиваем необходимые связи, освобождаем, частично, мгновенную память.

На основании домена (3) уровня пытаемся извлечь из внутреннего представления (тоже домены 3 уровня) похожую конструкцию.

Лично меня сейчас волнует больше представление карты знаний на основе потока входных данных.

Перевод карты в поток данных на другом языке IMHO осуществляется в обратном порядке через другой языковой интерфейс.

Я уверен что этот метод Вам известен, и Вы сможете подсказать мне его правильное название, чтобы я поискал подходящую литературу. Заранее спасибо.

С уважением,
ignat
[Ответ][Цитата]
anatoli
Сообщений: 249
На: автоматический перевод текстов.
Добавлено: 06 май 07 1:44
> уверен что этот метод Вам известен

К сожалению, этот метод мне не известен. И, в общем-то, не понятно, зачем текст на одном языке переводить в алфавит Деванагари (разновидность индийского письма)? И что значит "Потом засыпаем и во время сна проверяем домены более высокого(>0) уровня"? Кто засыпает?

В общем, я ничего не понял. Дайте ссылку на почитать.

P.S. ignat, может быть Вы зарегистрируетесь на форуме?
[Ответ][Цитата]
 Стр.5 (6)1  2  3  4  [5]  6<< < Пред. | След. > >>