GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.3 (7)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Не попробовать ли объеденить наши усилия?
kondrat
Сообщений: 4026
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 5:17
Цитата:
Автор: rrr3


Вот видите, как быстро достигли результата...

В принципе, мне достаточно просто общения.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 5:22
Цитата:
Автор: Kek
Объединяться имеет смысл для решения конкретных задач, узкозаточенных, но лежащих в направлении философского указателя ИИ. Такими задачами могут быть, например, задачи распознавания и кластеризации.

Они у Вас есть?
Тогда - ссылочку, плиз, на архив с данными (ну и описание этих данных и самой задачи).
Иначе - почему кто-то (решивший объединиться с Вами) должен давать обещание оказаться боеготовым фиг знает в какой момент в будущем (в момент, когда Вы подготовите данные) на фиг знает какой срок (тут нострадамусы стаями не бегают, чтобы точно спрогнозировать трудоемкость)?
Или распознавать предполагается "сферического коня в вакууме"? Так это не конкретная задача - а очередной околофилософский онанизм.
[Ответ][Цитата]
vchc
Сообщений: 194
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 5:43
Искренне поддерживаю всех желающих объединяться.
Сам когда-то пытался (линк). И до сих пор размышляю о том, как это всё провернуть.

Что касается спора программирование/философия, то даже в программировании нужна теоретическая база, если это не жесткое кодирование по шаблону. К сожалению, за всё время нахождения на форумах так и не встретил желающих заниматься именно теорией (в соответствии с научным методом). А без теоретических разработок любое программирование это в основном повторение уже пройденного.

То Кек: Что вы подразумеваете под распознаванием речи? Это продолжение вашей предыдущей темы или есть какие-то сдвиги? Сама задача распознавания речи интересна и я бы с удовольствием ей позанимался, но смотрим предыдущий абзац. Повторять уже имеющиеся разработки совершенно не хочется, а для новых решений нужно копать теорию. Сильно копать. Готов пообсуждать эту тему.
[Ответ][Цитата]

Сообщений: 768
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 6:58
Цитата:
Автор: Kek

1. Если есть желание объединиться для этого не надо специальных форм. Желание первично - форма вторична.
утверждение подобное тому, если сказать, что для создания программы не нужно ничего кроме желания...
другое дело разделение в группе функций, вопросы объединения и взаимодействия группы задача не интересная для всех, но кому-то об этом надо думать.
Цитата:

2. Философы в принципе объединяться не могут, тем более с технарями.(rr3) Философы - глобальные указатели.
на счет "в принципе", берут сомнения, пример философия программирования, но в этой философии есть конкретная цель, а вот философия ниочем, с одной целью самоутверждения, ее адептам не нужно сотрудничество им надо поклонение
Цитата:

5. Объединяться имеет смысл для решения конкретных задач, узкозаточенных, но лежащих в направлении философского указателя ИИ. Такими задачами могут быть, например, задачи распознавания и кластеризации. От себя могу предложить тему распознавания речи, которая сейчас зудит сильно в моем нэокортексе...
а чем эти цели так хороши, чем они лучше других целей, почему надо начинать с этих целей, что участники получат в результате?
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 8:41
Цитата:
Автор: Victor G. Tsaregorodtsev
Они у Вас есть?

Да, у меня есть некий иструмент программный, выложу код в ближайшее время. На даче интернет < 2G.
Цитата:
Автор: VCHC
Это продолжение вашей предыдущей темы или есть какие-то сдвиги?

Продолжение.

To (Victor G. Tsaregorodtsev && VCHC)
Задача распознавания речи Гуглом решена в основном для коммерческого использования. И многие, зная это, подумают: «Зачем велосипед изобретать?» Но, во-первых – Андрей сказал, что надо побольше велосипедов в ветке ПОСТУЛАТЫ ИИ, во-вторых кто-то может похвастаться, что он может встроить в свое приложение Гугловский метод – думаю нет.
Мой подход не раз высвечивался,
еще раз кратко: Есть непрерывный информационный поток – текст, речь, изображение. Каждый поток представляет из себя не набор хоатичных кластеров, а иерархиезированную структуру. Буквы – слоги – слова – фразы и т.д. Гармоники – фонемы – слоги – слова и т.д. ЕИ научился выделять кластеры и распознавать их. Я хочу сделать модель иерархической памяти, каждый слой которой соответствует уровню кластера. Критерии работы и заполнения памяти кластера описаны здесь. Про Нументу знаю.
http://www.project-ai.org/forum/viewtopic.php?f=7&t=832#p1320
То VCHC , да это продолжене char-agenta. Я перескочил в другой информационный поток, так как char-поток представляется предательски простым для кластеризации. А на примере более сложного sound-потока можно выработать методы кластеризации.
Пока есть программный способ разбиения речевого потока на самом нижнем уровне кластеризаци: фраза длится 2 секунды, разбивается на 50 кадров, в каждом кадре есть его спектральное представление на 320 гармоник. Образец покадрово сранивается с текущей реализацией на основе корреляции Пирсона ит.д.
Подготовлю описание и выложу, если интересно, то в отдельной ветке.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 9:14
Цитата:
Автор: ‮
... а чем эти цели так хороши, чем они лучше других целей, почему надо начинать с этих целей, что участники получат в результате?

Ничем. Задачи распознавания лежат в общем векторе ИИ. Можно сказать, что эти задачи низкоуровневые. Но мне представляется, и это моя философия, что и на этом уровне надо закладывать целеполагание. Качественное распознавание, как коммерческая задача, может быть реализована только в системе ИИ, как частный случай.
[Ответ][Цитата]
covax
Сообщений: 1609
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 9:25
Цитата:
Автор: Kek
Пока есть программный способ разбиения речевого потока на самом нижнем уровне кластеризаци: фраза длится 2 секунды, разбивается на 50 кадров, в каждом кадре есть его спектральное представление на 320 гармоник. Образец покадрово сранивается с текущей реализацией на основе корреляции Пирсона ит.д.
Подготовлю описание и выложу, если интересно, то в отдельной ветке.


Выкладывайте. Я возможно поделюсь своей неклассической реализацией. Можно даже соревнование устроить (преимущественно для мотивации меня) или даже против Хокинса и его Grok-а.
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 9:41
Цитата:
Автор: covax
Выкладывайте.

ОК. Чукча будет писателем...на некоторое время...
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 10:18
Цитата:
Автор: Kek


ОК. Чукча будет писателем...на некоторое время...

память как представлять/заполнять/извлекать замышляете? Можно где нибудь почитать
[Ответ][Цитата]
Kek
Сообщений: 1133
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 10:27
Цитата:
Автор: Nuarez
память как представлять/заполнять/извлекать замышляете? Можно где нибудь почитать

Пока в самом общем виде только в рамках форумных баталий:
Начало
http://www.gotai.net/forum/Default.aspx?postid=57100#57100
Продолжение
http://www.project-ai.org/forum/viewtopic.php?f=7&t=832#p1320
[Ответ][Цитата]

Сообщений: 768
На: Не попробовать ли объеденить наши усилия?
Добавлено: 30 апр 13 10:37
Цитата:
Автор: Kek

Ничем.
да, пожалуй лучше было спросить какие у этого преимущества, в общих чертах понятно.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Не попробовать ли объеденить наши усилия?
Добавлено: 01 май 13 2:15
Цитата:
Автор: vchc
А без теоретических разработок любое программирование это в основном повторение уже пройденного.

Тем не менее, даже повторение уже пройденного (если это пройденное было забыто) иногда позволяет улучшать результат.

Свой прошлогодний пример я описывал (см. последний абзац в http://neuropro.ru/memo334.shtml). Всунул многослойному персептрону полиномиальные сумматоры нейронов - и "пробил" ранее непробиваемый (многослойным персептроном) порог точности решения некоторой задачи.
Да, персептроны высокого порядка известны как минимум с 1986г (с известного двухтомника Parallel distributed processing, где был предложен и сам метод обратного распространения). Но весь цимес в том, что соавтором той книги был Джефф Хинтон, который тот же самый непробиваемый порог точности решения пробил совершенно другим методом. Т.е. Хинтон с коллегами (да и другие исследователи за много лет - тоже) так и не попробовали на задаче MNIST сетку высокого порядка - а я таки взял и попробовал. Причём имеется возможность применить и хинтоновский метод dropout - т.е. точность решения задачи улучшается не только каждым методом по-отдельности, но можно и дальше ползти на связке полиномиальных сеток с дропаутом.

Ну и что было в указанной заметке не описано. Щас рулят свёрточные сетки с предварительно явно инициализируемыми весами рецептивных полей нейронов первого слоя (если надо - ссылки на статьи дам). Я же написал, что эффект от полиномиальных сумматоров зависит от места их применения (т.е. на каких-то слоях эффект положителен, на каких-то эффекта нет). Но не написал, что если на первом слое положительного эффекта нет - то можно рецепторы первого слоя инициализировать проверенным методом. Т.е. опять получаем ситуацию, когда есть 2 метода улучшения точности (относительно новый, сделанный под свёрточные сети, и старый, от топологии сети не зависящий), которые можно применить одновременно (но - для разных слоёв нейронов нейросети).
Вот только почему-то никто полиномиальные сумматоры на свёрточные сети так кроме меня и не ставил, хотя сверточным сеткам скоро стукнет 25 лет И ведь не было же доказательств, что high-order-нейросети вообще и полиномиальные сумматоры в частности есть полный мастдай - наоборот, было много работ с положительными результатами, но народ почему-то сейчас всё позабыл (полиномиальные машины опорных векторов не берём в расчёт - доказано, что для задач распознавания изображений они не будут наилучшим методом).
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Не попробовать ли объеденить наши усилия?
Добавлено: 01 май 13 2:22
Цитата:
Автор: Kek
Да, у меня есть некий иструмент программный, выложу код в ближайшее время.

Вопрос был про данные, а не про код.
Код и у меня есть
Хотелось просто понять - на каких задачах Вы хотите тестирования, и сопоставить особенности этих задач с особенностями сейчас используемого набора "стандартных" задач распознавания изображений и т.д.

Цитата:
Автор: Kek
Задача распознавания речи Гуглом решена в основном для коммерческого использования.

Тем не менее, есть задачи (распознавания речи), для которых только в прошлом году подползли к порогу в 20% ошибок (т.е. 80% правильного распознавания). Имеется в виду TIMIT.
И данные эти лежат в свободном доступе - т.е. можно тестировать-сравнивать разные алгоритмы и методы. А гугл отдаёт свои данные всем желающим?
[Ответ][Цитата]
vchc
Сообщений: 194
На: Не попробовать ли объеденить наши усилия?
Добавлено: 01 май 13 3:14
Цитата:
Автор: Kek

То VCHC , да это продолжене char-agenta. Я перескочил в другой информационный поток, так как char-поток представляется предательски простым для кластеризации. А на примере более сложного sound-потока можно выработать методы кластеризации.
Пока есть программный способ разбиения речевого потока на самом нижнем уровне кластеризаци: фраза длится 2 секунды, разбивается на 50 кадров, в каждом кадре есть его спектральное представление на 320 гармоник. Образец покадрово сранивается с текущей реализацией на основе корреляции Пирсона ит.д.
Подготовлю описание и выложу, если интересно, то в отдельной ветке.


Меня в основном интересуют ваши выводы, после того как вы всё пощупаете своими руками. И что последует за этими выводами. В любом случае, если у вас есть какой-то промежуточный результат, то его лучше выложить.

Цитата:
Автор: Victor G. Tsaregorodtsev

Тем не менее, даже повторение уже пройденного (если это пройденное было забыто) иногда позволяет улучшать результат.


Несомненно. Но такова судьба всех узкоспециализированных методов. Они слабо отделимы от задач, для которых разработаны. Исчезает исходная задача - метод перестаёт представлять ценность и забывается.

Что касается сумматоров высоких порядков, то исходя из теории персептрона вполне естественно, что подбирая функцию суммирования, мы можем добиться лучшего согласования с выборкой и получить улучшение результата. Насколько я понимаю, для нейронных сетей основной проблемой всегда были общие принципы подбора параметров, на основе которых можно было бы автоматически строить сеть заданной топологии под конкретные данные. Вы как специалист можете обрисовать ситуацию? Такие принципы разработаны в достаточной мере?

Я в основном интересуюсь только общим, так как тут большее поле для деятельности.
[Ответ][Цитата]
гость
176.241.225.*
На: Не попробовать ли объеденить наши усилия?
Добавлено: 01 май 13 10:55
Цитата:
Автор: Kek
Пока есть программный способ разбиения речевого потока на самом нижнем уровне кластеризаци: фраза длится 2 секунды, разбивается на 50 кадров, в каждом кадре есть его спектральное представление на 320 гармоник.

Это принципиально неверно.
[Ответ][Цитата]
 Стр.3 (7)1  2  [3]  4  5  6  7<< < Пред. | След. > >>