GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.2 (4)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Официальная страница соревнования на gotai.net
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 21 сен 17 5:04
Изменено: 21 сен 17 5:06
Цитата:
Автор: eto_ya
Давайте все же разделять...

Давайте!
Только Вы разделите критерии - где младенец, а где уже не очень, где интеллект, а где просто большая база данных. И... как только, так сразу будет "давайте"!

p.s. Тогда Вам и "давайте" не понадобится, сами все поймете и возможно сделаете... без всяких конкурсов.
[Ответ][Цитата]
ANGULIMALA
Сообщений: 80
На: Официальная страница соревнования на gotai.net
+1
Добавлено: 22 сен 17 6:31
Изменено: 22 сен 17 6:33
Цитата:
Автор: eto_ya

В данный момент здесь ведется открытое обсуждение возможного соревнования для разработчиков в области ИИ, предлагаются варианты заданий и т.п. После обсуждения и написания задания для первого соревнования на gotai.net, комментарии данной дискуссии будут удалены.

Ссылка на картинку


Цитата:
Автор: eto_ya


Предлагаю сосредоточиться на формулировании задания для соревнования. Одна из существующих задач это диалоговая система, в которой выделяется несколько подзадач. В процессе общения на естественном языке хорошо раскрывается наличие или отсутствие "интеллектуальности" у противоположной стороны диалога, поэтому человеку очень удобно проверять наличие этого качества через разговор. Это к тому, что для вызова интереса к соревнованию, задача должна быть понятна (близка) обычному человеку и потенциальному спонсору.



NLP – самая сложная, пока концептуально не решенная, задача машинного обучения, согласен с аналогией от rrr3 о полете на Луну и поделками в детском ракетном кружке, очень масштабная задача. Нужны более скромные цели.

Поглядите например что творят на openai(тем которым 1B$ кашлянул Маск), библиотечки инструментов пишут на питоне коих 100500, что в одном позорном шаге до продажи туториалов “как написать ИИ на питоне”, а из реальной практики тесты уровня “страуса на лыжах”



ИМХО нужно ставить и решать интересные, прибыльные, посильные задачи, например я считаю очень круто в своё время выиграть у Каспарова в шахматы и недавно у китайчика в GO, круто когда CNN распознаёт изображения лучше человека и даже кое как описывает смысл увиденного(описывает сцену) и может по описанию найти картинку, круто когда ИИ прогнозирует рынок лучше среднего аналитика, или ставит медицинские диагнозы по симптомам лучше среднего врача и тд.

Если поставлена интересная, монетизируемая задача, то спонсоры появятся сами, когда увидят хоть какие то плоды труда и перспективу, а если задача оторванная от реальности то всё быстро затухнет, так как большинству нужно семьи кормить и не в состоянии долго “творить” без финансовой поддержки.

NLP – конечно интересная, монетизируемая задача, однако она сейчас в состоянии, как многослойный персептрон до изобретения бэкпропа. Нужно привлекать лингвистов, в ручную забивать датасеты из миллионов отображений текстового описания в семантическое для каждого языка и тд. Короче в ручную программировать онтологию человека, всё его пространство смыслов, это сотни тысяч сущностей и миллиарды взаимосвязей. А текущие наивные технологии “worl2vec etc.” + диплернинг не катят, это как читать не исходники а бинарники, потому что мозг не мыслит словами в основном, слова – РЕЗУЛЬТАТ РАЗМЫШЛЕНИЙ, в форме для передачи, а не материал.

Не советую ставить запредельные задачи, толка не будут о этого. Начните с чего то попроще.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 22 сен 17 7:44
В целом здравое высказывание. Если вести речь за то, чтобы хоть что-то сделать, а лучше монетизировать.

А вот с подходами по решению NLP - промашка.
Ну да ничего страшного, т.к. ни средств, ни времени, ни понимания того как... - нет... по отдельности может и есть, но вместе - нет!
[Ответ][Цитата]
r
Сообщений: 837
На: Официальная страница соревнования на gotai.net
Добавлено: 22 сен 17 11:53
Изменено: 22 сен 17 11:55
ЕЯ это инструмент для обмена знаниями и информацией между двумя независимыми моделями мира. Сначала нужно создать работающую модель мира, поверх нее создать универсальную инструментальную машину, и только поверх нее пытаться реализовать NLP. Другие маршруты мне кажутся несостоятельными.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 22 сен 17 12:03
Цитата:
Автор: r
ЕЯ это инструмент для обмена знаниями и информацией между двумя независимыми моделями мира. Сначала нужно создать работающую модель мира, поверх нее создать универсальную инструментальную машину, и только поверх нее пытаться реализовать NLP.

Типичнейшая ошибка!!!
"Модель мира" - может быть только субъективной не смотря на то, что мы порой все же понимаем друг друга и почти не возникает споров о том, что такое, например, солнце. Здесь стоит притормозить и долго многократно думать.
"Модель мира" должна строиться уже в самой "универсальной инструментальной машине" (не будем пока уточнять, что это за универсальность такая), т.е. "машина" первична.
Ну и наконец, в последнюю очередь NLP.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: Официальная страница соревнования на gotai.net
Добавлено: 25 сен 17 7:30
Изменено: 25 сен 17 9:50


Подготовлен подробный проспект 1-й сессии соревнований на gotai.net

Приглашаются участники и спонсоры соревнования! Приглашаются ведущие секций! Просьба помочь в распространении информации о данном мероприятии на других форумах, страницах соцсетей и т.п. Высказывайте свое мнение и пишите комментарии.

[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 25 сен 17 7:46

Хм... Интересно что из этого может получиться...
[Ответ][Цитата]
data
Сообщений: 109
На: Официальная страница соревнования на gotai.net
Добавлено: 25 сен 17 8:07
Цитата:
Автор: eto_ya



Подготовлен подробный проспект 1-й сессии соревнований на gotai.net

Приглашаются участники и спонсоры соревнования! Приглашаются ведущие секций! Просьба помочь в распространении информации о данном мероприятии на других форумах, страницах соцсетей и т.п. Высказывайте свое мнение и пишите комментарии.

Круто! Но нужны более формальные требования к метрикам успешности алгоритмов, субъективизм судей и спонсоров это ммм...

Кроме того ИМХО для спонсоров условия пока так себе, нужно ещё поразмышлять. Вы предлагаете заплатить только за информацию к кому обратиться за дальнейшим сотрудничеством, это конечно важная информация, однако цена её не сопоставима с ценой самого продукта или выгодой от сотрудничества, которое может вообще не состояться, а продукт не быть продан. Нужен хоть какой то потенциальный фитбэк от спонсорства.

А пока на данных условиях, с целью узнать "самого-самого" по NLP в рунете, могу предложить от себя 100USDT в призовой фонд и равное количество токенов GOTAI сколько получится призовой фонд в $ вообще. Разумеется если это будет не состязание из 3 колек, в виде Константина, Kirzelnik и подобных юмористов.
[Ответ][Цитата]
гость
93.115.95.*
На: Официальная страница соревнования на gotai.net
Добавлено: 25 сен 17 8:33
Цитата:
Автор: data
Константина, Kirzelnik и подобных юмористов.
Константина и Kirzelnik не юмористы а сумасшедшие(инвалиды шизофреники), не нужно с этого смеяться, все мы под Богом ходим.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: Официальная страница соревнования на gotai.net
Добавлено: 25 сен 17 10:38
Цитата:
Автор: data

Круто! Но нужны более формальные требования к метрикам успешности алгоритмов, субъективизм судей и спонсоров это ммм...

Кроме того ИМХО для спонсоров условия пока так себе, нужно ещё поразмышлять. Вы предлагаете заплатить только за информацию к кому обратиться за дальнейшим сотрудничеством, это конечно важная информация, однако цена её не сопоставима с ценой самого продукта или выгодой от сотрудничества, которое может вообще не состояться, а продукт не быть продан. Нужен хоть какой то потенциальный фитбэк от спонсорства.

А пока на данных условиях, с целью узнать "самого-самого" по NLP в рунете, могу предложить от себя 100USDT в призовой фонд и равное количество токенов GOTAI сколько получится призовой фонд в $ вообще. Разумеется если это будет не состязание из 3 колек, в виде Константина, Kirzelnik и подобных юмористов.

Спасибо!

Какими вы хотели бы видеть требования к метрикам? Например?

Про профит для спонсоров. Тут может быть много схем. Для начала я бы разделил спонсорство на две категории:
1) безвозмездное (благотворительность)
2) возмездное (инвестиции)

Считаю, что нужны обе категории, но со второй есть много вариантов и схем.

Первая, когда спонсор дарует средства ради общей поддержки развития направления деятельности, молодых людей, начинающих и т.п. и в этом находит смысл. В качестве профита он получает звание спонсора, нахождение в официальном списке своего имени или компании и ссылки на сайт, получает благодарность.

Вторая, когда международные или национальные корпоративные и частные инвесторы рассчитывают вложить деньги в уже прибыльные или перспективные проекты. Взамен получают 1) выплаты/дивиденды 2) преференции (эксклюзивные договоры) 3) долю в прибыли 4) долю в бизнесе (этот вариант у нас изначально отсечен, т.к. имеется цель поддерживать независимых самостоятельных разработчиков, чтобы никто не мог им указывать сверху и выгнать из своего же проекта).

На каких условиях вам кажутся привлекательными инвестиции?
[Ответ][Цитата]
data
Сообщений: 109
На: Официальная страница соревнования на gotai.net
+1
Добавлено: 26 сен 17 5:02
Изменено: 26 сен 17 5:09
Цитата:
Автор: eto_ya

Какими вы хотели бы видеть требования к метрикам? Например?

Про профит для спонсоров...

Формальные метрики для NLP кажутся сложнее чем для к примеру для MNIST, но принцип тот же. Обучаюшая выборка, тестовая, самое очевидное это accuracy(точность) как пропорция правильно угаданных ответов к количеству всех ответов *100%. Можно взвесить ответы и считать скалярные произведения и тд. У Вас будет не известный никому тестовый датасет состоящий из элементов текста с одинаковым\близким смыслом, по нему будет оценка алгоритмов.


Например датасет:
яблоня; растение плоды которого яблоки; дерево с плодов которого делают яблочный пирог; дерево на котором растут яблоки; и тп.
….....

.

Тестовый датасет:
дерево плод которого упал на голову Ньютону и тот изобрел гравитацию; то из чего строят дома; сексуальные игрушки, фруктовое дерево; и тп.
…...

.

Про прочее: Благотворительность в нашем корыстном деле не уместна однозначно. Благотворительность это милостыня для больных и необразованных, от «публичных людей» которые покупают или восстанавливают таким образом себе репутацию, к стартапам по машинному обучению это не относится совсем. А инвестиции дело тонкое, особенно у нас в стране.

Взять к примеру kaggle, что они предлагают на конкурс? Всегда это некий фрагмент инфраструктуры уже готового бизнеса, какой то алгоритм машинного обучения, для например прогнозирования чего то там, фондовых рынков, цен на недвижимость, социальных и политических трендов, спрос на вещи, поиск сисек и террористов на видео, медицинское диагностирование и тп. Всё что можно напрямую монетизировать, для чего уже продуманна схема конвертации этих распознаваний в деньги. Заставить заплатить бизнес можно только предложив недостающую деталь их инфраструктуры или какой либо акселератор их бизнеса, просто бойскаутов никто содержать не будет.

Поэтому лучше размышлять сразу в контексте решения проблем и оптимизаций бизнеса. Если Вы хотите NLP то нужно сразу брать в проекции на ряд интересных(прибыльных) задач, ну например первое что в голову приходит это автоматическая оценка влияния новостей в текстовой форме на ЕЯ на цены тех или иных финансовых активов и деревативов, по качеству чтобы на уровне стажера аналитика или хотя бы обывателя. В качестве обучения есть корпус из миллиона новостей с твитами, вбросами и пространной демагогией политиков, с известным после них поведением рынка, нужно предсказать реакцию рынка на новые подобные новости. Это задача максимум, задача минимум, чтобы ИИ мог вообще «понять» о чем текст в проекции на вектор рынка, типа «влиятельный политик ХХХ вангует бычий рынок» в реальности он вероятно ошибется, но его мнение будет как фича, если дядя значимый. За еле еле превосходящие рандом поделки в этом деле заплатят миллионы без вопросов, а если хорошо поторговаться то сотни миллионов$

А чат бот... Это ИМХО сложнее и очень туманно с точки зрения перспектив монетизации. Как минимум нужно предложить в придачу, четкую схему его конвертации в бабло и рассчитывать на 1-5% предполагаемой прибыли. К сожалению ИИ-шники не склонны об этом думать, а мыслят себя как неких спортсменов, аля Марадонны или сексуальной Шараповы которых нужно спонсировать «просто так», без понимания что и спортсменов поддерживают из за ПОПУЛЯРНОСТИ их спорта и их как личностей в проекции на связанные с этим прибылями при демонстрацией спорта в СМИ в месте с рекламой с рэйтами ротациии по 10M$ за рекламный ролик, сам по себе спортсмен и спорт, бизнес не интересует, только деньги.
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: Официальная страница соревнования на gotai.net
Добавлено: 27 сен 17 5:40
Изменено: 27 сен 17 5:43
Цитата:
Автор: data


Формальные метрики для NLP кажутся сложнее чем для к примеру для MNIST, но принцип тот же. Обучаюшая выборка, тестовая, самое очевидное это accuracy(точность) как пропорция правильно угаданных ответов к количеству всех ответов *100%. Можно взвесить ответы и считать скалярные произведения и тд. У Вас будет не известный никому тестовый датасет состоящий из элементов текста с одинаковым\близким смыслом, по нему будет оценка алгоритмов.


Например датасет:
яблоня; растение плоды которого яблоки; дерево с плодов которого делают яблочный пирог; дерево на котором растут яблоки; и тп.
….....

.

Тестовый датасет:
дерево плод которого упал на голову Ньютону и тот изобрел гравитацию; то из чего строят дома; сексуальные игрушки, фруктовое дерево; и тп.
…...

.

Про прочее: Благотворительность в нашем корыстном деле не уместна однозначно. Благотворительность это милостыня для больных и необразованных, от «публичных людей» которые покупают или восстанавливают таким образом себе репутацию, к стартапам по машинному обучению это не относится совсем. А инвестиции дело тонкое, особенно у нас в стране.

Взять к примеру kaggle, что они предлагают на конкурс? Всегда это некий фрагмент инфраструктуры уже готового бизнеса, какой то алгоритм машинного обучения, для например прогнозирования чего то там, фондовых рынков, цен на недвижимость, социальных и политических трендов, спрос на вещи, поиск сисек и террористов на видео, медицинское диагностирование и тп. Всё что можно напрямую монетизировать, для чего уже продуманна схема конвертации этих распознаваний в деньги. Заставить заплатить бизнес можно только предложив недостающую деталь их инфраструктуры или какой либо акселератор их бизнеса, просто бойскаутов никто содержать не будет.

Поэтому лучше размышлять сразу в контексте решения проблем и оптимизаций бизнеса. Если Вы хотите NLP то нужно сразу брать в проекции на ряд интересных(прибыльных) задач, ну например первое что в голову приходит это автоматическая оценка влияния новостей в текстовой форме на ЕЯ на цены тех или иных финансовых активов и деревативов, по качеству чтобы на уровне стажера аналитика или хотя бы обывателя. В качестве обучения есть корпус из миллиона новостей с твитами, вбросами и пространной демагогией политиков, с известным после них поведением рынка, нужно предсказать реакцию рынка на новые подобные новости. Это задача максимум, задача минимум, чтобы ИИ мог вообще «понять» о чем текст в проекции на вектор рынка, типа «влиятельный политик ХХХ вангует бычий рынок» в реальности он вероятно ошибется, но его мнение будет как фича, если дядя значимый. За еле еле превосходящие рандом поделки в этом деле заплатят миллионы без вопросов, а если хорошо поторговаться то сотни миллионов$

А чат бот... Это ИМХО сложнее и очень туманно с точки зрения перспектив монетизации. Как минимум нужно предложить в придачу, четкую схему его конвертации в бабло и рассчитывать на 1-5% предполагаемой прибыли. К сожалению ИИ-шники не склонны об этом думать, а мыслят себя как неких спортсменов, аля Марадонны или сексуальной Шараповы которых нужно спонсировать «просто так», без понимания что и спортсменов поддерживают из за ПОПУЛЯРНОСТИ их спорта и их как личностей в проекции на связанные с этим прибылями при демонстрацией спорта в СМИ в месте с рекламой с рэйтами ротациии по 10M$ за рекламный ролик, сам по себе спортсмен и спорт, бизнес не интересует, только деньги.


Спасибо за ваши размышления!

По метрикам.

Не могу согласиться с обязательным наличием датасета для выполнения ДАННОГО задания, т.к. по сути, тест проверяет наличие выполнения логических операций, и практически не затрагивает задачи "извлечения знаний".

Также считаю неприменимым критерий "правильность ответов". Я бы применил термин вроде "логичность ответов". В этом случае ответ может быть неправильным, но в то же время логичным. Тогда причиной "неправильного ответа" может быть либо непонятный вопрос, либо нехватка и устаревание исходных данных, либо нехватка вычислительных мощностей. В том, чтобы проверять угадчивость системы, я не могу найти твердого основания для оценки качества системы.

По деньгам.

Я не исключаю, что инвесторам, особенно крупным, все это будет экономически неинтересно. Поэтому здесь и нужна фишка какая-то. Например, за спонсирование более чем на N-ную сумму (при этом доступную частному лицу) на ранней стадии разработки, можно предложить предоставление лицензии на доступ к мыслящей системе (разговорный бот, личный помощник, консультант, живой справочник, онлайн психолог, бухгалтер, писатель и т.д.). Например, 100$ сейчас, а потом одна лицензии на встраивание бота в сайт или прямой доступ на сайте производителя (если несколько раз вложились на ранних стадиях, то еще лицензия). При этом открытой продажи бота может вообще и не быть. Полный эксклюзив, ну или гарантировать период эксклюзивности, после чего открыто продавать. При этом цена для вошедших на стадии готового бота будет уже далеко не 100$, а крупный бизнес спохватится как раз именно на этой стадии. В этот же момент частные инвесторы могли бы выгодно продать имеющиеся у них лишние лицензии, и неплохо заработать.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 27 сен 17 5:50
Изменено: 27 сен 17 5:59
Цитата:
Автор: eto_ya
По метрикам.
... и практически не затрагивает задачи "извлечения знаний".

Я бы сказал "рождения знаний" или "создания знаний" вместо "извлечения знаний"...
[Ответ][Цитата]
eto_ya
Сообщений: 1545
На: Официальная страница соревнования на gotai.net
Добавлено: 27 сен 17 6:10
Изменено: 27 сен 17 6:20
Цитата:
Автор: rrr3

Я бы сказал "рождения знаний" вместо "извлечения знаний"...

Тема знаний не слишком относится к текущему заданию. Есть разница между "знанием" и "выводом". Здесь уместнее применять термин "вывод" или "логический вывод". Знание это когда я увидел зеленое яблоко и теперь знаю, что оно бывает зеленое. Вывод это когда мне сказали, что есть одно зеленое и два синих яблока, и спросили о численности яблок, а я ответил, что три яблока, тем самым сделав вывод и проигнорировав знание о том, что синих яблок не бывает (для меня). Это пример "чистого вывода".
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Официальная страница соревнования на gotai.net
Добавлено: 27 сен 17 6:41
Изменено: 27 сен 17 6:45
Цитата:
Автор: eto_ya
Тема знаний не слишком относится к текущему заданию...

Ну и латны, пусть будет так.

(Знания, это когда показали два зеленых яблока, а в ответ получили, что одно можно съесть, а другое использовать как камень и бросить в воду и посмотреть, утонет или нет... В книжках нет знаний, они создаются в голове в процессе чтения, правда не у всех. Вопрос не в знаниях, вопрос в их создании, вопрос не в ответах, а в их создании вместо вычисления из готового по готовым правилам.)
[Ответ][Цитата]
 Стр.2 (4)1  [2]  3  4<< < Пред. | След. > >>