GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.1 (40)След. > >>   Поиск:  
 Автор Тема: Модерируемая площадка для предметного обсуждения
Эгг
Сообщений: 8881
Модерируемая площадка для предметного обсуждения
Добавлено: 21 авг 16 8:25
Изменено: 26 апр 17 10:16
Модерируемая площадка.
Работают два правила модерирования: здесь пресекаются всякие переходы на личности и всякий оффтоп.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 9:57
Да просто ветку открыть ещё даже не пол дела, тему нужно интересную поднять, какой то ИИ сконструировать, коллективными усилиями, или батл алгоритмов на конкурентных основаниях. В соседних ветках предлагалось MNIST или ImageNet распознавать ну хотя бы выше среднего, это бы доказало что тут не только демагоги и прочие гуманитарии, но и настоящие ИИ-шники есть.


Вот кто например сможет MNIST с менее 5% ошибки распознавать?
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 10:33
Изменено: 21 авг 16 10:38
Цитата:
Автор: Калитеран
Вот кто например сможет MNIST с менее 5% ошибки распознавать?

Занимались семь лет назад на Артмайнде этой тематикой:
"для цифры "0" результат - 6 ошибок из 980 изображений, т.е. 99.39%"
"В целом, результат - 96.86% правильно распознанных цифер..."
http://artmind.build2.ru/viewtopic.php?id=42
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 10:43
Цитата:
Автор: Egg


Занимались семь лет назад на Артмайнде этой тематикой:
"для цифры "0" результат - 6 ошибок из 980 изображений, т.е. 99.39%"
"В целом, результат - 96.86% правильно распознанных цифер..."
http://artmind.build2.ru/viewtopic.php?id=42

Цитата:
напомню,
что данные для теста лежат здесь:
http://yann.lecun.com/exdb/mnist/
и в jpg --
напомню, что:
3d6 написал(а):
Я вам сообщаю результаты, опубликованные в приличных рецензируемых журналах, или на не менее приличных конференциях - а вам пофиг. Покажите на MNISTе хотя бы 90% - тогда и поговорим.
докладываю, что макетик собрал, запустил...
для цифры "0" результат - 6 ошибок из 980 изображений, т.е. 99.39%
думаю, для остальных цифер будет похуже, но не ниже 98% распознавания...
и при этом, данный алгоритм самый простой, его можно сильно улучшать...
уже утром запущу, выложу результаты и макетик...
статистика распознавания здесь: http://www.sharemania.ru/0203145
Отредактировано Egg (2009-08-23 09:15:53)

Круто!

Какую модель использовали? Как считаете сможете менее 1% в среднем на всех цифрах сделать?
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 10:58
Цитата:
Автор: Калитеран
Какую модель использовали?

Сейчас я называю это "когнитивной архитектурой", несколько широкое название, но пока не до названий.

Цитата:
Автор: Калитеран
Как считаете сможете менее 1% в среднем на всех цифрах сделать?

Я не уверен, очень многое зависит (естественно) от качества самих данных, там есть объективные ограничения. MNIST - это скучная задача, вот, например, отождествить лица людей на двух разных фотографиях в группе людей - это чуть интереснее.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:23
Цитата:
Автор: Egg


Сейчас я называю это "когнитивной архитектурой", несколько широкое название, но пока не до названий.


Я не уверен, очень многое зависит (естественно) от качества самих данных, там есть объективные ограничения. MNIST - это скучная задача, вот, например, отождествить лица людей на двух разных фотографиях в группе людей - это чуть интереснее.
Хорошая задача, можно попробовать, у Вас есть такой датасет?

Только идея такой публичной разработки потеряет смысл если не будут опубликованы исходники, так как, что кто то как то достиг некоторого результата, особо никому не интересно, нужно четко знать как, да и доверять в наше время никому нельзя, нужны факты.

Как я вижу эту задачу, ну во первых обучать будем только лицам в разных проекциях, то есть в качестве предобработки нужно будет их найти на изображении виолойджинсом, вырезать, а затем распознавать, в идеале если бы человека многократно сфоткали на монохромном фоне с активной мимикой и поворотами головы и разным освещением с шапочкой тогоже цвета что и фон, чтобы вырезать, тогда не очень нужен будет большой датасет с реальными фотками из которых надо будет вырезать лица.

Ну в общем задача интересная можно продолжить.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 2933
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:23
Цитата:
Автор: Калитеран
Вот кто например сможет MNIST с менее 5% ошибки распознавать?

Да там даже у многослойного персептрона с одним скрытым слоем меньше двух процентов ошибки. Правда, если им на выходной слой нелинейные функции поставить - без нелинейных (когда в качестве выходных нейронов обычные адаптивные сумматоры) хуже, но всё равно меньше 5%.

Именно ошибка на независимой тестовой выборке имеется в виду - не ошибка запоминания обучающей выборки.

Т.е. Вы цифры от каких-то слишком уж кривых алгоритмов взяли за ориентир.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:29
Цитата:
Автор: Калитеран
Только идея такой публичной разработки потеряет смысл если не будут опубликованы исходники, так как, что кто то как то достиг некоторого результата, особо никому не интересно, нужно четко знать как, да и доверять в наше время никому нельзя, нужны факты.

Публикация исходников, методов, результатов - это удел ученых. Инженер, работающий по коммерческому проекту иногда даже право не имеет показывать технологию, если заказчик ее покупает вместе с проектом.

Цитата:
Автор: Калитеран
Хорошая задача, можно попробовать, у Вас есть такой датасет?

А зачем датасет, взять две фотографии. Только две. Никакой статистики, никакого "обучения". Вот Вы можете на чужой фотографии найти одного и того же человека в двух разных группах людей. Почему компьютер не должен это уметь?

Цитата:
Автор: Калитеран
Как я вижу эту задачу, ну во первых обучать будем только лицам в разных проекциях

Да, согласен. Систему нужно познакомить с понятием лица. То есть, кроме двух фоток, еще должна быть фотка лица. Произвольного.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:32
Изменено: 21 авг 16 11:32
Цитата:
Автор: Victor G. Tsaregorodtsev
Вы цифры от каких-то слишком уж кривых алгоритмов взяли за ориентир.

Просто ув. 3d6 говорил "Покажите на MNISTе хотя бы 90%", ну я за сутки набросал программку, которая показывает 96,86. Уверен, что 1.75% ошибки - это достижимо за неделю работы, можете мне ее оплатить, если хотите получить такую системку.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:33
Цитата:
Автор: Victor G. Tsaregorodtsev


Да там даже у многослойного персептрона с одним скрытым слоем меньше двух процентов ошибки. Правда, если им на выходной слой нелинейные функции поставить - без нелинейных (когда в качестве выходных нейронов обычные адаптивные сумматоры) хуже, но всё равно меньше 5%.

Именно ошибка на независимой тестовой выборке имеется в виду - не ошибка запоминания обучающей выборки.

Т.е. Вы цифры от каких-то слишком уж кривых алгоритмов взяли за ориентир.
Ну я сам не делал, просто предложил идею для местного челенжа, раз уж разговор зашел про предметную область. На днях будет время попробую MLP MNIST одолеть, расскажу о результатах, выложу код. Тут всё равно есть много неизвестных, это же картинка, на превый взгляд кажется если тупо вогнать все яркости пикселей как вектор в нейросетку, то ничего хорошего не выйдет, наверно нужна предобработка, границы, градиенты и тп. Надо пробовать.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:41
Цитата:
Автор: Victor G. Tsaregorodtsev
Да там даже у многослойного персептрона с одним скрытым слоем меньше двух процентов ошибки.

И, потом, мы говорили с ув. 3d6 о кластеризации, а не классификации, то есть речь идет об "обучении без учителя", как это принято у вас, искусственных нейро-ученых, говорить.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:45
Цитата:
Автор: Egg

1.
Публикация исходников, методов, результатов - это удел ученых. Инженер, работающий по коммерческому проекту иногда даже право не имеет показывать технологию, если заказчик ее покупает вместе с проектом.

2.
А зачем датасет, взять две фотографии. Только две. Никакой статистики, никакого "обучения". Вот Вы можете на чужой фотографии найти одного и того же человека в двух разных группах людей. Почему компьютер не должен это уметь?

3.
Да, согласен. Систему нужно познакомить с понятием лица. То есть, кроме двух фоток, еще должна быть фотка лица. Произвольного.
1.В данном случае предлагаются экспериментальные поделки “для души”, нарушения договоров о неразглашении быть не может в данном случае, к тому же задача простая, в ряд ли понадобятся эксклюзивные алгоритмы. То есть если бы кто то из нас такую задачу решал как коммерческий проект, то нужно взять другую, пропадает чистота эксперимента))) Кто знает может её год делали, проекты таких масштабов сложно будет понять кому то со стороны из за количества деталей и всяких костылей.

2.Ок. Без проблем. Это не важно.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:54
Изменено: 21 авг 16 11:55
Цитата:
Автор: Калитеран
1.В данном случае предлагаются экспериментальные поделки “для души”, нарушения договоров о неразглашении быть не может в данном случае, к тому же задача простая, в ряд ли понадобятся эксклюзивные алгоритмы.

Все зависит от реализации. Я вот, например, не очень люблю нейронные сети, однако успехи глубокого обучения меня вдохновляют и я ищу вариант "альтернативного" создания многоуровневой онтологии для распознавания. Точнее даже для задачи кластеризации. Поэтому даже самая простая поделка очень явно покажет то, как устроены структуры данных, которые я использую, а заниматься чем-то другим мне не интересно.

Поэтому мой формат не изменился, мы можем говорить о концепциях, мы можем устраивать соревнования макетов, но я не стану показывать внутренности систем и не стану объяснять элементы реализации.
[Ответ][Цитата]
dr2chek
Сообщений: 781
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 11:59
Цитата:
Автор: Egg

Вот Вы можете на чужой фотографии найти одного и того же человека в двух разных группах людей. Почему компьютер не должен это уметь?

А еще мы можем узнать мелодию из двух разных вариантов исполнения. Или голос индивида из 2-х разных записей. И возникает тот же сакраментальный вопрос: "Почему компьютер не должен это уметь?" Вот не умеет, и адски сложно его научить...
[Ответ][Цитата]
гость
95.128.43.*
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:12
Цитата:
Автор: Egg

Я не уверен, очень многое зависит (естественно) от качества самих данных, там есть объективные ограничения. MNIST - это скучная задача, вот, например, отождествить лица людей на двух разных фотографиях в группе людей - это чуть интереснее.
http://www.codeproject.com/Articles/239849/Multiple-face-detection-and-recognition-in-real

баян
[Ответ][Цитата]
 Стр.1 (40): [1]  2  3  4  5  ...  40След. > >>