GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.2 (40)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Свободный от троллей канал, предназначенный для предметного обсуждения
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:13
Цитата:
Автор: dr2chek
А еще мы можем узнать мелодию из двух разных вариантов исполнения. Или голос индивида из 2-х разных записей. И возникает тот же сакраментальный вопрос: "Почему компьютер не должен это уметь?" Вот не умеет, и адски сложно его научить...

Наверное, можно и эту задачу пообсуждать, но я абсолютно чист в понимании фактуры звуковых данных, поэтому сильно полезен Вам не буду. Фурье и вейвлетами, конечно, я занимался, но без фанатизма. И вообще, у меня есть ощущение, что распознавание и идентификация звуков намного сложнее, чем обработка изображений.

Кстати, на распознавании голоса именно глубокие сети показывают промышленный результат.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:21
Цитата:
Автор: гость
баян

Нет, я другую задачу предлагал для обсуждения.
[Ответ][Цитата]
dr2chek
Сообщений: 781
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:24
Цитата:
Автор: Egg


я абсолютно чист в понимании фактуры звуковых данных, поэтому сильно полезен Вам не буду. Фурье и вейвлетами, конечно, я занимался, но без фанатизма. И вообще, у меня есть ощущение, что распознавание и идентификация звуков намного сложнее, чем обработка изображений.

Если отталкиваться от того, что изображение, равно как и звук, поступают во всё тот же мозг, со структурой коры не сильно (не радикально) отличающейся для зон слуха и зрения, то можно осторожно утверждать, что и обработка в мозге происходит по сходным принципам. Для слуха просто добавляется временнАя характеристика, ибо надо звук накопить, чтобы распознать.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:36
Цитата:
Автор: Egg


Все зависит от реализации. Я вот, например, не очень люблю нейронные сети, однако успехи глубокого обучения меня вдохновляют и я ищу вариант "альтернативного" создания многоуровневой онтологии для распознавания. Точнее даже для задачи кластеризации. Поэтому даже самая простая поделка очень явно покажет то, как устроены структуры данных, которые я использую, а заниматься чем-то другим мне не интересно.

Поэтому мой формат не изменился, мы можем говорить о концепциях, мы можем устраивать соревнования макетов, но я не стану показывать внутренности систем и не стану объяснять элементы реализации.
Ну выберите таск который Вы можете обсуждать в подробностях, что толку говорить о сферическом коне в вакууме, такого полно об на форуме, Вы же не одним секретным алгоритмом решаете все задачи, кроме которого ничего больше не интересно.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:38
Цитата:
Автор: dr2chek
можно осторожно утверждать, что и обработка в мозге происходит по сходным принципам. Для слуха просто добавляется временнАя характеристика, ибо надо звук накопить, чтобы распознать.

Да, принципы сходные, природа сигнала разная. Все-таки мы представляем себе мир именно как изображения, как проекцию. И критерии похожести для изображений проще сформулировать, все-таки работа со спектрами реально сложнее для понимания (кмк).
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:41
Цитата:
Автор: гость

http://www.codeproject.com/Articles/239849/Multiple-face-detection-and-recognition-in-real

баян
Ну, речь о собственных поделках а не готовых библах, если Вы сами написали openCV тогда зачтено)) Ну или рассказывайте как работает алгоритм, своими словами
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:47
Цитата:
Автор: Калитеран
Ну выберите таск который Вы можете обсуждать в подробностях, что толку говорить о сферическом коне в вакууме, такого полно об на форуме

Программистских форумов довольно много, в том числе есть такие, где обсуждаются сети, машинное обучение, другие классические учебные методы.

Цитата:
Автор: Калитеран
Вы же не одним секретным алгоритмом решаете все задачи, кроме которого ничего больше не интересно.

Не одним, но подход, который я развиваю - один. И много тонкостей заключено именно в деталях. Например, в библиотеке морфологии изображений, до 2005 года в этом была определенная новизна. И таких элементов (которые даже от типа задачи не зависят) не мало. Нет, я принципиальный противник демонстрации рабочего кода. Если бы я занимался преподаванием - то моя позиция была бы противоположной.
[Ответ][Цитата]
dr2chek
Сообщений: 781
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:48
Цитата:
Автор: Egg


Да, принципы сходные, природа сигнала разная. Все-таки мы представляем себе мир именно как изображения, как проекцию. И критерии похожести для изображений проще сформулировать, все-таки работа со спектрами реально сложнее для понимания (кмк).

Сложнее? Я почему-то думал, что в обработке изображений как раз и используется спектральная информация (пространственные спектры). Видимо, ошибался
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 12:54
Цитата:
Автор: dr2chek
Сложнее? Я почему-то думал, что в обработке изображений как раз и используется спектральная информация (пространственные спектры). Видимо, ошибался

Используется, конечно. Фильтры. Снижение размерности. Знаю одну компанию, которая нейросети обучает именно по вейвлетовому образу. Но я говорил о представлении. Звук даже в самом простом представлении выглядит волной. С модуляцией
[Ответ][Цитата]
dr2chek
Сообщений: 781
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 13:04
Цитата:
Автор: Egg


Знаю одну компанию, которая нейросети обучает именно по вейвлетовому образу.

И как успехи?

Цитата:
Автор: Egg


я говорил о представлении. Звук даже в самом простом представлении выглядит волной. С модуляцией

Скажете тоже... Как функция давления воздуха во времени, да, на экране осциллографа - да, волной, но в голове уже после улитки - никаких волн нет, одни сплошные спектры
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 13:20
Цитата:
Автор: dr2chek
И как успехи?

Не очень...

Цитата:
Автор: dr2chek
никаких волн нет, одни сплошные спектры

Вот этого я и боялся.
Нет, я - пас. Лучше давайте прогнозировать курс доллара или какие-нибудь стоимости. Там тоже спектры, но там фактура сигнала понятнее.
[Ответ][Цитата]
Андрей
Сообщений: 3312
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 13:49
Цитата:
Автор: Калитеран
нужно будет их найти на изображении виолойджинсом
С 2005 года модно гистограмма направленных градиентов.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 16:15
Цитата:
Автор: Egg


Программистских форумов довольно много, в том числе есть такие, где обсуждаются сети, машинное обучение, другие классические учебные методы.


Не одним, но подход, который я развиваю - один. И много тонкостей заключено именно в деталях. Например, в библиотеке морфологии изображений, до 2005 года в этом была определенная новизна. И таких элементов (которые даже от типа задачи не зависят) не мало. Нет, я принципиальный противник демонстрации рабочего кода. Если бы я занимался преподаванием - то моя позиция была бы противоположной.
Не знаю тогда о чем говорить предметно в таком случае, о еде, безопасности, власти и прочих нищих потребностях(по Маслоу) рассуждать не интересно, а про высшие словами не получится, тут только собственный опыт, остаётся только про вектора, матрицы и нейросетки говорить или дразнить друг друга ради забавы.
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 16:20
Цитата:
Автор: Андрей

С 2005 года модно гистограмма направленных градиентов.
знаю про хоги, эффектиная штука, но сейчас в тренде сверточные нейросети которые сами обучаются банку фильтров, хотя наверно просто такая волна и всё равно потом когда ажиотаж успокоится по всплывают и ручные нетривиальные сетапы типа хогов, в ряд ли нейросетка сможет чемуто тапа хога сама выйучиться
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: Свободный от троллей канал, предназначенный для предметного обсуждения
Добавлено: 21 авг 16 16:39
Изменено: 21 авг 16 18:21
Цитата:
Автор: Калитеран
Не знаю тогда о чем говорить предметно в таком случае

Да, Вы правы.
Следует подумать, не торопясь, как найти какой-то компромисс, чтобы и обсуждение было предметным и чтобы какие-то тонкости не засвечивать. Если такое возможно.
[Ответ][Цитата]
 Стр.2 (40)1  [2]  3  4  5  6  ...  40<< < Пред. | След. > >>