GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.2 (19)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: ML battle
гость
195.182.154.*
На: ML battle
Добавлено: 11 янв 15 8:24
Цитата:
Автор: Алексeй
победит наивный байес.
Че вы все тут к бйаесу пристали… На практике рулят «леса»(rnd forest) и разные семплирующие пространство методы, вроде парзеновского окна.Ну и бустинг бустин бустинг всего со всем…
[Ответ][Цитата]
mserg
Сообщений: 249
На: ML battle
Добавлено: 11 янв 15 8:35
Цитата:
Автор: Slava



Приятно было это прочесть
не слышал
похоже, из журавлевцев
жаль, о методах ни слова не говорится

Похоже на то, Журавлев в предисловии:
http://alexanderdyakonov.narod.ru/lpotdyakonov.pdf
Наверное, есть лекции в письменном виде.
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 11 янв 15 8:44
Недавно смотрел какие-то лекции про нейросети. Там xor, с которым была проблема у перцептрона нарисовали таблицей
01
10
и сразу видно, что тут нельзя провести линию чтобы отделить нули от единиц.

Я МЛ не занимаюсь, но вроде всегда хватало просто ближайшего соседа. И никаких моделей с их параметрами, просто сами данные, компьютер таблицами пользуется нисколько не хуже чем формулами. Наверно где-то это самый плохой подход, по правилу бесплатных завтраков. Но я всегда смотрю на данные с которыми работаю и в любом случае их сначала нужно чистить и всяко нормировать. Если там классы в шахматном порядке, как в xor, можно написать такую функцию и добавить к параметрам, алгоритм сразу назначит этому параметру большой приоритет и остальное цеплять к нему. А не данные выворачивать наизнанку. МЛ это же просто обратная задача, или я чего-то не знаю?
[Ответ][Цитата]
mserg
Сообщений: 249
На: ML battle
Добавлено: 11 янв 15 8:46
Цитата:
Автор: гость

Че вы все тут к бйаесу пристали… На практике рулят «леса»(rnd forest) и разные семплирующие пространство методы, вроде парзеновского окна.Ну и бустинг бустин бустинг всего со всем…

Подтверждаю, на Kaggle наивный бйаес не припомню чтобы что-то выиграл. Похоже он дохлый. Случайные леса - да. Чего я не ожидал, один раз выиграли нейросети. Это был шок для меня.
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: ML battle
Добавлено: 11 янв 15 8:51
Цитата:
Автор: гость
Ну и бустинг бустин бустинг всего со всем…

Это обычно в два этапа происходит. На первом этапе, когда заключается контракт и формируется ТЗ, тогда да, в ТЗ вовсю рулит бустинг и леса. Лет семь назад (я ушел из ML примерно в это время) было еще модно делать вейвлет предобработку. А на втором этапе - обработка реальных данных и получение результатов - побеждает все-таки унылый байес.
[Ответ][Цитата]
Slava
Сообщений: 3070
На: ML battle
Добавлено: 11 янв 15 8:57
Цитата:
Автор: mserg


Подтверждаю, на Kaggle наивный бйаес не припомню чтобы что-то выиграл. Похоже он дохлый. Случайные леса - да. Чего я не ожидал, один раз выиграли нейросети. Это был шок для меня.


я говорил тут уже про своего парня на КДД
так, у него тоже были голосующие леса
[Ответ][Цитата]
Slava
Сообщений: 3070
На: ML battle
Добавлено: 11 янв 15 9:00
Цитата:
Автор: Алексeй


Это обычно в два этапа происходит. На первом этапе, когда заключается контракт и формируется ТЗ, тогда да, в ТЗ вовсю рулит бустинг и леса. Лет семь назад (я ушел из ML примерно в это время) было еще модно делать вейвлет предобработку. А на втором этапе - обработка реальных данных и получение результатов - побеждает все-таки унылый байес.


это говорит лишь о том, что в первой фазе вышли на разумные координаты
потому и важно не оставлять задачу за кадром
[Ответ][Цитата]
Эгг
Сообщений: 8881
На: ML battle
Добавлено: 11 янв 15 9:03
Изменено: 11 янв 15 9:04
Цитата:
Автор: mserg
Не соответствует статистике Kaggle

Я это связываю с тем, что задачи на kaggle довольно рафинированные. Сам я тоже байес не использую, я стараюсь исходить из фактуры данных и задачи, получается что каждый тип требует почти уникальной обработки. По поводу байеса я просто транслирую устойчивое в среде дейтамайнеров мнение. Надо же как-то общий разговор поддерживать, тема без обсуждения умрет.
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 11 янв 15 9:20
Чему не учат в анализе данных и машинном обучении
http://alexanderdyakonov.narod.ru/lpot4emu.pdf
[Ответ][Цитата]
Калитеран
Сообщений: 527
На: ML battle
Добавлено: 11 янв 15 9:26
Цитата:
Автор: гость

Че вы все тут к бйаесу пристали… На практике рулят «леса»(rnd forest) и разные семплирующие пространство методы, вроде парзеновского окна.Ну и бустинг бустин бустинг всего со всем…
данные нужно в разных проекциях рассматривать и кастомно подбирать метод или композицию.

Судя по картинкам топикстартера, там как раз таки байес и сработает, 3 четких гауссовых облака тока не наивный а нормальный с разными ковариационными матричками для каждого класса.

Ну а если классы перемешаны XORные и тд, то никакой байес не прокатит, но это намек на плохую предобработку, периодичности и тд.

по поводу экзотичности нейросетей, соглашусь, КПД на практике галименький.
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 11 янв 15 11:43
Вот пишет бустинг-бустинг-бустинг приводит к переобучению. По-моему это тоже самое трудное, угадать уровень сложности. Помню меня когда-то потрясло когда кто-то сказал, что нагенерированный ГСЧ полный экран шума имеет сложность зерна ГСЧ, то есть ровно 32 бита.
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 11 янв 15 14:26
Создание модели это синтез, творческая работа и некорректно поставленная задача. Работа модели это анализ данных.
Данные бывают про разные вещи и модели соответственно нужны принципиально разные.
Если одна таблица бюджет Украины, а другая меню в ресторане, глупо искать способы как и Украину и обед представить по-разному сжатым и растянутым хоть гиперкубом хоть суперкаром. Украина это страна, обед это обед. У них нет общей модели.

Да и данные могут быть не те, я видел кто и как разные таблицы заполняют циферками и кто как шапку таблицы придумывает. Уж точно они делают это не под форесты с бустингом. Собрали чего проще достать, лишнего навалили, на нужном сэкономили.
[Ответ][Цитата]
гость
178.74.103.*
На: ML battle
Добавлено: 11 янв 15 15:39
Цитата:
Автор: 185.8.238.*

Был предложен здесь ML бой


А давайте выберем интересную задачку кагле и там сразимся, под объявленными тут именами что бы знать кто есть кто.

Можножеж не обязательно теститься в активных конкурсах, если задачи там такие себе в данный момент, выбрать из старенького прикольного и посмотреть кто победил «бы».

Вот мне кажется прикольная задачка. Хочется что то связанное с прогнозированием бабла, чтобы воодушевление присутствовало
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 11 янв 15 23:51
Прошелся еще раз по МЛ. Бросается в глаза, что они не ищут причины и следствия. Хотя по сути занимаются просто перекодировкой данных в другие координаты где приоритет бит другой. Старшие биты были не идентификаторами классов, а типа фотокадрами, младшие биты наоборот больше значат, всё решается только в конце описания как в детективе. Старшиство и есть приоритет что чему подчинено.
И вообще времени нет, вместо этого есть большая тема "временных рядов". Но там время отражает движение наблюдателя по элементам, а не взаимодействие элементов, это совсем другое время.
Для времени нужны поля таблицы с парами значений. Или уж счетное множество полей, то есть где не разные свойства описаны, а одно в разное время. Транспонировать таблицу.
Искать в данных логику. Что почему, необходимо-достаточно. Но это ещё физические данные, они физико-математически и отражаются. В данных нет ума и для обработки он не нужен. МЛ для ИИ может дать толко модель только сетчатки глаза, а не мозга.
Время обязательно нужно, тогда и думать будет не что является чем, а что произойдет. Молоток по пальцу бьет, а не является.
[Ответ][Цитата]
NO.
Сообщений: 9050
На: ML battle
Добавлено: 12 янв 15 0:26
И модели нужно строить с памятью, а не математические. Например конечные автоматы. Тогда и при их выполнении будут шаги "в уме", будет этот самый ум. А так всё правда про каких-то насекомых, которые где-то рассекают и быстренько куда-то попадают.
Не интересно, у меня в провинции за такое не платят. Вероятно числа маловаты, нужно думать, а не считать.
[Ответ][Цитата]
 Стр.2 (19)1  [2]  3  4  5  6  ...  19<< < Пред. | След. > >>