GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.10 (12)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Игра Х-О. Подводные камни. Обсуждение.
Yandersen
Сообщений: 351
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 03 авг 13 11:36
"процесс обучения - это всегда процесс рефлексии одного субъекта через другого. Этот субъект может быть явным (дядя сидит напротив), а может быть неявным (в голове какбэ голос говорит). Если нет учителя - нет обучения."

То, что поведение ИИ синтезируется на основе ранее увиденного и не является результатом спонтанно возникшего алгоритма действий - это бесспорно. Но зачем придумывать абстрактных учителей? Просто встроенный алгоритм обучения есть - изначально описанный способ интерпретирования поступающей информации для использования её в процессе синтеза поведения. Невнятно, что подразумевать под учителем - поступающую информацию или алгоритм её обработки. Информация ведь не есть обучающий материал, готовый алгоритм действий - она есть лишь субстрат для исследования и прикладного преобразования. Если мы видим явное подражание и копирование действий другого существа или предмета, это не значит, что последний был для ИИ учителем - это лишь значит, что информация, полученная при наблюдении за предметом подражания была использована полностью и без преобразований, что возможно при подобии форм своего тела и тела предмета подражания.
Животные склонны копировать действия других, пусть даже бессмысленные, никак не способствующие достижению главной задачи. Зачем же тогда? А для расширения каталога спсобов воздействия на окружающий мир - никогда не знаешь, что может понадобиться в дальнейшем. Бессмысленные иррациональные энергетически невыгодные движения типа танцевальных никак не способствующие достижению цели сейчас, однажды смогут помочь в привлечении самки. Так же и с жестами - с их помощью можно будет перетянуть акцент внимания компании на себя, обеспечив тем самым своё доминирование (душа компании, гвоздь вечеринки).

Slava, кто такой Полевой - это о чём?
[Ответ][Цитата]
Slava
Сообщений: 3070
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 03 авг 13 12:16
Цитата:
Автор: Yandersen

Slava, кто такой Полевой - это о чём?


Есть тут интересный участник
пишется, кажется, vPolevoj, сорри
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 03 авг 13 12:45
Цитата:
Автор: Yandersen
Если мы видим явное подражание и копирование действий другого существа или предмета, это не значит, что последний был для ИИ учителем
Читаю Вас и думаю, неужели я тоже был когда-то таким же категоричным и всё рубил сплеча. Аккуратнее что ли надо думать, степЕннее. Хотя вкупе с рестартами, самокритикой и безжалостной сменой позиции такой метод рассуждений может быть эффективным.

Если мы видим действия другого существа и копируем их, значит для этого есть специальный механизм. "Просто так само" подражание не происходит. Вот здесь, например, есть местами любопытное словоблудие про цели и их достижение, в том числе про зеркальные нейроны.

Почему я считаю, что в процессе обучения стоит всегда выделять учителя как самостоятельную субъединицу?

1. Потому что человек может учиться как у конкретного субъекта (не обязательно живого, например "быть как столб"), так и своего опыта. Но поскольку никаких переключений режимов обучения у человека нет, значит в обоих случаях работает один и тот же механизм. И либо обучение у субъекта-учителя стоит интерпретировать как обучение у своего опыта, либо обучение у своего опыта стоит интерпретировать как обучение у субъекта-учителя. Поскольку я наблюдаю застой в теориях про обучение на своём опыте, вполне законно попробовать второй вариант и интерпретировать свой опыт как разновидность учителя-субъекта.

2. Потому что наше "Я" формируется после обучения, а не до. "Я" - это центральное ядро личности, оно содержит систему ценностей, правил и формирует генеральную траекторию нашего поведения - запускает одни действия, а другие завершает. Учитель не может быть частью "Я", потому что учитель может ошибаться. "Я" должно быть максимально выверенным и неизменным, а учителей для этого "Я" можно штамповать и уничтожать дюжинами каждую секунду. Если мы будем постоянно менять "Я", то его не будет. А оно есть.

3. Потому что наполненность индивидуального интеллекта представлениями о том, чем наполнены интеллекты окружающих субъектов - это, имхо, естественное и необходимое условие функционирования индивидуального интеллекта. Совершенно естественно и удобно если он будет наполнен также и учителями, среди прочих.
Интеллект не может жить сам в себе, сам для себя, сам себе ставить задачи, сам себя обучать и сам их решать. Интеллект существует для других.
Кстати, кто не видел, прикольная короткометражка на близкую тему )

Ещё раз приведу простейший пример того, что я понимаю под внутренним учителем. Если Вы музицируете, то наверняка подбирали на слух музыкальные произведения т.е. обучали свою моторику (умения) на базе своей сенсорики (знаний). В этом случае Ваша память была Вашим же учителем. Вы как бы сами себя обучали. Но на самом деле Вас обучал автор композиции через Вашу память.

Но если Вы, Yandersen, сможете придумать какие-то более простые способы "интерпретирования поступающей информации для использования её в процессе синтеза поведения" - я за Вас первый порадуюсь.
[Ответ][Цитата]
гость
78.25.123.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 03 авг 13 23:47
Анатоль> Если Вы рассматриваете именно игру ХО, то программа должна знать изначально
> правила и цели игры. А вот как играть чтобы выигрывать (алгоритмы) - этому пусть
> учится. Нет правил - нет игры.

Андрей> программа должна научиться правилам игры, в которые попадут и правила выигрыша.
> А для компутера может быть задана одна совершенно искусственная задача - "выиграть".

Понятно, что Андрей говорит о более общей постановке, когда абстрагируются от специфики конкретной игры и лишь настраиваются на нее.

Но, как кажется, его позиция существенно недоопределенная.

Когда система ОБЩЕЙ компетенции (способная 'воспринимать', имеющая базовый репертуар реакций, имеющая базовые механизмы модификации соотношений SR (т.е. выделять стимул на стимульном фоне это тоже реакция, но внутренняя и уже 'освоенная'), организованная так, что она существует в режиме поддержания выделенных внутренних переменных в 'нормальных' пределах погружается в новую для себя группу ситуаций (пространство игры), то естественным первым этапом совокупности ее адаптивных поведенческих проб и внутренних перестроек является выявление 'правил игры' - на любой неизвестный стимул можно отвечать молчанием (не замечать), не интепретировать изменение в ситуации как стимул, требующий ответа. Последствия этого могут быть представлены в постановке по-разному: cистема может прекратить свое существование и при ее клонировании ее
молчащие потомки тоже не будут иметь шанса на продолжение истории, либо будет происходить СТОРОННЕЕ вмешательство, выводящее гомеостазированные переменные за границы нормы.

При генетико-эволюционной постановке Учителя нет, есть 'естественная история выживания способных к адаптации через наследуемые вариации'. Тут понятие 'учитель' плохо бы дифференцировало триаду наследование-вариации-отбор. Селективные преимущества не 'учительствуют', а открывают возможности продолжения.

Второй случай отражает обучение с учителем в собственном смысле понятия учитель. Учитель как носитель знания правил, того что правильно и неправильно.

Внутрення трудность позиции Андрея (как она излагается) вот в чем. -

Для ПРОСТЫХ игр (понятие простоты можно конкретизировать в терминах теории игр, теории грамматик, теории обучения) экстракцию правил и игру не выигрыш можно совместить, стуация от первого хода и до 'эндшпиля' обозрима и выигрывающие стратегии можно сформулировать (они и существуют в таком виде) в терминах базовых правил ходов и простых свойств игровых ситуаций (паттернов). То, что выигрыш существует и определены свойства выигрышной позиции известно Учителю.

Однако сама постановка Андрея гораздо шире того, что он говорит. Если речь идет об обучающейся системе в 'сильном' смысле, об ИГРЕ НА ВЫЖИВАНИЕ, то НИОТКУДА не известно, что существует выигрышная стратегия, что существует сама возможность выигрыша. Существует только ВОЗМОЖНОСТЬ НЕ ПРОИГРАТЬ В БЛИЖАЙШЕЕ ВРЕМЯ. Ничто не гарантирует определенность и устойчивость свойств среды в смысле определенности определенной игры.

С самого 'начала' системе должна играть на непроигрыш, а игра на выигрыш возникает только в очень искусственных ситуациях.

Система должна (в 'общем' случае) сначала стремиться экстрагировать правила, промоделировать среду, и только потом отрыть выигрывающие стратегии в отношении частного понятия 'выигрыша' (допускаемого средой). Т.е. проинтерпретировать
свои глобальные стратегии непроигрыша на частном, локальном контексте стратегий выигрыша.
[Ответ][Цитата]
гость
78.25.123.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 4:05
Андрей>

Кстати, есть повод вернуться ненадолго к вопросу о неА. Андрей утверждал, что негативность это чистая фикция, утверждал достаточность языка 'позитивных констатаций', языка об А. Я говорил о том, что это сверхупрощение. Вот как натурализовать мои слова, как показать полезность, продуктивность, неизбежность неА-языка, позитивность логики негативного. Очень просто. неА возникает тогда, когда система нормализует неожиданное, необычное. Т.е. когда система начинает активно ожидать
и обрабатывать ОШИБКИ ожидания. Особенно неА-логика будет востребована при моделировании альтернатив и планированиянеизбежных ошибок ожидания (прогноза, модели, результата действия). Т.е. неА-логика это естественный способ существования
рискованной (негарантированной) информационной системы, организованной на регенеративных принципах.
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 4:48
Я вообще не вижу никаких здесь проблемм. Хоть А, хоть неА. Хоть 'выиграть', хоть 'не проиграть'. Программа будет срабатывать на то, что в нее заложат. По факту неизбежности. Она сама себя остановить не сможет пока не придет к какому-либо решению в своих 'размышлениях'. Здесь всегда надо исходить из конкретных случаев, на что этот ИИ был создан. Я могу запрограммировать ее только на отбивание атак, и она с опытом может 'научится' делать это эффективно. Но выигрывать она даже 'не захочет'.
[Ответ][Цитата]
гость
78.25.122.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 5:11
да, 'особых' проблем нет, если не абсолютизировать крайности, упрощенные представления,
а иметь в виду балансирование стратегий защиты и нападения. Но вопрос стоит так - а как будут выглядеть эти стратегии до того, как они отдифференцируются друг от друга,
когда они еще не будут выраженным нападением или выраженной защитой. Еще не освоив
игру, не открыв возможности выигрыша система может делать ничего иного как обучаться
просто ходам и осваивать их ПЕРВИЧНОЕ значение - какие ходы не приводят СРАЗУ к проигрышу. Далее значения ходов будут развиваться контекстуально: какие ходы не вызывают сразу осложнений (безопасные), какие ходы позволяют предотвратить прямую угрозу, какие ходы позволяют создать угрозу (давленние) противнику. Т.е. задача непроигрыша выглядит более 'фундаментальной'. Как бы агрессивность (цель победить) ТОЛЬКО на консервирующей базе опыте защит, нейтрального развития позиции и опыте пробных атак. если речь идет об 'универсальном игроке', а не о специализированном.

[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 5:25
Цитата:
Автор: гость 78.25.123.*
Если речь идет об обучающейся системе в 'сильном' смысле, об ИГРЕ НА ВЫЖИВАНИЕ, то НИОТКУДА не известно, что существует выигрышная стратегия, что существует сама возможность выигрыша.
Из этого следует только одно - ни одна система не может обучиться гарантированному выживанию. Потому что любое обучение обязательно предполагает право на ошибку. В случае с выживанием такого права нет. Устал повторять.
Проигрыш не есть смерть - это типичная ситуация "жизни" на пути к выигрышу. Когда человек проигрывает, он рвёт на живой жопе живые волосы и говорит: "А давай ещё партейку!" - никто при этом не умирает.
Более того, возможна постановка задачи играть на проигрыш - поддавки называется. Что ещё раз показывает, что и выигрыш и проигрыш - это позитивно констатированные цели.

Я давно предупреждал, эволюционизм и отрицания до добра не доведут.

Цитата:
Автор: гость 78.25.123.*
Существует только ВОЗМОЖНОСТЬ НЕ ПРОИГРАТЬ В БЛИЖАЙШЕЕ ВРЕМЯ.
В свете вышесказанного можно перефразировать так: невозможно научиться выживать, но можно научиться не умирать в ближайшее время. Что, очевидно, бред.
Возможно научиться добывать пищу, строить жилище, размножаться, чувствовать радость. А уж ведёт это к выживанию, умиранию, раю, аду, вечной жизни - никто точно не знает. Пока что все умирали, так что если и делать корректные выводы, то можно сказать только одно - умирать научаются все.

Цитата:
Автор: гость 78.25.123.*
неА возникает тогда, когда система нормализует неожиданное, необычное. Т.е. когда система начинает активно ожидать и обрабатывать ОШИБКИ ожидания
1. Интеллектуальная система ВСЕГДА обрабатывает ошибки ожидания. В сущности это её ключевая функция.
2. Сама ошибка ожидания конечно является отрицанием, противоречием. Но осознаётся она как позитивная точка входа - задача.
[Ответ][Цитата]
гость
78.25.122.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 5:25
т.е. система должна еще понять, что ее ход, вроде нейтральный 'на самом деле' есть
атака и создает трудности для противника. Скажем, понять это можно на основе анализа
поведения противника - если тот не совершает 'очевидных' угрожающих ходов, то у него
возникли проблемы.
[Ответ][Цитата]
гость
78.25.121.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 5:52
А.>

разумеется, выживание не гарантировано. Но не гарантировано абсолютно, гарантировано относительно, относительно адаптивной истории, самобучения системы выживать (успевать протранслироваться до наступления терминальных состояний). Обучается в этом смысле не конкретная система, а эволюционная линия. Процесс адаптации развивается на разных масштабных уровнях - на уровнях эволюционно-генетическом (доставляющем врожденные адаптации и механизмы адаптации), на уровне работы механизмов адаптации
и на уровнях обучения и самообучения. Поэтому право на ошибку в задаче выживания у индивида есть, - задача на выживание задана не на отдельном индивиде, а на популяции, в которой кто-то все-таки решает эту задачу в частной постановке. Когда
проигрыш не смерть в игре на выживание это всего лишь УСЛОВНЫЙ прием для удобства моделирования, когда мы делаем ансамбль популяции виртуальным и отождествляем разные релизы с одним типом и представляющим его экземпляром. Другое дело, что в эволюции сами организмы перешли к моделирующей в явном виде стратегии - умирать не самим, а неудачным представлениям, теориям, не порождать потомков, а генерировать гипотезы. Информационная активность экономит энергию и вещество. В этом смысле эволюция довела до 'информационного' добра (шняки).

> невозможно научиться выживать, но можно научиться не умирать в ближайшее время. Что, > очевидно, бред

никакой это не бред, а элементарное регулирование жизненно важных параметров, гомеостаз. Разумеется, что само по себе регулирование не гарантирует устойчивости стабилизированного состояния. Если проголодался, то регулируй не регулируй
уровень сахара в крови, но резервы истощаются и нужно совершить активные управляющие поведением внутренние действия. Поставить задачу в открытой информационной среде и решить ее.
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 6:27
Цитата:
Автор: гость

Т.е. задача
непроигрыша выглядит
более
'фундаментальной'. Как
бы агрессивность (цель
победить) ТОЛЬКО на
консервирующей базе
опыте защит,
нейтрального развития
позиции и опыте пробных
атак. если речь идет об
'универсальном игроке', а
не о специализированном.

Пару раз рискнет-получит по зубам. И при следующих партиях будет учитывать ошибки. А это значит, что каждое приложение этой игры будет вырабатывать свои стратегии, в зависимости от опыта и соперника. Будет формировать собственную память, модель мира. Каждое приложение будет индивидом, практически 'личностью'
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 21:47
Такие вещи как "учитель" (внутренний), "я", "рефлексия" (так скажем высокого уровня) и т.д. и т.п. - все это побочный продукт работы "материала" "ядра" мозга (достаточно "мощного" варианта). Связано это прежде всего с тем, что для любого элемента/ансамбля (другими словами для любых частей этого ядра) его окружение - есть внешняя среда. А нетолько то, что мы обычно понимаем под внешней средой то, что "снаружи" сенсоров и эффекторов.
Получение этих наблюдений для выяснения "материала" ядра мозга - есть наблюдение за фильмом для выяснения материала телевизора. Что-то выцепить можно, но только это "что-то" чаще путает, чем помогает. Конечно, строго говоря, пример с телевизором не корректный, но этим в данном случае можно пренебречь, т.к. он достаточно наглядный.
Что касаемо "внешнего учителя", то как правило это всего лишь способ задания "ученику" область "внимания" в которой он как бы учиться сам. В предельном своем варианте - эта область может быть сужена учителем до областей в которых ученик уже имеет достаточно "знаний" и воспринимает (запоминает) все как есть, без личного обучения. А то, что называется "правильно"/"не правильно" - так это с точки зрения учителя. Таким образом учитель задает конечное нахождение "цели". Но "цель" у ученика могла быть и другая, а учитель таким образом Навязывает ему свою!
Не зря существует, говорят, поговорка: - научить не возможно, возможно научиться.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 21:59
Для Андрея.

Если я не ошибаюсь, Вы приверженец необходимости "первоцели", на которой должны "накручиваться" все остальные и отрицаете, что для "реорганизаций" (решения задач) достаточно разницы между тем что было и тем, что есть вне связи с "первоцелью". В связи с этим вопрос. Как необходимость "первоцели" согласуется с необходимостью "учителя" (внутреннего или внешнего). На мой взгляд либо "то", либо "другое", вместе - не судьба...(Хотя и закладывание "первоцели" не запрещено, но Необходимости в ней для "ядра" - нет!)

И повторяю, истин не глаголю, только свое мнение (говорят забывают порой об этом читая мои мнения)
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 22:37
Очень часто читаю чей-нибудь пост и создается двоякое впечатление: с одной стороны, кажется, что я все понял, с другой, что не понял ни шиша. Ведь, наверняка, о каких-то ключевых моментах мы все думаем примерно одиникого. Богатство и могучесть русского языка здесь играет отрицательную роль. Одно и то же обзываем кучей разных слов. Как из этого лабиринта вылезти даже не представляю. Видимо, придется кому-то одному создать таки нечто впечатляющее и объяснить это своими словами. И тогда всем останется принять его терминологию, чтобы понять как это работает.
[Ответ][Цитата]
Yandersen
Сообщений: 351
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 04 авг 13 23:27
"ни одна система не может обучиться гарантированному выживанию. Потому что любое обучение обязательно предполагает право на ошибку. В случае с выживанием такого права нет."

Аналогии в помощь. Наблюдая за процессом шинковки мяса в мясорубке я осознаю, что станет со мной, если я туда попаду. Мне не нужно реально туда раз попасть, чтобы обучиться. Я вижу, что происходит с куском мяса, и я ассоциирую его со своим телом. После этого прогнозирование даёт очевидный результат - будет больно. Прогнозирование не даст такого результата, если я в первый раз увижу мясорубку и не буду знать, что она делает с мясом. Ассоциирование же требует наличия у предметов сходных признаков.
[Ответ][Цитата]
 Стр.10 (12)1  ...  6  7  8  9  [10]  11  12<< < Пред. | След. > >>