GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.5 (12)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: Игра Х-О. Подводные камни. Обсуждение.
Nuarez
Сообщений: 107
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 5:28
У меня есть чем занятся. Надо разбить игровой мир на элементарные частицы, на их основе создать какую то структру памяти. И придумать как из них же генерировать поведение. Но по существу мне пока самому нечего сазать
Вы тока дом не спалите. А так хоть за нос друг друга щипайте.
[Ответ][Цитата]
rrr3
Сообщений: 11857
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 5:43
Цитата:
Автор: Nuarez
...
Вы тока дом не спалите. А так хоть за нос друг друга щипайте.

[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 8:01
Цитата:
Автор: гость 78.25.121.*
сначала учимся ЕСТЕСТВЕННОЙ (скромной) цели НЕ ПРОИГРАТЬ.
Не получилось в одном топике, перешли сюда оХмурять?
Цель, как предмет контроля, может иметь исключительно позитивое выражение. Отрицание существует только в языке, для удобства коммуникации и компактного выражения мыслей, которые в контексте могут быть легко доопределены слушателем до позитива. Мозг же, как конечный материальный аппарат, на физическом уровне не может работать с бесконечностями. Поэтому если в языке цель обозначена как "не проиграть", мозг вынужден доопределить эту бесконечную цель в совершенно конкретную цель, например: сыграть в ничью, отказаться от партии, разбить доску на голове соперника и т.д. Мозг может достигать только "чего-то", но никак не "не чего-то". Следовательно приходим к единственно возможной схеме с исключительно позитивно заданными целями. Это настолько очевидно, что разговоры о "не целях" я с трудом могу воспринимать как "не провокацию".
Это было сказано не для того, чтобы вразумить Хмура - уверен, это невозможно. Но только в качестве позиционирования своей непокобелимой позиции и предупреждения другим читателям.

Цитата:
Автор: Nuarez
Теперь надо игру разбить на какието элементы. Создать папку 'линии'. В ней 4 папки, 'горизонт','верт', 'диаг1','диаг2'. В них по ходу игры, делать каки-то записи
Нужно быть очень аккуратным, чтобы не привнести в рассуждение что-то лишнее и извратить тем самым саму идею обучения. Ведь нам не игрока в Х-0 надо сделать, а на более-менее простом примере отладить механизмы обучения. Иначе получится как у Анатоля - игрок есть, а обучения нет.

В свете этого, я бы рассуждал очень медленно с постоянными рестартами с нуля. Начнём с эффекторов. Почему Вы решили что игрок уже должен что-то знать про клетки, диагонали, линии? Если рассуждать по моей схеме, то в первый момент есть задача, но нет ещё ни одного решения ни одной задачи, даже приблизительного. Но если нет даже приблизительного решения, то чем же программе дополнить свои ожидания, чтобы впервые попытаться решить задачу? Наверное сначала нужно ввести два общих ожидания - "будь спокоен" и "будь активен". Допустим, что по умолчанию программа для любой новой задачи выбирает 1-ый вариант - "будь спокоен". Вот она дополнила ожидание этим новым ожиданием, и ждёт, ничего не делает. С одной стороны, мы не расплодили новых задач т.к. ничегонеделание программы в каждый момент времени соответствует её ожиданию. С другой стороны, наше главное ожидание "выигрывай" остаётся в противоречии с действительностью. В человеческой практике для выхода из такой пассивной ямы обычно вводится таймер. Т.е. игрок проигрывает не только в определённой позиции, но и по истечении некоторого заданного промежутка времени. А это автоматически означает, что нашему игроку обязательно нужно чувство времени. Обязательно по той причине, что в общем случае нельзя отметать вариант "будь спокоен" ибо во многих задачах это лучшее решение.

Если программа будет ничего не делать, то в случае с таймером она всегда проиграет. Попробуем второе ожидание - "будь активен". Если программа будет активной и сразу начнёт тыкать крестики-нолики куда ни попадя то, возможно, она проиграет ещё быстрее, чем с таймером. Мы должны понимать, что изначально "правильная" программа не владеет даже примерными правилами игры. Например, наше привычное представление о том, что ходить следует вблизи окрестности уже поставленных крестиков-ноликов - это очень серьёзная ограничивающая эвристика, хотя в общем случае она может и не работать. Программа должна пробовать улучшать свои ожидания по мере улучшения результата. Сначала пробовать тыкать куда ни попадя, потом, например, справа, потом слева, потом ближе к уже поставленным точкам и так далее.

Ещё очень хорошо бы, если бы программа смогла ставить себя на место соперника, менять точку зрения, а значит и свои ожидания. Тогда она смогла бы пополнять свой багаж ожиданий через запоминание действий соперника.

Это - шаблон расуждения, который призван только показать примерный уровень детальности и скрупулёзности. Я не уверен, что такие рабочие рассуждения нужно делать прямо на форуме. На форуме полезно выкладывать готовый результат. имхо.

И я уже говорил, крестики-нолики - это очень сложная задача для базовых экспериментов. Начинать надо с простого - с перемещения из точки А в точку Б по команде.
[Ответ][Цитата]
Анатоль
Сообщений: 1964
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 9:22
Цитата:
Автор: Андрей
Следовательно приходим к единственно возможной схеме с исключительно позитивно заданными целями.

Но ведь может быть стратегия и оборонительная и наступательная.
Более того, почти у каждого животного есть и жертвы (цель - поймать, съесть) и враги (цель - убежать). Т.е. животное балансирует свое поведение между этими целями (заскочить в курятник и собаке не попастся).
Такая же ситуация и у игровой программы.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 9:54
Цитата:
Автор: Анатоль
может быть стратегия и оборонительная и наступательная
Может. Только разница между ними не в том, что одна из них цель, а вторая - не-цель. Разница сложнее и глубже.
В антагонистических играх (к которым относится Х-О) людям удобно мыслить ход, как способ решить или создать задачу. Одним своим ходом можно решать и создавать задачи как себе так и сопернику. Оборонительная стратегия предполагает ходить так, чтобы одним своим ходом решить максимум своих задач при этом мало внимания уделяется тому, сколько задач этот ход создаст сопернику. Наступательная же стратегия подразумевает создание максимума задач сопернику, при этом мало внимания уделяется тому, сколько своих задач решает этот ход.
Лично я, к слову, предпочитаю оборонительную стратегию, с большинством людей она работает эффективнее, но конечно, надо смотреть по ситуации. Оптимальная стратегия (о чём я писал ранее) предполагает ходить так, чтобы одним своим ходом решить максимум своих задач и создать максимум задач сопернику. Причём так, чтобы соперник не смог их решить одним своим ходом. К сожалению, эти условия часто взаимоисключающи.

Цитата:
Автор: Анатоль
почти у каждого животного есть и жертвы (цель - поймать, съесть) и враги (цель - убежать). Т.е. животное балансирует свое поведение между этими целями
Да, и обе эти цели заданы позитивно, без "не". Другое дело, что некоторые цели сложно достигать одновременно, в силу конструкции организма ("стой там иди сюда"), и поэтому в языке их удобно противопоставлять. Но это совсем не значит, что мозг при этом достигает некую "не-цель". Потенциально достижимая цель для мозга всегда задана явно и предметно.
[Ответ][Цитата]
Nuarez
Сообщений: 107
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 22 июл 13 15:04
Цитата:
Автор: Андрей


я понял, наконец, что вы имеете ввиду нет цели "не проиграть", да и вообще всяких "не...". Я собственно, так и считал всегда. Вопрос как всегда был в терминологии, просто одно и то же разными словами называли.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 0:59
По поводу "не проигрыша" есть перспективная мысль.
Что концептуально представляет собою проигрыш?
- Выигрывает соперник,
- дальнейшие ходы в достигнутых условиях оказываются невозможными,
- поле очищается и
- всё начинается с начала.

Выигрыш (т.е. достижение единственной главной цели (ожидания)) после ситуации проигрыша возможен только с нуля, с пустого поля. Проигрыш не означает останов, потому что главная задача ведь не решена, главное ожидание - "выиграть" - не достигнуто. Проигрыш означает только, что все достижения на поле стираются и всё начинается с первого хода.
Выигрыш же - это единственная ситуация, в которой возможен полный останов, спокойствие, смерть т.е. ситуация, в которой все задачи решены. В которой все ожидания (цели) достигнуты и деятельность естественным образом прекращается.
Я веду к тому, что проигрыш это обычная игровая ситуация со своими специфическими правилами дальнейшей игры. Типичная игровая ситуация на длином пути к выигрышу - единственной истинной цели.
[Ответ][Цитата]
гость
78.25.121.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 4:39
Андрей> Не получилось в одном топике, перешли сюда оХмурять?

Во всех топиках вполне 'получилось', ваши агрументы были подорваны, контрконтраргу-ментации вы не предоставили. В этом легко убедиться, просмотрев протоколы. Про бессмысленность вашей риторики мы уже говорили.

Мы говорили о cимметрии выигрышей и не-проигрышей. Не-проигрыш в данных играх столь же строго определен как и выигрыш. Для не-проигрыша достаточно не-выигрыша противника. Если обучаться с нуля, то более естественная цель на этапе освоения игры - парировать прямые угрозы противника. Т.е. задачи распознавания угроз более приоритетны чем задачи поиска выигрывающих комбинаций. Шанс выигыша при не-проигрыше остается, проигрыш фатален. По мере освоения игры приоритеты стратегий становятся динамичными.

Отрицание существует в логике, совершенно странно выглядит ваша установка на синтез интеллекта в неполном логическом базисе. Инверсия как основа операции отрицания - это одна из базовых перцептивных операций. Для работы с отрицанием нет нужды работать с бесконечным (особенно в малых игровых мирах). Искать выигрыш новичку в ближайшие два хода это совершенно нереалистическая задача, гораздо более реалистичнее - исследование ситуации на отсутсвие прямых и ближайших угроз. Ловить возможности для атакующих действий - это в меру оставшихся ресурсов времени на ход. Ставить с самого начала стратегические цели - это ПОДОРВАТЬ программу обучения, дисгармонизировать мотивы игры,
сформировать игровой процессор бисбалансированным, рисковым, неосмотрительным, авантюрным, неосторожным (плохокорректируемо неосторожным).

Тут еще такой момент. Освоение игры может быть в двух режимах. При игре против противника уже освоившего игру и при игре против противника при совместном освоении игры. При игре против сильного противника именно что естественно ставить
поначалу реалистичную цель - не проиграть, т.е. иметь адекватные ожидания.

Да, установка на не-проигрыш (поначалу) это не установка на конкретную цель выигрыша (которая ставится тогда, когда научились защищаться), это преследование ИНТЕРЕСА не-проигрыша, т.е. категория ИНТЕРЕСА должна рассматриваться как более базовая, чем категория цели, ожидания. У системы есть интерес продолжать оставаться в игре КОГДА УМЕНИЯ ВЫИГРЫВАТЬ ЕЩЕ НЕТ, нет и ожиданий выигрыша. Только не-проигрыш оставляет ВЕРОЯТНОСТЬ выигрыша. НЕосторожные атаки при сильном противнике почти гарантируют проигрыш.
[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 5:49
Цитата:
Автор: гость 78.25.121.*
Инверсия как основа операции отрицания - это одна из базовых перцептивных операций.
Отрицание - это всего-лишь искусственный языковой приём, упрощающий речь, навроде ссылочных слов "это", "который" и т.п. Без которых легко можно обойтись, сменив стиль облечения мыслей в слова. Я неоднократно говорил и повторю снова - инверсия, мышление через отрицание, страсть к выискиванию оппозитности - это приобретённое мыслительное извращение, имманентно чуждое практическому мышлению и всегда заводящее в блуд, которым я стараюсь не злоупотреблять и других отговариваю. Но Вы можете в одиночку заниматься любыми извращениями (отрицаниями, усложнениями, разделением и противопоставлением равного, вероятностями, самоорганизациями и прочим). Хозяин — барин.

По поводу остального (оборонительная стратегия и "фатальность" проигрыша) уже сказано выше, повторять или дискутировать не вижу смысла.
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 5:59
Цитата:
Автор: гость
Суть в том, что патерн есть 'величина' переменная - это может быть одна фигура, а
може быть некая структура из нескольких ХO. Это проблематика переменного операционного алфавита.

Скорее, проблематика только лишь неограниченного размера "доски".
Если "доска" заранее заданного ограниченного размера - нет проблем одновременно сунуть все размеры паттернов во всех их позициях.
См. нейроигрока в шашки (мастерский уровень) Челлапиллы и Фогеля. Он видел как всю доску 8*8 (один размер структуры), так и 4 позиции структуры 7*7, и т.д. вплоть (если мне не изменяет память) до всех областей доски размером 3*3. Какие размеры в итоге оказались нужны/полезны - фиг его знает, авторы не изучали информативность отдельных групп сигналов ("окон" того или иного размера в той или иной позиции доски). Сунули изначально все возможные размеры во всех позах - а сеть при обучении сама разобралась.

ЗЫ. Сорри, что заузил Ваш текст до вырожденной ситуации (без ОП и ДП, без вспоминания и модификации паттерна из/в ДП) - но здесь всё становится абсолютно технологичным и завязаным лишь на вычислительные возможности (хотя такое решение грубой силой может и не дать наилучшей точности решения и/или наиболеее элегантной структуры решателя). Просто тутошний народ даже в простых задачах предпочитает "шашечки, а не ехать" А я в этих случаях говорю: "чего тут думать - трясти надо" (С) или "всё украдено до нас (С).
[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 6:01
Цитата:
Автор: rrr3
Не верным может быть все что угодно (Гедель в помощь)

Неверным (вернее, не работающим в отдельных, заранее неизвестных ситуациях) может быть только алгоритм раскидывания некоторого множества ситуаций на два подмножества (например, раскидывание множества утверждений на истинные и ложные, доказуемые и недоказуемые и т.д.). Гёдель в помощь.
[Ответ][Цитата]
гость
78.25.120.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 6:08
Говорить и повторять вы можете сколько угодно что угодно. Нет такой глупости, которая
не пропагандировалась тем или иным любителем простоты. Но факт отсается фактом - уже
на уровне рецепторов мы имеем инверсированные рецептивные поля. Скажем, когда выключение света вызывает реакцию. Здесь именно что позитивное утверждение об отсутствии света. Инсинуации про блуд вы с равным успехом можете применить к себе,
ибо ваш не-блуд это блуд в гамбурге. Равно и свои инсинуации о том, о чем вы не имеете
представления лучше оставить при себе. Ибо нет гарантий в том, что вы сами тайком
не практикуете такие формы извращений (упрощенчество это форма логического эксгбиционизма), по сравнению с которыми мои грешные упражнения покажутся чтением
песни песней.

Можно не дискутировать, но не говорите, что вы оставили поляну за собой. Целью было
выснить что именно вы можете сказать, - только и всего.

[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 6:10
Цитата:
Автор: Андрей
Оптимальная стратегия (о чём я писал ранее) предполагает ходить так, чтобы одним своим ходом решить максимум своих задач и создать максимум задач сопернику. Причём так, чтобы соперник не смог их решить одним своим ходом.

Вы тут мешаете вместе оптимальную аналитическую и оптимальную неаналитическую стратегии. Создание максимума задач противнику, чтобы он не мог их все в реалтайме просчитать (и чтобы с каждым ходом число листьев на дереве альтернатив росло) - это неаналитика. А в аналитике обычно хватает создания противнику только лишь пары непарируемых проблем (в шахматах, например, достаточность пары слабых пунктов позиции известна со времён Тарраша)
[Ответ][Цитата]
гость
78.25.120.*
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 6:11
Пардон, предыдущий пост адресован, разумеется, Андрею, а не ув. VGT, чьими нейропродуктами я пользовался в далекой юности на бирже..

[Ответ][Цитата]
Андрей
Сообщений: 3943
На: Игра Х-О. Подводные камни. Обсуждение.
Добавлено: 23 июл 13 7:03
2 Victor G. Tsaregorodtsev
Конечно, смешиваю, отождествляю и тем самым оправданно упрощаю.
Создание сопернику сложностей комбинаторного порядка (невозможность просчитать все альтернативы) это тоже создание задач сопернику. Поэтому такая стратегия тоже аналитическая. Может даже более аналитическая, чем создание задач, исходя исключительно из правил игры. Ведь создание комбинаторных задач требует знания вычислительных способностей соперника и других его индивидуальных качеств, а значит построение модели соперника, а не только модели игрового мира.
[Ответ][Цитата]
 Стр.5 (12)1  2  3  4  [5]  6  7  8  9  ...  12<< < Пред. | След. > >>