GotAI.NET

Форум: Проблемы искусственного интеллекта

 

Регистрация | Вход

 Все темы | Новая тема Стр.3 (26)<< < Пред. | След. > >>   Поиск:  
 Автор Тема: На: "Киберсеть" - экономический симулятор как игра для программистов
NO.
Сообщений: 10700
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 23 май 14 22:41
Для "разрешение на вырубку" нужен узел "медведь", кому деньги-то платить?
Для оценочных функций желательно чёрта и ангела, неприятности и везение явления неформализуемые и довольно одухотворенные.
Теорвер появляется когда построят казино, а до этого тёмные силы и прочие информационные технологии администрирует шаман, коллега медведя.
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 0:38
Изменено: 24 май 14 0:39
Деньги платить правительству (специально выделенный агент), оно же и скупает товар ..

В игре есть понятие распостраненности сырьевых продуктов, это собственно заменяет детализацию "неприятностей и везения". А вместо "медведя" потеря здоровья при добычи в зависимости от уровня опасности действия.

[Ответ][Цитата]
Victor G. Tsaregorodtsev
Сообщений: 3187
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 5:16
Цитата:
Автор: tac
Вас же прошу предложить мне как бы вы решили эту задачу с помощью ИИ методов.

В кратце, проблема связана с построением в общем виде оценочной функции, точнее представления оценочной функции например в виде графа для решения о том, какой путь выбрать при решении задачи логического вывода.

Задача восстановления/нахождения коэффициентов в марковской модели? А конкретнее - POMDP?
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 8:14
Изменено: 24 май 14 9:07
Цитата:
Автор: Victor G. Tsaregorodtsev


Задача восстановления/нахождения коэффициентов в марковской модели? А конкретнее - POMDP?


От этого можно оттолкнутся, т.к. это наиболее близкое из того, что уже имеется. Но на мой взгляд этого мало и нужны некоторые новые решения.

На самом деле дело тут несколько в другом. Действительно в MDP есть функция вознаграждения, а в PoMDP есть еще модель наблюдения. В общих терминах, это может и не плохо. Тогда бы задача стояла бы как не имея функции вознаграждения, агент сам ее строит на основании модели наблюдения.

Но на самом деле в PoMDP под моделью наблюдения понимают всего лишь вероятность попадания в состояния. А такое описание непригодно для задач, в том числе и для данной.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 9:22
Просто в лоб всё расписать. Когда добавляется фича в зависимых узлах автомата выбирается новый вектор коэффициентов. Он не многомерный, наверно фичи добавляются не в произвольном порядке и не любое множество допустимо. Нарисовать граф шагов развития откуда какие апгрейды. А на переходы повесить поправки графа операций.
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 9:38
Изменено: 24 май 14 9:51
Цитата:
Автор: NO.

Просто в лоб всё расписать. Когда добавляется фича в зависимых узлах автомата выбирается новый вектор коэффициентов. Он не многомерный, наверно фичи добавляются не в произвольном порядке и не любое множество допустимо. Нарисовать граф шагов развития откуда какие апгрейды. А на переходы повесить поправки графа операций.


Ну например? Распишите для моего примера?

Есть время получения каждого продукта (t_n, где n -способ получения продукта), есть количество q_n получаемого продукта, есть распостраненность продукта, которое получается из наблюдений за выполнением своих действий, и описывается минимальным pmin_n и максимальным значением pmax_n. Также известно, что для сырья (камни, руда, бревна) количество зависит от распостраненности, т.е. q_n * pmin_n для пессимистического прогноза, и q_n * pmax_n для оптимистического. Для остальных продуктов распостраненность не влияет, т.е. pmin_n = pmax_n = 1. Нужно минимизировать t_n и максимизировать q_n * pmin_n.

Теперь внимание вопрос! Как ОПИСАТЬ эти закономерности оценивания в виде графа, а не математической формулы (оценивающей функции), с тем, чтобы агент мог бы на основании этого графа по определенному алгоритму, не проводя математических вычислений (за исключением простых) решить что ему делать, или если проводя мат. вычесления, то без подсказок "каких?" от разработчика?

+ Дополнение, алгоритм не должен изменится, если "оценочный граф" изменится, по аналогии с тем, как не меняется алгоритм логического вывода при расширении онтологии.

(Пример, того какие дополнения могут быть - агент при производстве затрачивает здоровье, которое так же как распостроненность можно наблюдать и представить в виде минимального и максимального значения. Восстановление здоровья требует производить определенные продукты и затрачивать время на лечение, эти затраты нужно учесть при выборе действия.)

P.S. Это та общая задача, которая на мой взгляд является камнем предкновения в ИИ вообще. Ну а частные решения, конечно тоже важны и полезны - и тут предлагаю посоревноваться и написать ботов для игры
[Ответ][Цитата]
NO.
Сообщений: 10700
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 10:15
Исследование операций, динамическое программирование - там типичные задачи по логистике и менеджменту.

Я задачу совсем не понимаю. Чем управляем, что такое распространённость, как время устроено, запасы. Есть ли противники, если есть то оптимизировать намного сложнее, лишняя оптимизация всё делает очень хрупким. Насколько всё реально. Например доски в лесопилку нужны сушеные, да и дрова тоже, первый год они плохо сохнут
[Ответ][Цитата]
гость
78.25.122.*
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 10:45
t.> Как ОПИСАТЬ эти закономерности оценивания

да уж, похоже вообще нет смысла говорить об 'общем' решении, в чем и преткноение..
масштабное имитационное агентно-ориентированое моделирование производственно-экономической системы из 'первых принципов' экономического поведения.. агенты
далеко не рациональны.. у агентов гиганский дефицит информации.. обменные процессы
неравновесные, цены неравновесные, рынки нестационарные..

наверное, нужно рассматривать некие КЛАССЫ закономерностей (стратегий) оцениыания,
так или иначе параметризованных, распределять эти стратегии по агентам, чтобы агенты могли наблюдать друг друга, оценивать успешность друг друга и соотв. образом либо
совершенствовать свои стратегии или заимствовать чужие (в меру распознавания).
Агенты-неудачники не выживают, успешные стратегии воспроизводятся с расширением.

В итоге можно наблюдать (наверное) некие устойчивые смеси стратегий в соответсвии
с теми или иными установочными параметрами системы.

насколько известно, часто такого рода экспериментальные результаты удается проинтерпретировать в терминах клаcсических (равновесных, балансовых etc) моделей.
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 11:35
Изменено: 24 май 14 11:36
Цитата:
Автор: NO.

Я задачу совсем не понимаю. Чем управляем, что такое распространённость, как время устроено, запасы. Есть ли противники, если есть то оптимизировать намного сложнее, лишняя оптимизация всё делает очень хрупким. Насколько всё реально. Например доски в лесопилку нужны сушеные, да и дрова тоже, первый год они плохо сохнут


Управляем тем в каком порядке создавать продукты. Что за странный вопрос про устройство времени? Создание продукта занимает определенное кол-во секунд, после которого продукт появляется на складе в определенном кол-ве. В игре противники есть, но для начального бота это можно игнорировать, иначе с места не сдвинитесь ..

Детализацию можно уточнять, но от этого изменится, усложнится лишь онтологический граф. Но, конечно, есть определенные допущения.
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 11:42
Изменено: 24 май 14 11:45
Цитата:
Автор: гость

t.> Как ОПИСАТЬ эти закономерности оценивания

наверное, нужно рассматривать некие КЛАССЫ закономерностей (стратегий) оцениыания,
так или иначе параметризованных, распределять эти стратегии по агентам, чтобы агенты могли наблюдать друг друга, оценивать успешность друг друга и соотв. образом либо
совершенствовать свои стратегии или заимствовать чужие (в меру распознавания).
Агенты-неудачники не выживают, успешные стратегии воспроизводятся с расширением.



Не уверен, что это проще, прейдется так или иначе создать алгоритм поведения одного агента. Случайное поведение тут вообще не прокатит, оно так или иначе должно подчиняться логическому поведению на правилах. Просмотреть все варианты поведения не возможно - их слишком много. А тогда из чего выбирать?

Но если хотите попробовать - напишите бота для игры?
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 11:44
Изменено: 24 май 14 11:57
Цитата:
Автор: гость

масштабное имитационное агентно-ориентированое моделирование производственно-экономической системы из 'первых принципов' экономического поведения..


Эка, Вы красиво назвали описываемую задачку прям решай, пиши статью, а заголовок готов
[Ответ][Цитата]
DCV
Сообщений: 746
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 24 май 14 23:43
Чтобы составить алгоритм для бота, сначала нужно самому долго играть в игру. Не у всех есть на это время.
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 25 май 14 12:51
Цитата:
Автор: DCV

Чтобы составить алгоритм для бота, сначала нужно самому долго играть в игру. Не у всех есть на это время.


Не совсем так, конечно полезно понять, как играть с помощью ЕИ, но создание алгоритма бота займет существенно больше времени, а если нет времени - то конечно ничего нельзя сделать. Но тогда и не стоит думать, что умеешь строить алгоритмы ИИ. Можно конечно тратить время на пустословие и фиософские выкладки, которые ничего не стоят - каждый сам выбирает на что тратить время.
[Ответ][Цитата]
NO.
Сообщений: 10700
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 25 май 14 13:14
раскидать ресурсы по задачам с максимальной прибылью это динамическое программирование, фон-Нейман занимался на первых компьютерах
[Ответ][Цитата]
tac
Сообщений: 2601
На: "Киберсеть" - экономический симулятор как игра для программистов
Добавлено: 25 май 14 22:31
Цитата:
Автор: NO.

раскидать ресурсы по задачам с максимальной прибылью это динамическое программирование, фон-Нейман занимался на первых компьютерах


ага, только так и не дозанимался
[Ответ][Цитата]
 Стр.3 (26)1  2  [3]  4  5  6  7  ...  26<< < Пред. | След. > >>