Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Поощряющие игроки с наказанием: Совершенная народная теорема для критерия угасания.

Игры с конечным числом повторений | Punishing the Punisher: A Perfect Folk Theorem for the Overtaking Criterion | Rewarding Players Who Punish: A Perfect Folk Theorem for the Discounting Criterion. | The Structure of Subgame Perfect Equilibria Under the Discounting Criterion | Finitely Repeated Games |


Читайте также:
  1. Акционерные фонд отвечает всем пяти критериям вложений
  2. Безопасность жизнедеятельности и теория риска. Классификация опасных ситуаций по критериям риска и уровню управления.
  3. В любви нет страха, но совершенная любовь изгоняет страх, потому что в страхе есть мучение. Боящийся не совершенен в любви. — 1 Иоанна 4:18
  4. В матрице БКГ используются 2 критерия
  5. ГЛАВА 13. МЕЖДУНАРОДНАЯ ДЕЯТЕЛЬНОСТЬ
  6. Глава 13. МЕЖДУНАРОДНАЯ ДЕЯТЕЛЬНОСТЬ
  7. ГЛАВА 3. ФУНДАМЕНТАЛЬНАЯ ТЕОРЕМА ПОКЕРА

Профиль стратегий, построенный в доказательстве предложения 149.1, в котором игроки наказываются за отказ выполнять наказание, которое им назначено, может не быть равновесием совершенным по под-играм в случае, если предпочтения игроков выражаются критерием угасания. Причина в следующем. В предложенном профиле стратегий игрок, который отказывается принимать участие в наказании, которое должно было продлиться, скажем, периодов, будет сам наказан на протяжении, скажем, периодов, где может быть значительно больше, чем . Последующие отклонения могут потребовать и более долгих наказаний, и как результат, стратегии должны быть выбраны таким образом, чтобы осуществлять наказания сколь угодно большого периода времени. Однако, если добавить даже небольшое угасание, то существует наказание, которое приведет к потерям, которые никогда нельзя будет восстановить. Следовательно, профиль стратегий может не быть равновесием, совершенным по под-играм, если предпочтения игрока выражаются критерием угасания.

Для того, чтобы построить аналог предложения 149.1 для случая, когда предпочтения игроков выражаются критерием угасания, мы построим новую стратегию. В этой стратегии игроки, которые наказывают отклоняющихся по условиям стратегии, впоследствии награждаются, что в итоге оправдывает их вложения. Как и в прошлом разделе, мы построим профиль стратегий только для случая, в котором равновесная ситуация состоит только из повторения одной (строго возможной) стратегии. Результат требует наложить дополнительное ограничение на множество игр, которое обычно называют полноразмерностью.

Предложение 151.1. (Совершенная народная теорема для критерия угасания) Пусть - строго возможный исход игры . Предположим, что существует набор строго возможных исходов игры , таких, что для каждого игрока мы имеем и для всех . Тогда существует такое, что для всех существует равновесие, совершенное по под-играм, для – угасающей бесконечно повторяющейся игры над , которое образует путь , в котором для всех .

Доказательство. Профиль стратегий, в котором каждый игрок использует следующую машину, является равновесием, совершенным по под-играм, которое обеспечивает исход в каждом периоде. Машина имеет три типа состояний. В состоянии профиль действий, выбираемый игроками – . Для каждого состояние – состояние "восстановления", в которое переходит игрок после того, как завершено наказание игрока . В этом состоянии выбираемый профиль действий – . Для каждого игрока и периода между и некоторым числом , которое мы определим позже, состояние – состояние, в котором остается периодов, в течение которых предполагается наказание игрока ; в этом состоянии каждый игрок , отличный от , выбирает действие , которое удерживает игрока с его минимаксным выигрышем. Если какой-либо игрок отклоняется в каком-либо состоянии, существует переход в состояние , (то есть другие игроки планируют наказывать игрока на протяжении периодов). Если ни в одном из периодов наказания не произошло отклонения, то состояние переходит в . Множество состояний служит системой, которая наказывает игроков, которые отклоняются от требуемого поведения во время наказания: если игрок не наказывает игрока , как это предполагалось, то вместо перехода в состояние с исходом , игрок наказывается на протяжении периодов, после чего состояние становится , в котором исход .

Подводя итог, машина игрока определяется следующим образом, где для удобства мы полагаем ; число мы определим позже.

· Набор состояний .

· Начальное состояние .

· Функция вывода: в состоянии выбрать . В состоянии выбрать , если , и , если .

· Переходы в ответ на исход :

o В состоянии оставаться в нем же, если только единственный игрок не отклонился от , в этом случае перейти в состояние .

o Из состояния :

§ Если единственный игрок отклонился от , то перейти в состояние .

§ Иначе перейти в состояние если , и в состояние , если

Сейчас мы определим значения и . Как и ранее, пусть будет максимум по всем и . Мы выберем и достаточно большими так, чтобы все возможные отклонения были сдержаны. Для того, чтобы сдержать отклонение какого-либо игрока в состоянии , мы выберем достаточно большим так, чтобы для всех и для всех , и выберем , где достаточно близко к так, чтобы для всех выполнялось

(Этого условия достаточно, так как для ). Если игрок отклоняется от для , то он выигрывает самое большее в период, когда он отклонился, затем на протяжении периодов его выигрыш составляет , и далее на каждом ходу . Если же он не отклоняется, то его выигрыш составляет от до периодов и далее . Следовательно, чтобы подавить отклонение, достаточно выбрать достаточно близкой к , так чтобы для всех мы имели

(Такое значение существует в силу нашего предположения о том, что если )

Упражнение 152.1. Рассмотрим симметричную бесконечно повторяющуюся игру трех игроков, в которой предпочтения каждого игрока выражены критерием угасания, и составная игра - , где для мы имеем и для всех .

a) Найдите множество возможных исходов составной игры

b) Покажите, что для любого ослабляющего множителя выигрыш любого игрока в любом равновесии, совершенном по под-играм, в повторяющейся игре, будет по крайней мере .

c) Согласуйте полученные результаты с предложением 151.1.


Дата добавления: 2015-11-14; просмотров: 53 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Наказание карателя: Совершенная народная теорема для критерия гонки| Структура равновесия, совершенного по под-играм, для критерия угасания

mybiblioteka.su - 2015-2025 год. (0.009 сек.)