Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Платежная матрица. Верхняя и нижняя цена игры.

Читайте также:
  1. Аффинно-эквивалентные игры.
  2. Если у вашего противника две пары или тройка, лучшая нижняя комбинация у него будет до старшей карты.
  3. Задачи, игры.
  4. Инновационная платежная система
  5. Иногородним командам КВН желательно быть за 1 день до игры.
  6. ИСПОЛЬЗУЙТЕ ПОКАЖИ-КАК-ЭТО-РАБОТАЕТ И РОЛЕВЫЕ ИГРЫ.
  7. Категория игры.

Рассмотрим парную конечную игру:

Игрок А имеет m стратегий A1, A2,…,Am.

Игрок В имеет n стратегий B1, B2,…,Bn.

Размерность игры m´n.

В результате выбора игроками любой пары стратегий Ai и Bj (i=1,2,…m; j=1,2,…n) однозначно определяется исход игры, то есть выигрыш игрока А aij и проигрыш игрока В -aij.

Матрица P=(aij) (i=1,2,…m; j=1,2,…n), элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj, называется платежной матрицей или матрицей игры. Общий вид матрицы:

Таблица 1

  B1 B2 Bn
A1 a11 a12 a1n
A2 a21 a22 a2n
Am am1 am2 amn

Строки этой таблицы соответствуют стратегиям игрока А, столбцы - стратегиям игрока В.

Пример 17. Игра "Поиск"

Игрок А может спрятаться в одном из убежишь I или II. Игрок В ищет игрока А. Если найдет, то получает от А штраф $1, если не найдет, то платит игроку А $1.

Стратегии игрока А:

А1 - игрок А прячется в убежище I;

А2 - игрок А прячется в убежище II.

Стратегии игрока В:

В1 - игрок В ищет в убежище I;

В2 - игрок В ищет в убежище II.

Если игрок А в убежище I и В его обнаружил (стратегия A1B1), то платит штраф $1 (а11=-1). Аналогично для стратегии A2B2 а22=-1.

Если А в убежище I, а В его не обнаружил (стратегия A1B2), то игрок А получает $1 (а12=1). Аналогично для стратегии A2B1 а21=1.

Размерность игры 2´2.

Платежная матрица игра, матрица размером 2´2:

-1  
  -1

 

Рассмотрим игру m´n с матрицей Р=(аij) размером m´n.

Определим наилучшую стратегию игрока А среди стратегий A1, A2,…,Am.

Выбирая стратегию Аi, игрок А рассчитывает, что В выберет стратегию Вj, для которой выигрыш А минимален (игрок В вредит А).

Обозначим - минимальный выигрыш игрока А, при выборе им стратегии Ai, для всех возможных стратегиях В.

- минимальное число в i-ой строке платежной матрицы.

Среди всех возможных выберем максимальное:

- нижняя цена игры (максимин) - максимальный гарантированный выигрыш игрока А.

Стратегия, соответствующая максимину называется максиминной стратегией.

Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А. Выбирая стратегию Вj, игрок В максимально возможный при этом выигрыш игрока А. Обозначим - самый большой элемент в столбце j. Тогда

- верхняя цена игры (минимакс) - минимальный гарантированный выигрыш игрока В.

Стратегия, соответствующая минимаксу называется минимаксной стратегией.

Принцип, диктующий игрокам выбор "осторожных" минимаксных или максиминных стратегий называется принципом минимакса.

Найдем верхнюю и нижнюю цену игры "Поиск".

Следовательно, игрок А может выбирать любую стратегию А1 или А2, они обе масиминны. Нижняя цена игры равна -1.

Любая стратегия игрока В минимаксна и верхняя цена игры равна 1.

Если верхняя цена игры равна нижней цене игры, то - чистая цена игры. Минимаксные стратегии, соответствующие чистой цене игры, называются оптимальными, а их совокупность - оптимальным решением или решением игры. Игрок А получает гарантированный, не зависящей от стратегии игрока В выигрыш , а игрок В добивается минимального гарантированного, не зависящего от выбора А, проигрыша .

Решение игры устойчиво, если один из игроков придерживается оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Пара чистых стратегий Ai Bj дает оптимальное решение игры тогда и только тогда, когда aij - максимум в своем столбце и минимум в своей строке. Такая ситуация, если она существует, называется седловой точкой.

Пусть А* В* - пара чистых стратегий при которых достигается решение игры в задаче с седловой точкой. Введем функцию выигрыша игрока. P(Ai,Bj)=aij. Тогда, из условия оптимальности в седловой точке выполняется неравенство P(Ai,B*)£ P(A*,B*)£ P(A*,Bj), которое справедливо для всех i=1,2,…m; j=1,2,…n.

Пример.

Найти верхнюю и нижнюю цену игры.

0,5 0,6 0,8
0,9 0,7 0,8
0,7 0,6 0,6

Имеет ли игра седловую точку?

Решение:

Найдем минимумы по строкам и максимумы по столбцам. Среди минимумов найдем максимум max(0,5;0,7;0,6)=0,7 Минимксная стратегия А2. Среди максимумов найдем минимум min(0,9;0,7;0,8)=0,7 Максиминная стратегия В2.

  В1 В2 В3
А1 0,5 0,6 0,8 0,5
А2 0,9 0,7 0,8 0,7
А3 0,7 0,6 0,6 0,6
0,9 0,7 0,8

Таким образом , следовательно игра имеет седловую точку а22, соответствующую стратегии А2В2 (решение игры) и чистая цена игры .

Задания.

Определить верхнюю и нижнюю цену игры, минимаксные стратегии и оптимальное решение игры, если существует седловая точка.

1.

0,3 0,6 0,8
0,9 0,4 0,2
0,7 0,5 0,4

2.

     
     
     

3.

       
       
       

4.

     
     
     
     

5.

       
       
       
       

6.

         
         
         
         

 


Дата добавления: 2015-11-16; просмотров: 93 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Элементы теории игр.| Решение игр в смешанных стратегиях.

mybiblioteka.su - 2015-2024 год. (0.022 сек.)