Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Свойства матричных игр.

Читайте также:
  1. XI. ПРИСПОСОБЛЕНИЕ И ДРУГИЕ ЭЛЕМЕНТЫ, СВОЙСТВА. СПОСОБНОСТИ И ДАРОВАНИЯ АРТИСТА
  2. Апофатические свойства Божии: самобытность, неизменяемость, вечность, неизмеримость, вездеприсутствие.
  3. БЕЛЫЙ И ЦВЕТНОЙ ЦЕМЕНТЫ. СВОЙСТВА. ПРИМЕНЕНИЕ.
  4. БЕТОН ФИЗИКО-ТЕХНИЧЕСКИЕ СВОЙСТВА.
  5. Биологические свойства грибов
  6. Влияние некоторых параметров на фармакологические свойства недеполяризующих миорелаксантов
  7. Все реальные газы с уменьшением плотности приближаются по своим свойствам к идеальным газам, поэтому уравнение Ван-дер-Ваальса при переходит в уравнение Менделеева - Клапейрона.

Раздел III. ИГРОВЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЯ

 

В этом разделе показано применение принципа оптимального поведения (принципа минимакса) при вычислении оптимальных чистых стратегий, способ доминирования чистых стратегий, а также общий метод нахождения оптимальных смешанных стратегий в матричных играх (сведение матричной игры к двойственным задачам линейного программирования).

Литература: [11-13]

 

§1. Основные сведения из теории матричных игр.

 

Любую конфликтную ситуацию принятия решения, в которой участвуют две стороны (игрока) с противоположными интересами и с конечным числом возможностей (стратегий), можно описать в виде матрицы

(1)

В этой модели выбор I игрока сводится к выбору строки (m чистых стратегий), выбор II игрока - к выбору столбца (n чистых стратегий); аij - выигрыш I игрока при стратегиях (i,j); выигрыш II игрока при тех же стратегиях есть число аij с противоположным знаком (игра антагонистическая). Каждый игрок выбирает свою стратегию так, чтобы получить как можно больший выигрыш.

В отличие от ранее рассмотренных задач оптимизации в модели (1) участвуют два ЛПР. Наша задача заключается в вычислении "оптимальных" стратегий и соответствующих им выигрышей обоих ЛПР (игроков).

Стратегия i* (j*) называется оптимальной чистой стратегией первого (второго) игрока, если для любых i = 1,2,...,m и j = 1,2...n выполнено неравенство

aij*≤ai*j*≤ai*j (2)

Пара оптимальных стратегий (i*j*) называется седловой точкой, а число ai*j* -значением (или ценой) игры (1).

Свойства матричных игр.

1. Седловая точка в матричных играх существует не всегда (примеры см. в [14]). Она существует тогда и только тогда, когда

(3)

Поэтому принципы оптимальности в матричных играх называются принципом минимакса (или максимина).

2. Значение игры, если оно существует, является наименьшим числом в своей строчке и наибольшим в своем столбике.

3. Оптимальные стратегии не изменятся, если ко всем элементам матрицы (1) прибавить или отнять одно и то же число или умножить все элементы матрицы на одно и то же положительное число.

4. Игра (1) может иметь несколько седловых точек. Если (i*,j*), () - седловые точки, то (i*, ) и (,j*) - тоже седловые точки (взаимозаменяемость) и ai*j*= = = (эквивалентность).

5. Если игра (1) не имеет оптимальных чистых стратегий, то вводят смешанные стратегии:

x=(x1,…,xm): 0≤xi≤1, i=1,…,m; x1+…+xn=1 и

=(y1,…,yn): 0≤yj≤1, j=1,…,n; y1+…+yn=1;

х - смешанная стратегия 1 игрока; у - смешанная стратегия II игрока. Таких стратегий у игроков бесконечное множество.

6. В любой матричной игре существуют оптимальные смешанные стратегии x*,y*:

(4)

для любых стратегий х, у. Значением игры в смешанных стратегиях называется число

Решить игру (1) это значит найти пару оптимальных стратегий (чистых или смешанных) и значение игры.

§ 2. Решение игры в чистых стратегиях.

 

Пример 1. Найти оптимальные чистые стратегии и значения следующей матричной игры:


Чтобы упростить эту игру, умножим каждый элемент матрицы А на 12, а затем каждому элементу прибавим 6 (чтобы избавиться от отрицательных чисел) - см. свойство 3:

Сравнивая элементы первой строки (выигрыши, соответствующие первой чистой стратегии I игрока) с соответствующими элементами четвертой строки видим, что I игрок однозначно предпочтет первую стратегию, т.е. четвертую стратегию использовать не будет. Поэтому ее можно исключить из рассмотрения:

       
   


В этом случае говорят, что первая стратегия доминирует четвертую стратегию.

Так как II игрок (выбирающий столбики) минимизирует выигрыш I игрока, то, как видно из последней матрицы, вторая стратегия II игрока доминирует его первую и третью стратегии, а пятая - четвертую. В итоге исключения доминируемых стратегий получим игру

Игра А' эквивалентна исходной игре в том смысле, что в них оптимальные стратегии одинаковы (свойство 3), a ν(A') = 12ν(A)+6

В игре А' применяем принцип минимакса (3). Вычислим левую часть равенства (З):

max{6,1,3}=6.

Вычислим правую часть равенства (З):

min{l0,7} =7.

Так как равенство (3) не выполнено, то в игре А' и, значит, в игре А, оптимальных чистых стратегий нет.

Пример 2. Решить игру

Решение: max{-2, 1,3,-6)=3,

min {3,6,5)=3.

Оптимальные стратегии: i*=3 (третья строка), j* = 1 (первый столбик); значение игры ν(А)=3.

Пример 3. Решить игру

В этой игре четыре седловые точки: (1,2), (1,4), (2,1), (2,4); значение игры ν(А)=3. Алгоритм решения матричной игры в чистых стратегиях следующий;

1) выполнить доминирование стратегий для обоих игроков;

2) вычислить обе части равенства (3); если равенство выполнено, то игра имеет решение в чистых стратегиях; если не выполнено - то оптимальных чистых стратегий нет.

§ 3. Общий метод решения матричных игр.

 

Практика показывает, что в большинстве матричных игр оптимальные чистые стратегии не существует. Однако в любой матричной игре существуют оптимальные смешанные стратегии (см. свойство 6).

Для решения игры (1) в смешанных стратегиях сводят ее к паре двойственных задач линейного программирования, применяя неравенство (4). Прямая задача ЛП:

min z=ξ 1 2+...+ξ m (1)

при ограничениях

a11ξ 1+a21ξ 2+…+am1ξ m≥1,

a12ξ 1+a22ξ 2+…+am2ξ m≥1, (2)

………………………….

a1nξ 1+a2nξ 2+…+amnξ m≥1,

ξ 1≥0,…,ξ m≥0 (3)

где

ξ 1=xi*/ν, i=1,…,m; z=1/ν, (4)

a (x1*,…,xn*)=x* - оптимальная смешанная стратегия первого игрока. Задача (1)-(3) соответствует первому игроку, т.е. решая ее симплекс-методом находят оптимальную смешанную стратегию I игрока и значение игры по формулам (4).

Двойственная задача ЛП:

max w =h1+h2+…+hn (5)

при ограничениях

 

a11h1+a21h2+…+am1hm≤1,

a12h1+a22h2+…+am2hm≤1, (6)

………………………….

a1nh1+a2nh2+…+amnhm≤1,

h1≥0,…, hm≥0, (7)

где

hj=yj*/ν, j=1,…,n; w =1/ν, (8)

a (у1*,...,уn*)=у* - оптимальная смешанная стратегия II игрока. Задача (5)-(7) соответствует второму игроку, т.е. решая ее симплекс-методом, находят оптимальную смешанную стратегию II игрока и значение игры по формулам (8).

Пример 4. Решить следующую игру

Решение: Доминируемых стратегий нет, т.е. упростить игру невозможно. Оптимальных чистых стратегий нет, т.к. равенство (3) не выполнено. Поэтому надо решить игру в смешанных стратегиях.

Чтобы исключить случай v ≤0 (см. (4),(8)) избавимся от отрицательных элементов матрицы, прибавив ко всем элементам 4. Тогда получим эквивалентную игру

Задача (1)-(3) и (5)-(7) запишутся:

min z= ξ1+ ξ2+ ξ3

при ограничениях

1+3ξ2+2ξ3≥1,

1+6ξ2+ ξ3≥1,

1+7ξ2+8ξ3≥1,

1+4ξ2+ ξ3≥1,

ξ1≥0, ξ2≥0, ξ3≥0;

 

max w=h1+h2+h3+h4

при ограничениях

5h1+4h2+2h3+5h4≤1

3h1+6h2+7h3+4h4≤1

2h1+ h2+8h3+ h4≤1

h1≥0,…,h4≥0

 

Примеры решения таких задач ЛП приведены в разделе II в достаточном количестве. Поэтому подробное решение здесь приводить не будем.

Последняя (оптимальная) симплекс-таблица для двойственной задачи (задачи второго игрока) имеет вид:

        h1 h2 h3 h4 h5 h6 h7
w 7/29   5/29   3/29 4/29 3/29  
h1 5/29   16/29   27/29 7/29 -2/29  
h3 2/29   18/29   5/29 -3/29 5/29  
h7 3/29   144/29   65/29 10/29 36/29  

 

Отсюда находим решение задачи ЛП: = (5/29,0, 2/29, 0) - точка максимума, w* =7/29 - максимальное значение целевой функции.

Оптимальную смешанную стратегию игрока П и значение игры А' находим по формулам (8):

v (A') =1/ w* = 29/7; у* = (5/7, 0, 2/7, 0).

В исходной игре А: v (А)= v (A')-4=1/7.

В качестве упражнения найдите оптимальную смешанную стратегию I игрока, решая прямую задачу двухфазным симплекс-методом.

 


Дата добавления: 2015-09-05; просмотров: 182 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Встреча по размещению первого заказа проводится за один день или в день сдачи заказа.| Общие сведения.

mybiblioteka.su - 2015-2024 год. (0.019 сек.)