Читайте также:
|
|
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией SA игрока А называется применение чистых стратегий А1, А2,…,Аi,…Аm с вероятностями p1, p2,…,pi,…pm, причем сумма вероятностей равна 1: . Смешанные стратегии игрока записываются в виде матрицы:
,
или в виде строки . Аналогично свешанные стратегии игрока В обозначаются:
или , где сумма вероятностей появления стратегий игрока В равна 1: .
Чистые стратегии можно считать частным случаем смешанных и задавать строкой из нулей и единицы, причем единица должна стоять в позиции, соответствующей чистой стратегии.
На основании принципа минимакса определяется оптимальное решение игры: это пара оптимальных стратегий , в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей оптимальной стратегии. Выигрыш, соответствующей оптимальному решению, называется ценой игры . Цена игры удовлетворяет неравенству:
,
где - нижняя цена игры; - верхняя.
Теорема Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Если чистая стратегия входит в оптимальную смешанную стратегию с вероятностью, отличной от нуля, то она называется активной.
Теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равен цене игры , если второй игрок не выходит за пределы своих активных стратегий.
Пусть задана платежная матрица игры:
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
, а игрок В чистую стратегию (соответствует первому столбцу платежной матрицы Р), равен цене игры :
.
Тот же средний выигрыш получит игрок А, если игрок В выберет стратегию , то есть: . Учитывая, что , получим систему уравнений для определения оптимальной стратегии и цены игра :
Решая эту систему получим оптимальную стратегию и цену игры:
Применяя теорему об активных стратегиях - оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А ( или ) средней проигрыш игрока В равен цене игры :
Решая эту систему получим оптимальную стратегию и цену игры:
Пример 18:
Игра "Поиск" задана платежной матрицей без седловой точки:
Ищем решение в смешанных стратегиях; для игрока А средней выигрыш равен цене игры , для игрока В средний проигрыш равен цене игры. Системы уравнений имеет вид:
Решая эти системы получаем
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средней выигрыш равен 0.
Задания:
Найти смешанные стратегии игроков и цену игры:
1.
-2 | |
-1 |
2.
3.
-2 | |
Дата добавления: 2015-11-16; просмотров: 47 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Платежная матрица. Верхняя и нижняя цена игры. | | | ЗАНЯТТЯ № 3 III YEAR, V TERM |