Читайте также: |
|
Пояснение к лабораторной работе №1
Довольно часто в своей практической деятельности человеку приходится сталкиваться с задачами, в которых необходимо принимать решение в условиях, когда две или более стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят мероприятий партнера.
Столкновение противоположных интересов участников приводит к возникновению конфликтных ситуаций. Чтобы исключить трудности, возникающие при анализе конфликтных ситуаций, строится упрощенная модель ситуаций. Такая модель называется игрой. Теория игр относится к теории статистических решений.
В задачах теории игр предполагалось, что в них примут участие две стороны, интересы которых противоположны. Поэтому действия каждой стороны направлены на увеличения выигрыша. Но во многих задачах, приводящих к игровым, неопределенность вызвана отсутствием информации об условиях, в которых осуществляется действие. Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности, которую принято называть природой.
Игру с природой описывается с помощью платёжной (полезности или эффективности) матрицы, в которой в качестве игрока А выступает статистик (человек, который принимает решения), имеющий m возможных стратегий А1, А2, …, Аm, а в качестве второго игрока выступает природа.
План, по которому игрок совершает выбор в каждой возможной ситуации и при каждой возможной фактической информации называется стратегий игрока.
Главным в исследовании теории игр является выбор оптимальных стратегий игроков. Стратегия игрока является оптимальной, если применение этой стратегии обеспечит ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. В процессе одной игры каждый из игроков выбирает одну стратеги. Стратегии делятся на чистые и смешанные.
Чистая стратегия – это стратегия, имеющая одно единственное значение или решение из множества заданных.
Смешанная (сложная) стратегия – это стратегия, которая берёт m значений с соответствующими вероятностями.
Стороны участвующие в конфликтной ситуации называются игроками, а предполагаемые действия каждого из игроков, направленные на достижение некоторой цели, называется правилами игры.
Платёж – это количественная оценка результатов игры.
Ходом в теории игр называется выбор одного из предложенных правилами игры действий его осуществлении.
Далее будут рассмотрены три критерия, на основе которых принимаются решения в зависимости от предпочтения ЛПР.
Пусть задан некоторый вектор S = (S1,S2,..,Sn), описывающий n состояний внешней среды, и вектор X = (X1,X2,..,Xm), описывающий m допустимых решений. Требуется найти вектор X*=(0,0,..,0, Xi,0,..,0), который обеспечивает оптимум некоторой функции полезности W(X,S) по некоторому критерию K.
Информация oб указанной функции представляют матрицей (платежной матрицей) размерности m x n c элементами Wij = F(Xi, Sj), где F - решающее правило.
Рассмотрим типичный пример формирования такой матрицы на основе задачи.
Планируется выпуск новой продукции, для чего необходимо закупить станки. Система оптовой торговли может поставить не более 50 станков; комплект поставки - 10 станков. Минимальный объем поставок - 20 станков. Соответственно, вектор решений об объеме поставок X = (20,30,40,50).
Ежегодный доход от продукции, снимаемой с одного станка, cоставляет 21.9 тыс.руб. Оптовая цена одного станка 4.775 тыс.руб., эксплуатационные расходы - 3.6 тыс. руб. Затраты на подготовку производства составляют 25.5 тыс.руб. и не зависят от числа станков и объема выпуска.
Пусть спрос пропорционален количеству продукции, снимаемой с S работающих станков, и для простоты ограничимся вектором состояний спроса S = (0,10,20,30,40,50).
Если решающее правило сформулировать как "доход - издержки", то можно рассчитать элементы матрицы полезности:
Wij = (21.9 - 3.6) * min(Xi, Sj) - 4.775 Xi - 25.5
Wij | = | -121 | |||||
-168,75 | 14,25 | 197,25 | 380,25 | 563,25 | 746,25 | ||
-216,5 | -33,5 | 149,5 | 332,5 | 515,5 | 698,5 | ||
-264,25 | -81,25 | 101,75 | 284,75 | 467,75 | 650,75 |
Например
W11 = -(4.775 20+25.5) = -121,
W12 = (21.9-3.6) * 10-(4.775 20+25.5) = 62,
W13 = (21.9-3.6) * 20-(4.775 20+25.5) = 245,
W14 = W15 = 245 (спрос останется неудовлетворенным).
Дата добавления: 2015-07-19; просмотров: 65 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Географическое приложение. | | | Критерий Вальда. |