Читайте также:
|
|
Неопределенность, связанную с отсутствием информации о вероятностях состояний окружающей среды (природы), называют «безнадежной». В таких случаях для определения наилучших решении используются критерий Лапласа, критерий «максимакса», критерий Вальда, критерий Сэвиджа и критерий Гурвица. Перечисленные критерии отличаются характерной степенью оптимизма для ЛПР.
Критерий Лапласа основан на принципе недосточного основания, который состоит в том, что, если распределение вероятностей ситуаций p(sj) неизвестно, то нет основания считать их различными. Таким образом, используется оптимистическое предположение, что p1=p2=…=pn=1/n. Следовательно, лучшим решением ai будет решение, при котором достигается максимум критерия:
.
Критерий максимакса определяет стратегию принятия решения, максимизирующую максимальные выигрыши для каждой ситуации (состояния природы). Этот критерий отличается крайним оптимизмом. Наилучшим признается решение, при котором достигается максимальный выигрыш, равный .
Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только сверхоптимисты, но и ЛПР, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «все или ничего».
Максиминный (минимаксный) критерий Вальда выбирает решение, для которого достигается значение . ЛПР руководствующийся данным критерием рассматривает окружающую среду как агрессивно настроенного и сознательно действующего противника и выбирает стратегию, дающую наилучший результат при реализации наихудших вариантов каждого из решений.
Для платежной матрицы (6.3) критерий Вальда дает следующие варианты наихудших значений:
i= 1, ;
i =2, ;
i =3, .
Тогда искомый максимум достигается при выборе второго решения a2.
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W = 3). Такая перестраховочная позиция крайнего пессимизма рассчитана на худший случай. Эта стратегия принятия решения приемлема, например, когда ЛПР не столько стремится к крупному выигрышу, сколько хочет застраховаться от большого проигрыша.
Критерий минимаксного риска Сэвиджа производит выбор стратегии аналогично выбору по критерию Вальда, но ЛПР руководствуется не матрицей платежей V, а матрицей рисков R, и производит выбор, минимизируя максимальный риск:
Для матрицы рисков (6.4) критерий Сэвиджа дает:
i =1 ;
i =2 ;
i =3 .
Минимально возможный из самых крупных рисков S = 1, достигается при принятии решения а2.
Критерий Гурвица рекомендует при выборе решения ориентироваться на некоторый усредненный результат. Такой подход характеризуется промежуточной склонностью ЛПР к риску между крайним пессимизмом (боязнью риска) и безудержным оптимизмом (безоглядный риск). Согласно критерию Гурвица предпочтительное решение выбирается по матрице V так, чтобы было достигнуто максимальное значение средневзвешенного выигрыша H:
Параметр р – показатель степени оптимизма ЛПР. При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при р = 1 - с критерием Вальда. Покажем процедуру применения данного критерия для матрицы V (6.3) при р = 0,5:
Тогда , т.е. оптимальным является решение а2.
Применительно к матрице рисков R критерий Гурвица имеет вид:
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (); при р = 1 - по критерию минимаксного риска Сэвиджа.
В случае, когда по принятому критерию рекомендуется к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию, например в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:
A | B | C | D | E | F | G | H | I | J | K | |
V | s1 | s2 | s3 | s4 | Макси макс | Лаплас | Вальд | Сэвидж R | Грувиц | р_ Гурвиц | |
a1 | 18,75 | 0,75 | |||||||||
a2 | 38,75 | 33,75 | |||||||||
a3 | 33,75 | 33,75 | |||||||||
a4 | |||||||||||
макс | 38,75 | 33,75 | |||||||||
а2 | а2 | а3 | а2 | а2 | |||||||
R | s1 | s2 | s3 | s4 | max r ij | ||||||
a1 | |||||||||||
a2 | |||||||||||
a3 | |||||||||||
a4 |
Рис. 6.2. Модель принятия решений в условиях неопределенности
Модель для выбора решений представлена на рис. 6.2. В соответствие с полученными значениями критериев ЛПР может принять следующие решения:
по критерию Лапласа – а2,
по критерию максимакса – а2.
по критерию Вальда – а3,
• по критерию Сэвиджа – а2,
• по критерию Гурвица (при р = 0,75) – а2.
Таким образом, в случае отсутствия информации о вероятностях состоянии среды теория не дает однозначных и математически строгих рекомендации по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях - попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны (хотя бы из-за склонности ЛПР к оптимизму или пессимизму). Не смотря на то, что применение математических методов в «играх с природой» не дает абсолютно достоверного результата и последний в определенной степени является субъективным (вследствие произвольности выбора критерия принятия решения), оно создает некоторое упорядочение и структурирование данных, имеющихся в распоряжении ЛПР: задаются множество состояний окружающей среды, множестово альтернативных решений, определяются выигрыши и потери при различных сочетаниях системы «среда - решение». Такое структурирование знаний об исследуемой проблеме способствует повышению качества принимаемых решений.
Задание.
Построить электронную таблицу (рис. 6.2), задав соответствующие формулы для ячеек F6-J6, в которых получаются значения критериев, используя промежуточные вычисления максимумов и минимумов по строкам матрицы V (диапазон B2:E5), а также для вычисления матрицы R (диапазон B10:E13). Обеспечить отображение выбираемых решений в ячейках F7-J7.
Для демонстрации зависимости критерия Гурвица от значения «показателя оптимизма» p, включить в модель элемент управления «линия прокрутки», обеспечивающий изменение параметра р от 0 до 1 с шагом 0,01.
Дата добавления: 2015-07-15; просмотров: 143 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Принятие решений в условиях неопределенности | | | Имитационное моделирование как метод исследования операций и оптимизации |