Читайте также:
|
|
Данный метод, разработанный Р. Беллманом, позволяет решать вариационные задачи при сложном виде возможных управлений. Он получил широкое применение при решении транспортных задач, задач распределения ресурсов, замены оборудования и т.д. При проектировании метод динамического программирования может быть использован для оптимизации конфигураций деталей, если их поверхность представлена как некоторая траектория в пространстве.
Метод динамического программирования отвечает тому естественному ходу человеческой мысли, который был выработан эволюцией. Подобные методы оптимизации, основанные на идее последовательного анализа вариантов, в большой степени используют природу изучаемых задач.
В основе метода лежит сформулированный Р. Беллманом принцип оптимальности. Этот принцип верен для тех систем, последующее движение которых полностью определяется их
состоянием в текущий момент времени. К таким системам относятся, например, управляемые системы, т.е. системы, аналогичные тем, для которых вводится принцип максимума.
Принцип оптимальности отражает важнейшие особенности задач оптимального управления. Его суть можно объяснять по-разному. Ввиду его важности приведем несколько формулировок.
Первая формулировка. Если управление оптимально, то, каковы бы ни были первоначальное состояние системы и управление системой в начальный момент времени, последующее управление оптимально относительно состояния, которое система примет в результате начального управления.
Указанное свойство - одно из основных, для процессов марковского типа, т.е. процессов, будущее поведение которых полностью определяется состоянием и управлением в настоящее время.
Вторая формулировка. Оптимальное управление в любой момент времени не зависит от предыстории системы и определяется только состоянием системы в этот момент и целью управления.
Еще один вариант принципа оптимальности дадим для за-дачи оптимального управления с фиксированным временем и свободным правым концом. Пусть закон движения описывается автономной системой дифференциальных уравнений (6.25), причем заданы начальный t1 и конечный t2 моменты времени, а также начальное состояние x(t1) = х1. Целевой функционал определим следующим образом:
Третья формулировка. Начиная с любого момента времени t'ϵ[t1,t2] участок оптимальной траектории также является оптимальной траекторией.
Другими словами, каково бы ни было положение точки x*(t') на оптимальной фазовой траектории, ее участок от точки х*(t') участок 2 на рис. 6.10) тоже является оптимальной траекторией.
Что же касается участка 1 оптимальной траектории до точки x*(t'), то можно утверждать, что этот участок есть оптимальная траектория, когда точка x*(t') - х' является фиксированной, т.е. когда по условию задачи допустимая траектория обязательно должна проходить через точку х'. Если же задана только начальная точка x*(t1) - x1, то участок 1 оптимальной траектории сам по себе может и не быть оптимальной траекторией, т.е. может не доставлять минимум целевому функционалу в задаче со свободным правым концом.
Таким образом, важно иметь в виду, что принцип оптимальности относится к последующему за данным состоянием движению системы, но может нарушаться для движения, предшествующего данному состоянию. Следовательно, нужно подчеркнуть, что принцип оптимальности не может быть распространен на любой участок траектории движения.
Отметим еще одну особенность оптимального управления, вытекающую из принципа оптимальности: выбор оптимального управления определяется лишь состоянием системы в текущий момент времени Если в какой-то период времени управление было не оптимальным, то последствия этого в будущем исправить уже нельзя
Дата добавления: 2015-07-15; просмотров: 193 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Билет 14. вопрос 1. Методы многомерной оптимизации: покоординатного спуска и градиентный. | | | Билет 16. Вопрос 1. Регулярные методы оптимизации: симплекс-метод решения задач линейного программирования. |