Читайте также:
|
|
Это метод расчета оптимальных процессов и систем, который выражает необходимое условие оптимальности. Рассмотрим упрощенный вывод принципа максимума.
Задано уравнение управляемого объекта в векторно-матричной форме
где .
Ограничение наложено на скалярное управляющее воздействие .
Задан минимизируемый функционал:
.
Необходимо найти оптимальные управление и траекторию . Порядок решения поставленной задачи следующий.
1. Вводим дополнительную переменную состояния
,
конечное значение которой , т.е. равно критерию оптимальности. Эта переменная вместе с другими характеризует объект управления и образует обобщенный вектор состояния
.
Дифференцируя по t выражение для новой переменной найдем уравнение в нормальной форме . Добавив это уравнение в систему заданных уравнений объекта управления, получим систему обобщенных уравнений:
, (17)
где .
2. Производим игольчатую вариацию управляющего воздействия относительно искомого оптимального закона его изменения (рис. 12), при которой это воздействие скачком изменяется до предельного значения и затем обратно в течение бесконечно малого отрезка времени .
Рис. 12
Площадь игольчатой вариации бесконечно мала, поэтому она вызывает бесконечно малые отклонения (вариации) переменных состояния:
,
где .
В частности, вариация
, (18)
так как система оптимальна по минимуму критерия оптимальности.
3. Выразим вариацию траектории в момент времени как произведение ее скорости на длительность вариации, т. е.
.
В последнем равенстве заменим скорости на соответствующие функции, взятые из (17):
. (19)
4. Определим вариацию критерия оптимальности в момент по формуле скалярного произведения:
, (20)
где - вспомогательная вектор-функция, подлежащая определению и имеющая смысл градиента изменения критерия оптимальности при изменении переменных состояния.
5. Подставляем (19) в (20) и с учетом знака вариации получим неравенство для :
. (21)
6. Обозначаем функцию Гамильтона (гамильтониан)
. (22)
Сравнение (22) и (21) позволяет сформулировать принцип максимума.
Для оптимального управления объектом необходимо, чтобы гамильтониан Н имел максимальное (наибольшее) значение в любой момент процесса управления.
Если оптимальное управление находится внутри допустимой области, то гамильтониан Н достигает максимума. Если же управление меняется по границам этой области, то Н достигает своего наибольшего значения (супремума).
7. Для нахождения вспомогательных функций получены следующие уравнения:
. (23)
Для функций в соответствии с (20) и (18) получаются следующие граничные условия:
.
Так как гамильтониан Н от х0не зависит, то из (23) имеем , следовательно, .
1.10. Порядок практического применения принципа максимума
1. Располагая заданным функционалом и уравнениями объекта, составляем гамильтониан Н по формуле (22). Причем, если подынтегральная функция f 0 от управления и не зависит, то соответствующее слагаемое можно в гамильтониан не включать, так как это не повлияет на решение задачи. Это справедливо, в частности, для критерия максимального быстродействия, когда f 0=1.
2. Исследуем гамильтониан Н на максимум по управлению и, т. е. решаем уравнение .
Отсюда находим в общем виде оптимальное управление через переменные и . Если это уравнение приводит к нулевым значениям хотя бы для одной функции ; (тривиальное решение), то это считается неприемлемым и означает, что оптимальное управление изменяется по границам допустимой области. Соответственно гамильтониан Н имеет не максимум, а наибольшее значение (супремум). В этом случае оптимальный закон управления находится из выражения для Н в классе знаковых функций с учетом ограничений на управление.
3. Найденный оптимальный алгоритм управления подставляют в уравнения (16) и (23), и они решаются совместно. При этом решении возникают сложности с определением постоянных интегрирования, удовлетворяющих граничным условиям. Поэтому обычно ограничиваются решением качественного характера, при котором определяется лишь характер изменения оптимального управления. Дальнейшее применение метода припасовывания позволяет получить точное решение количественного характера.
Лекция 6.
1.12. Синтез оптимального по быстродействию регулятора для линейного стационарного объекта второго порядка
Этот синтез производится с использованием метода припасовывания в фазовом пространстве и теоремы об п интервалах. Объект управления задан своим дифференциальным уравнением
(24)
где .
Требуется определить алгоритм оптимального управления при произвольных краевых условиях.
Порядок синтеза следующий:
1. В качестве переменных состояния целесообразно выбрать ошибку управления х1 и ее первую производную х2 по времени
так как на фазовой плоскости этих переменных изображающая точка в конце оптимального переходного процесса приходит в начало координат.
Учитывая эти равенства и заданное уравнение объекта управления, запишем систему уравнений последнего в нормальной форме:
(25)
2. Определяем допустимое задающее воздействие g (t) в неко-
тором классе функций, например, в классе полиномиальных
(26)
Допустимым называется такое задающее воздействие которое управляемая величина y(t) может «догнать» при заданном
ограничении на управление.
Определим, какие значения коэффициентов A 0, A 1 и A 2 допус-
тимы при заданном ограничении. Исходим из требования, что в
конце переходного процесса ошибка и ее производные первого и
второго порядка должны равняться 0:
(27)
Решим эту задачу применительно к двигателю постоянного
тока как объекту регулирования угла поворота вала. Исходное
уравнение (24) и уравнения (25) примут вид:
;
. (28)
Требование (27) с учетом (26) и (28) можно записать в виде:
Так как функция A 2 t растет неограниченно, а управление и ограничено значением Um, то это равенство может быть выполнено при
Для объектов управления с разным порядком астатизма V требования к коэффициентам А0, А1 и А2сведены в табл. 2.
Таблица 2
Порядок V | A0 | A1 | А2 |
Любое | |||
Любое | Любое |
3. Находим дифференциальное уравнение фазовых траекторий объекта управления, решаем его и строим два семейства фазовых траекторий при .
Уравнение фазовой траектории объекта при оптимальном управлении имеет общий вид
(29)
где для объекта в виде двигателя постоянного тока.
Постоянная интегрирования х 10 имеет смысл координаты точки пересечения фазовой траектории с осью х1, так как функция f равна 0 при х2 = 0. По найденному уравнению можно построить два семейства фазовых траекторий (рис.14).
Рис. 14
4. Строим фазовый портрет оптимальной по быстродействию системы, используя теорему об п интервалах и метод припасовывания. Так как изображающая точка в конце переходного процесса должна приходить в начало координат, то второй интервал оптимального процесса должен совершаться по отрезкам нулевых полутраекторий АО или ВО.
Первый интервал того же процесса должен совершаться по полутраекториям семейства , оканчивающимся на АО, либо по полутраекториям , оканчивающимся на ВО (рис.15).
5. Используя построенный фазовый портрет, синтезируем алгоритм оптимального по быстродействию регулятора.
Рис.15
Из фазового портрета видно, что оптимальный регулятор является релейным двухпозиционным, и его линия переключения (ЛП) - это АОВ. Найдем ее уравнение. Для этого нужно учесть, во-первых, общее уравнение фазовых траекторий (29), во-вторых, прохождение линии АОВ через начало координат, т. е. х 10 = О, в-третьих, то, что на линии АОВ управление u совпадает по знаку с переменной х2, т. е. . Перенеся все члены уравнения (29) в одну часть, запишем уравнение ЛП
,
где . (30)
Функция является функцией переключения регулятора, так как она совпадает по знаку с оптимальным управлением на всей фазовой плоскости, кроме линии АОВ (рис.15).
Итак, алгоритм работы оптимального регулятора на первом интервале управления
(31)
Заметим, что равенства (30) и (31) определяют алгоритм работы оптимального регулятора приближенно, т. е. в квазиоптимальном режиме. Приближенность состоит в том, что второй интервал процесса при таком алгоритме управления будет совершаться не по отрезкам АО и ВО, а по бесконечно близким отрезкам фазовых траекторий, получающимся после пересечения ЛП изображающей точкой.
В соответствии с выражениями (30) и (31) построим структурную схему оптимальной по быстродействию системы автоматического управления объектом с астатизмом первого порядка (рис.16).
Рис.16
1.13. Оптимальные по быстродействию процессы
при ограничениях на управление
и одну из производных регулируемой величины
Рассмотрим в общем виде оптимальный по быстродействию процесс управления объектом п-го порядка с уравнением
при двух ограничениях:
.
Анализ оптимального процесса показывает, что он состоит из нескольких участков:
1) участок перевода ограниченной координаты от заданного начального значения к одному из предельно допустимых значений ;
2) участок стабилизации этой координаты на достигнутом предельно допустимом значении;
3) участок перевода ограниченной координаты от предельного допустимого значения одного знака до предельно допустимого значения противоположного знака и т. д.;
2 к + 1) участок перевода от одного из предельно допустимых значений до конечного значения .
Всего в процессе имеется k участков стабилизации и k + 1 участок перевода. Причем каждый участок перевода математически описывается уравнением, получаемым из уравнения объекта, если выходом считать не величину у, а ее k -ю производную y (k). При этом порядок уравнения понижается и становится равным n-k. Если соответствующее характеристическое уравнение удовлетворяет теореме об n интервалах, то в соответствии с этой теоремой на каждом участке перевода имеем n-k интервалов с постоянными управляющими воздействиями на уровнях .
Каждый участок стабилизации описывается заданным уравнением объекта, в котором производная k- го порядка постоянна. Поэтому производные высшего порядка от k +1 до n равны 0. В результате интегрирования можно найти младшие производные и выходную величину объекта управления. Затем из уравнения объекта можно найти управляющее воздействие на участке стабилизации как функцию времени. Этот закон изменения управления будет непрерывным и может быть обеспечен либо в разомкнутой системе заданием программы, либо в замкнутой системе за счет нелинейной отрицательной обратной связи по производной y(k) которая называется отсечкой. Такая отрицательная обратная связь не проявляет себя, пока не достигнуто ограничение, и имеет бесконечно большой коэффициент усиления в обратном случае.
Лекция 7.
Дата добавления: 2015-07-08; просмотров: 185 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Задача на безусловный экстремум функционала | | | Управляемость и наблюдаемость |