ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 2, с. 72-82
= ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ =
УДК 62-50
О НЕКОТОРЫХ ОПТИМАЛЬНЫХ ЗАДАЧАХ БЫСТРОДЕЙСТВИЯ
ДЛЯ МАЯТНИКОВЫХ СИСТЕМ
© 2007 г. Э. К. Лавровский
Москва, Институт механики МГУ Поступила в редакцию 03.05.06 г.
Решается задача оптимального по быстродействию приведения двухзвенного маятника с верхней точкой подвеса (и некоторых других механических систем маятникового типа) из устойчивого нижнего положения в неустойчивое верхнее. Управляемым является межзвенный угол маятника, точнее - угловая скорость данного угла. Эта угловая скорость, а также сам угол могут меняться в ограниченных пределах.
Введение. Работа посвящена решению оптимальной по быстродействию задачи приведения двухзвенного маятника с верхней точкой подвеса в неустойчивое верхнее положения из нижнего положения покоя. Задача рассматривается в "кинематической" постановке, при которой управлением является ограниченная по модулю скорость по межзвенному углу. Накладывается и ограничение по самому межзвенному углу. Прототипом такой динамической системы служит гимнаст на перекладине. Какое-либо управляющее воздействие в точке закрепления верхнего звена маятника отсутствует.
Задача исследуется численно. Основная трудность построения решения краевой задачи, получающейся из принципа максимума, заключается в наличии так называемых режимов особого управления. Однако в случае, когда нет ограничения по угловой скорости (он назван "предельным"), удается найти замену переменных, для которых при написании принципа максимума режимы особого управления отсутствуют, точнее, они преобразуются в режимы промежуточного управления. Это обстоятельство позволяет без проблем решать соответствующую новую краевую задачу.
Аналогичная ситуация возникает и в задаче управления колебаниями двухзвенного маятника-балансира, у которого нижнее звено - балансир может перемещаться относительно верхнего -рейки либо строго вертикально, либо горизонтально.
1. Управление колебаниями двухзвенного маятника. Уравнения движения. Постановка задачи. Рассматривается задача управления плоскими колебаниями двухзвенного маятника с верхней точкой подвеса, движение которого осуществляется под действием силы веса и управляющего момента, приложенного в точке сочленения звеньев. Момент в точке подвеса отсутствует. В этом состоит аналогия между рассматриваемыми ко-
лебаниями и колебаниями гимнаста на перекладине, у которого руки вместе с туловищем составляют как бы верхнее звено, а ноги - второе, нижнее звено.
Введем определяющие координаты маятника: ф - угол от вертикали верхнего звена в точке подвеса О, а - межзвенный угол верхнего и нижнего звеньев (рис. 1), I и г2 - длины верхнего звена и расстояние до центра масс нижнего звена от точки сочленения звеньев, т2 - масса нижнего звена, а 1х и 12 - соответственно моменты инерции верхнего звена в точке подвеса и нижнего звена в его центре тяжести. Вместо того, чтобы рассматривать систему уравнений Лагранжа 4-го порядка, запишем сначала выражение для кинетического момента динамической системы
К = ф'{ 1Х +12 + т2 (I2 + + 2 ¡г2соъ а)} +
+ а'{ 12 + т2 (г2 + ¡г2 со8 а)}.
Точкой помечено дифференцирование по времени. Обозначая через тх массу верхнего звена, % -ускорение силы тяжести и гх - координату центра
тяжести верхнего звена, из теоремы об изменении кинетического момента имеем
ях. Назовем "предельным" случаем данной зада-
dK/dt + m1 gr1 sin ф + + m2g {l sin ф + r2sin (a + ф)} = 0.
(1.2)
где
R = Я(ф, a) = 1 [3 sin ф + sin(a + ф)],
(1.4)
чи вариант un
=, когда поведение координаты
Пусть для простоты рассматривается случай однородных звеньев с одинаковыми массой т и длиной I. Переходя к безразмерным значениям времени т = t|ll|2gí|2, дифференцирование по которому обозначим штрихом, и кинетического момента, равного К|mIi|2gí|2, из соотношений (1.1) и (1.2) получаем
К = -Я, К = ф% + а'п, (1.3)
= £(a) = 5/3 + cos a, П = n(a) = 1/3 + 1/2 cos a.
Будем рассматривать задачу в "кинематической" постановке, при которой управляющим полагается не момент в точке сочленения звеньев, а угловая скорость по межзвенному углу. Тем самым указанный момент допускается достаточно большим, чтобы обеспечить практически мгновенное изменение угловой скорости в некотором предписанном ей диапазоне, который естественно считать симметричным. При кинематической постановке задачи порядок уравнений, описывающих колебания маятника, понижается до третьего, что позволяет исследовать ряд оптимальных задач, связанных с его раскачиванием. Действительно, в качестве фазовых переменных тогда введем К, ф, a. При этом уравнения (1.3), (1.4) дополняются единственным соотношением a' = u, |u| < umax. (1.5)
Обратимся к задаче наибыстрейшего приведения маятника из состояния покоя ф(0) = 0, a(0) = = 0, К(0) = 0 в некоторое верхнее состояние. При конечных ф = ±п, a = 0, К = 0 маятник переводится с торможением в верхнее положение в "раскрытом" виде; при ф = ±п, a = 0 и произвольном К он перемещается туда же, но не тормозится; наконец, при ф = ±п и свободных конечных величинах a, К маятник переводится без торможения и с произвольной конфигурацией наверху. Дополнительно, отчасти имея в виду аналогию с гимнастом, наложим ограничение на область изменения угла a
Omin < a < Omax. (1.6)
В частности, рассматривая маятник с одинаковыми, однородными звеньями, будем считать, что
-п < a < 0. (1.7)
Сформулированная задача быстродействия имеет третий порядок при двух фазовых ограничени-
а в принципе носит разрывный характер. Будем считать, что имеет место непрерывная зависимость оптимального режима от итах, а "предельный" случай соответствует переходу к пределу
при итах --
"Предельный" случай. Замена переменных. Отвечающие поставленной задаче быстродействия (1.3)-(1.7) необходимые условия оптимальности представлены в Приложении. Здесь илюстрируется, что путем перехода от старой независимой переменной времени т к новой 5, которой является длина дуги графика функции а(т), предельный и общий случаи задачи могут быть рассмотрены с позиций единого принципа максимума. Показано, что оптимальный режим управления может состоять из участков трех типов движения: по ограничениям угла а (1.7) с максимальным по величине управлением и = ±итах и, наконец, с использованием особого управления. Условия оптимальности этих участков и их согласования довольно сложны, что оставляет мало шансов на чисто аналитическое исследование задачи. Численному же решению мешает, в первую очередь, наличие режимов особого управления и связанная с ними неопределенность моментов выхода и схода с данных особых участков. Если же рассматривается предельный случаи, то трудности, порождаемые особыми режимами, оказывается, могут быть преодолены за счет постановки задачи в других переменных.
Перейдем к исследованию предельного случая и сделаем необходимую замену переменных. Применению стандартной схемы принципа максимума в уравнениях (1.3) препятствует наличие 5-функции за счет dа|dт во втором уравнении (1.3) для угла ф. Оставим в прежнем виде уравнение для кинетического момента К и произведем замену переменных - вместо ф будем рассматривать [1] новую переменную р
Р = ф + a - 4arctg(°.51§О
(1.8)
Дифференцируя (1.8) в соответствии с (1.3) и преобразуя полученное, имеем
= d-ф + ° 5^-о 3
1
dT d т
х -
dT
0.5 1 da
V (°.5tg22
K
х
а2 dт £(а)'
со8-
Тем самым, заменяя ф на р из (1.8), приходим окончательно к замкнутой системе второго порядка в переменных (К, р)
Условие максимума гамильтониана Н по управлению имеет вид
maxH = max
а а
К у2
-У!
.5/3 + cos а 2
х
х { 3sin ф + sin (ф + а)}
ае [-п,0].
Запишем производную дН/да и приравняем ее к нулю. После некоторых преобразований имеем
Рис. 2.
dK п, ,,, dp К - = -к(ф(Р,а),а), = ,
а3
ф = Р - 2+ 4a g
Г а 2 2
(1.9)
H = ¥0 - | ¥J 3sin ф + sin (а + ф)] + ¥ 2
К £;(а),
d у 1 d т
дН "ЭК
-¥2 а),
d V:
d V2 дН ¥iro , . чпЭф
— = - ^ = - [ 3cos ф + cos (а + ф)]дР,
дф = \ д p
с управлением а е [-п, 0]. Переменная р, так же, как, впрочем, и К, не рвется при скачках управления а: она как бы описывает целый диапазон возможных углов ф при изменении а в интервале а е [-п, 0].
Поставим следующую новую задачу быстродействия в переменных (К, р), описываемую системой (1.9) с краевыми условиями,
К(0) = р(0) = 0, К(Т) = 0, р(Т) = ±п.
Легко видеть, что такая новая задача полностью эквивалентна исходной задаче быстродействия для случая приведения раскрытого маятника в верхнее положение с успокоением. Действительно, если ф(Т) = ±п, а(Т) = 0, то и р(Т) = ±п. И наоборот, если р(Т) = ±п, но при этом конечное а Ф 0, то за счет дополнительного участка нулевой длительности можно поменять значение а на а = 0, обеспечив, тем самым, выполнение условия ф(Т) = ±п. Отсюда вытекает, что обе задачи полностью эквивалентны.
Переход к решению новой задачи более низкого порядка, однако, не означает, что все трудности позади. С первого взгляда кажется, что, если исходная задача имела режимы особого управления, то они должны возникнуть и здесь. Запишем условия принципа максимума [2]
дН К ¥2 sin а Vi {[Q ,л )
Т" = -77ТГ-+ Т {[ 3cos (ф - p) -
да 5/3 +cos а 2
- cos(ф-p + а)]^3- + .-cosа^-
- cos(ф - p + а)} = 0.
Поскольку функция (ф - р) зависит только от а, мы получили тригонометрическое уравнение по этой переменной, коэффициентами которого являются фазовые и сопряженные переменные задачи. Следовательно, в тех точках режима управления, где а принимает промежуточные значения, оно определяется (с точностью до конечного числа решений) из условия дН/да = 0 и потому не является особым. Это свойство новой задачи открывает путь к ее численному решению. Опишем этот численный алгоритм.
Введем переменные X, Y и несколько по-иному запишем гамильтониан
X = -R ^(p, а), а) Y =
1
1
£(а) 5/3 + cos а' Н = Ку2 Y + ¥ 1X = n (X, Y).
На рис. 2 показана жирной линией типичная картина поведения переменных X, Y при некотором р, когда управление а пробегает свой диапазон изменения. Видно, что максимуму Н отвечает почти всюду единственная точка на жирной кривой, для которой
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.