научная статья по теме О НЕКОТОРЫХ ОПТИМАЛЬНЫХ ЗАДАЧАХ БЫСТРОДЕЙСТВИЯ ДЛЯ МАЯТНИКОВЫХ СИСТЕМ Кибернетика

Текст научной статьи на тему «О НЕКОТОРЫХ ОПТИМАЛЬНЫХ ЗАДАЧАХ БЫСТРОДЕЙСТВИЯ ДЛЯ МАЯТНИКОВЫХ СИСТЕМ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 2, с. 72-82

= ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ =

УДК 62-50

О НЕКОТОРЫХ ОПТИМАЛЬНЫХ ЗАДАЧАХ БЫСТРОДЕЙСТВИЯ

ДЛЯ МАЯТНИКОВЫХ СИСТЕМ

© 2007 г. Э. К. Лавровский

Москва, Институт механики МГУ Поступила в редакцию 03.05.06 г.

Решается задача оптимального по быстродействию приведения двухзвенного маятника с верхней точкой подвеса (и некоторых других механических систем маятникового типа) из устойчивого нижнего положения в неустойчивое верхнее. Управляемым является межзвенный угол маятника, точнее - угловая скорость данного угла. Эта угловая скорость, а также сам угол могут меняться в ограниченных пределах.

Введение. Работа посвящена решению оптимальной по быстродействию задачи приведения двухзвенного маятника с верхней точкой подвеса в неустойчивое верхнее положения из нижнего положения покоя. Задача рассматривается в "кинематической" постановке, при которой управлением является ограниченная по модулю скорость по межзвенному углу. Накладывается и ограничение по самому межзвенному углу. Прототипом такой динамической системы служит гимнаст на перекладине. Какое-либо управляющее воздействие в точке закрепления верхнего звена маятника отсутствует.

Задача исследуется численно. Основная трудность построения решения краевой задачи, получающейся из принципа максимума, заключается в наличии так называемых режимов особого управления. Однако в случае, когда нет ограничения по угловой скорости (он назван "предельным"), удается найти замену переменных, для которых при написании принципа максимума режимы особого управления отсутствуют, точнее, они преобразуются в режимы промежуточного управления. Это обстоятельство позволяет без проблем решать соответствующую новую краевую задачу.

Аналогичная ситуация возникает и в задаче управления колебаниями двухзвенного маятника-балансира, у которого нижнее звено - балансир может перемещаться относительно верхнего -рейки либо строго вертикально, либо горизонтально.

1. Управление колебаниями двухзвенного маятника. Уравнения движения. Постановка задачи. Рассматривается задача управления плоскими колебаниями двухзвенного маятника с верхней точкой подвеса, движение которого осуществляется под действием силы веса и управляющего момента, приложенного в точке сочленения звеньев. Момент в точке подвеса отсутствует. В этом состоит аналогия между рассматриваемыми ко-

лебаниями и колебаниями гимнаста на перекладине, у которого руки вместе с туловищем составляют как бы верхнее звено, а ноги - второе, нижнее звено.

Введем определяющие координаты маятника: ф - угол от вертикали верхнего звена в точке подвеса О, а - межзвенный угол верхнего и нижнего звеньев (рис. 1), I и г2 - длины верхнего звена и расстояние до центра масс нижнего звена от точки сочленения звеньев, т2 - масса нижнего звена, а 1х и 12 - соответственно моменты инерции верхнего звена в точке подвеса и нижнего звена в его центре тяжести. Вместо того, чтобы рассматривать систему уравнений Лагранжа 4-го порядка, запишем сначала выражение для кинетического момента динамической системы

К = ф'{ 1Х +12 + т2 (I2 + + 2 ¡г2соъ а)} +

+ а'{ 12 + т2 (г2 + ¡г2 со8 а)}.

Точкой помечено дифференцирование по времени. Обозначая через тх массу верхнего звена, % -ускорение силы тяжести и гх - координату центра

тяжести верхнего звена, из теоремы об изменении кинетического момента имеем

ях. Назовем "предельным" случаем данной зада-

dK/dt + m1 gr1 sin ф + + m2g {l sin ф + r2sin (a + ф)} = 0.

(1.2)

где

R = Я(ф, a) = 1 [3 sin ф + sin(a + ф)],

(1.4)

чи вариант un

=, когда поведение координаты

Пусть для простоты рассматривается случай однородных звеньев с одинаковыми массой т и длиной I. Переходя к безразмерным значениям времени т = t|ll|2gí|2, дифференцирование по которому обозначим штрихом, и кинетического момента, равного К|mIi|2gí|2, из соотношений (1.1) и (1.2) получаем

К = -Я, К = ф% + а'п, (1.3)

= £(a) = 5/3 + cos a, П = n(a) = 1/3 + 1/2 cos a.

Будем рассматривать задачу в "кинематической" постановке, при которой управляющим полагается не момент в точке сочленения звеньев, а угловая скорость по межзвенному углу. Тем самым указанный момент допускается достаточно большим, чтобы обеспечить практически мгновенное изменение угловой скорости в некотором предписанном ей диапазоне, который естественно считать симметричным. При кинематической постановке задачи порядок уравнений, описывающих колебания маятника, понижается до третьего, что позволяет исследовать ряд оптимальных задач, связанных с его раскачиванием. Действительно, в качестве фазовых переменных тогда введем К, ф, a. При этом уравнения (1.3), (1.4) дополняются единственным соотношением a' = u, |u| < umax. (1.5)

Обратимся к задаче наибыстрейшего приведения маятника из состояния покоя ф(0) = 0, a(0) = = 0, К(0) = 0 в некоторое верхнее состояние. При конечных ф = ±п, a = 0, К = 0 маятник переводится с торможением в верхнее положение в "раскрытом" виде; при ф = ±п, a = 0 и произвольном К он перемещается туда же, но не тормозится; наконец, при ф = ±п и свободных конечных величинах a, К маятник переводится без торможения и с произвольной конфигурацией наверху. Дополнительно, отчасти имея в виду аналогию с гимнастом, наложим ограничение на область изменения угла a

Omin < a < Omax. (1.6)

В частности, рассматривая маятник с одинаковыми, однородными звеньями, будем считать, что

-п < a < 0. (1.7)

Сформулированная задача быстродействия имеет третий порядок при двух фазовых ограничени-

а в принципе носит разрывный характер. Будем считать, что имеет место непрерывная зависимость оптимального режима от итах, а "предельный" случай соответствует переходу к пределу

при итах --

"Предельный" случай. Замена переменных. Отвечающие поставленной задаче быстродействия (1.3)-(1.7) необходимые условия оптимальности представлены в Приложении. Здесь илюстрируется, что путем перехода от старой независимой переменной времени т к новой 5, которой является длина дуги графика функции а(т), предельный и общий случаи задачи могут быть рассмотрены с позиций единого принципа максимума. Показано, что оптимальный режим управления может состоять из участков трех типов движения: по ограничениям угла а (1.7) с максимальным по величине управлением и = ±итах и, наконец, с использованием особого управления. Условия оптимальности этих участков и их согласования довольно сложны, что оставляет мало шансов на чисто аналитическое исследование задачи. Численному же решению мешает, в первую очередь, наличие режимов особого управления и связанная с ними неопределенность моментов выхода и схода с данных особых участков. Если же рассматривается предельный случаи, то трудности, порождаемые особыми режимами, оказывается, могут быть преодолены за счет постановки задачи в других переменных.

Перейдем к исследованию предельного случая и сделаем необходимую замену переменных. Применению стандартной схемы принципа максимума в уравнениях (1.3) препятствует наличие 5-функции за счет dа|dт во втором уравнении (1.3) для угла ф. Оставим в прежнем виде уравнение для кинетического момента К и произведем замену переменных - вместо ф будем рассматривать [1] новую переменную р

Р = ф + a - 4arctg(°.51§О

(1.8)

Дифференцируя (1.8) в соответствии с (1.3) и преобразуя полученное, имеем

= d-ф + ° 5^-о 3

1

dT d т

х -

dT

0.5 1 da

V (°.5tg22

K

х

а2 dт £(а)'

со8-

Тем самым, заменяя ф на р из (1.8), приходим окончательно к замкнутой системе второго порядка в переменных (К, р)

Условие максимума гамильтониана Н по управлению имеет вид

maxH = max

а а

К у2

-У!

.5/3 + cos а 2

х

х { 3sin ф + sin (ф + а)}

ае [-п,0].

Запишем производную дН/да и приравняем ее к нулю. После некоторых преобразований имеем

Рис. 2.

dK п, ,,, dp К - = -к(ф(Р,а),а), = ,

а3

ф = Р - 2+ 4a g

Г а 2 2

(1.9)

H = ¥0 - | ¥J 3sin ф + sin (а + ф)] + ¥ 2

К £;(а),

d у 1 d т

дН "ЭК

-¥2 а),

d V:

d V2 дН ¥iro , . чпЭф

— = - ^ = - [ 3cos ф + cos (а + ф)]дР,

дф = \ д p

с управлением а е [-п, 0]. Переменная р, так же, как, впрочем, и К, не рвется при скачках управления а: она как бы описывает целый диапазон возможных углов ф при изменении а в интервале а е [-п, 0].

Поставим следующую новую задачу быстродействия в переменных (К, р), описываемую системой (1.9) с краевыми условиями,

К(0) = р(0) = 0, К(Т) = 0, р(Т) = ±п.

Легко видеть, что такая новая задача полностью эквивалентна исходной задаче быстродействия для случая приведения раскрытого маятника в верхнее положение с успокоением. Действительно, если ф(Т) = ±п, а(Т) = 0, то и р(Т) = ±п. И наоборот, если р(Т) = ±п, но при этом конечное а Ф 0, то за счет дополнительного участка нулевой длительности можно поменять значение а на а = 0, обеспечив, тем самым, выполнение условия ф(Т) = ±п. Отсюда вытекает, что обе задачи полностью эквивалентны.

Переход к решению новой задачи более низкого порядка, однако, не означает, что все трудности позади. С первого взгляда кажется, что, если исходная задача имела режимы особого управления, то они должны возникнуть и здесь. Запишем условия принципа максимума [2]

дН К ¥2 sin а Vi {[Q ,л )

Т" = -77ТГ-+ Т {[ 3cos (ф - p) -

да 5/3 +cos а 2

- cos(ф-p + а)]^3- + .-cosа^-

- cos(ф - p + а)} = 0.

Поскольку функция (ф - р) зависит только от а, мы получили тригонометрическое уравнение по этой переменной, коэффициентами которого являются фазовые и сопряженные переменные задачи. Следовательно, в тех точках режима управления, где а принимает промежуточные значения, оно определяется (с точностью до конечного числа решений) из условия дН/да = 0 и потому не является особым. Это свойство новой задачи открывает путь к ее численному решению. Опишем этот численный алгоритм.

Введем переменные X, Y и несколько по-иному запишем гамильтониан

X = -R ^(p, а), а) Y =

1

1

£(а) 5/3 + cos а' Н = Ку2 Y + ¥ 1X = n (X, Y).

На рис. 2 показана жирной линией типичная картина поведения переменных X, Y при некотором р, когда управление а пробегает свой диапазон изменения. Видно, что максимуму Н отвечает почти всюду единственная точка на жирной кривой, для которой

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком