научная статья по теме ОПТИМАЛЬНЫЙ ПО БЫСТРОДЕЙСТВИЮ СИНТЕЗ УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ МАЯТНИКОМ Кибернетика

Текст научной статьи на тему «ОПТИМАЛЬНЫЙ ПО БЫСТРОДЕЙСТВИЮ СИНТЕЗ УПРАВЛЕНИЯ НЕЛИНЕЙНЫМ МАЯТНИКОМ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 1, с. 13-22

= ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ =

УДК 531.36;62-50

ОПТИМАЛЬНЫЙ ПО БЫСТРОДЕЙСТВИЮ СИНТЕЗ УПРАВЛЕНИЯ

НЕЛИНЕЙНЫМ МАЯТНИКОМ*

© 2007 г. С. А. Решмин, Ф. Л. Черноусько

Москва, ИПМех РАН Поступила в редакцию 26.06.06 г.

Получен оптимальный по быстродействию синтез управления, который переводит нелинейный маятник в нижнее устойчивое положение равновесия. Решение основано на принципе максимума и включает в себя аналитическое исследование в комбинации с численными расчетами. В результате для различных значений максимального допустимого управляющего момента построены кривые переключений и рассеивающие кривые (или разделения), ограничивающие области в фазовом пространстве, которые соответствуют разным значениям релейного оптимального управления. Исследованные картины синтеза раскрывают механизм образования многочисленных изломов на кривых переключений при малых управляющих моментах.

Введение. Маятник (рис. 1) - хорошо известный пример нелинейной механической системы, которая часто используется как эталон для проверки алгоритмов управления. Во множестве публикаций предложены различные способы управления по обратной связи, которые переводят маятник в нижнее устойчивое положение равновесия. В данной работе получено оптимальное по быстродействию управление в форме синтеза. Это управление переводит маятник в нижнее положение равновесия за минимальное время. Решение основано на принципе максимума [1].

Как известно, наличие нелинейности в уравнении движения маятника приводит к периодической структуре (цилиндричности) по углу картины синтеза. Нижнему положению равновесия соответствует бесконечное множество терминальных точек в фазовом пространстве. Решение в окрестности каждой из этих точек близко к оптимальному синтезу для линейного осциллятора [1]. Кривая переключений для линейного осциллятора состоит из бесконечного числа полуокружностей, радиус которых равен максимально допустимому управляющему моменту. Поэтому чем жестче ограничение на управление, тем меньше радиусы указанных полуокружностей и тем чаще изломы на кривой переключений.

Цилиндричность фазового пространства вызывает специфические особенности синтеза. Главная из них - наличие кривой разделения, или рассеивающей кривой на цилиндре, из каждой точки которой исходят две оптимальные траектории с одинаковым временем движения (см. рис. 2, а, где

* Работа выполнена в рамках гранта Президента РФ на поддержку молодых российских ученых (МК-3127.2005.1) и ведущих научных школ (НШ-9831.2006.1) и при финансовой поддержке РФФИ (гранты < 05-01-00647 и 05-08-50226).

условно изображены две окрестности соседних терминальных точек в фазовом пространстве и кривая разделения между ними).

С другой стороны, при большом управляющем моменте нелинейное слагаемое в уравнении движения маятника можно опустить. Картина синтеза в этом случае состоит их параболических кривых переключений, проходящих через терминальные точки, и кривых разделения, расположенных между ними (рис. 2, б). Уравнение кривых разделения в случае большого управляющего момента может быть получено в явном виде [2].

Возникает вопрос, что происходит с картиной синтеза при постепенном уменьшении максимально допустимого управляющего момента, начиная от некоторого достаточно большого значения? А именно откуда появляются изломы на кривых переключений, которые первоначально были гладкими?

Расчеты авторов настоящей работы показали, что самые первые из указанных изломов получаются в результате трансформации границ так называемых областей ФЛАГ, которые ограничены линиями, состоящими из дуг кривых переключений и рассеивающих кривых. Здесь и далее ис-

Рис. 1. Маятник.

Кривая разделения \

Кривые переключений : окрестностях терминальных точек

x Кривая разделения ^ \ б

~\ы = -1 u = -1

(0, 0) (2п, 0) x

u = 1 u = 1

ю

= (J)

1/2

Здесь ю - собственная частота малых колебаний маятника, а t' - безразмерное время. Запишем безразмерные переменные

_ d ф

M

Mn

xi =ф, x2 = ^' u = M0' k = mgi (Ы)

и сформируем уравнение (1.1) в следующем виде:

Х1 = x2, Х2 = - sin x1 + ku, (1.5)

используя точки для обозначения производных по безразмерному времени t (далее штрих опускаем).

Ограничение (1.2) может быть представлено как:

U (t )|< 1. (1.6)

Начальные состояния для системы (1.5) произвольны

Xi( 0) = X0, Х2( о) = x2,

(1.7)

Кривые переключений

Рис. 2. Цилиндричность фазового пространства и трансформация картины синтеза.

пользуется термин ФЛАГ, введенный в [2] и образованный из заглавных букв имен авторов работы [3], в которой было обнаруженно существование бесконечного числа областей ФЛАГ в фазовой плоскости при больших управляющих моментах. Дальнейшее образование изломов (при уменьшении управляющего момента) происходит по аналогичной схеме, причем указанный процесс изображен ниже на рисунках при различных ограничениях на управляющий момент.

1. Постановка задачи. Рассмотрим маятник, который может вращаться вокруг горизонтальной оси O и управляется приложенным к нему моментом M. Введем следующие обозначения: ф -угол между маятником и вертикальной осью (рис. 1), m - масса маятника, J - его момент инерции относительно оси O, I - расстояние от оси O до центра масс маятника, g - ускорение свободного падения.

Уравнение движения маятника имеет вид

Jф + mgl sin ф = M, (1.1)

где точка обозначает взятие производной по времени t. Пусть на управляющий момент наложено ограничение

M < Mo, (1.2)

где M0 - заданная постоянная. Введем

f = ю t.

(1.3)

а терминальные условия соответствуют нижнему устойчивому положению равновесия

хх( Т) = 2 пп, х2 (Т) = 0, (1.8)

где п - произвольное целое число.

Управление, которое удовлетворяет ограничению (1.6) при всех t е [0, Т] и переводит систему (1.5) из произвольного начального состояния (1.7) в терминальное (1.8) за минимально возможное время, будет найдено как в программном виде, так и в форме синтеза.

2. Обзор литературы. В [4] рассмотрена задача об оптимальном управлении математическим маятником, которая описывает также управляемый поворот спутника в плоскости круговой орбиты. Проведено численное и качественное исследование программной задачи о повороте маятника, первоначально находящегося в нижнем устойчивом положении, на 360° вокруг точки подвеса. Построены зависимости времени быстродействия и числа переключений от момента.

В [2, 3, 5-7] для достаточно больших значений управляющего момента исследованы программная задача и оптимальный синтез приведения системы в начало координат как на всей фазовой плоскости, так и на фазовом цилиндре. Статья [3] содержит анализ задачи управления (1.5), (1.6) и для уравнения более общего, чем (1.5), но там рассматривается оптимальный по быстродействию перевод любой точки фазовой плоскости в начало координат и не учитывается цилиндричность фазового пространства. Наличие в фазовом пространстве областей ФЛАГ - наиболее существенная деталь, обнаруженная в [3]. Однако, как замечено в [4], работа [3] содержит ошибку. Результаты [3] использовались впоследствии в [2], где рассматривалась задача (1.5)-(1.8) при четных п в (1.8) (т.е. учитывалась цилиндрич-

ность фазового пространства, возникающая в задачах управления спутником).

В [6, 7] ничего не говорится о существовании областей ФЛАГ, и на картинах синтеза они не изображены. В [8] исследуется управляемая механическая система в виде маятника с точкой подвеса на оси колеса, которое может катиться по горизонтали без проскальзывания. Управляющий момент, приложенный к колесу, ограничен по модулю. На фазовом цилиндре строится оптимальное по быстродействию управление гашением колебаний маятника. Дается алгоритм построения программного управления, переводящего систему из нижнего положения равновесия в неустойчивое верхнее с гашением колебаний точки подвеса в конце движения. Обсуждаемая в [8] задача существенно отличается от задачи, решаемой в настоящей работе.

В [9, 10] построен оптимальный по быстродействию синтез для приведения нелинейного маятника в верхнее неустойчивое положение равновесия. Результат дан для различных значений максимально допустимого управляющего момента.

3. Принцип максимума. Следуя принципу максимума [1], введем гамильтониан системы (1.5)

H = p 1 x2 + p2( -sin x1 + ku). (3.1)

Здесь p1 и p2 - сопряженные переменные, удовлетворяющие уравнениям

pi = p2 cos Xi, p2 = -pi. (3.2)

Оптимальное управление, удовлетворяющее ограничению (1.6), определяется из условия

u = sign p2. (3.3)

Из уравнений (1.8), (3.1) и (3.3) следует, что в терминальный момент времени t = T выполнено условие

Ht = k|p2(T)|> 0,

представляющее одно из необходимых условий оптимальности [1]. Результаты Главы 7 книги [6] указывают, что в рассматриваемой задаче особые управления не существуют.

Из (3.3) следует, что оптимальное управление принимает значения u = ±1, и для того, чтобы получить его в форме синтеза, достаточно найти кривые переключений и рассеивающие кривые в плоскости XjX2, ограничивающие области, где u = = +1 и -1.

Заметим, что кривые переключений состоят из точек, в которых управление u(t) изменяет свой знак при движении вдоль оптимальной траектории. Рассеивающие кривые образованы такими точками, где оптимальное управление может равняться либо +1, либо -1, а две оптимальные траектории, начинающиеся в каждой из этих точек, достигают терминального состояния (1.8)

(при одинаковых или разных n) за одинаковое время.

4.0собые траектории. Проанализируем особые траектории, приводящие в терминальные состояния x1 = 2nn, x2 = 0 при постоянном управлении u = +1 или -1. Представим подробное построение особой траектории для x1 = 0 (n = 0), x2 = 0 и u = +1. Зададим терминальные значения сопряженных переменных так, что pi(T) > 0, p2(T) = 0, и докажем, что p2(t) > 0 при t < T. В этом случае уравнение (3.3) будет выполнено. Без ограничения общности сопряженные переменные можно нормализовать

pi( T) = 1, p2 (T) = 0. (4.1)

Подставим u = +1 в (1.5) и найдем первый интеграл

x2

"2~ cos Xi kxi Ci.

Для того чтобы определить константу C1, подставим терминальные усл

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком