научная статья по теме НЕПРЕРЫВНОЕ УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ НА ОСНОВЕ МЕТОДА ДЕКОМПОЗИЦИИ Кибернетика

Текст научной статьи на тему «НЕПРЕРЫВНОЕ УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ НА ОСНОВЕ МЕТОДА ДЕКОМПОЗИЦИИ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2014, № 4, с. 3-17

УПРАВЛЕНИЕ В ДЕТЕРМИНИРОВАННЫХ СИСТЕМАХ

УДК 531.36; 62-50

НЕПРЕРЫВНОЕ УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ НА ОСНОВЕ МЕТОДА ДЕКОМПОЗИЦИИ*

© 2014 г. И. М. Ананьевский, С. А. Решмин

Москва, ИПМех РАН Поступила в редакцию 27.01.14 г.

Для лагранжевых динамических систем с неточно известными параметрами построено непрерывное управление в форме синтеза, использующее идеи метода декомпозиции на основном участке траектории и линейные обратные связи с коэффициентами, зависящими от фазовых переменных, в окрестности терминального состояния. Предполагается, что в области движения матрица кинетической энергии системы близка к некоторой постоянной матрице и на систему действуют неконтролируемые ограниченные возмущения. Предложенные законы управления позволяют переводить систему из произвольного начального состояния в заданное терминальное состояние за конечное время при помощи ограниченных по модулю обобщенных сил. Дана оценка сверху полного времени движения системы и указаны способы ее уменьшения. Эффективность представленных алгоритмов продемонстрирована на примере численного моделирования динамики ряда простых механических систем.

Б01: 10.7868/80002338814040027

Введение. Рассматривается задача о построении непрерывных законов управления в форме обратной связи для лагранжевых механических систем, содержащих неточно заданные параметры и подверженных неконтролируемым возмущениям. В отличие от задач стабилизации заданных положений системы целью управления в рассматриваемой в работе постановке является приведение системы в заданное положение за конечное время. В научной литературе изложены некоторые подходы, позволяющие приводить систему в заданное положение за конечное время с помощью ограниченного управления. Как правило, созданные в рамках этих подходов управления оказываются разрывными функциями фазовых переменных и времени. Так применение алгоритмов, использующих программные траектории [1, 2], и законов управления, основанных на декомпозиции [3—8], приводит к появлению скользящих режимов. Причина их возникновения — наличие параметрической неопределенности в описании динамики системы, а также неизвестных возмущений, действующих на систему.

Предлагаемый ниже способ управления состоит из двух этапов. На первом этапе система приводится в окрестность терминального состояния с помощью метода декомпозиции. Этот метод позволяет перейти от исходной нелинейной системы со многими степенями свободы к простым подсистемам с одной степенью свободы каждая, т.е. задача управления нелинейной системой порядка 2п сводится к задаче управления системой п простых независимых линейных уравнений второго порядка. Для каждой подсистемы применяются методы теории оптимального управления и дифференциальных игр. В результате получается в явном виде управление в форме обратной связи для исходной нелинейной системы. Это управление близко к оптимальному (субоптимально), если величины возмущений и нелинейностей в системе оказываются малыми. В данной работе для построения непрерывных законов управления предлагается модификация метода декомпозиции с использованием процедуры сглаживания скользящих режимов.

На втором этапе применяется подход, развитый в [9, 10] и позволяющий приводить систему из окрестности терминального состояния в это состояние за конечное время. Подход основан на прямом методе Ляпунова. Возникающие законы управления могут быть истолкованы как линейная обратная связь, коэффициенты которой представляют собой гладкие функции от фазовых переменных. Коэффициенты возрастают и стремятся к бесконечности по мере того, как траектория системы стремится к терминальному состоянию, однако управляющие силы остаются

* Работа выполнена в рамках гранта Президента РФ на поддержку ведущих научных школ (НШ-2710.2014.1) и при финансовой поддержке РФФИ (проекты № 14-08-00606 и 14-01-00476).

ограниченными и удовлетворяют наложенным условиям. Управление, применяемое на втором этапе, оказывается качественно близким к оптимальному по быстродействию управлению.

1. Постановка задачи. Рассматриваются системы, динамика которых описывается дифференциальными уравнениями, имеющими лагранжеву форму:

й дТ дТ тт , ■ 1 /1 1\

—— = + 0Ь I = 1, п; (1.1)

ш д(к дqi

здесь q и ( — «-мерные векторы обобщенных координат и скоростей соответственно, Ц — управляющие обобщенные силы, Q¡ — все прочие обобщенные силы, включая неконтролируемые возмущения, п — число степеней свободы системы, I — время, точкой обозначаются производные по времени, Т ((, q) — кинетическая энергия системы, заданная в виде симметрической положительно-определенной квадратичной формы от обобщенных скоростей:

п

Т(я,q) = 2{ЛШ,() = 2 £ а]кШ}(1к. (1.2)

2 2 ],к=1

Скобки •) означают скалярное произведение.

Используя (1.2), приведем уравнения движения (1.1) к виду

А(()( = и + 0. (1.3)

т т

Здесь и = (иь ип) — вектор управляющих сил, £ = (£ь Б^) — вектор-функция

п

Б((, I) = <2((, 0 - £ Г]кд#к, (1.4)

1,к = 1

где Гд = (Гщ, ..., Гф)т — «-мерные векторы с компонентами

г = дОи -1 да]к чк д(к 2 д(1

Предполагается, что на управляющие воздействия в каждый момент времени наложены геометрические ограничения вида

и/ = ~п, (1.5)

Т-7-0

где и ( — заданные постоянные.

Сделаем некоторые предположения относительно кинетической энергии и обобщенных сил Q¡. Будем считать, что матрицаиз (1.3) известна неточно и близка к постоянной, т.е. предста-вима в виде

А(() = А + А((), (1.6)

где А — постоянная положительно-определенная матрица, а А( — неизвестная симметрическая

матрица. Предполагается, что евклидовы нормы матриц А( и А_1(() удовлетворяют неравенствам

(7)|| ^ м, м> 0, (1.7)

||А"1 ^ ЙИ<Р- (1.8)

Здесь ц — достаточно малый параметр, возможные значения которого указаны ниже. Кроме того, предполагаем, что

^ ^ с, С > 0, ], к = \п, (1.9) и что обобщенные силы Q¡ представляются в виде суммы:

а = о+(1.10)

где силы О 1 (д, д, ^ удовлетворяют ограничениям

|0,|< 00, I = й (1.11)

Величины постоянных 00 не превосходят постоянных и0 в ограничениях (1.5) на управляющие силы и, т.е.

00 < и0, I = \п. (1.12)

Через ¥ (д, д, ?) в (1.10) обозначены силы, которые достаточно малы при малых скоростях и удовлетворяют ограничениям

¥0 (|д|), , = . (1.13)

Здесь ¥ 0(у) — некоторая монотонно возрастающая непрерывная функция, определенная при V 5г 0 и такая, что ¥0(0) = 0; |д| — евклидова норма вектора д. Точный вид функций 0(д,д,?), ¥(д, д, 0 в (1.10) может быть неизвестен. Сформулируем задачу управления.

Задача. Определить управляющие вектор-функции и (д, д), которые удовлетворяют ограничениям (1.5) и обеспечивают перевод системы (1.3) из некоторого начального состояния

д(0) = д0, д(0) = д0 (1.14)

в заданное конечное состояние покоя

д(т) = д*, д(т) = 0. (1.15)

Время процесса управления т конечно и не фиксируется. Без ограничения общности начальный момент времени принят равным нулю. Кроме того, будем считать д* = 0, чего можно добиться с самого начала выбором обобщенных координат.

Отметим, что если для некоторых / неравенство (1.12) нарушается, то задача может не иметь решения.

2. Декомпозиция. Для решения поставленной задачи воспользуемся методом декомпозиции,

который предложен в [4]. Умножим обе части уравнения (1.3) на АА-1 (матрица А была введена в (1.6)). Введя обозначение

х, = [ Ад] ¡, (2.1) получим

X = и, + V, (2.2)

V = 5 - [АА-'(и + 5)],. (2.3)

Система (2.2), (2.3) эквивалентна исходному уравнению (1.3). Используя условие (1.9) и соотношение

,=1

получим цепочку неравенств

Xг »¿я*

1,к = 1

3 с 2

Г п ^

Ъь

=1 )

2 пС|д|2, I = 1, п.

Отсюда и из соотношений (1.4), (1.10), (1.11), (1.13) вытекают следующие ограничения на компоненты вектора Б:

^^(д,д,О0 + ¿0(|д|), З0^) = ¥0 (|д|) + 2пС|д|2, (2.4)

п

где в силу (1.8), (2.1)

р-1|4 (2.5)

Предположим, что имеют место неравенства

р р,< 1, (2.6)

где р I — некоторые постоянные. Ниже будут указаны условия, при которых эти неравенства справедливы. Функции V будем рассматривать в (2.2) как независимые ограниченные возмущения, не превосходящие допустимых значений управлений. Тогда исходная нелинейная система распадается на п линейных подсистем ( ¡-я подсистема описывается ¡-м уравнением (2.2)), подверженных возмущениям, с одной степенью свободы каждая. Таким образом, для решения задачи достаточно решить п более простых задач управления для подсистем второго порядка. Полученный результат можно подытожить в виде следующего утверждения.

Те о р е м а 1. Пусть выполнено условие (2.6) при всех рассматриваемых движениях системы (1.3). Тогда для решения задачи достаточно решить п задач управления для линейных подсистем (2.2) с одной степенью свободы. В каждой из этих задач требуется построить скалярное управление и)(хь х,), удовлетворяющее ограничению (1.5) и переводящее ¡-ю подсистему (2.2) из начального состояния (х0, X0)

X0 = [ А( 0], X0 = [ А( 0] (2.7)

в терминальное состояние (0, 0) за конечное время при любых допустимых возмущениях V, удовлетворяющих ограничению (2.6).

При каждом I рассмотрим задачу о приведении системы (2.2) в начало координат за кратчайшее время. Эту задачу будем рассматривать как дифференциальную игру, в которой один из игроков (управляющая сторона) выбирает управление Ц, а второй игрок (противник) выбирает возмущение V. Воспользуемся подходом теории дифференциальных игр [11] и построим управление по обратной связи (позиционное управление) и (х{, ), приводящее систему (2.2) в начало координат за минимальное гарантированное время при любом допустимом возмущении V. Заметим, что данная дифференциальная игра (2.2), (2.7) представляет собой линейную дифференциальную игру однотипных объектов.

Ее решение, как известно [11], может быть сведено к решению задачи оптимального быстродействия для системы

х = (1 -ри |и,|« и0 (2.8)

при тех же граничных условиях (2.7). Искомое управление и I (х,, X,) и минимальное гарантированное время в игровой задаче (2.2), (2.7) совпадают соответственно с синтезом оптимального управления и временем оптимального быстродействия для задачи (2.7), (2.8). О

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком