Автоматика и телемеханика, № 5, 2015
( 2015 г. А.И. ОВСЕЕВИЧ, д-р физ.-мат. наук (ovseev@ipmnet.ru) (Институт проблем механики РАН, Москва), А.К. ФЕДОРОВ (akfedorov@student.bmstu.ru) (Институт проблем механики РАН, Москва, Московский государственный технический университет им. Н.Э. Баумана)
ДВИЖЕНИЕ СИСТЕМЫ ОСЦИЛЛЯТОРОВ ПОД ДЕЙСТВИЕМ УПРАВЛЕНИЯ В ВИДЕ ОБОБЩЕННОГО СУХОГО ТРЕНИЯ1
Изучается вопрос существования движения системы из произвольного числа линейных осцилляторов под действием управления в виде обобщенного сухого трения. Рассматриваемый тип управления возникает в задаче о приведении данной системы в положение равновесия. Вопрос существования и единственности движения под действием предлагаемого управления решается в рамках теории ДиПерны-Лионса сингулярных обыкновенных дифференциальных уравнений.
1. Введение
Материал статьи основан на докладе авторов, сделанном на XII Всероссийском совещании по проблемам управления [1]. Б.Т. Поляк проявил к сообщению авторов большой интерес, поэтому публикация данной статьи именно в юбилейном номере "Автоматики и телемеханики" особенно приятна.
Управление колебательными системами является одной из важнейших задач теории оптимального управления [2]. Классическим достижением является аналитическое построение управления по обратной связи (в форме синтеза) для быстрейшего успокоения одного линейного осциллятора [3]. С точки зрения канонической системы принципа максимума такая задача является вполне интегрируемой.
Предметом данной статьи является более сложная задача управления системой из произвольного числа N линейных осцилляторов с различными собственными частотами шг:
(1)
Уг = —^¡Хг + и, |и| ^ 1, % = 1, . . . , N
У
которая, по-видимому, не является вполне интегрируемой, и поэтому аналитическое построение оптимального управления недостижимо.
Авторы не рассчитывают аналитически построить оптимальное управление, тем не менее задача гашения колебаний системы (1) остается актуальной. Стандартным способом гашения колебаний является использование трения.
1 Работа выполнена при поддержке Российского фонда фундаментальных исследований (проекты №14-08-00606 и №14-01-00476).
Прямолинейное использование закона Кулона приводит к векторному управлению Ui = —signy^ Используемое нами скалярное управление является обобщением сухого трения в том смысле, что имеет вид
N
(2) u = — sign^ Лiyi,
i= 1
где Лi — некоторые коэффициенты. Управление такого типа возникло в авторских работах [4-6] на основе исследования асимптотического поведения области достижимости системы (1).
Хорошо известно, что использование сухого трения, хотя и способствует гашению колебаний, может не приводить к полной остановке системы: возникают зоны застоя, в которых система не движется вовсе, несмотря на то, что терминальное множество еще не достигнуто. В [4-6] предложен подход к построению квазиоптимального управления, использующий комбинацию трех различных стратегий. При малых энергиях задача решается с помощью общих функций Ляпунова [6], тогда как при больших и промежуточных энергиях используется управление в виде обобщенного сухого трения.
Характерной чертой задач управления является разрывность правых частей дифференциальных уравнений движения. С тем же явлением сталкиваемся при изучении движения под действием сухого трения. Вопрос о существовании решений традиционно решается с помощью теории Филиппова существования решения дифференциальных включений [7]. Однако вопрос о единственности решения остается за рамками теории Филиппова, хотя интуитивно концепция движения подразумевает однозначную определенность траекторий системы законом управления.
В данной статье исследуется вопрос о существовании и единственности движения системы осцилляторов под действием управления в виде обобщенного сухого трения. Показывается, как управление в виде обобщенного сухого трения следует из структуры асимптотического поведения областей достижимости. Центральным в данной статье является вопрос существования однозначно определенного движения под действием управления. Задача решается в рамках теории ДиПерны-Лионса (DiPerna-Lions) сингулярных обыкновенных дифференциальных уравнений (ОДУ) [8, 9]. В данной статье ограничиваемся только формулировкой теорем существования и единственности. Доказательства приведенных утверждений могут быть найдены в [4].
2. Управление в виде обобщенного сухого трения
Рассмотрим систему из произвольного числа линейных осцилляторов, связанных общим ограниченным скалярным управлением. Система имеет вид
(3) x = Ax + Bu, x € V = R2N, u € U = R, |u| < 1, где матрица A и вектор B заданы в форме:
(4) Ai = ( Д2 1 ) , A = diag(Ai), Bi = Q , B = ®Вг.
Из принципа динамического программирования Беллмана следует, что управление оптимального быстродействия имеет вид [10]:
(5)
«(ж) = — sign(B,p(ж)},
дТ
р = р( ж) = т^М-
Здесь Т(ж) — время быстродействия, р — внешняя нормаль к области достижимости из нуля Р(Т(ж)), граница которой проходит через ж, а угловые скобки обозначают скалярное произведение в М2М. Напомним, что область достижимости Р(Т) определяется как множество точек, достижимых из нуля за время Т вдоль траекторий системы (3).
На практике области достижимости устроены весьма сложно. Поэтому будем строить управление по формуле (5), в которой р — нормаль к приближенной области достижимости, граница которой проходит через ж. Согласно асимптотической теории областей достижимости при Т — то для системы (3) хорошим приближением к Р(Т) служит множество вида ТО, где О — некоторое фиксированное выпуклое тело [11-13]. Как известно, замкнутое выпуклое множество М однозначно определяется своей опорной функцией [14]
(6)
Нм (£) = вир ({, ж}.
хем
Точное утверждение об асимптотическом поведении областей достижимости удобно выразить на языке опорных функций [11].
Теорема 1. Пусть импульс р записан в виде р = (рг), где рг = (£г,Пг), г = 1,...,Ж, — переменная, двойственная к жг, пг — переменная, двойственная к уг, и пусть = (п2 + ^"2{2)1/2. В случае отсутствия резонан-сов, т.е. нетривиальных соотношений между частотами вида
N
У^ шгшг = 0, где 0 = т = (т1,..., mN) € ^,
г=1
опорная функция Ну области достижимости Р(Т) имеет при Т — то асимптотику вида
2п 2п
(8) Ну(р) =
Т
(2п)
N
N
У] Х ссе г
г=1
... dVN + о(Т) = ТН(х) + о(Т),
а опорная функция выпуклого компакта О задается главным членом Н(х).
2.1. Формула для опорной функции
Опорная функция Нп(р) выпуклого тела О задается главным членом асимптотики в (8):
(9) нп(р) = ад = /
N
У] Х СС8 г
г=1
d^>, где х = (х1, ..., ) € М
N
и
0
При N = 1 получим Sj(z) = — |г;|. В случае двух осцилляторов N = 2 функция (10) H(z) = У |zi cos + Z2 cos 1
может быть выражена через эллиптические интегралы [4]. В общем же случае функция
N г=1
(Ц) =
(2*У
N
1(1 - t2)-1/2dti ...tN
i=1
является интегралом типа Эйлера, задающим обобщенную гипергеометрическую функцию в смысле И.М. Гельфанда.
2.2. Уравнение, определяющее управление
Вектор р является нормалью к границе дП в точке Поэтому нор-
маль к приближенной области достижимости рП, граница которой проходит через х, определяется из уравнения
(12) 1х=дН^ = Щг1сЪ
др дг др
где р € R2N и р > 0 — неизвестные. Отметим, что опорная функция Нп -дифференцируема и уравнение (12) имеет ровно одно решение ввиду гладкости границы множества П, установленной в [12].
2.3. Двойственность
В более общем виде связь между опорной функцией Н = Нп(р) и функцией р = р(х) в уравнении (12) аналогична преобразованию Лежандра
(13) (х,р) = р(х)Н(р), р(х) = тах (х,р), Н(р) = тах (х,р),
Я(РК1 р(жИ1
а соответствующее точечное преобразование х ^ р имеет вид
(14) х = р{х)^{р), р = Н{р)^-{х).
Здесь р и х — точки максимума в соотношениях (13). Эти соотношения имеют смысл, если функции Н и р являются нормами своего аргумента. Дифференцирования в (14) понимаются как взятие субградиентов. Если одна из функций Н или р строго выпукла и дифференцируема вне нуля, то и другая тоже. Тогда соотношения (14) выполняются в классическом смысле.
С использованием функции р = р(х) можно записать управление (5) в виде
др
(15) и(х) = —sign ( В, „
\ dx
Уравнение (15) используется даже в резонансном случае, когда асимптотика (8) не работает. Заметим, что u(x) — многозначная функция, поскольку sign(0) определен неоднозначно и может принимать любые значения в интервале [-1,1].
2-4- Гамильтонова структура
Функция р = р(ж) из уравнения (12) играет для рассматриваемого управления такую же роль, как время оптимального быстродействия T(ж) для оптимального управления. Рассмотрим "канонический" импульс p = —др/дж. Функция р(ж) — норма вектора ж в метрике, где тело Q — единичный шар. Это гладкая функция вне нуля.
Более того, выполнен «принцип максимума»: составной вектор (ж,р) удовлетворяет гамильтоновой системе
д2р / др\
(16) ж = Ах + Ви, и = — sign(£>,р), р = — А*р + т—-В sign ( В, —— ) ,
дж2 дж
где гамильтониан имеет вид
(17)
H = (Аж,р) + |(B,p)| —
В,??
дж
Этот гамильтониан равен нулю на траекториях управляемого движения, в полной аналогии со случаем оптимального быстродействия.
3. Движение под действием управления
Формально движение системы осцилляторов под действием управления (15) описывается дифференциальным уравнением
(18) х = Л'r-Бsign^Б,|^.
На самом деле, как было отмечено ранее, правая часть этого уравнения определена неоднозначно (sign(0) = [—1,1]). Поэтому имеет место дифференциальное включение.
Из теории Филиппова [7] следует, что задача Коши для дифференциального включения (18) разрешима для любого начального условия ж(0), т.е. имеется функция времени ж(£), которая абсолютно непрерывна и удовлетворяет (18) в точках дифференцируемости. Это следует из того, что правая часть /(ж), во-первых, ограничена |/(ж)| ^ С|ж|. Во-вторых, она принимает выпуклые и компактные значения. Наконец, функция /(ж) непрерывна как многозначная функция: если уп € /(жп) и жп — ж, то у € /(ж), где у -любая предельная точка последовательности уп. Вообще говоря, "движение" по Филиппову не определено однозначно: возможны несколько траекторий, исходящих
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.