научная статья по теме ПОСТРОЕНИЕ МНОЖЕСТВА ДОСТИЖИМОСТИ ИНТЕГРАТОРА БРОКЕТТА Математика

Текст научной статьи на тему «ПОСТРОЕНИЕ МНОЖЕСТВА ДОСТИЖИМОСТИ ИНТЕГРАТОРА БРОКЕТТА»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 68. Вып. 5, 2004

УДК 62-50

© 2004 г. С. А. Вдовий, А. М. Тарасьев, В. Н. Ушаков

ПОСТРОЕНИЕ МНОЖЕСТВА ДОСТИЖИМОСТИ ИНТЕГРАТОРА БРОКЕТТА

Методами теории оптимального управления [1, 2] решается задача построения множеств достижимости для нелинейной динамической системы, известной как неголономный интегратор Брокетта [3]. Доказывается, что граница множеств достижимости характеризуется точками оптимальных траекторий, построенных для задачи управления с интегральным показателем качества, задающим площадь фигуры, ограничиваемой траекторией движения управляемой системы. Задача заключается в максимизации этой площади. Такая постановка близка к известной в вариационном исчислении задаче Дидоны о построении фигуры максимальной площади с заданным периметром. Предлагается алгоритм построения оптимальных траекторий и исследуются их свойства. В основу алгоритма положены результаты решения частного случая задачи оптимального управления с замкнутой траекторией движения. Для построенных оптимальных траекторий проверены необходимые условия оптимальности принципа максимума Понтряги-на. Выведены аналитические формулы для функции цены задачи управления и выполнена проверка необходимых и достаточных условий оптимальности решения с использованием минимаксных неравенств А. И. Субботина для уравнений Гамильтона - Якоби.

Интегратор Брокетта [3] - один из первых классических примеров системы, для которой решение задачи управления требует введения нелинейного (разрывного) закона управления. После подходящей замены переменных эта система описывает поведение многих механических объектов: колесного мобильного робота, асинхронного электродвигателя с большим коэффициентом усиления контурных токов, твердого тела с двумя управляющими параметрами корректировки скорости. Исследованию этой системы посвящены работы многих авторов [4-7]. Были рассмотрены [4] задачи стабилизации системы интегратора Брокетта с помощью разрывных законов управления и предложены экспоненциальные оценки сходимости системы к равновесию. В рамках проксимального анализа доказывалось [5], что в системе интегратора Брокетта не существует непрерывных стратегий стабилизации. Получена [6] внутренняя оценка множества достижимости системы.

Отметим, что задачи управления механическими системами изучались в работах [7, 8], результаты которых используются ниже, при исследовании замкнутых оптимальных траекторий движения объекта.

Задача исследуется с помощью методов теории оптимального управления [1, 2, 9] и теории дифференциальных игр [10-12]. Основу конструкции составляют траектории, выводящие систему на границу множества достижимости [1, 2, 9, 10]. Для этих траекторий выводятся необходимые условия принципа максимума Понтрягина [2]. Параллельно с построением множеств достижимости решается задача аналитического вычисления функции цены. Для аналитических формул функции цены проверяются необходимые и достаточные условия оптимальности в виде дифференциальных неравенств А.И. Субботина [11-15].

1. Постановка задачи 1 построения множества достижимости и анализ свойств множества достижимости. Рассматривается управляемая система - интегратор Брокетта

X = и1, Х2 = и2, Хъ = X1 и2-Х2и1, Х(0) = (0, 0, 0)

(1.1)

\и 1 < 1, \и2\ < 1 (1.2)

Здесь X = (Хь Х2, Х3) - фазовый вектор системы, и ^ = и)(г) (/ = 1, 2) - управления, г е е [0, те) - время.

Требуется найти множества достижимости (МД) А = А(Т) системы в момент времени Т, 0 < г < Т, Т е [0, те), т.е. определить множество точек (Х1(Т), Х2(Т), Х3(Т)), в которые приходит система (1.1) в момент времени Т при произвольном выборе измеримых управлений

и = иJ(г), |и/г)|< 1, 0 < г < Т, ] = 1,2

Определение 1. Допустимыми управлениями и1(г), и2(г) будем называть измеримые функции, удовлетворяющие ограничениям (1.2).

Определение 2. Допустимой траекторией будем называть траекторию Х(г), г е [0, Т], системы (1.1), порожденную допустимым управлением.

Под допустимой траекторией (Х:(г), Х2(г)), г е [0, Т], в плоскости Х1, Х2 будем понимать проекцию допустимой траектории Х(г) на плоскость Х1, Х2.

Квадрат с центром в начале координат и стороной, равной 2 (обозначим его символом Р, дР - граница квадрата Р), согласно ограничениям (1.2) представляет собой множество допустимых значений вектора их(г), и2(г).

Свойства траекторий.

Свойство 1. Проекция МД на плоскость Х1, Х2 представляет собой квадрат К с центром в начале координат и стороной 2Т.

Доказательство. Для координаты Х1(Т) справедливо соотношение

Т

х 1 (Т) = | и 1( г )йг

0

Согласно первому ограничению (1.2) имеем -Т < Х1(Т) < Т. Аналогичное выражение можно записать для Х2(Т).

Для построения МД достаточно найти для каждой точки (Х:, Х2) квадрата К множество {Х1(Т), Х2(Т), Х3(Т): Х1(Т) = Х1, Х2(Т) = Х2}, в которые может прийти система в момент времени Т.

Определение 3. Вектором результирующего перемещения (обозначим его Уй) будем называть вектор в плоскости Х1, Х2, соединяющий начало координат (0, 0) с конечным состоянием траектории (Х1(Т), Х2(Т)).

Пусть Б = (Х1(г), Х2(г)) - допустимая траектория, порожденная допустимым управлением (и1(г), и2(г)). Дополним Я до замкнутой кривой Ь отрезком 20, соединяющим точку (Х1(Т), Х2(Т)) с началом координат 0, как показано на фиг. 1. Пусть Б - область, ограниченная кривой Ь. Символом Ь+(Ь ) обозначим кривую Ь с направлением обхода против часовой стрелки (по часовой стрелке).

Свойство 2. Для траекторий Х(Т), г е [0, Т], системы (1.1) справедливы следующие интегральные соотношения:

X 3 (Т) = -2^Х2йХх, X 3 (Т) = -2 Ц йХ2йХх

Ь Б

Доказательство. Согласно формуле Грина имеем

ЛйХ2йХ! = -1 Х2йХ! = |Х2йХ 1= |Х2йХ!+ | Х2йХ! = |Х2ёХ1-Х1(Т^^2(Т-(1.3)

Б Ь+ Ь~ Б 20 Я

Интегрируя по частям уравнения динамики (1.1), преобразуем выражение для Х3(Т) следующим образом:

Т

X 3 (Т) = Хх( Т) Х2 (Т)-2$ X 2 (г) йХх (г) = 2 Ц йХ2 йХх = -21X 2 йХх (1.4)

0 й ь

Здесь использованы равенства (1.3).

Отметим, что значение Х3(Т) определяется с точностью до знака площадью фигуры, ограничиваемой кривой Ь.

Если вектор УЕ - нулевой, то в последнем интеграле (1.4) кривые Ь и 5 совпадают. Рассмотрим следующие симметричные преобразования допустимой траектории симметрия 51, 52 относительно осей координат Х1, Х2, симметрия 53, 54 относительно биссектрис первого и второго координатного углов, центральная симметрия 55 относительно середины вектора результирующего перемещения.

Утверждение 1. Симметрии 51, ..., 55 - допустимые траектории на плоскости Х1, Х2. Доказательство. Пусть (их(г), и2(г)) - допустимое управление. Для построения 53 в качестве порождающего допустимого управления достаточно взять симметричное управление

и*(г) = и2(г), и*(г) = их(г) (1.5)

Это можно сделать, так как множества допустимых значений для их и и2 совпадают. Для построения 54 достаточно поменять знаки обеих координат управления (1.5). Для построения 5^52) следует поменять знак первой (второй) координаты управления (1.5).

Для построения 55 следует выбрать управление

и * (г) = их( т - г), и* (г) = и2( т - г)

При таком отображении точки X*(T- г) и Х(г) симметричны (фиг. 1).

Покажем, что такой допустимый путь 55 действительно симметричен исходному пути 5 относительно середины вектора Уй. Для такой симметрии должно выполняться соотношение

X* = Ук/2 + (Уй/2 - X) = Ук - X

Оно проверяется по определению допустимого управления и*(г). Действительно,

Т - г Т - г

X*(Т- г) = | и*(т)йт = | и(Т- т)йт =

о о

Т Т

= | и( Т - т) йт -1 и( Т - т) йт = X( Т) - X(г)

ог

Следствие. Из утверждения 1 для симметрии следует формула симметрии для третьей координаты движения: X* (Т) = —Уз^. В силу этой симметрии достаточно

строить МД только для положительной (отрицательной) третьей координаты.

Доказательство. Площади фигур, ограниченных симметричными траекториями, одинаковы. По свойству 2 модуль координаты X3(T) равен удвоенной площади фигуры, ограниченной дополненной траекторией движения. При изменении направления обхода знак координаты X3(T) меняется на противоположный.

Введем в рассмотрение множество Н точек, принадлежащих квадрату К и расположенных не выше биссектрисы первого координатного угла, в первом квадранте (фиг. 1). Зафиксируем точку X б Н. Рассмотрим траектории системы ^(г), X2(г), X3(г)), для которых конец результирующего вектора УЕ в плоскости X!, X2 совпадает с X.

Пусть М = М(Х) - максимальное значение в множестве, состоящем из третьих координат X3(T) точек ^(7), X2(T), X3(T)) таких траекторий.

Свойство 3. Отрезок 1(2X), соединяющий точки (X, М(Т)) и (X, 0), целиком принадлежит МД А(Т).

Доказательство. Пусть и(г) - управление, которое переводит систему из начала координат (0, 0, 0) в точку (X, М(Х)) а X(г) = ^(г), X2(г)) - проекция соответствующей траектории на плоскость X1, X2. Построим управление и* = и*(а, г), приводящее систему в любую точку отрезка 1(X). Такому управлению соответствуют Ук = X, X3(T) =

= аМ^, 0 < а < 1. Обозначим ~г = г/а, Т = Т/а. Пусть

Г и (?), 0 < 7 < Т и * (а, г) = \

[ Уй/( Т - а Т), Т < г < Т

Тогда проекция соответствующей траектории на плоскость X1, X2 определяется соотношением

(г), 0 < г < Т X* (а, г) = \ _ -

[Укг/Т, Т < г < Т

Соответственно, площадь фигуры Б*, ограничиваемой траекторией Х*(а, г) и вектором результирующего перемещения, равна площади фигуры Б, умноженной на а (см. фиг. 1). Согласно свойству 2

X*(а, Т) = -2Л йХ2йХ1 = а -2ЦйХ2йХ

= а Х3( Т)

Предположим, что значения М(Ъ) построены для всех точек Ъ множества Н. Согласно свойству 3 и следствию утверждения 1 множество точек

А(Н) = {(Ъ, т): Ъ б Н, -М(Ъ)< т < М(Ъ)} содержится в МД А.

Свойство 4. МД А может быть построено на основании свойств симметрии из множества А(Н) по следующему алгоритму: сначала по симметрии из А(Н) восстанавливается МД в первом квадранте, затем по симметрии 52 - во втором квадранте, наконец, по симметрии 53 - в третьем и четвертом квадрантах.

Таким образом, задача построения МД сводится к задаче поиска управления, переводящего систему из начала координат в точку (Ъ, М(Ъ)), или, симметрично, в точку (Ъ, -М(Ъ)), т.е. требуется найти управление и(

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком