научная статья по теме ЧИСЛЕННОЕ ИССЛЕДОВАНИЕ МНОЖЕСТВ ДОСТИЖИМОСТИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ Автоматика. Вычислительная техника

Текст научной статьи на тему «ЧИСЛЕННОЕ ИССЛЕДОВАНИЕ МНОЖЕСТВ ДОСТИЖИМОСТИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ»

Автоматика и телемеханика, № 6, 2011

© 2011 г. А.И. ТЯТЮШКИН, д-р техн. наук (Институт динамики систем и теории управления СО РАН, Иркутск),

О.В. МОРЖИН

(Институт проблем управления им. В.А. Трапезникова РАН, Москва)

ЧИСЛЕННОЕ ИССЛЕДОВАНИЕ МНОЖЕСТВ ДОСТИЖИМОСТИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ1

Статья посвящена схемам аппроксимации множеств достижимости нелинейных управляемых дифференциальных систем, где «элементарной операцией» является задача оптимизации программного управления. Приводятся результаты численных экспериментов.

1. Введение

Рассматривается нелинейная дифференциальная система

(1) х = /(г, х, и), х(гв) € Хв,

(2) и(г) € и с Дг, г € Т = [гв],

где Хв, и - выпуклые компактные множества. Функция /(г, х, и) вместе со своими производными по х, и считается непрерывной по совокупности аргументов (г, х, и) на Т х Д" х и, а также удовлетворяет условию Липшица по х € Д" с общей константой Ь > 0 Ух1, х2 € Д" на Т х Д" х и. Под допустимым управлением понимаем кусочно-непрерывную функцию и(г), г € Т, удовлетворяющую (2) и обеспечивающую непрерывную кусочно-дифференцируемую траекторию х(г) системы (1) при г € Т и заданном начальном состоянии хв. Множество допустимых управлений будем обозначать через и.

Для оценивания множеств достижимости линейных управляемых систем (и приводимых к ним преобразованиями) успешно применяется метод эллипсоидов [1, 2]. Множества достижимости нелинейных систем в общем случае невыпуклые, несвязные. Наряду с подходами для аппроксимации [3-7], использующими уравнение Белл-мана, а также принцип сравнения с реализацией метода эллипсоидов, известны схемы [1, 8] аппроксимации множеств достижимости за счет вычисления характерных точек множеств непосредственно через решение серии задач оптимального управления [8-12].

В [13-15] развит подход к аппроксимации траекторных множеств, базирующийся на решении серий задач оптимального управления. Имеем перспективное приложение методов нелокального улучшения программ управления [16], поскольку эти методы позволяют, в частности, избежать проблемы с особыми управлениями, присущей методам, основанным на принципе максимума [17].

2. Схемы аппроксимации множеств

На отрезке [гв,г_р] вводится равномерная сетка с шагом Дг = (гР — гв:

(3) 18 = ¿о < < • • • < < < ■ ■ ■ < ¿N—1 < = 3 = 0, N.

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследо-

ваний (первого автора — по проекту № 09-07-00267-а, второго — по проекту № 10-01-90718-моб_ст).

Рис. 1.

Обозначим через х3,г) позицию, где (] (Е О, Ы) - текущий момент, г (Е 1, К -номер точки в некотором конечном наборе всевозможных состояний в этот момент.

Множеством достижимости К , ж''*,^) системы (1) при (2) из позиции (tj, ж''*) называется множество, состоящее из всевозможных состояний системы в момент ¿к, соответствующих всевозможным допустимым управлениям «(*), I € где з, к € О, N - 1, ts < ^ < tk ^ tF, г € 1, А'.

Трубкой достижимости К , ж''*, , ¿й]) системы (1) при (2) из позиции (^ж"7'') А е О, N - 1) на полуотрезке (¿5 ^ < ^ ^ будем называть

множество точек пространства позиций (¿, ж), достижимых по траекториям системы при всевозможных допустимых управлениях «(¿), £ € , ¿й].

Аналогично определяются множества и трубки достижимости из компакта X (tj), взятого в пространстве состояний в некоторый момент € [¿д , ¿р).

Понятие трубки достижимости иллюстрирует рис. 1, на котором представлены внешние оценки множеств достижимости некоторой билинейной системы в последовательные моменты времени. Множество достижимости является сечением трубки достижимости в некоторый момент времени.

Целевым множеством М назовем компакт в пространстве состояний, на который требуется привести систему (1) при (2) в момент ¿р.

Множеством М-управляемости №(tj, ¿р, М) для системы (1) при (2) в момент tj € [¿д, ¿р) при заданном целевом множестве М называется множество, состоящее из состояний, из которых в момент t = система переводима на М при всевозможных допустимых управлениях «(¿), t € , ¿р].

Для краткости вместо К , ж''*,^) будем писать К[£й] и, аналогично, №] -вместо №, ¿р, М).

Необходимое условие перевода системы (1) при (2) на множество М по траекториям, «стартующим» из компакта ] (Е О, N — 1:

Мр|К(^- ,Х ),£р ) = 0, X )р| № ,£Р , М) = 0.

Если множество X (¿д) не задано, следует рассматривать множество № [¿о].

Трубкой М-управляемости № , ¿й),£р, М) системы (1) при (2) на полуотрезке , ¿й) (¿д ^ < ¿й ^ ¿р) при заданном множестве М назовем множество точек пространства позиций (¿,ж), из которых достижимо целевое множество М по траекториям системы (1) при (2) при всевозможных допустимых управлениях.

6 Автоматика и телемеханика, № 6

161

Трубка М-управляемости системы (1) при (2) при целевом множестве М является трубкой достижимости этой же системы, рассмотренной в «обратном времени», где множество М играет роль множества начальных состояний.

Аппроксимация в смысле построения е-сети. Под аппроксимацией (приближенным описанием) множества достижимости можно понимать, во-первых, покрытие множества определенным конечным набором его точек и, во-вторых, вообще различные оценки (например, просто координаты вершин параллелепипеда, граней которого изнутри касается изучаемое множество). Далее аппроксимацию траекторного множества будем понимать в первом смысле.

Аппроксимацией (ограниченного) множества достижимости Д[г&] системы (1) при (2) в момент г^ € (гв, г^] будем называть его е-сеть, а именно (конечное) множество И[гй] = |хг(гй)} (г = 1,д(гй)) такое, что выполнены условия: а) любая точка хг(гй) множества (г € 1,^(г^)) принадлежит множеству достижимости ^[г&];

б) для всякой точки х(гй) € ] найдется такие элемент хг(г&) из аппроксимирующего множества 7£[г&] (г € 1,^(г^)) и малое число е > 0, что расстояние ||х(г&) — — хг(гй)|| ^ е. Здесь ^(г^) - количество элементов во множестве 7£[г&].

В частности, будем говорить об аппроксимации границы множества достижимости в смысле построения ее е-сети.

Аналогично вводится понятие аппроксимации множества М-управляемости.

Специфика множеств достижимости нелинейных систем такова, что исследуемые множества могут оказаться невыпуклыми и несвязными [13, 14].

Различного рода аппроксимации множеств достижимости и разрешимости имеют большое значение, поскольку дают информацию о предельных возможностях управляемых систем при любом целевом критерии.

В статье развивается подход к аппроксимации, состоящий в вычислении характерных точек множества через решение серии задач оптимального управления. Применение метода эллипсоидов сопряжено с разрешением вопросов о качестве оценивания, о сходимости последовательности эллипсоидальных оценок [1, 2]. Реализация же подхода, основанного на решении серии задач оптимального управления, выдвигает вопросы эффективности решения этих задач.

Если применяются надежные алгоритмы улучшения программных управлений (например, без остановки на неоптимальных особых управлениях), то представленные далее схемы аппроксимации траекторных множеств вполне реализуемы.

При фазовых ограничениях вида ж(£)) ^ 0, г = 1 ,М, I (Е дополни-

тельных к системе (1) при (2), речь идет об условных траекторных множествах, для построения аппроксимаций которых, конечно, не достаточно непосредственного отсечения «лишних» частей множеств.

Реализация модификации метода опорных гиперплоскостей. При исследовании множества достижимости ] с помощью метода опорных гиперплоскостей [1, § 1.3] вычисляется серия точек А; = 1, К, характеризующих границу данного мно-

жества исходя из известного в выпуклом анализе понятия опорной гиперплоскости. В этой связи решается серия из К задач оптимального управления относительно (1)

при (2) на отрезке [гв, гз-] с целевым критерием

"

(4) I = (Ск,х(г,-м, ||су2 = Е4 = 1,

3=1

где каждой задаче соответствует однозначно вектор С^, k (Е 1, К. Для системы второго порядка (п = 2) вектор Си = (cos sin где G [0, 2^). Метод предполагает многократное решение однотипных задач оптимального управления (1), (2), (4).

\

Рис. 2.

В случае, если Х^ - многоточечное множество, начальное условие ж^) = а, где а - вектор управляющих параметров. Для простоты будем считать, что Х^ состоит из одной точки.

Теоретически метод опорных гиперплоскостей предназначен для аппроксимации границ выпуклых множеств, поэтому, вообще говоря, не гарантирует корректную аппроксимацию границы множества достижимости нелинейной системы: будут вычисляться точки, принадлежащие, конечно, исследуемому множеству, но аппроксимирующие границу его выпуклой оболочки, а само множество может оказаться невыпуклым. Если некоторые последовательно вычисляемые точки будут отстоять друг от друга достаточно далеко, то это может означать наличие участка вогнутости. Точки, аппроксимирующие участок вогнутости, не могут быть найдены данным методом.

Рассмотрим случай плоского (п = 2) множества достижимости и представим, что его граница имеет участок вогнутости, который характеризуется тем, что для некоторых вычисленных методом опорных гиперплоскостей двух последовательно идущих точек ж, ж отрезок, соединяющий их, сравнительно большой длины. Из точки ж(<т) = х + <т(ж — ж), а (Е (0,1), опускается перпендикулярно луч до первого пересечения с изучаемым множеством в точке ж(<т), являющейся одной из искомых точек аппроксимации участка вогнутости. Функция Н(<т) = ||ж(<т) — ж(<т)||2, а £ (0,1), характеризует «степень невыпуклости». На этой идее основана модификация [13] метода опорных гиперплоскостей. Идею модификации метода опорных гиперплоскостей иллюстрирует схематический рис. 2.

Для вычисления точки ж следует решить задачу оптимального управления относительно (1), (2) с критериями

(5) 1= ||ж(^)-5(сг)||2 -ИМ, (ж-ж)т(ж(<г)-х{Щ =0.

Целевой функционал в (5) является нелинейным по ж. Линейное по ж терминальное ограничение в (5) может быть учтено методом штрафов. Во вспомогательной задаче метода штрафов рассматривается целевой критерий

(6) Г3 = ||ж(^) - ж(<т)||2 +/?[(£ - ж)т(£(а) - ж(^))]2 ->■ М, ¡3 > о.

При ином значении параметра а € (0,1) будет найдена другая точка аппрокс

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком