научная статья по теме АБСОЛЮТНЫЙ ЭКСТРЕМУМ В АВТОНОМНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Кибернетика

Текст научной статьи на тему «АБСОЛЮТНЫЙ ЭКСТРЕМУМ В АВТОНОМНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2013, № 3, с. 60-73

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

УДК 519.97

Выведены необходимые и достаточные условия абсолютного (глобального) экстремума для центрального поля траекторий в автономных задачах оптимального управления. Показано, что в регулярном случае гладкого поля экстремалей Понтрягина эти условия выполнены автоматически.

Б01: 10.7868/80002338813020091

Введение. В задачах оптимального управления принцип максимума Понтрягина является необходимым условием локального экстремума [1—9]. При этом специфика задач такова, что в конечном счете требуется построить именно оптимальное управление, т.е. управление, обеспечивающее абсолютный (глобальный) экстремум. Поэтому исследование на необходимость — только начало решения задачи оптимального управления. Принцип максимума является не только необходимым, но и достаточным условием в линейных задачах оптимального быстродействия, когда целевым состоянием будет положение равновесия [2, с. 96]. Для других случаев вопросы достаточности абсолютного экстремума мало изучены.

В вариационном исчислении для исследования на абсолютный экстремум требуется поле (поток) экстремалей, т.е. семейство экстремалей, однократно покрывающее исследуемую область (условие Вейерштрасса). В каждой конкретной задаче возникают свои сложности при построении такого поля. Например, в задаче о минимальной поверхности вращения поле состоит из цепных линий, к которым добавляется множество особых кривых, представляющих собой трехзвенные ломаные [4, 10—12].

Неизбежность исследования полей в задачах оптимального управления была осознана уже давно в связи с задачей синтеза. Так, в классической монографии [1] представлены весьма впечатляющие рисунки центральных полей экстремалей Понтрягина для самых разнообразных конкретных задач. В данной статье предполагается, что центральное поле траекторий уже каким-то образом построено. Требуется определить, будет ли оно оптимальным. Как и в вариационном исчислении, не всегда все траектории поля являются экстремалями Понтрягина — полю могут принадлежать особые траектории, огибающие, скользящие режимы... Само поле не обязано быть гладким. Будет выведено необходимое и достаточное условие абсолютного экстремума для, вообще говоря, негладкого центрального поля траекторий. Будет также показано, что в случае гладкого поля экстремалей Понтрягина проверку этого условия проводить не нужно, так как оно выполнено автоматически. При построении центрального поля траекторий можно фиксировать стартовое или финишное состояние — принципиального различия в этом нет. В вариационном исчислении предпочтение отдают начальной точке 8 [4, 10—12], в задачах оптимального управления обычно фиксируется терминальная точка 1 [1—8]. Чтобы подчеркнуть связь с вариационным исчислением и условием Вейерштрасса, в данной статье в качестве центра поля выбрана точка старта 8. Здесь ограничимся задачами оптимального управления в автономной форме. Задачи с закрепленным временем рассматривались в [13].

1. Постановка задачи. Следуя [1], рассмотрим задачу оптимального управления в автономной форме для двухточечной краевой задачи с нефиксированным временем Т > 0

х(0) = 8, х(Т) = г, и, г е Б,

(1.1)

Т

(1.2)

^ = адо, и(0), (1.3)

йг

х(г) = (X(1)(г), ..., X(в)(г)) 6 Б с К", (1 4)

и(г) = (м(1)(г), ..., и(т\г)) 6 и с Кт.

Как обычно, отображения Ь : Б1 х и ^ Я1 и Г : Б1 х и ^ К", где D1 — открытое множество, содержащее D, будем считать дифференцируемыми, а управление и(.) — кусочно непрерывным. В данной постановке движение начинается в момент t = 0. Система автономна, поскольку L и Г не зависят явно от времени. Решение задачи по сути не изменилось бы, если бы мы в качестве начала отсчета времени выбрали любой момент В этом случае процесс оканчивался бы в момент г 0 + Т. Вместе время движения T, управление и(.) и траектория х(.) образуют управляемый процесс у = (х(.), и(.), Т). Стартовая точка 8 е Б считается заданной. Учитывая часто возникающую биекцию (траектория) ^ (управляемый процесс), мы, как правило, не будем делать различия между этими терминами и чаще будем использовать более наглядный термин "траектория".

На этапе исследования концы траектории могут быть произвольными. Начальное и конечное состояния произвольного процесса у будем обозначать соответственно а(у) и р(у). Таким образом, а(у) = х(0), р(у) = х(Т). Кроме того, положим

I (у) = \ Ь(х(г), и(г ))йг.

Обозначим через Ш ножество управляемых процессов, а через Ш 8 — множество процессов у, стартующих из точки 8, т.е. а(у) = 8 для у е М8. Множество Ш наделено полезными алгебраическими свойствами и представляет собой теоретико-множественную категорию [14, 15]. Рассмотрим эти свойства.

Если даны две траектории, у 1 = (хиТ1) и у 2 = (х 2(.), и 2(.), Т2), причем вторая из них начинается там, где оканчивается первая: а (у 2) = в (у1), то их можно скрепить (склеить), определив единую траекторию у = (х(.), и(.), Т1 + Т2) следующим образом:

и(г) = {и!(г)' если г < Т1, х(г) = Гх1(г), если г < Т1,

|и2(г - Т1), если г > Т1, [х2(г - Т1), если г > Т1.

Траекторию у будем называть произведением траекторий у1 и у 2 и обозначать

У = У1У 2-Имеем

а (у1у 2) = а (у1), Р (у 1у 2) = Р (у 2), 1 (у 1У 2) = 1 (у 1) + 1 (у 2) •

Очевидно, что траектории у1 и у 2 являются соответственно начальным и конечным участками траектории у1у 2. Произведение траекторий ассоциативно, но не коммутативно. Если имеет место равенство

У = У1У 2 У 3,

то траектории у1, у2, у3 являются соответственно начальным, промежуточным и конечным участками траектории у.

В случае T = 0 траектория вырождается в точку. Будем считать, что такие вырожденные (единичные) траектории ух для всех х е Б включены в Ш. Для вырожденной траектории ух = (у(.), и(.), 0) имеем I (ух) = 0, у(0) = х, и, следовательно, а (у2) = р (у 1) = х. Вырожденные траектории являются нейтральными элементами при умножении. А именно если к какой-либо траектории "приклеить" вырожденную траекторию, то никаких изменений не произойдет: уу х = у при р(у) = х или у х у = у при а(у) = х.

Определение. Семейство траекторий Т 8 с Ш 8 будем называть центральным полем (потоком, пучком, деревом), если через каждую точку у е Б проходит ровно одна траектория семейства.

0

Данное определение необходимо пояснить. Под выражением "через каждую точку x проходит ровно одна траектория" понимается буквально следующее. Во-первых, если у = (x(.), u(.), T) е Ts и T е (0,T), то начальный участок у1 = (x(.), u(.),T1) траектории у также принадлежит T s. Во-вторых, если Yj, у2 е T s и в (уi) = в(у2), то у1 = у2. Таким образом, траектории центрального поля могут иметь не одно продолжение, т.е. могут ветвиться, образуя своеобразное дерево с корнем в s.

Центральное поле T s будем называть оптимальным, если каждая траектория поля является оптимальной при соответствующих граничных условиях, т.е. если для любого t е D траектория у е T s, для которой р(у) = t, обеспечивает оптимальное управление (1.1)—(1.4). Заметим, что если среди траекторий имеются отрицательные циклы (5 е Ш, а(5) = р(5) и J(5) < 0), то оптимального центрального поля не существует. В противном случае мы могли бы к траектории поля "приклеить" отрицательный цикл и получить тракторию меньшей стоимости.

В статье исследуется следующая задача на абсолютный экстремум. Дано центральное поле экстремалей T s. Требуется определить условия, при которых это поле является оптимальным.

2. Неравенство треугольника и его следствия. 2.1. Криволинейный треугольник. Определим действие по Гамильтону S(x) : D ^ К как сложную функцию центрального поля траекторий. Пусть у — траектория поля T s, оканчивающаяся в точке x. Тогда

S(x) = J (у).

Число S(x) можно понимать как расстояние (по функционалу) от стартовой точки s до текущей точки x. В этом смысле функция S(x) в какой-то степени соответствует функции Беллмана (если обратить время). Заметим, что для оптимального центрального поля траекторий S(s) = 0, так как величина S(s) не может быть меньше нуля из-за отсутствия отрицательных циклов, а также не может быть больше нуля из-за наличия вырожденной траектории у s.

Пусть дана произвольная траектория 5 = (y(.), w(.), T) е Ш. Рассмотрим криволинейный треугольник, вершинами которого являются состояния s, а(8), р(5), а сторонами — сама траектория 5 и две траектории поля у1,у2 е Ts; первая пусть оканчивается в точке а(8), а вторая — в точке р(5). "Длины" этих сторон равны соответственно /(5), S(a(8)), S(P(5)). Рассмотрим выражение

Ф (5) = S(a(S)) + J (5) - S(P(5)). Условие

Ф (5) > 0 (2.1)

будем называть неравенством треугольника для траектории 5. Следующее утверждение, доказываемое чисто логически, может быть получено также из принципа оптимальности Беллмана [16].

Те о р е м а 1. Для оптимальности поля T s необходимо и достаточно, чтобы для любой траектории 5 е Ш выполнялось неравенство треугольника (2.1).

Доказательство теоремы 1. Необходимость. Пусть для некоторой траектории 5 е Ш неравенство треугольника нарушено, т.е. ф(5) < 0. Обозначим a(8) = x, р(5) = y. Пусть у1,у2 е T s — траектории поля, для которых р(у1) = x, р(у2) = y. Тогда неравенство ф (5) < 0 приобретает вид J (у1) + J (5) < J (у2). Отсюда получаем J (у15) < J (у2). Произведение у18 определено, начинается в s и оканчивается в y. Это значит, что траектория у 2, а вместе с ней и все поле T s, не являются оптимальными.

Достаточность. Пусть неравенство треугольника всюду выполнено. Возьмем произвольное состояние x и сравним две траектории: 8 е Ш s, ye T s, такие, что р(5) = р(у) = x. Распишем неравенство треугольника для траектории 8: S(s) + J (5) > S(x) или J (5) > J (у). Ввиду произвольности 8 траектория у является оптимальной.

2.2. Функции вдоль пробной траектории. Зафиксируем произвольную траекторию 8 = (y(.), w(.), T) е Ш, T > 0, которую будем называть пробной. В принципе можно ограничиться только такими пробными траекториями, для которых T не превосходит константы. Для t е [0, T] обозначим, как это часто делается,

ДО = L(y(t), w(t)),

J (t) = J L(x)d т,

о

S(t) = S (y(t)).

Далее рассматривается зависящее

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком