научная статья по теме НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ Кибернетика

Текст научной статьи на тему «НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 6, с. 16-33

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

УДК 519.8

НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ*

© 2007 г. А. С. Бортаковский

Москва, МАИ (технический ун-т) Поступила в редакцию 18.12.06 г., после доработки 25.05.07 г.

Рассматриваются детерминированные логико-динамические системы, динамическая часть которых описывается дифференциальными уравнениями, а логическая часть, моделирующая работу автомата с памятью, - рекуррентными включениями. Получены необходимые условия оптимальности управления. Выведены уравнения для вариаций функционалов, определенных на траекториях логико-динамических систем, а также уравнения для нахождения оптимального программного управления. Применение условий оптимальности демонстрируется на примерах.

Введение. Логико-динамические системы (ЛДС) служат математическими моделями многорежимных систем автоматического управления технологическими процессами и движущимися объектами [1-5]. Движение динамической части ЛДС определяется дифференциальными уравнениями, а работа логической части, моделирующей автомат с памятью, - рекуррентными включениями. В частности, такими соотношениями описывается движение летательных аппаратов, управляемых с помощью бортовых вычислительных комплексов. В отличие от непрерывно-дискретных систем [6], где изменение (переключение) дискретной части системы происходит в тактовые, заранее заданные моменты времени, логическая часть ЛДС может изменять состояние в произвольные, заранее не заданные моменты времени в зависимости от текущего состояния динамической части и предшествующего состояния логической части ЛДС. Причем каждое переключение логической (автоматной) части оценивается, и его "стоимость" включается в критерий качества управления ЛДС в виде штрафа. Для описания работы логической части ЛДС могут быть использованы и другие модели [5].

Вывод необходимых условий оптимальности ЛДС имеет некоторые отличия от обычно применяемых подходов [7-12]. Дело в том, что игольчатые вариации траектории логической части системы (т.е. конечные изменения состояний логической части системы на множестве малой меры) недопустимы, поскольку приводят к конечным изменениям критерия качества из-за наличия штрафных слагаемых. Поэтому можно использовать следующие два типа малых вариаций: малые вариации моментов переключения состояний логической части системы либо малые кусочно-постоянные вариации (т.е. малые изменения состояний автомат-

ной части системы на конечных промежутках времени), если эти изменения допустимы. Здесь необходимо учитывать, что пространство состояний логической части системы может быть несвязным. Например, если состояние автоматной части описывается вектором с логическими (булевыми) или целочисленными компонентами, то малых вариаций таких векторов просто не может быть. В результате применения указанных вариаций траекторий ЛДС выводятся слабые необходимые условия оптимальности, которые в общем случае не позволяют однозначно найти оптимальный процесс, но ограничивают область поиска, отбрасывая часть неоптимальных процессов. В некоторых задачах оптимальный режим находится однозначно аналогично применению принципа максимума для непрерывных систем [7, 8].

1. Постановка задачи. Пусть поведение детерминированной ЛДС описывается соотношениями

у(0 е ¥((, х(0, у(Г - 0)),

(1.1) (1.2)

где х, у - векторы состояния динамической и логической частей ЛДС, х е X с 1КИ; у е У с К™ ; и -вектор управления, и е и с t - время, t е Т = = t1] - промежуток времени функционирования системы, t0, t1 - моменты начала и окончания процесса управления заданы; ^, х, у, и): Т

состояний логичес возможен переход в момент времени , сти ЛДС. Предпол;

Работа выполнена при финансовой поддержке РФФИ (гранты < 05-01-00458, 06-08-00882).

но непрерывной функции х(0 отображение t —► —► У(¿, х(0, у) непрерывно справа, т.е.

У(г + 0, х(Г + 0), у) = У^, х(£), у) (1.3)

при всех t е Т, и кусочно-постоянно, т.е. существует разбиение t0 = т0 < т < ... < тл = t1 промежутка Т на конечное число непересекающихся полуинтервалов [тк - х, тк), к = 1, ..., Л, на каждом из которых многозначное отображение t —► У(t, x(t), у) постоянно для каждого у е У.

Начальное состояние ЛДС задано условиями х^о) = Хо; у^0 - 0) = уо. (1.4)

Дифференциальное уравнение (1.1) описывает динамическую часть ЛДС управления. В каждый момент времени t функция/^, x(t),y(t), и(ф указывает скорость изменения состояния х(0 динамической части системы, которая зависит также от состояния у(0 логической части системы и от управления и(0. Включение (1.2) задает логическую часть ЛДС в форме конечного автомата с памятью [5]. Выбор состояния у(0 в каждый момент времени t указывается множеством У(^ х(0, y(t - 0)) возможных состояний, которое зависит от текущего состояния х(0 динамической части системы, а также от предшествующего состояния y(t - 0) логической части ЛДС.

Допустимыми процессами считаются тройки функций (х(), у(), и()), где и() - измеримая функция и : Т —► и; у() - непрерывная справа кусочно-постоянная функция у : Т —► У; х() - абсолютно непрерывная функция х : Т —► X, причем пара функций (х(), у()) удовлетворяет начальным условиям (1.4) и при всех t е Т - рекуррентному включению (1.2), а тройка (х(), у(), и()) почти всюду на Т - уравнению (1.1). Функции х() и у() определяют траектории движения динамической и логической частей ЛДС соответственно. Множество допустимых процессов обозначим через

2)00, х0, у0).

На множестве х0, у0) допустимых процессов задан функционал

I =

х(tl), у(11)) +(^ х(t),у(t), и(t))Л-

(1.5)

+

££0(т, х(т), у(т -0), у(т)),

где функция ^ : X х У —К непрерывна по х, функции/0 : Т х X х У х и К и : Т х X х У х У — К непрерывны по совокупности аргументов t и х, причем

g0(t, х, у, V) > 0 У^, х,у, V) е Т хXх У х У; (1.6) g0(t, х, у, у) = 0 У^, х, у) е Т х Xх У. (1.7)

Суммирование в (1.5) ведется по всем точкам т разрыва функций у(). Заметим, что множество таких точек конечно.

Для любого допустимого процесса й = (х(), у(), и( )) е х0, у0) в силу непрерывности функции /(^ х, у, и) по аргументам t, х и и сложная функция / (^ х(0, y(t), u(t)) будет измеримой и ограниченной, т.е. суммируемой [13,14]. Поэтому значение 1(й) функционала (1.5) определено на 2(^, х0, у0).

Требуется найти допустимый процесс й* = (х*(), у*(), и*()), минимизирующий функционал (1.5)

I (й *) = шш I (й).

й е 2(хо, уо)

(1.8)

Если наименьшее значение (1.8) не достигается, то ставится задача нахождения минимизирующей последовательности допустимых процессов [9] й = = (х/О, у/-), и/ )) е 2%, х0, у0),] = 1, 2, ...

I (й]) ^ М

й е 2( t0, х0

I ( й) = I *.

у о)

(1.9)

В отличие от классической задачи оптимального управления [7] на значения у(0 допустимых функций у(), играющих для динамической части роль дополнительного кусочно-постоянного управления, наложены ограничения, зависящие от выбора предшествующих величин у^ - 0). При этом не исключается случай, когда компоненты вектора у е У являются двузначными логическими (булевыми) переменными, принимающими значения 0 или 1, либо многозначными логическими переменными. Эти условия можно учесть, ограничивая либо множество У, либо У(^ х, у), например

У с Ж"

(1.10)

где Ж - множество целых. Условие вида (1.10) можно использовать для объектов, совершающих типовые движения (разгон, поворот, торможение и т.п.). В этом случае состояние у(0 автоматной части соответствует номеру типовой траектории движения. Дискретность (несвязность) множества состояний логической (автоматной) части системы является существенным отличием ЛДС от обычных систем управления со связным множеством состояний. Для описания ЛДС можно использовать дифференциальные включения [8], считая, что логическая часть задает переменную область управления.

В критерий качества управления (1.5) входят слагаемые g0(т, х(т), у(т - 0), у(т)), зависящие как от у(т), так и от у(т - 0). В частности, это могут быть скачки

g0(т, х(т), у(т - 0), у(т)) = | у(т) -у(т - 0)|

функции у(). Условия (1.6), (1.7) позволяют рассматривать каждое слагаемое g0(т, х(т), у(т - 0), у(т)) в (1.5) как "штраф" за изменение (переключение) состояния у(т - 0) логической части системы.

о

Чтобы исключить многократные переключения логического блока в фиксированный момент времени, полагаем, что

g0(t, х, у, w) < х, у, V) + х, V, w),

Уу е х, у) и Vw е У^, х, V); (1.11)

У^, х, у) з У^, х, V) V V е У(^ х, у).

Первое условие означает, что "штраф" за однократный переход у —► w из состояния у в w меньше, чем суммарный "штраф" за двукратный переход у —- V и V —► w (сначала из у в V, а затем из V в w). Во втором случае предполагается, что множество У(^ х, у) содержит все состояния w е У(^ х, V), в которые можно попасть из V е У(^ х, у). Оба условия не исключают возможности появления режима с бесконечным числом переключений автоматной части, которые происходят, однако, в различные моменты времени. Бесконечное число переключений для оптимальной траектории можно исключить, усиливая неравенство (1.6)

g0(t, х,у, V) > X > 0 У^, х,у, V) е ТхХх У х У.(1.12)

Включение таких "штрафов" в критерий качества необходимо в тех прикладных задачах, где решением служит минимизирующая последовательность релейных законов управления. Например, в задаче демпфирования колебаний спутника с гравитационной штангой [9] последовательность управлений, минимизирующая расход топлива, составляется из коротких включений двигателей. В пределе получается бесконечная последовательность мгновенных включений двигателя в определенных точках орбиты. Такое решение практически не реализуемо. Рассматривая ту же задачу в классе ЛДС, учитываем, что каждое включение реактивного двигателя от его запуска до достижения номинальной тяги сопровождается расходом топлива и представляет собой некоторый немгновенный переходной процесс. Добавляя в критерий качества соответствующие штрафные слагаемые вида (1.12), получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя, а процессы, требующие бесконечного числа включений, отбрас

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком