научная статья по теме ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ИНТЕРВАЛЬНЫМИ ОГРАНИЧЕНИЯМИ Математика

Текст научной статьи на тему «ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ИНТЕРВАЛЬНЫМИ ОГРАНИЧЕНИЯМИ»

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ, 2015, том 55, № 5, с. 758- 775

УДК 519.626

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ С ИНТЕРВАЛЬНЫМИ ОГРАНИЧЕНИЯМИ^

© 2015 г. В. М. Александров

(630090 Новосибирск, пр-т Акад. Коптюга, 4, Ин-т матем. СО РАН) e-mail: vladalex@math.nsc.ru Поступила в редакцию 07.08.2014 г. Переработанный вариант 16.11.2014 г.

Для линейных систем с интервальными ограничениями предложен метод вычисления оптимального по быстродействию управления. Метод основан на преобразовании квазиоптимального управления. Рассмотрены свойства и особенности квазиоптимального управления. Дан способ деления области начальных условий на области достижимости за различные времена и аппроксимации каждой области семейством гиперплоскостей. Разработан итерационный метод вычисления оптимального управления с интервальными ограничениями. Доказана сходимость метода и получено достаточное условие сходимости вычислительного процесса. Найден радиус локальной сходимости с квадратичной скоростью сходимости. Приведены результаты моделирования и численных расчетов. Библ. 17. Фиг. 3. Табл. 2.

Ключевые слова: оптимальное управление, квазиоптимальное управление, интервальные ограничения, быстродействие, области достижимости, сопряженная система, сходимость, итерационный процесс.

Б01: 10.7868/$004446691505004Х

1. ВВЕДЕНИЕ

Развитие теории оптимального управления представляет значительный теоретический и практический интерес (см. например, [1]). Отечественными и зарубежными специалистами рассмотрены различные ее аспекты [2]—[6], к числу которых следует отнести и проблему вычисления оптимального управления с интервальными ограничениями (см. [7]—[11]). В работе предлагается метод вычисления оптимального по быстродействию управления с интервальными ограничениями на компоненты вектора управления, основанный на преобразовании квазиоптимального управления (см. [12], [13]). Квазиоптимальное управление представляет чередующуюся последовательность разнополярных управляющих воздействий, величины которых пропорциональны начальным условиям, а моменты переключений близки к моментам переключений оптимального по быстродействию управления. Квазиоптимальное управление обладает рядом важных свойств, к числу которых относятся простота реализации и перевод системы в начало координат из любого начального состояния, принадлежащего области управляемости. Сложность реализации квазиоптимального управления практически не увеличивается с ростом порядка управляемой системы и числа управляющих параметров. Управление формируется в реальном времени для систем высокого порядка, что позволяет управлять быстродействующими объектами и быст-ропротекающими процессами.

2. ПОСТАНОВКА ЗАДАЧИ Пусть управляемая система описывается линейным дифференциальным уравнением

х = А(0х + В(0и, х(?0) = х0, х0 е Б, Б с V, (2.1)

1) Работа выполнена при финансовой поддержке РФФИ (код проекта 13-01-00329) и СО РАН (междисциплинарный проект № 80).

где х есть «-мерный вектор фазового состояния; A(t) и B(t) — непрерывные матрицы размера n х n и n х m соответственно; u есть m-мерный вектор управления, компоненты которого принадлежат классу кусочно-непрерывных функций и подчинены интервальным ограничениям

M < \u\ < М2, M], Mj > 0, Mj > M], j = 1, m. Предполагается, что система (2.1) полностью управляема, т.е.

(2.2)

rank

]Ф( tbx) В(т) B *(т)Ф * ( tk,T) dT

= n,

(2.3)

и переводима в начало координат из ограниченной области начальных условий Б; V — область управляемости; Ф^к, ?0) — фундаментальная матрица решений однородного дифференциального уравнения; * — знак транспонирования. Ставится

Задача. Найти допустимое управление и0(0, удовлетворяющее интервальным ограничениям (2.2) и переводящее за минимальное время Т = — ^ систему (2.1) из начального состояния х(?0) = х0 в начало координат х(1к) = 0.

k

3. ВЫЧИСЛИТЕЛЬНЫМ МЕТОД РЕШЕНИЯ ЗАДАЧИ

3.1. Формирование квазиоптимального по быстродействию управления

Введем в рассмотрение переменные ограничения, зависящие от начальных условий, и ограничим компоненты вектора управления по условию

< £](to)|, N] > 0, j = 1, m, (3.1)

|Ы;| < ^ NjX; ( U )1 , NV,-; > и, 1 = 1, т

i = 1

где Ny — некоторые весовые коэффициенты. Пусть начальная точка x(t0) = x0 расположена на i-й оси фазового пространства, т.е. вектор начальных условий x(,)(t0) содержит только одну ненулевую компоненту xi(t0) для некоторого фиксированного i. Рассмотрим процесс формирования управления из начального условия i-й фазовой координаты. Для рассматриваемого начального условия ограничение (3.1) принимает вид

j < tu)|, i = ~n, j = ТГт. (3.2)

Рассмотрим задачу оптимального линейного быстродействия. Для нахождения минимального времени T() = tik) — t0 перевода системы (2.1) из начального состояния x(l)(t0) = (0, ..., 0, x(t0),

0, ..., 0) в нулевое конечное состояние x( tik)) = 0 воспользуемся принципом максимума [1]. Выпишем функцию Понтрягина: H(x(t), y(t), u(t)) = y*A(t)x + y*B(t)u, где у* — транспонированный вектор решения сопряженной системы у = —A*(t)y, y(t0) = у0. Функция Понтрягина максимальна, если компоненты вектора управления при ограничении (3.2) удовлетворяют соотношению

U(i)( t) = Щ\х( tu)| sign [ Bj (t)] * y(t), i = ~n, j = 17m. (3.3)

Пусть x(t0) = x+ (t0) > 0. Тогда (3.3) можно записать в виде

j (t) = NjjX+( tu) sign [ Bj( t)] * y(i) (t), i = ~n, j = ТГт, (3.4)

где y(i)(t) — решение сопряженной системы, соответствующее положительному значению x(t0). Если x(t0) = — х+ (t0) < 0, то имеем

j (t) = NjX+( tu) sign [Bj( t)] * у/(0 (t), i = TTn, j = )~m, (3.5)

n

где \|/(l) (t) — решение сопряженной системы, соответствующее симметричной точке [—x+ (t0)]. В силу симметрии относительно начала координат многообразий переключений оптимального управления имеем у(l) (t) = —y(i)(t). Запишем теперь (3.5) в виде

j (t) = -NX (to) sign [Bj( t)] *y(i) (t), i = ~n, j = irm. (3.6)

Объединим (3.6) и (3.4) для произвольного значения x(t0) и получим

j (t) = NijXi( to) sign [Bj( t)]* y(i) (t), i = in, j = im. (3.7)

Выпишем решение дифференциального уравнения (2.1) в конечный момент времени t = tk :

t(i) m 'k

x(k) = ф(tk°, to)x(i)(to) + £ Jф(4°, т)Bj(T)jdx, i = M. (3.8)

j = 1 'o

Через r(,)(t, t0) обозначим i-й вектор-столбец фундаментальной матрицы решений Ф(^ t0). Тогда первое слагаемое в правой части уравнения (3.8) можно записать в виде

Ф( tf, to )x(i) (to) = r(i) (4°, to) X, (to), i = I~n. (3.9)

Выразим решение сопряженной системы через фундаментальную матрицу решений прямой системы и начальное условие: y(i)(t) = [Ф-1(t, t0)]*y(,)(t0), i = 1, n . Подставим в (3.8) выражения (3.9), (3.7) и конечное условие x(tk) = 0. Получим уравнение, которое связывает моменты переключений управления (3.7), время перевода T(') = tk — t0 и начальное условие x(t0) с параметрами управляемой системы. Получили систему из n линейных уравнений с n неизвестными, которыми являются начальные условия у|') (t0), = 1, n:

£

j = i

JФ(if, to)Bj(x)Nysign[Bj(т)]*[Ф-1 (x, to)]*y(i)(to)dx + r(i)(tf, to)

x,(to) = o, i = 1, n.

Так как x(t0) Ф 0 Vi = 1, n , то получаем основное уравнение, связывающее моменты переключений управления

j (t) = Nx( to) sign [ Bj (t)]* [Ф-1 (t, to)] *y(i) (to), i = I~n, j = im, (3.10)

с параметрами управляемой системы

t(i) m tk

£ J Ф( tf, x) Bj(x) N^ sign [ Bj(x)] *[Ф-1(т, to)] *y(i) (to) dx + r(i) (tf, to) = o, i = I~n. (3.11)

j = 1 'o

Решив систему (3.11), найдем начальные условия у|() (t0), = 1, n, сопряженной системы. Они определяют все моменты переключений управления (3.7), которые задаются функцией переключений [Bj(t)]*y(,)(t). Из (3.11) непосредственно следует, что моменты переключений управления (3.10) не зависят от значения x(t0) Vi = 1, n .

В случае постоянных матриц A и B из (3.11) получаем следующее основное уравнение, связывающее моменты переключений управления (3.7) с матрицами A, B и коэффициентом Nf

Ti)

m 1 )

£ JeA( 1 -T)Bj-Nysign[Bj]*y(i)(x)dx + Г(°(Tii)) = o, i = I~n. (3.12)

j = 1 'o

k

m

Из (3.12) непосредственно следует, что моменты переключений не зависят от начального момента t0, начального условия x¡(t0)Vi = 1, n и постоянны. В результате доказана

Теорема 1. Моменты переключений управления (3.7), сформированного из начального условия i-й фазовой координаты, не зависят от значения x¡(t0) Vi = 1, n . В случае постоянных матриц A и B

моменты переключений не зависят от начального момента t0, начального условия x¡(t0) Vi = 1, n и постоянны.

Обозначим точки пересечения границы множества достижимости DT за время T = tk — t0 с осями фазового пространства через ±(x;(t0))max, i = 1, n. Весовые коэффициенты Nj выбираем из условия Nj-|x¿(t0)|max = Mj, i = 1, n , j = 1, m . В результате время перевода T(i) равно значению T, т.е.

T» = T и 4 = tk.

Каждая из компонент управления (3.7), ограниченного по условию (3.2), представляет чередующуюся последовательность разнополярных импульсов, величина которых прямо пропорциональна начальному условию x¡(t0), а моменты переключений равны значениям моментов переключений оптимального по быстродействию управления для максимального отклонения |x;(t0)|max. Таким образом, квазиоптимальное управление совпадает с оптимальным управлением при максимально допустимых "осевых" начальных условиях и сохраняет эти моменты переключений и время перевода. При этом для каждой компоненты величина квазиоптимального управления не

превышает предельно допустимого значения Mj, j = 1, m , и пропорциональна начальному условию. Управление (3.7) переводит систему (2.1) из любой начальной точки, расположенной на i-й фазовой оси, в начало координат за фиксированное время T = tk — t0. Учитывая, что функция переключения sign[By]*y(í)(t) = ±1 и задает моменты переключений, квазиоптимальное управление может быть записано в следующем простом виде: u¡ ] (t)kv = ±N¡jx¡(t0), j = 1, m , i = 1, n .

В общем случае, когда вектор начальных условий x(t0) содержит все (либо часть) ненулевые компоненты, компоненты вектора управления образуются суммированием составляющих, сформированных из каждой фазовой координаты

ujv(t) = £Nijxi

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком