научная статья по теме ОБ ОПТИМИЗАЦИИ ГАРАНТИРОВАННОГО РЕЗУЛЬТАТА ПРИ ЗАПАЗДЫВАНИИ В УПРАВЛЕНИИ Математика

Текст научной статьи на тему «ОБ ОПТИМИЗАЦИИ ГАРАНТИРОВАННОГО РЕЗУЛЬТАТА ПРИ ЗАПАЗДЫВАНИИ В УПРАВЛЕНИИ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 77. Вып. 5, 2013

УДК 62-50

© 2013 г. М. И. Гомоюнов

ОБ ОПТИМИЗАЦИИ ГАРАНТИРОВАННОГО РЕЗУЛЬТАТА ПРИ ЗАПАЗДЫВАНИИ В УПРАВЛЕНИИ

Для линейной динамической системы, подверженной воздействиям помех и содержащей запаздывание в органе управления, рассматривается задача об управлении по принципу обратной связи при показателе качества — евклидовой норме совокупности отклонений траектории движения системы в заданные моменты времени от начала координат. Дается процедура для вычисления величины оптимального гарантированного результата, основанная на рекуррентном построении выпуклых сверху оболочек вспомогательных функций. Указывается способ формирования управляющих воздействий, гарантирующих достижение этого результата.

В рамках теоретико-игрового подхода [1—5] для линейной динамической системы, содержащей запаздывание в органе управления [6—8], рассматривается задача об управлении в условиях помех с оптимизацией нетерминального показателя качества, представляющего собой евклидову норму совокупности отклонений траектории движения системы в заданные моменты времени от начала координат.

Эта задача была сведена к нахождению цены и минимаксной стратегии в подходящей вспомогательной дифференциальной игре без запаздывания и с терминальным показателем качества [9]. Для вычисления цены было предложено использовать конструкции выпуклых сверху оболочек [3, 4] из метода стохастического программного синтеза [2], для построения минимаксной стратегии — метод экстремального сдвига на сопутствующую точку [2, 3]. В результате, для решения исходной задачи была дана процедура [9], основанная на рекуррентном построении выпуклых сверху оболочек вспомогательных функций. Следует, однако, отметить, что размерность множеств, на которых согласно этой процедуре определяются овыпукляемые вспомогательные функции, зависит от числа N моментов времени оценки движения в показателе качества и может быть велика даже при малой размерности n фазового вектора исходной системы. Это существенно сужает область эффективного применения такой процедуры.

Ниже, на примере одного частного случая расположения моментов времени оценки качества движения, который, однако, демонстрирует все особенности рассматриваемой задачи, связанные, прежде всего, с наличием запаздывания в управлении, показано, что предложенную ранее процедуру [9] можно редуцировать, существенно понизив размерность множеств, на которых требуется проводить овыпукление, сведя ее в рассматриваемом случае от Nn к 2n.

Работа продолжает исследования [3—5], развивая предложенные в них конструкции на случай систем, содержащих запаздывание в управлении.

1. Постановка задачи. Пусть движение динамической системы описывается уравнением

dx(t) = A(t)x(t) + B(t)u(t) + BT (t)u(t - t) + C(t)u(t), 10 < t <3 (1.1)

dt

x e Un, u e P с Ur, и e Q с Us, т = const > 0

Здесь t — время; x — фазовый вектор; u — вектор управления; и — вектор помехи; т — постоянная величина запаздывания; t0 и О — заданные начальный и терминальный моменты времени соответственно (t0 < О); P и Q — известные компакты; A(t), B(t), BT(t) и C(t) — непрерывные матрицы-функции соответствующих размерностей.

Пусть число X > 0 таково, что справедливо неравенство \\A(t)x + B(t)u1 + BT(t)u2 + C(tU < (1 + ||x|\)X t e [t0,9], x e Rn, u1 e P, u2 e P, и e Q

Здесь и далее символ || • || означает евклидову норму.

Обозначим через U множество измеримых по Борелю функций из [-т, 0) в P. Назовем позицией системы (1.1) тройку (t, x, p()) e [t0,9] x Rn x U. Определим множество возможных позиций

K = {(t,x,p()) e [t0,9] x Rn x U :||x|| < (1 + R0)e(t-t")X - 1} (1.2)

где R0 > 0 — некоторое фиксированное число.

Пусть заданы позиция (t*, x*, p*()) e K, < и момент времени t* e (i*,B]. Допустимыми считаем измеримые по Борелю реализации управления

u[t*[]t*) = {u(t) e P, t* < t < t*}

и помехи

u[t*[]t*) = {u(t) e Q, t* < t < t*}

Кроме того, при t* - т < t < t* имеем u(t) = p*(t - t*). Из позиции (t*, x*, p*(-)) такие реализации единственным образом порождают движение системы (1.1) — абсолютно непрерывную функцию

x[t*[]t*] = {x(t) e Rn, t* < t < t*}

которая удовлетворяет условию x(t*) = x* и при почти всех t e [t*, t*] вместе с u(t) и u(t) удовлетворяет уравнению (1.1). При этом для любого t e [t*, t*] справедливо включение (t, x(t), ut(■)) e K, где ut(■) = {ut(Z) = u(t + [-т,0)}.

Качество движения x[t*[-]B], порожденного из начальной позиции (t*, x*, p*(-)) e K некоторыми допустимыми реализациями u[t*[-]9) и u[t*[-]9), оценивается показателем

( N Y'2

Y = X ||x(9;)||2 (1.3)

\t=h(t,) )

где 9,- e [t0,9], i = 1, N, таковы, что 9,- = t0 + iT, i = 1N, 9 N = 9

и

h(t) = min{i = 1N : 9, > t}, t e [t0,9] (1.4)

Цель управления — доставить показателю y (1.3) как можно меньшее значение. При этом действия помехи неизвестны и, в частности, могут быть нацелены на максимизацию у.

Допустимой стратегией управления U() считаем любую функцию U() = {U(t, x, p(),e) e P,(t, x, p()) e K,s > 0} где s > 0 — параметр точности (см., например, [2], с. 68).

Пусть задана начальная позиция (t*, x*, p*()) е K. Стратегия U(•) действует на систему (1.1) в дискретной по времени схеме на базе некоторого разбиения отрезка времени [t*,S]:

Ak = Аk{tj} = {tj: ti = t*, tj < tj+1, j = \k, tk+1 = 9} (1.5)

Тройка {U (•), s, A k} определяет закон управления, который последовательно по шагам разбиения Ak в цепи обратной связи формирует кусочно постоянную реализацию

u(t) = U(tj, x(tj), utj (-),s), tj < t < tj+i, j = 1k (1.6)

где

utj (•) = {utj © = u(tj + [-т,0)} и u(tj + = p*(tj t*) при t*-т< tj t*.

Обозначим через S(t*, x*, p*Q, U(•), e, Ak) множество всех возможных троек (x[t*[-]3], u[t*[-]»), u[t*[-]»))

таких, что: u[t*[-]ö) — допустимая реализация помехи; u[t*[-]-9) — реализация управления, которая формируется законом {U (•), s, A k} по правилу (1.6); x[t*[-]-9] — движение системы (1.1), порождаемое из позиции (t*, x*, p*(-)) этими реализациями u[t*[-]-9) и u[t*[-]ö). Следуя принципу гарантированного результата, определим величину

r(t*, x*, p*Q, U Q,e,A k) =

= sup{y : (x[t*[-]9], u[t*[-]9), u[t*[-]3)) e S(t*, x*, p*() U() e, Ak)} Тогда оптимальным гарантированным результатом управления будет

Г °(t*, x*, p*() = inflimsuplimsup Г(?*, x*, p*(-), U(•),£, A k)

U(-) S^0 Äk

где верхняя грань вычисляется по всем разбиениям Ak = Ak{tj} (1.5) с диаметром

8k = max(tj+i - tj) < 5

j=1,k

Задача заключается в том, чтобы найти величину оптимального гарантированного результата и построить закон управления, обеспечивающий этот результат.

2. Формулировка результата. Для t е [t0,9] через h(t - 0) (соответственно, h(t + 0)) обозначим предел функции h(t) из (1.4) в точке t слева (соответственно, справа), полагая при этом

h(t0 - 0) = 1 и h(9 + 0) = N

Пусть X(t, Е) — матрица Коши для уравнения dx(t)/dt = ^(t)x(t). Определим (2n х r) -матрицу B(t) и (2n х s)-матрицу C(t) следующим образом:

B(() = (Х(Ч+0), №) )

Uo, t)(B(t) + X(t, t + x)B%(t + x)i(t))) 1)

C(() +0),tC(t)^, X(()=|1, t (.)

t)C(t) |p, t >-&-T

Зафиксируем t* e [t0,Э]. Назначим разбиение Ak = Ak{tj} вида (1.5). При этом всюду далее, рассматривая разбиение Ak, будем всегда предполагать, что оно содержит момен-

ты времени 9,- (i = h(t*), N) из показателя качества (1.3). В случае t* =9 полагаем, что через Ак обозначено вырожденное разбиение, состоящее из одной точки t1 = t* = 9 = tk+1. Положим

'j+i _

Ay(tj, g) = f max min (g, B(t)u + C(t)u) dt, g e R2n, j = 1, к (2.2)

ueQ ueP

tj

Символ (•, •) означает скалярное произведение векторов.

Попятно по шагам разбиения Ак определим множества G(tj ± 0) в пространстве R2n векторов g и скалярные функции

q(tj ± 0, g), g е G(tj ± 0), j = 1, к + 1

Всюду ниже запись g = (l, m) означает, что первые n координат вектора g е R2n совпадают с координатами вектора l е R", а следующие n координат — с координатами вектора m е R

При j = к + 1 полагаем

G(tk+1 + 0) = {g = 0}

G(tk+1 - 0) = {g = (l, m) e R2n : ||l|| < 1, m = 0} фк+1 ± 0, g) = 0, g e G(tk+1 ± 0)

Дальнейшие построения проводятся согласно следующим рекуррентным соотношениям. Пусть уже известны множества G(tj+1 ± 0) и функции

qj ± 0, g), g е G(tj+1 ± 0), 1 < j < к

Тогда

Щ + 0) = G(tj+1 - 0)

Щ, g) = АЩ, g) + 9tj+1 - 0, g), g e G(tj + 0) 9tj + 0, •) = {\y(tj, ■)}*}{t.+0)

Символ {yQ}* означает выпуклую сверху оболочку функции у(-) на множестве G, т.е. минимальную вогнутую функцию, которая мажорирует функцию у(-) на G. Далее, если tj ^ 9h, где h = h(tj), т.е. если момент j не совпадает ни с одним из моментов 9,- из (1.3), то полагаем

Gj(tj - 0) = G(tj + 0), qOfj - 0, g) = q0tj + 0, g), g e Gj(tj - 0) (2.3)

Если же tj = 9h, то, определяя множество

M(tj,g = (l,m)) = {(v,g* = (l*,m*)) e [0,1] x G(tj + 0):

И2 < 1 - v2;m = v(m* + XT($h+1,W*)} (2.4)

где верхний символ T означает транспонирование, полагаем

Gitj - 0) = {g е R2" : M(tj, g) ф 0} q(tj - 0, g) = max vq(tj + 0, g*), g е G(tj - 0)

(V, g,)Mtj, g)

(2.5)

Можно проверить, что для каждого у = 1, к + 1 множества 0((у ± 0) — выпуклые компакты в К2", а функции у^у ± 0, g), g е 0((у ± 0), — вогнутые, ограниченные и полунепрерывные сверху, причем

0 е G(tj ± 0), ф(tj ± 0,0) > 0

Рассмотрим систему величин

e(tj ± 0, z) = max [(g, z) + ф(tj ± 0, g)], z e

g^G(tj ±0)

ъ2п

j = 1, к +1

(2.6)

(2.7)

Для ((, х, р()) е [(о,9] х К" х и определим 2п-мерные векторы

w(t ± 0, х, p()) =

( $h(t ±0)

X(9Ht±0),t)x + j X(9Ht±0),®B%(Qp&-1 -T)d$ t

t+T

X(9, t)x + j X(9, ЪБ&Ш - T)p& -1 - T)dZ,

(2.8)

Зафиксируем некоторое значение параметра точности е > 0 и для всякой позиции

(tj, х, p(■)) е K (j = \ к) рассмотрим сопутствующую точку zj (х, p(-),E) е мую по величине e(tj + 0, •) (2.7):

zj (х, p(), s) е arg min e(tj + 0, z)

ъ2п

выбирае-(2.9)

где минимум берется по всем векторам z е К2", для которых

Ыу + 0,х, р()) - ^ < е + ((у - ?0)е (2.10)

В моменты времени ^ назначенного разбиения Ак определяем стратегию управления иеА (•), исходя из условия экстремального сдвига на сопутствующую точку (2.9):

UL (tj, х, p(), е) е arg min{sy, B(t,)u), (t,, x, p()) e K, j = 1,

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком