научная статья по теме ОБ ОДНОМ АЛГОРИТМЕ ВОССТАНОВЛЕНИЯ УПРАВЛЕНИЙ В РАВНОМЕРНОЙ МЕТРИКЕ Математика

Текст научной статьи на тему «ОБ ОДНОМ АЛГОРИТМЕ ВОССТАНОВЛЕНИЯ УПРАВЛЕНИЙ В РАВНОМЕРНОЙ МЕТРИКЕ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 77. Вып. 2, 2013

УДК 531.36:62-50

© 2013 г. В. И. Максимов

ОБ ОДНОМ АЛГОРИТМЕ ВОССТАНОВЛЕНИЯ УПРАВЛЕНИЙ В РАВНОМЕРНОЙ МЕТРИКЕ

Обсуждается задача динамического восстановления неизвестных управлений, действующих на нелинейное векторное дифференциальное уравнение. Указывается два регуляризирующих алгоритма, позволяющих синхронно с развитием рассматриваемых процессов осуществлять восстановление этих управлений в равномерной метрике. Алгоритмы устойчивы к информационным помехам и погрешностям вычислений.

1. Введение. Рассматривается нелинейная динамическая система, описываемая векторным дифференциальным уравнением

где х е Rn — фазовый вектор системы, f: R х Rn ^Rn — нелинейная функция, B — (n х n)-матрица. Начальное состояние системы х0 задано. Возмущение — n -мерная входная вектор-функция (управление) u(t) — неизвестно. Предполагается, что эта функция дифференцируема. Такова вся априорная информация о действующем на систему (1.1) возмущении. Цель работы — построение алгоритма реконструкции входа u(-) в равномерной метрике. Входными данными алгоритма являются результаты измерения фазового состояния системы x(t); выход — некоторая функция и(-), играющая роль приближения u(-). Требуется построить динамический алгоритм реконструкции u(-).

Такой алгоритм характеризуется следующими особенностями:

а) вычисление функции и(т), 0 < т < t, осуществляется на основе результатов измерения состояния х(т) в моменты времени, предшествующие моменту t;

б) только после вычисления функции и(т) на промежутке 0 < т < t возможно использование новой информации о фазовом состоянии для вычисления и(т) в следующие моменты времени (при т > t).

Обсуждаемая задача относится к классу обратных задач динамики управляемых систем. Подобные задачи исследовались ранее (например, см. [1—3]). Один из подходов к решению задач динамической реконструкции входа u(-) для систем, описываемых обыкновенными дифференциальными уравнениями, был предложен А.В. Кряжимским и Ю.С. Осиповым [4] и развит в дальнейшем [5—8]. (Здесь указываем только обзорные работы.) Подход основан на сочетании методов теории гарантированного управления [9] и известного в теории некорректных задач метода сглаживающего функционала [10]. Предложенные в цитированных работах алгоритмы позволяют осуществлять процесс реконструкции в среднеквадратичной метрике. Таким образом, имеющиеся алгоритмы [4—8, 11] обеспечивают сколь угодно малое уклонение (в метрике пространства L2) формируемых ими управлений от управлений, порождающих текущие движения (траектории) при условии достаточной малости входных помех.

Ниже будет показано, что при некоторых дополнительных условиях, алгоритм, описанный ранее [11], позволяет восстанавливать неизвестный вход в равномерной метрике.

2. Постановка задачи. Метод решения. В дальнейшем полагаем, что функция f(t, x) непрерывна по аргументу t и липшицева по х, т.е.

x(t) = f (t, x(t)) + Bu(t), t e T = [0,3], x(0) = x0

(1.1)

||f(t,xl) - f(t,x2)|| < L\\xi - x2\\, L = const > 0, xbx2 e R Символ jjxjj означает евклидову норму вектора х.

n

(2.1)

Рассматриваемая задача состоит в следующем. На промежутке времени T реализуется некоторая траектория системы (1.1), т. е. решение х() = х( ;t0,х0, «(•)) векторного дифференциального уравнения (1.1), зависящее от изменяющегося во времени управления «(•). Интервал T разбит на конечное число полуинтервалов

[%i, Ti+i), i e [0 : m -1], xt+1 = xt +5, To = 0, тm = 9

В моменты времени Ti е А = {тi}™0, измеряются (приближенно) состояния системы х(т,), т.е. находятся векторы е Rn со свойствами

|x(Ti) < h (2.2)

Здесь h е (0,1) — уровень информационной погрешности. Решение х() уравнения (1.1) неизвестно.

Задача состоит в построении алгоритма восстановления (в темпе "реального" времени) входа «(•) на основе неточного измерения х(х,).

Наряду с измерениями фазовых состояний в дискретные моменты времени (см. условия (2.2)) рассмотрим также случай, когда измерения фазовых состояний x(t) осуществляются "непрерывно". Именно, предполагается, что в каждый момент времени t е T измеряются фазовые состояния системы (1.1), в результате чего определяются

векторы Е,h(t) е Rn со свойствами

h(t) - x(t)|| < h, t e T (2.3)

где функции E,h(t), t e T измеримы по Лебегу.

Для того чтобы приближенно вычислять входную вектор-функцию «(•), воспользуемся методом позиционного управления с моделью [5, 9]. В соответствии с этим методом задача восстановления неизвестного управления по результатам измерения величин (Е, h0) заменяется другой задачей, а именно, задачей позиционного управления вспомогательной системой M (моделью). Таким образом, задача восстановления «(•) сводится к следующим двум задачам:

1) задаче выбора вспомогательной системы M, называемой моделью, которая функционирует "синхронно" с реальной системой,

2) задаче управления этой системой по принципу обратной связи.

Один из путей реализации описанной выше схемы был указан (для автономной системы, т.е. для f = f (х)) [11] в случае, когда выполнялись неравенства (2.2). (Случай, когда выполнялись неравенства (2.3), был рассмотрен позже [12].) Предполагалось

[11], что u е Rm (при этом B — (nх m)-матрица) и управление «(•), действующее на систему (1.1), является функцией, суммируемой с квадратом ее евклидовой нормы, т.е.

элементом пространства ^(T; Rm). В качестве модели M была взята система

W(t) = f + Buh(t) + vh(t), t e 8i = [Ti, Ti+i)

Было показано, что, если управления и h() и v h() в модели формировать по принципу обратной связи согласно правилу

иh(t) = a-1BT(^h - w(xi)), vh(t) = с8а~2(^h - w(xt)) при t e 8i; c = const > 0

(индекс T означает транспонирование), то при определенном согласовании вспомогательного параметра a > 0, величины информационной погрешности h, а также шага

к

разбиения 5 имеет место сходимость и (•) ^ и*() при к ^ 0. Здесь «*(•) — минимальное по норме пространства L2(T; Rm) управление, порождающее истинное решение уравнения (1.1), т. е. функцию х(-).

Будем рассматривать случай, когда размерности управления и и фазового вектора х совпадают, а матрица B — невырожденная. Также предположим, что вход и(-) — непрерывная функция. При выполнении этих условий покажем, что построенные ранее алгоритмы [11, 12] позволяют строить управления и к(), сходящиеся (при определенном согласовании соответствующих параметров, в частности, при с = 0) к истинному управлению и(-) в равномерной метрике.

3. Алгоритм решения при непрерывном измерении фазовых состояний. Укажем алгоритм решения задачи в случае непрерывного измерения фазовых состояний. При этом результатами измерений фазовых состояний системы (1.1) являются я-мерные вектор-функции Е,к(г), удовлетворяющие неравенствам (2.3). Итак, нужно указать уравнение модели, а также правило управления ею по принципу обратной связи. В качестве модели возьмем я-мерную систему

*к(0 = /№к(0) + Вик(г) при п.в. г е Т (3.1)

с начальным состоянием

* (0) = хо

Таким образом, модель описывается линейным дифференциальным уравнением, в то время как заданная система — нелинейна (см. (1.1)).

к

Введем вспомогательную функцию а(к): (0,1) ^ (0,1). Управление и = и (•) в модели (3.1) зададим следующим образом:

ик(г) = -а-1Вт(*к(г) - ^к(0), а = а(к) (3.2)

к

Можно показать, что функция и (г) вида (3.2) находится по правилу ик(г) = а^шт(а||и||2 + 2(фк(г),ВТи): и е Я"}; фк(г) = £к(г) - *к(г)

Символ (•,•) — скалярное произведение в пространстве Rn. При таком выборе управления и к() система (3.1) примет вид

*к(г) = /(г, $к(г)) - а-1В(*к(г) - $к(г)), г е т; В = ВВт

Обозначим решение этой системы символом *к (•).

В дальнейшем будем полагать выполненным следующее Условие 1. Матрица В — невырожденная.

Как видно из приведенной ниже теоремы 1, описанный метод позиционного

управления моделью (3.1) генерирует вход модели и к(), который сколь угодно точно (в смысле равномерной метрики) аппроксимирует вход и(-) системы (1.1), если только величина к (погрешность наблюдения) достаточно мала. Теорема 1. Пусть

а(к) ^ 0, ка-1(к) ^ 0 при к ^ 0

Если

u(-) 6 W1 "(T;Rn) = {u(-) 6 C(T;Rn): u(-) e L00(T;R")} то, каково бы ни было s > 0, имеет место сходимость

иh(•) ^ u() в C([е,9];Rn) при h ^ 0 Если, к тому же, u(0) = 0, то иh(•) ^ u(-) в C(T; Rn) Кроме того, имеет место следующая оценка скорости сходимости алгоритма: sup ILh(t) - u(t)|| < c1a(h) + c2ha-1(h) + c31|Ea(t)Bu(0)H

teT

где

Ea(t) = exp(a—1B? t)

Доказательство. Нетрудно видеть, что справедливо равенство

— [wh(t) - x(t)] = -a~1BB[wh(t) - h(t)] + gh(t) при п.в. t e T dt

Здесь

e„(f) = f (t,%h(t)) - f (t,x(t)) - Bu(t) Следовательно,

t t 2 t a-1B[wh(t) - x(t)] = Ea(t - s)Qh(s)ds = -Ea(t - s)Bu(s)ds + X JEa(t - s^s)ds (3.3)

0 0 j=1 0

где

06a)(s) = a-1 B[x(s) - ^h(s)]

^62)(s) = f (s, $h(s)) - f(s, x(s)) при п.в. s e T

Штрихом обозначена производная по s.

Учитывая свойства (2.1), (2.3), заключаем, что

(s)|| < C1ha-1, ||^(s)|| < C2h при п.в. s e T

В таком случае, воспользовавшись этими неравенствами, выводим

2 t

ZjE'a(t - s)^P(s) ds

j=10

< C3ha-1 (3.4)

Интегрируя по частям первое слагаемое в правой части равенства (3.3), используя соотношения (3.4) и условие ограниченности производной и'(5), получим оценку

|| -а- х(0] - £и(01! < С4На+ С5а +1|Еа(1)Би(Щ из которой вытекает справедливость теоремы.

4. Алгоритм решения при дискретном измерении фазовых состояний. Укажем алгоритм решения задачи в случае дискретного измерения фазовых состояний. Таким образом, ниже предполагаются выполненными соотношения (2.2). Прежде всего фиксируем семейство разбиений отрезка Т:

А к = (чЛм), тк,0 = 0 тк,тА = тк,1+1 = т к,1 + 5(к)

Заметим, что в силу липшицевости функции / (см. условие (2.1)) можно указать число М > 0, для которого верны неравенства

||х(г)|| < М при почти всех г е Т (4.1)

\/(г, х(г)) - /(т;,^;к)||< М(5 + к + ю(5)) при г е 5, = [т,,т,+1) (4.2)

где т, = тк ,, ю(8) — модуль непрерывности функции г ^ /(г, х(г)), t е Т, т.е.

о(5) = 8ир{/(г,х(г)) - /(г - 8,х(г - 8)) : г е [8,9]}

В качестве модели возьмем линейную систему, описываемую векторным дифференциал

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком