научная статья по теме АЛГОРИТМЫ СИНТЕЗА ЛИНЕЙНЫХ НАБЛЮДАТЕЛЕЙ ДЛЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ Кибернетика

Текст научной статьи на тему «АЛГОРИТМЫ СИНТЕЗА ЛИНЕЙНЫХ НАБЛЮДАТЕЛЕЙ ДЛЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2014, № 5, с. 3-16

УПРАВЛЕНИЕ В ДЕТЕРМИНИРОВАННЫХ СИСТЕМАХ

УДК 681.51

АЛГОРИТМЫ СИНТЕЗА ЛИНЕИНЫХ НАБЛЮДАТЕЛЕЙ ДЛЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ*

© 2014 г. Н. Е. Зубов, Е. А. Микрин, А. С. Олейник, В. Н. Рябченко

Королев МО, ОАО РКК "Энергия", Москва, МФТИ и МГТУ им. Н.Э. Баумана Поступила в редакцию 07.04.14 г., после доработки 26.04.14 г.

Для нелинейных динамических систем разработан подход, основанный на их потактовой линеаризации, позволяющий решать проблему синтеза алгоритмов наблюдателей (оценки вектора состояния) на основе линейной теории оценивания. С использованием предложенного подхода решена задача аналитического синтеза полного и редуцированного наблюдателя угловой скорости вращения космического аппарата относительно связанной системы координат по измерениям трех углов положения этой системы координат в инерциальном пространстве. Приведены результаты моделирования.

DOI: 10.7868/S0002338814050151

0. Введение. Построение современных систем управления динамических объектов, в целом, и космическими аппаратами (КА), в частности, не может обходиться без использования наблюдателей [1—3]. Рассмотрим полностью управляемую непрерывную или дискретную линейную систему, заданную в пространстве состояний уравнениями

Эх = Ax + Bu, y = C x, (0.1)

в которых x(t) e Rn — вектор состояния; u(t) e Rr — вектор входа; y(t) e Rm — вектор выхода; Э — символ, обозначающий либо оператор дифференцирования по континуальной переменной t е R+, т.е. Эx(t) = x(t), либо оператор сдвига вперед по целочисленной переменной t е Z+, т.е.

Эx(t) = x(t + 1); A е Rnxn, B e Rnxr, C e Rmxn — постоянные матрицы. Пусть для системы (0.1) существует управление с обратной связью по состоянию вида

u = F x, (0.2)

где F е Rrxn — матрица регулятора, которая обеспечивает некоторые заданные требования к процессу управления. Пусть пара матриц A, C является полностью наблюдаемой, т.е. выполняется ранговое условие Калмана

( C__

rank —■— = n (0.3)

n-m

ЧСА У

Последнее условие означает, что можно построить (синтезировать) наблюдатель, позволяющий по входному u и выходному у векторам системы (0.1) оценить вектор состояния x.

Если указанный наблюдатель формирует оценку всего (полного) вектора x, то говорят о наблюдателе полного ранга, если осуществляется оценивание только некоторой части этого вектора, то наблюдателя называют редуцированным.

Наблюдатель полного ранга определяется уравнением [4]

Эх = (А - ЬС) х + Ьу + Ви, (0.4)

" Исследование выполнено за счет гранта Российского научного фонда (проект № 14-11-00046).

где х е К* — вектор состояния наблюдателя, представляющий собой искомую оценку, а матрица

коэффициентов L е Кпхт находится из условия обеспечения устойчивости следующей вспомогательной линейной системы [4]:

Зц = А тц + С тп, п =-Ьц.

(0.5)

Здесь ц — вектор, имеющий размерность вектора состояния x объекта (0.1) и полностью управляемый вектором п.

В данной работе решается проблема применения линейной теории построения наблюдателей для нелинейных динамических систем и аналитический синтез наблюдателя полного и редуцированного порядка.

1. Потактовая линеаризация с учетом неполного наблюдения вектора состояния. Рассмотрим динамический объект, описываемый нелинейными уравнениями вида

% х = Б(х) + Ви, у = Сх,

(1.1)

где Б(х) = [^(х),^2(х),..., ^(х)] — вектор-функция. Для построения наблюдателя для динамической системы (1.1) с применением теории линейных систем необходимо выполнить ряд предварительных действий. Первое действие — линеаризация функции Б(х) в окрестности некоторой точки х N, под которой, в частности, будем понимать значение компонент вектора состояния в момент начала очередного (^-го) такта работы бортовой ЦВМ. Для линеаризации функции Б(х) воспользуемся разложением в ряд Тейлора. Таким образом, система (1.1) примет следующий вид:

Ьх = А(х N )х + в(х N) + Ви,

где

л/ о ч дБ

А(х N) = — дх

о

а11(х N )

У = Сх,

о

а1п(х N )

чЙп1(хN) ... апп(хN);

в(х N) = Б(х N) - А(х N )х N =

^ / 0 Л

&(х N )

Яп(х N )

(1.2)

(1.3)

(1.4)

Интервал справедливости уравнений (1.2) ? е [íN; tN+1).

Наблюдатель полного ранга для системы (1.2), так же как и для (0.4), согласно [4], находится из уравнения

ех = (А(х&) - ЬС)х + Ьу + ) + Ви.

(1.5)

Здесь матрицы A(XN) и G(XN), векторы х, XN представляют собой оценки матриц [4] А и О вида (1.3) и (1.4) и векторов х, х N соответственно. Причем

А(х N) = ) + А (^), в(х N) = G(xN) + в (^),

(1.6) (1.7)

где А(XN), в(^) обозначают невязки.

Учитывая, что не все переменные вектора состояния доступны непосредственному наблюдению, присутствующие в (1.2) матрицы А(х N) и О(х N), значения которых определяются величиной компонент вектора состояния на момент начала очередного такта работы бортовой ЦВМ, содержат неизвестные элементы. Следовательно, матрицу обратных связей наблюдателя L, входящую в (1.5) и вычисляемую с использованием вспомогательной системы вида (0.5), для которой А определяется выражением (1.3), получить не представляется возможным.

Для разрешения сложившегося противоречия поступим следующим образом. Введем в рассмотрение вектор невязок

о

х N

х = х - х (1.8)

и определим отсутствующие компоненты вектора состояния x системы (1.2) в векторе выхода у, которые будем обозначать вектор-столбцом x* с размерностью q, выражением следующего вида:

х* = х* + х*

(1.9)

Соответственно для х м аналогично можно записать

0* _ ~ 0* х N — х N + х

(.10)

Г) о

В результате невязка для х выглядит так:

*ТчТ

- (0 п-д х N )

и

0 _ л0 -0

х N — х N + х N.

Все элементы матриц А(х N) и в(х N), входящих в (1.2) и содержащие компоненты вектора х N

гп /v 0^ т"» <->

разложим в ряд Тейлора в окрестности точек хN . В результате, ограничиваясь линейными членами разложения, вместо (1.6), (1.7) получим

А(х N) = А^) + ДА^, х N), в(х N) = ) + Дв^, х N), где вторые слагаемые имеют вид

ДА^, х *) =

X К

к = 1 дхк

^Эап1 ,„0 ч~* —*)х *

к = 1 дх*

X ^ (х N )х

к = 1 дхк

X

дапп (х N )х **

= 1 дх*

дв(х N, х *) =

X %* N «

к = 1 дхк

X %х N )х **

*

к = 1 дхк

Член А(х )х выражения (1.2) преобразуем к виду

A(xN)x = A(хN)x + ДА(хN, х*)х = А(хN)х + ДА(хN, х*)х + ДА(хN, х*)х - А(хN)х + ДА(хN, х*)х, так

как величина ДАх второго порядка малости. Также представим Ав(хN,х*) = вх*(хN)х*, где

вх* = дв/дх* = (дgi(х)/дх*) — (п х д)-матрица Якоби частных производных «-мерной вектор-функции по q-мерному вектору ее аргументов. Тогда вместо (1.2) имеем

(1.11)

Матричные произведения ДА(хN, xN)х и в'х*(хN)XN из (1.11) запишем через невязку х как

(1.12)

Тогда уравнение наблюдателя (1.5) с учетом (1.9)—(1.12) можно записать для этой невязки в виде

Эх = А^)х + (ДA*(XN, х) + ДG*(XN))х + ЬСх - Ьу или, вводя обозначение

А ^) = А^ )х + ДA*(XN, х) + ДG*(XN), короче

Эх = А^ )х + ДА^, xN )х + ) + в 'х ^ + Ви.

ДA*(XN, х)х = ДA(XN, х ^х, Д G*(XN ))х = в х*^ )х N.

= (А^) - ЬС)х.

(1.13)

2. Наблюдатель полного порядка. Построение наблюдающих алгоритмов для нелинейных динамических систем основано на использовании уравнения для невязок вида (1.13). При этом

матрица L, как было отмечено ранее, определяется из условия обеспечения устойчивости следующей вспомогательной линейной системы:

Эц = A Тц + C Tn, П = -Ьтц. (2.1)

Хорошо известно [3], что выбором матрицы коэффициентов L при известных матрицах AL и C всегда можно обеспечить любое заданное размещение на комплексной плоскости корней характеристического полинома

detfr I„ - (Az - LTC)) и соответственно собственных значений

eig(XI„ - (A£ - LTC) = {X, G C: det(XIB - (XIB - (A£ - LTC)) = 0}

(полюсов) наблюдателя состояния.

Для решения задачи синтеза наблюдения (определения матрицы L) возможно применять любой из методов модального управления, в частности, те, которые изложены в [5—9]. Поступим так же, как это сделано в [3], и воспользуемся методом, описанным в [7, 8]. Введем многоуров-

T t

невую декомпозицию системы (1.13), представляемую парой матриц (AL, C ). Имеем нулевой (исходный) уровень

A о = A Т, Bo = CT, (2.2)

к-й уровень (к = 1, J, J = ceil (n/m) -1)

A к = В ¿-1A к-1В ¿-ъ В к = В ¿-1A к-1В k-i. (2.3)

Здесь B f — аннулятор (делитель нуля) матрицы В,-, т.е. В/"Б(- = 0; В^- — 2-полуобратная матрица для Вf [8], т.е. матрица, удовлетворяющая условиям регулярности

В/В, В/ = В/, В, В/В, " = В/". (2.4)

Тогда в соответствии с [5] искомая матрица L = L0 е №"*" вычисляется по рекурсивным формулам

Lj = В+Aj - ФJВ+, (2.5)

Lk = B-A - ФкВ-, B- = Lk+B + Bk = 0, J - 1, (2.6)

и обеспечивает точное заданное размещение полюсов. Это действительно так, поскольку все элементы множества собственных значений eig (A - LC) совпадают с собственными значениями

N заданных устойчивых матриц Ф-- порядка m х m, i = 0, J. Здесь B+,..., B+ — псевдообратные матрицы Мура—Пенроуза.

Таким образом, для синтеза рассматриваемого здесь наблюдателя полного порядка необходимо.

1. Найти матрицу AL в соответствии с процедурой ее поиска, описанной в разд. 1.

2. Воспользоваться следующим алгоритмом синтеза наблюдателя состояния полного ранга:

а) задать матрицы

A о = A L (2.7)

B о = CT;

б) вычислить

J = ceil (-1; (2.8)

\ml

в) задать матрицы Ф = Ф0, Ф1, ..., Ф^^, такие, что

j +1

^ eig(^_1) — желаемый спектр наблюдателя состояния;

i = 1

г) вычислить ортогональный аннулятор В к-1, а затем матрицы

А к = В£—1А к—1ВА:—1,

В к = В—1А к—1В к—1, (2-9)

к = 1, I;

д) последовательно вычислить матрицы

ьт7 = ФJВ+ - В+А/,

В- = В+ - Ьк+1Вкк, ЬТ = ФкВ- - В-Ак,

(2.10)

к = I -1,0.

В случае, если некоторые матрицы Bk (2.9) не являются матрицами полного ранга, воспользоваться алгоритмом напрямую нельзя. В этом случае в соответствии с [3] необходимо осуществить скелетное разложение матрицы Bk:

В к = В кТ. (2.11)

Тогда если приведенный ранее алгоритм "перезапустить" для пары матриц

(Ак,к-1, Вк,к-1) А к,к-1 = А к, В к,к-1 = В к,

то можно получить новый подуровень декомпозиции

А к,к = В к,к-1А кВ к,к-1, (2 12)

В к,к = В к,к-1А кВ к,к-1, где Вк,к Ф 0.

Известно [3], что регулятор Ь к, обеспечивающий заданное размещение полюсов управляемой пары

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком