научная статья по теме АНАЛИЗ НАБЛЮДАЕМОСТИ И УПРАВЛЯЕМОСТИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ ЛИНЕЙНЫМИ МЕТОДАМИ Кибернетика

Текст научной статьи на тему «АНАЛИЗ НАБЛЮДАЕМОСТИ И УПРАВЛЯЕМОСТИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ ЛИНЕЙНЫМИ МЕТОДАМИ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2010, № 1, с. 10-17

= УПРАВЛЕНИЕ В ДЕТЕРМИНИРОВАННЫХ СИСТЕМАХ :

УДК 681.51

АНАЛИЗ НАБЛЮДАЕМОСТИ И УПРАВЛЯЕМОСТИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ ЛИНЕЙНЫМИ МЕТОДАМИ*

© 2010 г. А. Н. Жирабок

Владивосток, Дальневосточный государственный технический ун-т Поступила в редакцию 12.08.08 г., после доработки 25.05.09 г.

Рассматривается задача получения достаточных критериев ненаблюдаемости и неуправляемости нелинейных (в том числе с недифференцируемыми нелинейностями) динамических систем на основе известных критериев ненаблюдаемости и неуправляемости линейных систем и дополнительных условий также линейного характера. Устанавливаются соотношения дуальности, дополняющие известный принцип дуальности линейных систем.

Введение. Анализу наблюдаемости и управляемости динамических систем посвящено большое число работ, в частности, для линейных систем с дискретным и непрерывным временем получены простые матричные критерии; в нелинейном случае исчерпывающих результатов заметно меньше [1]. Здесь имеется большое число разнообразных подходов, особенно в непрерывном случае, наиболее популярным из которых остается дифференциально-геометрический подход [2]. Многие из них предполагают, что описывающие систему функции — гладкие, следовательно, они не применимы к системам с недифференцируемыми не-линейностями, представляющими такие явления в реальных технических системах, как люфт, гистерезис, сухое трение, насыщение.

В [3] для задач диагностирования систем с такими нелинейностями был предложен так называемый логико-динамический подход, который позволил нелинейные задачи решать известными линейными методами с наложенными на них ограничениями линейного характера. В настоящей работе основная идея этого подхода используется для анализа наблюдаемости и управляемости нелинейных динамических систем с дискретным и непрерывным временем. В отличие от большинства работ анализируются не локальные, а глобальные свойства таких систем.

1. Основные определения. В качестве объекта анализа рассматривается класс нелинейных стационарных динамических систем, описываемых разностным уравнением

х^ + 1) = + Сф(Ах(), ы(0),

у (0 = НхЦ),

в дискретном случае и дифференциальным уравнением

*Работа выполнена при финансовой поддержке РФФИ (гранты № 07-08-00102-а, 07-08-92101-ГФЕН-а).

х(t) = Fx(t) + Gu(t) + Сф(Ax(t), u(t)),

y (t ) = Hx(t), . )

в непрерывном случае, где x е X œ Rn, u е U œ Rm, y e Y œ R1 — векторы состояния, управления (входа) и выхода; F, G и H — матрицы соответствующих размеров; A — матрица-строка; C — матрица-столбец: если C[i] Ф 0, то в правую часть уравнения для i-й компоненты вектора состояния системы входит скалярная нелинейная функция ф(Ах( t), u( t)). Предполагается, что области X и U замкнуты. На функцию ф не накладывается никаких ограничений, кроме тех, которые связаны с существованием и единственностью решения уравнения (1.2). Будем обозначать систему (1.1) или (1.2) пятеркой Е = ( F, G, H, С, А ).

Возможны различные определения наблюдаемости и управляемости динамических систем [1, 4]. Принятые в работе определения совпадают с классическими: наблюдаемость соотносится с возможностью восстановления значения вектора состояния по измеренным на некотором интервале времени значениям управления и выхода, управляемость — с существованием управления, переводящего систему из одного произвольного состояния в другое за конечное время. Поскольку предложенный в работе подход опирается на известные матричные критерии для линейных систем, то формальные определения наблюдаемости и управляемости не приводятся.

В [5—7] показано, что важную роль в анализе наблюдаемости и управляемости играет понятие гомоморфизма состояний, в [7] оно рассматривается в виде канонической проекции. Особенность настоящей работы состоит в том, что гомоморфизм ищется в классе линейных функций и задается матрицей T, связывающей векторы x ( t ) и x*( t)

Vt x*(t) = Tx(t). (1.3)

Будем обозначать этот гомоморфизм в виде T: Е ^ Е* = (F*,G*,H*,C*, A*), при этом предполагается, что система Е* описывается разностным

x*(t + 1) = F*x*(t) + G*u(t) + C*9(A*x*(t),u(t)),

y(t) = H*x*(t), '

либо дифференциальным

x*(t) = Fx*(t) + G*u(t) + C*9(A*x*(t ),u(t)),

y(t) = H*x*(t), '

уравнениями.

Из результатов [5, 6] следует, что если существует невзаимнооднозначный гомоморфизм Е ^ Е*, то система Е ненаблюдаема; можно сказать, что такой гомоморфизм "сжимает" пространство состояний системы. В нашем случае, когда гомоморфизм ищется в классе линейных функций, это означает, что размерность вектора x*(t) меньше размерности x (t).

2. Вспомогательные результаты. Установим связи между матрицей T и матрицами, описывающими системы Е и Е*; более детально рассмотрим дискретный случай, для чего запишем равенство (1.3) для момента t + 1 и заменим векторы x (t + 1) и x*(t + 1) правыми частями уравнений (1.1) и (1.4) соответственно

F*x*(t) + G*u(t) + C*(p(A*x*(t), u(t)) =

= TFx(t) + TGu(t) + TCq>(Ax(t), u(t)). .

Для получения необходимых соотношений будем полагать, что нелинейность ф может иметь произвольный вид. В частности, она может отсутствовать; тогда C = 0 и из (2.1) следуют матричные соотношения

F*T = TF, G* = TG. (2.2)

Из цепочки равенств y (t) = Hx (t) = = H*x*(t) = H*Tx(t) возникает еще одно соотношение

H = H*T. (2.3)

Из (2.1) и (2.2) получаем соотношение

C*9 (A*x*( t), u (t)) = C*<$>(A*Tx(t),u(t)) = = TC^(Ax{ t), u( t)). Для ф(-) = const следует условие

C* = TC, (2..)

которое в случае q>(Ax(t), u(t)) = Ax(t) и 9(A*x*(t),u(t)) = A*x*(t) при TC ф 0 дает

A = A*T. (2..)

Равенство TC = 0 соответствует варианту, когда E* — линейная система.

В частном случае, когда функция ф принимает какой-либо конкретный вид, зависимости между матрицами могут иметь другую форму, поэтому соотношения (2.2)—(2.5) являются достаточными

(но не необходимыми) условиями для того, чтобы матрица T реализовывала гомоморфизм Е ^ Е*. В непрерывном случае соотношения (2.2)—(2.5) могут быть получены путем дифференцирования (1.3) и использования правых частей уравнений (1.2) и (1.5).

Если Т — невырожденная матрица, то система Е*, матрицы которой удовлетворяют условиям (2.2)—(2.5), существует и определяется единственным образом; достаточно положить

F* = TFT-1, G* = TG, H* = HT 1,

C* = TC, A* = AT Л

Первые три из приведенных равенств называются соотношениями подобия для линейных систем [7], они являются следствием преобразования базиса

пространства состояний Rn с помощью матрицы Т. Такое преобразование может производиться, в частности, для получения различных канонических форм матрицы F*, например жордановой формы [8]. Ясно, что размерности систем Е и Е* совпадают.

Соотношения (2.2)—(2.5) могут выполняться и для системы Е* меньшей (по сравнению с Е) размерности, но в этом случае система Е должна обладать определенными свойствами. Так, если Е — ненаблюдаемая или неуправляемая линейная система, то матрица Т реализует каноническую проекцию из пространства состояний в определенным образом построенное фактор-пространство [7] и система Е * имеет меньшую по сравнению с Е размерность. В [7] показано, что матрицы F*, G*, H* подчиняются условиям (2.2) и (2.3).

Будем называть модели (1.1) или (1.2) без нелинейной составляющей линейной частью системы Е. Нашей задачей является использование соотношений (2.2)—(2.5) для анализа нелинейных систем, описываемых моделями (1.1)—(1.2), для получения условий ненаблюдаемости и неуправляемости на основе анализа их линейных частей, а также для получения соотношений дуальности свойств ненаблюдаемости и неуправляемости.

3. Анализ наблюдаемости. Суть предлагаемого в работе подхода к анализу наблюдаемости и управляемости состоит в следующем: проверяется наблюдаемость (управляемость) линейной части системы Е, и если она ненаблюдаема (неуправляема), то выясняется, в каком случае имеющаяся нелинейность не нарушит это заключение. Для реализации этого подхода прежде всего строится матрица наблюдаемости линейной части

u E*i

Е*2

Е*21

Е*22

Рис. 1. Каноническая декомпозиция линейной ненаблюдаемой системы

Рис. 2. Декомпозиция ненаблюдаемой подсистемы

V =

H HF

HFn

В случае гапк( V) = п предлагаемый метод не позволяет дать заключение о наблюдаемости системы Е, поскольку из того, что пространство состояний системы нельзя сжать с помощью линейной функции, не следует, что такое сжатие невозможно с помощью нелинейной. Поэтому ниже предполагается, что

гапк(V) < п. (3.1)

Обозначим через Т матрицу, строки которой составлены из максимального числа линейно независимых строк матрицы V. Известно [9], что для этой матрицы справедливы соотношения (2.2), (2.3), однако может не выполняться (2.5).

Важное значение в дальнейшем анализе имеет каноническая декомпозиция ненаблюдаемой линейной части на наблюдаемую Е* и ненаблюдаемую Е*2 подсистемы (см. рис. 1) [9], полученная ~Т 1

, где матрица Т0 дополняет

на основе матрицы

To

Т до невырожденной матрицы. Главную роль в нашем анализе будет играть матрица Т, которая

определяет вектор состояния х* наблюдаемой подсистемы Е*:. Нелинейность ф преобразуется этой матрицей и добавляется в декомпозицию в виде дополнительной связи между подсистемами. Суть предлагаемого подхода состоит в выяснении того, повлияет ли добавляемая нелинейность на заключение о ненаблюдаемости, сделанное на основе линейной части. Рассмотрим три случая.

1. Аргумент нелинейной функции формируется только на основе вектора состояния наблюдаемой подсистемы Е*1 и не зависит от вектора состояния ненаблюдаемой подсистемы Е*2, т.е.

имеет вид С*ф(х*, и). В этом случае нелинейность добавляется в декомпозицию в виде связи от первой подсистемы ко второй, т.е. структура связей, существующих в этой декомпозиции, сохранятся

и, следовательно, нелинейность не повлияет на свойство ненаблюдаемости. Сформулированное условие будет выполняться, если матрица-строка A, от которой зависит этот аргумент, представляет собой линейные комбинации строк матрицы T , т.е. для некоторой матрицы A* справедливо соотношение (2.5)

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком