научная статья по теме ОПТИМАЛЬНОЕ УСЛОВНО-ОТНОСИТЕЛЬНОЕ НАБЛЮДЕНИЕ НЕСТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ Математика

Текст научной статьи на тему «ОПТИМАЛЬНОЕ УСЛОВНО-ОТНОСИТЕЛЬНОЕ НАБЛЮДЕНИЕ НЕСТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ»

ПРИКЛАДНАЯ МАТЕМАТИКА И МЕХАНИКА

Том 68. Вып. 4, 2004

УДК 62-50

© 2004 г. Р. Габасов, Н. М. Дмитрук, Ф. М. Кириллова

ОПТИМАЛЬНОЕ УСЛОВНО-ОТНОСИТЕЛЬНОЕ НАБЛЮДЕНИЕ НЕСТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ

Рассматривается возникающая при управлении в условиях неопределенности задача оптимального наблюдения, в которой при неполностью определенном начальном состоянии динамической системы требуется путем обработки неполных и неточных измерений текущих состояний получить информацию о ее выходном сигнале. Задача исследуется для трех типов помех в измерительном устройстве. Описываются методы построения апостериорных и позиционных решений. Результаты иллюстрируются на примере наблюдения динамической системы четвертого порядка.

В теории управляемых систем с усложнением объектов управления и ужесточением требований к качеству систем управления неуклонно растет размерность используемых математических моделей. При этом часто априорная информация о начальных значениях многих фазовых переменных известна с ограниченной точностью, а существующие измерительные устройства могут неточно измерять лишь некоторые выходные сигналы физической системы. С другой стороны, для целей управления интерес могут представлять только отдельные фазовые переменные. В этой ситуации для управления динамической системой приходится от обратных связей по состоянию переходить к обратным связям по выходу. Поскольку выходные сигналы измеряются с ограниченной точностью, при реализации обратных связей возникает проблема наблюдения - проблема обработки доступных измерений с целью получения информации о представляющих интерес переменных.

В теории наблюдения используются множественные и вероятностные модели неопределенностей. Первые задачи оптимального наблюдения с множественными моделями поставлены и решены H.H. Красовским [1]. Подобные задачи исследовались затем и другими авторами [2-4]. Со стохастической теорией наблюдения (теорией фильтрации) можно ознакомиться по монографии Леондеса [5].

Данная работа примыкает к предыдущим исследованиям с участием авторов [6-9]. Ее цель -описать конструктивный метод решения задачи оптимального условно-относительного наблюдения [7-9] с учетом трех классов помех в измерительном устройстве. Основное внимание уделяется алгоритму работы оптимального эстиматора, который в реальном времени вычисляет текущие оценки выходного сигнала динамической системы. Это позволяет использовать результаты при управлении в реальном времени системами с неопределенностями.

1. Апостериорное и позиционное наблюдение. Рассмотрим динамическую систему, поведение математической модели которой на промежутке времени T = [t*, t*], < < t* < t* < го, описывается уравнением

х = А (t)x (1.1)

Здесь х = x(t) - я-вектор (столбец) состояния системы в момент времени t; A(t) б Rn x я, t е T, - кусочно-непрерывная (n x я)-матричная функция.

Считаем, что начальное состояние x(t*) системы не известно точно, а имеет вид

х (t *) = х0 + G ю

где х0 - известный я-вектор, G = (g(i), i е I = {1, 2, ..., я}) - (я x яю)-матрица (g(i) - ее i-я строка); ю - яю-вектор неизвестных параметров, принадлежащий ограниченному множеству

Q = {юе R"a : d* <ю<d*}

Множество О характеризует априорную неопределенность в поведении системы (1.1); назовем его априорным распределением параметров начального состояния. Ему соответствует априорное распределение Х0 = х0 + ОО начального состояния х(г*). Заметим, что здесь лишь для упрощения последующих выкладок рассматривается параллелепи-педное множество, результаты можно обобщить на случай произвольного полиэдрального множества.

Предположим, что в связи с некоторой задачей управления интерес представляет информация о выходном сигнале системы (1.1)

г(т*) = Нх(т*)

где т* е Т- заданный момент, Н = (Нрр е I), - заданная т х я-матрица, Нр - еер-й столбец. Априорным распределением выходного сигнала назовем множество 2 = НХТ , где Хт = х0(т*) + Ф(т*)О - априорное распределение состояния х(т*) системы (1.1); х0(г), г е Т, - траектория системы (1.1) с начальным состоянием х(г*) = х0; Ф(г), г е Т, -(я х яю)-матричная функция, решение уравнения

Ф = А (г)Ф, ф( г*) = О (1.2)

Если яю < я, т < я, т* = г* и матрицы О, Н имеют вид (штрих означает транспонирование)

О = (Е е я""*; 0 е -"т)х"")', Н = (Е е Ятхт; 0 е Ятх(я-т))

то у системы (1.1) не известны первые яю координат начального состояния и интерес представляет информация о первых т координатах начального состояния.

Для уменьшения априорной неопределенности векторов ю, х(г*), г будем вести за системой (1.1) наблюдение, обрабатывая записываемые в дискретные моменты г е Тк = = {г*, г* + Н, ..., г*} (Н = (г* - г*)1И, N - натуральное число) сигналы у(г*), у(г* + Н), ..., у(г*) измерительного устройства

у = С( г) х + \ (1.3)

где с(г), г е Т, - известная непрерывная я-вектор-функция.

Устройство (1.3) с ошибкой £ измеряет одну комбинацию с1(г)х1 + ... + ся(г)хя(г) компонент вектора х. Функция ошибок измерения £ = £(г), г е Т, кусочно-непрерывна и удовлетворяет неравенствам

£*<£(г)<£*, ге Тк (1.4)

в которых числа £*, £* характеризуют точность измерения.

Задача наблюдения состоит в получении информации о реализовавшемся выходном сигнале г путем обработки априорной информации 2 и результатов измерений.

Будем различать задачи апостериорного и позиционного наблюдения. Задача апостериорного наблюдения решается после проведения всех измерений; время, потраченное на ее решение, не имеет существенного значения. Задача позиционного наблюдения решается в процессе измерений и нацелена на получение текущей информации о векторе г по текущим измерениям. При решении задачи позиционного наблюдения время построения оценок вектора г играет решающую роль. Задачи апостериорного и позиционного наблюдения представляют собой двойственные аналоги задач программного и позиционного управления.

2. Задача оптимального наблюдения. Пусть у( ) = (у(г), г е Тк) - совокупность всех проведенных измерений.

Определение. Множество Q = Q (t*; y( )) назовем апостериорным распределением параметров начального состояния ю, соответствующим терминальной позиции (t*; у(-)), если оно состоит из тех и только тех векторов ю б Q, которым соответствуют начальные состояния x(t*) = x0 + Ою, способные вместе с некоторыми возможными £(t), t 6 Th,

породить сигнал у(-). Элементы ю б Q будем называть (апостериорно) возможными значениями параметров начального состояния.

Множеству Q соответствуют апостериорные распределения

Xo = Хо( t *; y (■)) = xo + GQ, Z = Z( t *; y( ■)) = H (Хо(т*) + Ф(т* )Q)

начального состояния и выходного сигнала. Множество X0 под другими названиями использовалось в [2, 3].

Для некоторых задач оптимального управления с гарантией [10] интерес представляет не все множество Z0, а только некоторые его оценки (числовые характеристики). В связи с этим, следуя описанному ранее подходу [6], задачей оптимального апостериорного наблюдения назовем экстремальную задачу (q - заданный ш-вектор, ||q|| = 1)

а(t*; у(■)) = q'z0(t*; y(■)) = maxq'z, z 6 Z (2.1)

Вектор z0 = z0 (t* ; y()) (экстремальный выходной сигнал) и соответствующую ему оценку а = а (t*; y()) будем называть апостериорным решением задачи оптимального наблюдения (2.1) (или решением задачи оптимального апостериорного наблюдения).

Перейдем к формулировке задачи оптимального позиционного наблюдения. Пусть т 6 Th - произвольный текущий момент времени, ут(-) = (y(t*), y(t* + h), ..., y(x)) - совокупность измерений, проведенных к этому моменту времени; Y(t) - множество всех возможных сигналов yT(). Множество Q (т) = Q (т, yT()) назовем текущим распределением параметров начального состояния для позиции (т, yT()); ему соответствуют текущие распределения

Xo (т) = Xo (т; yT( ■)) = Хо + GQ (т)

Z(т) = Z(т; Ут(■)) = H(Хо(т*) + Ф(т*)Q(т))

начального состояния и выходного сигнала. Семейство задач

а(т) = maxq'z, z 6 Z(т) (2.2)

зависящих от сигнала ут( ) 6 Y(т) и момента т 6 Th, назовем задачей оптимального позиционного наблюдения.

Решением этой задачи (позиционным решением задачи оптимального наблюдения (ПРЗОН)) будем называть функционалы

ю0(т, ут(■)), Xo(т, ут(■)), z0(т, ут(■)), а(т, ут(■)), Ут(■) 6 Y(т), т 6 Th (2.3)

удовлетворяющие соотношениям

Xo(т, Ут(■)) = Хо + Ою0(т, Ут(■)), zV Ут(■)) = H(Xо(т*) + Ф(т*)ю0(т, Ут(■))) а(т, Ут(■)) = q'z0(т, Ут(■)) = maxq'z, z 6 2(т)

Понятно, что ПРЗОН состоит из заранее (до начала процесса наблюдения) заготовленных отображений всех возможных измерений в представляющие интерес оценки. Знание ПРЗОН позволяет вести наблюдение (получать оценки вектора z) по ходу измерений. Для этого достаточно в каждый текущий момент времени т б Th, получив очередное измерение у(-), составить вектор ут() и подставить его в функционалы (2.3), что даст текущую оценку а (т, ут()).

ПРЗОН является аналогом позиционного решения задачи оптимального управления (оптимального управления типа обратной связи). В теории управления позиционные решения при использовании совершенных измерений состояний реализуются с помощью систем управления с замкнутыми контурами, включающими обратные связи по состоянию. ПРЗОН используются при управлении по несовершенным измерениям и реализуются с помощью части замкнутого контура. Остальная часть реализует управление по оценкам, получаемым в первой части. В совокупности обе части замкнутого контура реализуют управление типа обратной связи по выходу. Как и в случае оптимального управления типа обратной связи, построение ПРЗОН (2.3) в замкнутой форме невозможно для нетривиальных случаев, т.е. невозможно реализовать принцип оптимального наблюдения по "замкнутому" контуру. В связи с этим для реализации ПРЗОН перейдем к принципу оптимального наблюдения в реальном времени, который является аналогом принципа оптимального управления в реальном времени, описанным в [11]. При оптимальном наблюдении в реальном времени функционалы (2.3) не составляются заранее, а представляющие интерес оценки вычисляются в процессе наблюдения по мере поступления измерений.

Оптимальное наблюдение в реальном времени основано на следующем анализе.

Предположим, что ПРЗОН (2.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком