научная статья по теме ЧИСЛЕННО-АНАЛИТИЧЕСКИЕ ПРИБЛИЖЕНИЯ К ОПТИМАЛЬНОМУ РЕКУРРЕНТНОМУ ЛОГИКО-ДИНАМИЧЕСКОМУ ФИЛЬТРУ-ПРЕДИКТОРУ МАЛОГО ПОРЯДКА Кибернетика

Текст научной статьи на тему «ЧИСЛЕННО-АНАЛИТИЧЕСКИЕ ПРИБЛИЖЕНИЯ К ОПТИМАЛЬНОМУ РЕКУРРЕНТНОМУ ЛОГИКО-ДИНАМИЧЕСКОМУ ФИЛЬТРУ-ПРЕДИКТОРУ МАЛОГО ПОРЯДКА»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 5, с. 24-47

УПРАВЛЕНИЕ В СТОХАСТИЧЕСКИХ СИСТЕМАХ ^^^^ И В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

УДК 519.246.2: 681.518.22

ЧИСЛЕННО-АНАЛИТИЧЕСКИЕ ПРИБЛИЖЕНИЯ К ОПТИМАЛЬНОМУ РЕКУРРЕНТНОМУ ЛОГИКО-ДИНАМИЧЕСКОМУ ФИЛЬТРУ-ПРЕДИКТОРУ

МАЛОГО ПОРЯДКА* © 2015 г. Е. А. Руденко

Москва, МАИ (национальный исследовательский ун-т) Поступила в редакцию 26.01.15 г., после доработки 06.03.15 г.

Рассматриваются практические способы построения субоптимальных приближений к известному, реализуемому в реальном времени и наиболее точному из быстрых, двухшаговому конечномерному нелинейному оценивателю текущего случайного режима работы и вектора состояния многорежимного объекта с дискретным временем по результатам их косвенных измерений. Эти способы основаны на использовании гауссовских приближений некоторых плотностей вероятности, а также возможной линеаризации нелинейностей объекта и измерителя в случае их достаточной гладкости. В результате субоптимальные структурные функции конечномерного фильтра-предиктора аналитически выражаются либо через характеристики статистической линеаризации этих нелинейностей, либо через них самих и их первые частные производные. Параметры же этих функций определяются численно путем нахождения вероятностей, математических ожиданий и ковариаций методом Монте-Карло. Приведен пример сравнения предложенного приближения с его известным абсолютно-оптимальным аналогом существенно большего порядка и с подобным приближением к одношаговому конечномерному фильтру малого порядка.

Б01: 10.7868/80002338815040125

Введение. Логико-динамическими (ЛД) называют многорежимные (переключательные, муль-тиструктурные) системы управления [1, 2], которые кроме обычной непрерывнозначной динамической части содержат еще и релейную логическую часть в виде конечного автомата с памятью типа Мили или Мура [3] с алфавитом в виде номеров режимов (структур). Поэтому состояние ЛД-системы определяется не только вектором континуальных переменных состояния ее динамической части, но и целочисленным номером режима ее функционирования. Стохастические ЛД-системы, режимы работы которых меняются случайным образом, называют также системами случайной структуры [4]. Ниже рассмотрим такие системы с дискретным временем.

При наличии лишь косвенных, неполных или неточных измерений состояния стохастического объекта наблюдения возникает задача наиболее точного оценивания (идентификации) его истинного текущего состояния. Однако даже в наиболее простой линейно-гауссовской задаче ЛД-оценивания являющийся оптимальным банк из быстрых линейных фильтров Калмана нереализуем, так как число этих фильтров растет со временем экспоненциально в соответствии с увеличением количества возможных вариантов переключений с каждого случайного режима на любые другие за все время наблюдения [5]. В общем же случае классическое байесовское решение задачи оценивания, также получаемое без учета ограничения на практическую реализацию оценива-теля в реальном масштабе времени, приводит к рекуррентному абсолютно-оптимальному фильтру (АОФ) Стратоновича [6—9], использующему апостериорное распределение вероятности оцениваемого состояния. Но его численная потраекторная версия в виде парциального фильтра (Particle Filter) весьма дорога для реализации, так как основана на применении в реальном времени трудоемкого последовательного метода Монте-Карло [10, 11]. Аналитическая же версия АОФ, основанная на предварительном нахождении его уравнений состояния, является, как правило, бесконечномерной, зато позволяет получать реализуемые на практике конечномерные приближения. Из них в ЛД-случае наиболее распространен банк взаимосвязанных квазилиней-

* Работа выполнена при финансовой поддержке Минобрнауки (задание № 1.1191.2014К) и РФФИ (грант № 15-08-01902-а).

ных обобщенных фильтров Калмана (ОФК) (Extended Kalman Filters), количество которых равно числу режимов, а вектор состояния каждого из них довольно велик из-за наличия в нем кроме вектора оценки еще и элементов матрицы апостериорной ковариации. Реже используют банк более точных фильтров нормальной аппроксимации (ФНА) той же размерности, в которых вместо локальной линеаризации нелинейностей системы наблюдения по Тейлору используется их интегральная статистическая линеаризация по Казакову.

Учесть же требование по достаточно большой скорости обработки измерений позволяет условно-оптимальный фильтр (УОФ) Пугачева [12, 13]. Это достигается за счет непосредственного построения уравнения состояния быстрого конечномерного нелинейного фильтра малого порядка. Но его структура (вид нелинейных связей) задается заранее эвристически, а оптимизируются лишь параметры. Поэтому в [14, 15] были получены конечномерные фильтры оптимальной структуры (ФОС), подобные обычным (динамическим) одношаговым и двухшаговым дискретным фильтрам Пугачева, а их ЛД-аналоги — в [16, 17]. Однако уравнения ФОС определяются с помощью рекуррентных интегральных операций с плотностями вероятности, поэтому их точное нахождение все же связано с большими вычислительными трудностями, хотя оно и выполняется заранее. Требуется пошаговое применения метода Монте-Карло с построением многомерных гистограмм оптимальных структурных функций, которые затем нужно преобразовывать к удобному для реализации фильтра аналитическому виду. В связи с этим актуальны более простые численно-аналитические гауссовское и линеаризованное приближения к ФОС, которые для трех типов этих фильтров из четырех получены в [15, 16].

В настоящей работе рассматриваются такие же приближения и к потенциально наиболее точному из многорежимных фильтров малого порядка двухшаговому ФОС (ДФОС) [17]. В результате использования гауссовских аппроксимаций некоторых совместных плотностей вероятности оказываются гауссовскими также и все соответствующие им частные и условные плотности, а параметры последних находятся по известной теореме о нормальной корреляции. Вследствие этого вычисление структурных функций фильтра, имеющих вид содержащих эти плотности многомерных интегралов, сводится к аналитической операции нахождения характеристик статистической линеаризации (по Казакову) усредняемых функций (условных средних системы наблюдения), порождаемых нелинейностями системы наблюдения и негауссовостью ее возмущений. Появляющиеся при этом параметры в виде вероятностей, математических ожиданий и ковариаций могут быть найдены численно методом Монте-Карло путем выполняемого заранее пошагового статистического моделирования объекта, измерителя и гауссовского фильтра-предиктора. В процессе моделирования одновременно осуществляется и статистический анализ точности такого субоптимального оценивателя.

Рассмотрен и еще более простой способ приближенного аналитического построения структурных функций ЛД ДФОС, позволяющий обойтись без интегральной процедуры статистической линеаризации нелинейностей. Он основан на обычной линеаризации (по Тейлору) нели-нейностей объекта и измерителя, а потому применим только в условиях достаточной гладкости последних, а также при небольшой интенсивности случайных возмущений системы и малом разбросе ее начальных условий.

Технология построения обоих приближений к ЛД ДФОС демонстрируется на известном модельном примере оценивания состояния скалярной линейной системы наблюдения со случайными выбросами ошибок измерения [6]. Показано естественное совпадение в этом случае структурных функций гауссовского и линеаризованного фильтров.

1. Математическая модель системы наблюдения. Пусть поведение объекта наблюдения, состоящего из логического переключателя режима его работы и динамического блока с изменяемой структурой, описывается в дискретном времени k = 0,1,2,... следующей марковской системой стохастических разностных уравнений:

а осуществляемые на каждом такте дискретнозначная индикация структуры и континуальное измерение его состояния определяются формулами

Здесь 1к е {1, Ц — номер структуры, Хк е Кп — вектор состояния, Jk е {1, М} — переменная индикации (может отсутствовать), Ук е К"у — вектор измерений, тогда как ик, Ук, Тк, Жк — векторы

Ik+1 = Фкк \Хк, ик), Хк+1 = а(к1к\Хк, Vk),

(1.1)

J к = okIk \Хк, Tk), Yk = bkk \Xk, Wk).

(1.2)

дискретных белых шумов (не обязательно гауссовских и независимых), которые не зависят от случайного начального состояния объекта (10, X0). Законы распределения вероятностей шумов и

начальных условий известны, а вместо функций переключения ф^(х, и) и индикации о^(х, 0 могут быть заданы эквивалентные им условные вероятности.

Без существенного ограничения общности будем предполагать, что в каждый момент времени к случайные векторы Хк, Ук являются абсолютно непрерывными, т.е. существуют их плотности вероятности. Также предположим существование и конечность их вторых моментов:

М(||Хк||2 + ||Ук||2) < да, где М — оператор математического ожидания, Ц| — евклидова норма вектора.

Совместные распределения вероятности каждой из смешанных пар случайных величин вроде (1к, Хк) удобно описывать произведением вероятности ее дискретной компоненты р(ч) _ рг [1к _ 1к]на условную плотность вероятности ркк)(хк) = рк(хк11к = ¡к) соответствующей абсолютно-непрерывной компоненты

рк(к,Хк) = р(к)ркк)(Хк), Iк = Ц., Хк е К". (1.3)

Такая характеристика, называемая распределением вероятности, являясь вероятностью по дискретной переменной Iк и плотностью вероятности по континуальной хк, обладает естественными свойствами согласованности и нормированности. Обратный переход от распределения

рк(гьхк) к вероятности Ркк) и плотности ркк)(хк) осуществляется по формулам

Р(к) = \рк (к Хк) йхк, ^ \хк) = рк (¡к, Хк)/ Р(к). (1.4)

Здесь и далее интегралы берутся по всему евклидову пространству соответствующей размерности, так |/(Хк) йхк = | /(Хк) йхк.

Кроме того, для компактности записей будем опускать индексы времени у аргументов функций вроде (1.4), так что далее естественным образом полагаем I = ¡к, х = Хк, / = /к, у = ук, в отличие от чего обозначим ( = ¡к+1, х = хк+1. Приведенные ниже соотношения справедливы при всех

значениях этих переменных: ¡, ( = 1, Ь, у = 1, М, х, х е К", у е

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком