научная статья по теме ОПТИМАЛЬНАЯ ФИЛЬТРАЦИЯ СОСТОЯНИЙ СПЕЦИАЛЬНЫХ УПРАВЛЯЕМЫХ СИСТЕМ СЛУЧАЙНОЙ СТРУКТУРЫ Кибернетика

Текст научной статьи на тему «ОПТИМАЛЬНАЯ ФИЛЬТРАЦИЯ СОСТОЯНИЙ СПЕЦИАЛЬНЫХ УПРАВЛЯЕМЫХ СИСТЕМ СЛУЧАЙНОЙ СТРУКТУРЫ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 3, с. 16-26

= ОБРАБОТКА ИНФОРМАЦИИ И ИДЕНТИФИКАЦИЯ

УДК 62-50

ОПТИМАЛЬНАЯ ФИЛЬТРАЦИЯ СОСТОЯНИЙ СПЕЦИАЛЬНЫХ УПРАВЛЯЕМЫХ СИСТЕМ СЛУЧАЙНОЙ СТРУКТУРЫ*

© 2007 г. А. В. Борисов, А. И. Стефанович

Москва, ИПИ РАН Поступила в редакцию 16.05.06 г.

Рассмотрена задача оптимальной фильтрации состояний стохастических дифференциальных систем случайной структуры, чьи переключения порождены классом специальных марковских скачкообразных процессов. Получены уравнения для условного математического ожидания и условной плотности распределения сигнального процесса. Предложены численные методы решения соответствующих аналогов уравнений Фоккера-Планка-Колмогорова и Закаи.

Введение. Задачи оценивания состояний систем случайной структуры, рассматриваемых как скрытые марковские модели (СММ), по косвенным зашумленным наблюдениям активно исследовались на протяжении последних десятилетий. Интерес к этой теме легко объясним наличием большого числа прикладных областей для возможных приложений полученных результатов: финансовая математика [1-6], навигация и слежение [7, 8], телекоммуникации [9, 10], автоматическое управление [11-14] и т.д. Значительное число работ, связанных с оцениванием в СММ, посвящены построению конечномерных фильтров и/или выделению класса систем наблюдения, для которых оптимальный фильтр будет иметь конечную размерность [9, 15-17]. Другое направление исследований представляет собой развитие методов идентификации параметров СММ [2, 3, 6]. Однако задача анализа СММ, включающая исследование бесконечномерных объектов, таких, как функция распределения или ее плотность, рассматривались в меньшей степени [18]. Обычно в качестве СММ выступает стохастическая дифференциальная система случайной структуры, переключения которой порождаются некоторым ненаблюдаемым скачкообразным марковским процессом. В качестве переключающих обычно используются марковские процессы с конечным или счетным числом состояний (марковские цепи с непрерывным временем), что снижает степень адекватности описания реальных явлений. Например, в модели скачкообразной волатильности [2-4] предположение о том, что волатильность может принимать лишь фиксированный конечный набор возможных значений, является очевидной идеализацией. Ту же аргументацию мож-

*

Работа выполнена при частичной финансовой поддержке РФФИ (грант < 05-01-00508-а) и программы ОИТВС РАН "Фундаментальные алгоритмы информационных технологий" (проект 1.5).

но привести и против использования марковского процесса с конечным числом состояний для описания коммуникационного соединения, функционирующего под управлением протокола TCP/IP [9]. Очевидно, включение в СММ марковских процессов общего вида дает возможность повысить уровень адекватности модели. С другой стороны, это приводит к многократному усложнению математических выкладок и ослаблению возможных результатов. Поэтому представляется перспективным рассматривать в качестве переключающих марковские скачкообразные процессы более широкого класса, чем марковские цепи с непрерывным временем, но обладающие тем не менее простым описанием. В [19] был предложен подобный класс специальных скачкообразных процессов. В [20] исследовались СММ со скачкообразными процессами представленного класса. Была выведена система соответствующих интегродифферен-циальных уравнений для переходной вероятности, являющаяся аналогом уравнения Фоккера-Планка-Колмогорова (ФПК).

Целью работы являются решение задачи оптимальной фильтрации состояний СММ, порожденных специальным скачкообразным процессом, и разработка численных методов решения детерминированных и стохастических интегро-дифференциальных уравнений - аналогов уравнений ФПК и Закаи для рассматриваемых СММ.

1. Необходимые сведения. В статье используются следующие обозначения: 0 = {0t}t е [0, ^ - марковский процесс с конечным множеством состояний Sn = {e!,..., en}, начальным распределениемp0 и матрицей интенсивностей переходов Л(^ = Ц^-Д t)||" j = 1, имеющей непрерывные компоненты; X(t) = (A,n(t), ..., 'knn(t))T - вектор, составленный из диагональных

элементов матрицы Л^); Л (t) = Л(^ - diag^(t) - вспомогательная матрица; Nt - считающий процесс, рав-

ный числу скачков 0(, произошедших на отрезке времени [0, (] ; "(я, 0 = ("1(я, О, ..., 0)т - вектор условных вероятностей времени пребывания процесса в каждом состоянии, где

" г) = Р{^ - N. = 00 = е} =

ехр

и) ^

{Э 1, ..., Эи} - набор непересекающихся борелев-ских подмножеств пространства К; (Е, ГМ(Е)) - пространство Лузина на

Е= и; =1 %;

1Э(х) - индикаторная функция множества Э; 0 = = 0(х): Е —► 8; - специальная индикаторная функция: 0(х) = (1% (х), ..., 1%(х))т; (щ(А)}; = 1 - набор

распределений вероятностей с носителями %, i = 1, ..., ;: лг<%) = 1 V/ = 1, п; п(В) = (п^В), п„(В))т;

М.

/(у)] = \ /( г )п (&),

%

Мп[/(.У)] = (МпДЛу)], Мп;[/(У)])Т,

МП = ё1ав( Мп[ / (у)]);

Ж = {Ж*ь > о - последовательность независимых одинаково распределенных случайных векторов

Жк = (^, ..., )т с независимыми компонентами , имеющими распределения пг,

О пределение 1. Специальным скачкообразным процессом (ССП), порожденным марковским процессом 0 и стохастической последовательностью Ж, называется процесс

пример. Рассмотрим процесс у, описывающий изменение со временем ускорения автомобиля. Ясно, что с этой точки зрения можно выделить три принципиально разных маневра: приближенно равномерное движение, разгон и торможение. При этом вид маневра, выполняемого в текущий момент времени, однозначно определяется значением у: если у ( е [-5, 5] (здесь 5 > 0 - некоторое пороговое значение), то автомобить движется почти равномерно, если у ( < 5, он тормозит, если у ( > -5 -разгоняется. Учитывая соотношение времени выполнения маневров и времени перехода от маневра к маневру можно считать, что смена маневра происходит мгновенно. Таким образом процесс 0(, описывающий порядок смены маневра, является скачкообразным с тремя возможными состояниями и в некотором приближении может рассматриваться как марковский. Из практики оправданно считать, что в течение всего маневра ускорение остается постоянным, но для каждого маневра оно случайно. Далее, для любого вида маневра по статистическим данным можно построить распределение вероятности лг(0, г = 1, 2, 3, ускорения, используемого при его выполнении. Таким образом, в качестве вероятностной модели, описывающей ускорение автомобиля у, можно с определенной степенью точности использовать специальный скачкообразный процесс. Ясно, что предлагаемая модель недостаточно полная и для повышения степени адекватности реальному явлению ее придется усложнять, например, увеличив число возможных маневров и более детально их описав.

Рассмотрим функцию от ССП / = /у), где /(у): Е —► К - измеримая функция, такая, что

||МЛ / (у )|]||о

(1.1)

уг ~ 0t.

Процесс у1 имеет кусочно-постоянные непрерывные справа траектории и устроен следующим образом. Пусть в нулевой момент времени процесс

у равен и, следовательно, имеет распределение щ. Данное значение у сохраняет до момента следующего скачка т процесса 0. Допустим 0^ = ер тогда ут = £1, и, следовательно, сечение ут имеет

распределение щ. Это значение процесса у остается до следующего скачка т2 процесса 0 и т.д. Процесс у может быть интерпретирован как марковский процесс с конечным набором состояний, представляющих собой распределения с непересекающимися носителями.

Применимость на практике специальных скачкообразных процессов иллюстрирует следующий

Следующее утверждение определяет мартин-гальное представление функции от ССП.

Утверждение 1. Пусть функция / удовлетворяет условию (1.1), тогда процесс / допускает следующее представление:

/ = /(уо) + (я) +

МТ [ / (у )]Л Т( я )]0( у,_) ^ + М/,

/ /

где М\ - мартингал, М0 = 0.

Доказательство утверждения 1 следует из мар-тингального представления процесса 0/у), приведенного в [19].

- г

- я

о

2. Постановка задачи. Рассмотрим на вероятностном пространстве с фильтрацией (П, Р, {^,}), , е [О, Т], следующую систему наблюдений:

х, = Хо +1а (Х- У*-' 5) ^ +1ъ (Х- У*-' 5)

БОРИСОВ, СТЕФАНОВИЧ

ЗС, О < С < - : У(хьу1, н), (Х2,У2, t2) е К хЕ е [О, Т],

У, = Уо +

|[у.дт (*) + у ]ЛТ (* )]©( у*-) а* + му

(2.1)

/, = /о (Х0' Уо) + {М* + + |у ЛМ\

и, =

о

| ЯЛ

о

аХ°(хь У1,,) - аХ"(х2, У2,,)|"<

< С|Х1 - Х2

I = 0, 1,

ЪХ1)(Х1' У1' ,) - ЪХ1)(Х2' У2' ,)| 2 <

<

С|Х1 -.

I = 0' 1' 2,

и дополнительно выполняется неравенство Ъ ( Х!' У!' ) - Ъ ( Х2' У2' ,2 )| <

<

С (| Х!-.

+ ,1- ,2

к/2

) -

где х, е К - ненаблюдаемый диффузионный процесс с переключениями, у, е Е с К - соответствующий ненаблюдаемый ССП, заданный своим мар-тингальным разложением (утверждение 1), / е К -сигнальный процесс, подлежащий оцениванию; и, е К™ - процесс наблюдений.

В системе наблюдений (2.1) динамическая система сформирована первыми тремя уравнениями, в то время как четвертое уравнение представляет собой модель измерений. Относительно (2.1) сделаны следующие предположения.

Предположение 1. Борелевские функции а = а(х, у, ,) и Ъ = Ъ(х, у, ,): К х Е х [О, Т] —► К являются липшицевыми по паре переменных (х, у)

ЗК, О < К < - : Ъ е [О, Т], У(хь ух), (Х2, У2) е К х Е,

|а(х1' у1',) - а(Х2' У2',)|2 < < к (| х1- х22 + |у 1- у22),

Ъ (Х1' у1' ,) - Ъ (Х2' У2' ,)| 2 <

< к (| х1- х22 + |у 1- у22).

Предположение 2. Функции а(х, у, ,), а\ (х, у, ,) и Ъ(х, у, ,), ЪХ (х, у, ,), Ъ"Хх (х, у, ,) - непрерывны и ограничены по (х, у, ,) е К х Е х [О, Т], а также непрерывны по Гёльдеру с коэффициентом к (О < к < 1) по х равномерно по (у, ,)

Предположение 3. Существуют константы О < X < X < —, такие, что для У(х, у, ,) е К х х Е х [О, Т выполнено X < |Ъ(х,у, ,)| < X.

Предположение 4. Распределения пг-, / =

а п

= 1, ..., п имеют плотности —— (у) = фг(у), ф(у) =

а IX

= (ф1<У), •••, фп(у))т, причем найдется константа О < у < — такая, что ||Мп[[у|2 + < —.

Предположение 5. Начальные условия хо и у0 являются ^-измеримыми, причем у0 имеет

т

плотность распределенияру(у, 0) = р0 ф(у), гдер0 -плотность распределения начального значения 0О порождающего марковского процесса 0

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком