научная статья по теме УСЛОВНО-ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ СПЕЦИАЛЬНЫХ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ Автоматика. Вычислительная техника

Текст научной статьи на тему «УСЛОВНО-ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ СПЕЦИАЛЬНЫХ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ»

Автоматика и телемеханика, Л- 3, 2007

Стохастические системы

PACS 05.40.-а

© 2007 г. A.B. БОРИСОВ, канд. физ.-мат. наук (Институт проблем информатики РАН, Москва)

УСЛОВНО-ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ СПЕЦИАЛЬНЫХ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ1

Представлено решение задачи фильтрации состояний специальных марковских скачкообразных процессов, оптимальное в средпеквадратическом смысле па классе полиномиальных функций наблюдения. Дано сравнение предлагаемых оценок с известными оценками оптимальной лилейной и нелинейной фильтрации.

1. Введение

Известно, что исследование задачи оптимальной нелинейной фильтрации состояний стохастических систем, порожденных стохастическими дифференциальными уравнениями (СДУ) по впнеровскпм процессам, в общем случае приводит к необходимости решения стохастических дифференциальных или интегро-дифференциальных уравнений в частных производных (уравнений Закаи или Кушнера-Стратоно-вича), описывающих эволюцию условной плотности распределения оцениваемого состояния относительно имеющихся наблюдений [1 2]. Это означает, что в случае системы наблюдения общего вида условное распределение состояния не описывается конечным набором достаточных статистик. При этом класс систем наблюдения, для которых данный набор статистик все-таки является конечным, оказывается достаточно узким (см. [3] и библиографию к ней). Таким образом, реализация процедур оптимальной нелинейной фильтрации, по определению предназначенных для оперативного оценивания, зачастую требует использования громоздких, ресурсоемких и медленных численных методов решения.

Для достижения требуемого уровня оперативности фильтрации, в особенности при решении прикладных задач, приходилось жертвовать оптимальностью. В результате этого были предложены различные субоптнмальные [4], условно-оптимальные [5] и приближенно-аналитические [6] алгоритмы нелинейной фильтрации.

В [7 и 8] была рассмотрена задача оптимальной нелинейной фильтрации состояния недиффузионного специального марковского скачкообразного процесса (СМСП) по косвенным наблюдениям в присутствии вннеровскнх шумов. Решение данной задачи также было получено в форме громоздких стохастических интегро-дифферен-

1 Работа выполнена ири частичной финансовой поддержке Российского фонда фундаментальных исследований, грант № 05-01-00508-а, и программы ОИТВС РАН «Фундаментальные алгоритмы информационных технологий» (проект 1.5).

циальных уравнений в частных производных аналогов уравнений Закаи и Кушнс-ра-Стратоновича. В [9 и 10] была исследована соответствующая задача оптимальной линейной фильтрации состояния СМСП и оказалось, что ее решение может быть найдено с помощью весьма эффективного алгоритма фильтрации Калмана-Быоси. Был проведен сравнительный анализ полученных оптимальных линейных и нелинейных оценок со вполне очевидным выводом: линейные оценки легко вычисляются и обладают удовлетворительным качеством, однако по точности они значительно уступают нелинейным оценкам.

Целыо данной работы является разработка условно-оптимальных оценок фильтрации состояния СМСП, которые, во-первых, имеют точность выше, чем линейные оценки, во-вторых, могут аппроксимировать (в определенном ниже смысле) оптимальную нелинейную оценку и, в-третьих, могут быть легко реализованы численно.

Статья имеет следующую структуру. Раздел 2 содержит некоторые начальные сведения и описание исследуемой системы наблюдения. В разделе 3 представлено решение задачи условно-оптнмальной фильтрации: множество допустимых фильтров в данном случае ограничено классом линейных преобразований как самих наблюдений, так и степеней этих наблюдений. В разделе 4 исследованы свойства аналога алгоритма оптимальной полиномиальной фильтрации, примененной к системе наблюдения, рассмотренной относительно новой вероятностной меры, полученной из исходной путем стандартной гирсановской замены. Доказана сильная сходимость предложенных оценок оптимальной полиномиальной фильтрации в ненормированном случае к оптимальным нелинейным оценкам. Раздел 5 содержит численный пример, сравнивающий точность предложенной условно-оптнмальной (полиномиальной) оценки фильтрации с соответствующими характеристиками оптимальных оценок линейной и нелинейной фильтрации.

2. Описание системы наблюдения

Прежде чем описывать исследуемую систему наблюдения, введем необходимые обозначения, определения и некоторые свойства рассматриваемых СМСП.

в = {в(£)}(^о — марковский процесс с конечным множеством состояний Бп = = {в1,...,вп} (вк к-й единичный вектор в евклидовом пространстве Мп), с начальным распределением р0 и известной интенсивностью переходов Л^) = ||Аз (^Щ 3=11 являющейся непрерывной ограниченной матричнозначной функцией времени

N (^ - считающий процесс, соответствующий числу с качков процесса в.

А^)=( Ац(£),..., Апп^)) * - вектор диагональных элементе в матрицы Л^); Л(^ = = Л(Ь) — diagА(t) - вспомогательная функция,

О = {Х>1,..., гОп} - набор непересекающихся ограниченных борелевских подмножеств пространства М:

V % = 1,...,п : VI С В(М),

V %,3 = 1,...,п, % = з : Vз = 0,

п

Е = и VI; (Е, £) - измеримое пространство Л узина на Е,

г=1

I® (у) - индикаторная функция множества V.

© = ©(у) : Е ^ Бп - специальная индикаторная функция: ©(у) = (I® (у),.. ■ ...,1®п Ы) *,

{-Ki(Ä)}n=i - набор распределений вероят ностей на (E, E) с носителя ми Vi, i = = 1,...,п:

ni(Vi) = 1 Vi = 1,...,п; n(B) = (nl(B),...,nn(B ))* V B e£, Еп^ {f (У)} = j f (y)ni(dy), En {f (y)} = (Ещ {f (y)} ,...,Enn {f (y)} )*,

E

Ef = diag (En {f (y)}),

Z = {Zk последовательность независимых одинаково распределенных случай-

ных векторов Zk = (Zl,...,Zk)* 1 компонен ты Zгк которых независимы в совокупности и имеют распределения щ(-), i = 1, ...,п;

1 - вектор-столбец соответствующей размерности, состоящий из единиц.

Определение 1 ([7]). СМСП, порожденным марковским процессом д и по-Z

(1) Y (t) = ZN {t)d(t).

Пусть измеримая функция f (y) : E ^ R такова, что

(2) II En {f (y)}\\ < ж.

Обозначим через {Т^ = а{У (в), 0 ^ в ^ Ь} естественный поток а-алгебр, порожденный процессом У, и рассмотрим случайный процесс / = (/(Ь), Т^): /(Ь) =

= т/(у т.

Утверждение 1 ([7]). Пусть функция / удовлетворяет (2), тогда 1) процесс / допускает представление

(3)

f (t) = d(0)f (Y (0))+ diag A(s)f (s-) +Ei A *(s)d(s-) ds + Mf (t)

t

d(t) = д(0) + J A*(s)d(s-)ds + M9(t),

где М/ = (М' (Ь), Т?) и Мв = (Мв(Ь), Т?) - мартингалы, М'(0) = Мв(0) = 0 почти наверное (п.н.); д = (д(Ь), Т.?) - соответствующий порождающий марковский процесс с конечным числом, состояний, заданный своим мартингальным разлож-е-нием [11], причем д(Ь) = <Э(У(Ь));

2)

(4) ||En{f2(y)} | < ж,

то мартингал М1 является квадратично интегрируемым с предсказуемой квад-ратической характеристикой [1], определяемой формулой

{М1 ,М1)(г) = Е12Шаё (л*(в)в(в-)) -ШаёА(в)Шаё/2(в-)

¿в —

Ат&/ (з-)Л(з)Е1 + Е* Л *(з)Ма&/ (в-)

¿в,

(5)

{М1 ,Мв)(г) = Е1й\щ (л*(в)в(в-))-й\щ/(в-)Л(в)-Е1Л*(в)^щв(в-)

¿в,

{М9,Мв)(г) = ! [Шаё (Л*(в)в(в-)) - Л*(в)&а%в(в-) - ^а,ёв(8-)Л(в)] ¿в,

о

где р(г) = в(г)/2(У(I)), Е(2 = ^Е* {/2(у)}.

Для произвольных процессов /(г) = в(г)/(У(г)) и д(г) = в(г)д(У(г)) таких, что функции /(•) и д(-) удовлетворяют (4), их смешанная квадратическая характеристика равна

г

(6) {М1 ,Мд )(г) = ! Е 1яй\щ (Л *(з)в(з-)№-

/ (в-)д*(в-)йт Е\(в) + йт %/(а-)Л(а)Е% + Е1 Л *(в)Ша ёд(в-)

¿в,

где Е(а = ^Е* {/(у)д(у)}-

Рассмотрим на исходном вероятностном пространстве с фильтрацией (&, Т, Р, {Тг}ге[о,т]) следующую систему наблюдений на конечном интервале времени [0,Т]:

(7)

У(г) = в(0)У(0)^ ^й[щХ(в)У(в-) + ЕXЛ*(з)в(8-)| ¿в + М¥(г),

о

г

в(г) = в(0) + J л*(s)в(s-)¿s + М9 (г),

о

г г

и (г) = ! А(У (в-^ + ! с (У

где г(г) = (У (г),в*(г))* е Еп х Бп - ненаблюдаемое состояние, представляющее собой СМСП и порождающий его марковский процесс с конечным числом состояний, заданные своими мартингальными разложениями, и (г) е М — скалярный процесс наблюдений, ->л(г) е М - не зависимый от состояния г стандартный винеровский процесс ошибок наблюдений. Без ограничения общности будем считать, что Тг = = Т0г] V г]> Т = Тт- Необходимо отметить, что все представленные ниже в этой

г

г

г

работе результаты сохраняются и в случае векторного процесса наблюдений и(Ь), однако соответствующие выкладки становятся значительно более громоздкими.

Задача оптилшльной в среднеквадратическом смысле полиномиальной фильтрации порядка к состояния г(Ь), Ь £ [0,Т], заключается в нахождении оценки вида

(8) г(Ь) = в(Ь) + ]Г [ Ъ(Ь, п)дир(п),

Р=10

(]3(Ь), 7р(Ь,и),р = 1,...,к искомые функции), минимизирующей критерий (9) 1 (г(Ь)) = Е {\\г(Ь) - г(Ь)\\2} .

г

3. Оптимальная полиномиальная фильтрация: нормированный случай

Для вывода уравнений оптимальной полиномиальной фильтрации будем использовать подход, ранее примененный в [9] для вывода уравнений оптимальной линейной фильтрации состояний СМСП. А именно, расширим векторы состояния и наблюдений таким образом, чтобы, с одной стороны, вновь сформированный процесс наблюдений включал в себя как исходные наблюдения, так и их необходимые степени, а, с другой стороны, полученная система наблюдения была бы замкнутой системой линейных стохастических дифференциальных уравнений по процессам с ортогональными приращениями. Тогда для данной расширенной системы наблюдения искомая оценка оптимальной полиномиальной фильтрации определяется с помощью классического алгоритма оптимальной фильтрации Калмана-Быоси [2,12]. Заметим, что задача оптимальной полиномиальной фильтрации для линейных негаус-совских динамических систем с дискретным временем рассматривалась в [13].

Прежде всего, предположим, что распределения п^, г = 1,.. . ,п, а также функции Л(-) и С(-) в наблюдениях удовлетворяют следующим ограничениям:

(10) \\Еп {у2к} \\ < гс, \\Еп {Л2к(у)} \\ < гс, \\Еп {С2к(у)} \\ < гс.

Тогда, очевидно, корректным образом определены матрицы (И) О^ = Агщ {Еп {Л4(у)Ст(у)у7}} ,

для всех неотрицательных целых д, г, в таких, что д + г + в ^ 2к, а также процессы (12) Ур, ^ ¡(Ь) = д(Ь)и Р(У (Ь)Л (У (Ь))Ст (У (Ь))Уа(Ь)

являются специальными квадратично интегрируе

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком