Автоматика и телемеханика, Л- 3, 2007
Стохастические системы
PACS 05.40.-а
© 2007 г. A.B. БОРИСОВ, канд. физ.-мат. наук (Институт проблем информатики РАН, Москва)
УСЛОВНО-ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ СПЕЦИАЛЬНЫХ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ1
Представлено решение задачи фильтрации состояний специальных марковских скачкообразных процессов, оптимальное в средпеквадратическом смысле па классе полиномиальных функций наблюдения. Дано сравнение предлагаемых оценок с известными оценками оптимальной лилейной и нелинейной фильтрации.
1. Введение
Известно, что исследование задачи оптимальной нелинейной фильтрации состояний стохастических систем, порожденных стохастическими дифференциальными уравнениями (СДУ) по впнеровскпм процессам, в общем случае приводит к необходимости решения стохастических дифференциальных или интегро-дифференциальных уравнений в частных производных (уравнений Закаи или Кушнера-Стратоно-вича), описывающих эволюцию условной плотности распределения оцениваемого состояния относительно имеющихся наблюдений [1 2]. Это означает, что в случае системы наблюдения общего вида условное распределение состояния не описывается конечным набором достаточных статистик. При этом класс систем наблюдения, для которых данный набор статистик все-таки является конечным, оказывается достаточно узким (см. [3] и библиографию к ней). Таким образом, реализация процедур оптимальной нелинейной фильтрации, по определению предназначенных для оперативного оценивания, зачастую требует использования громоздких, ресурсоемких и медленных численных методов решения.
Для достижения требуемого уровня оперативности фильтрации, в особенности при решении прикладных задач, приходилось жертвовать оптимальностью. В результате этого были предложены различные субоптнмальные [4], условно-оптимальные [5] и приближенно-аналитические [6] алгоритмы нелинейной фильтрации.
В [7 и 8] была рассмотрена задача оптимальной нелинейной фильтрации состояния недиффузионного специального марковского скачкообразного процесса (СМСП) по косвенным наблюдениям в присутствии вннеровскнх шумов. Решение данной задачи также было получено в форме громоздких стохастических интегро-дифферен-
1 Работа выполнена ири частичной финансовой поддержке Российского фонда фундаментальных исследований, грант № 05-01-00508-а, и программы ОИТВС РАН «Фундаментальные алгоритмы информационных технологий» (проект 1.5).
циальных уравнений в частных производных аналогов уравнений Закаи и Кушнс-ра-Стратоновича. В [9 и 10] была исследована соответствующая задача оптимальной линейной фильтрации состояния СМСП и оказалось, что ее решение может быть найдено с помощью весьма эффективного алгоритма фильтрации Калмана-Быоси. Был проведен сравнительный анализ полученных оптимальных линейных и нелинейных оценок со вполне очевидным выводом: линейные оценки легко вычисляются и обладают удовлетворительным качеством, однако по точности они значительно уступают нелинейным оценкам.
Целыо данной работы является разработка условно-оптимальных оценок фильтрации состояния СМСП, которые, во-первых, имеют точность выше, чем линейные оценки, во-вторых, могут аппроксимировать (в определенном ниже смысле) оптимальную нелинейную оценку и, в-третьих, могут быть легко реализованы численно.
Статья имеет следующую структуру. Раздел 2 содержит некоторые начальные сведения и описание исследуемой системы наблюдения. В разделе 3 представлено решение задачи условно-оптнмальной фильтрации: множество допустимых фильтров в данном случае ограничено классом линейных преобразований как самих наблюдений, так и степеней этих наблюдений. В разделе 4 исследованы свойства аналога алгоритма оптимальной полиномиальной фильтрации, примененной к системе наблюдения, рассмотренной относительно новой вероятностной меры, полученной из исходной путем стандартной гирсановской замены. Доказана сильная сходимость предложенных оценок оптимальной полиномиальной фильтрации в ненормированном случае к оптимальным нелинейным оценкам. Раздел 5 содержит численный пример, сравнивающий точность предложенной условно-оптнмальной (полиномиальной) оценки фильтрации с соответствующими характеристиками оптимальных оценок линейной и нелинейной фильтрации.
2. Описание системы наблюдения
Прежде чем описывать исследуемую систему наблюдения, введем необходимые обозначения, определения и некоторые свойства рассматриваемых СМСП.
в = {в(£)}(^о — марковский процесс с конечным множеством состояний Бп = = {в1,...,вп} (вк к-й единичный вектор в евклидовом пространстве Мп), с начальным распределением р0 и известной интенсивностью переходов Л^) = ||Аз (^Щ 3=11 являющейся непрерывной ограниченной матричнозначной функцией времени
N (^ - считающий процесс, соответствующий числу с качков процесса в.
А^)=( Ац(£),..., Апп^)) * - вектор диагональных элементе в матрицы Л^); Л(^ = = Л(Ь) — diagА(t) - вспомогательная функция,
О = {Х>1,..., гОп} - набор непересекающихся ограниченных борелевских подмножеств пространства М:
V % = 1,...,п : VI С В(М),
V %,3 = 1,...,п, % = з : Vз = 0,
п
Е = и VI; (Е, £) - измеримое пространство Л узина на Е,
г=1
I® (у) - индикаторная функция множества V.
© = ©(у) : Е ^ Бп - специальная индикаторная функция: ©(у) = (I® (у),.. ■ ...,1®п Ы) *,
{-Ki(Ä)}n=i - набор распределений вероят ностей на (E, E) с носителя ми Vi, i = = 1,...,п:
ni(Vi) = 1 Vi = 1,...,п; n(B) = (nl(B),...,nn(B ))* V B e£, Еп^ {f (У)} = j f (y)ni(dy), En {f (y)} = (Ещ {f (y)} ,...,Enn {f (y)} )*,
E
Ef = diag (En {f (y)}),
Z = {Zk последовательность независимых одинаково распределенных случай-
ных векторов Zk = (Zl,...,Zk)* 1 компонен ты Zгк которых независимы в совокупности и имеют распределения щ(-), i = 1, ...,п;
1 - вектор-столбец соответствующей размерности, состоящий из единиц.
Определение 1 ([7]). СМСП, порожденным марковским процессом д и по-Z
(1) Y (t) = ZN {t)d(t).
Пусть измеримая функция f (y) : E ^ R такова, что
(2) II En {f (y)}\\ < ж.
Обозначим через {Т^ = а{У (в), 0 ^ в ^ Ь} естественный поток а-алгебр, порожденный процессом У, и рассмотрим случайный процесс / = (/(Ь), Т^): /(Ь) =
= т/(у т.
Утверждение 1 ([7]). Пусть функция / удовлетворяет (2), тогда 1) процесс / допускает представление
(3)
f (t) = d(0)f (Y (0))+ diag A(s)f (s-) +Ei A *(s)d(s-) ds + Mf (t)
t
d(t) = д(0) + J A*(s)d(s-)ds + M9(t),
где М/ = (М' (Ь), Т?) и Мв = (Мв(Ь), Т?) - мартингалы, М'(0) = Мв(0) = 0 почти наверное (п.н.); д = (д(Ь), Т.?) - соответствующий порождающий марковский процесс с конечным числом, состояний, заданный своим мартингальным разлож-е-нием [11], причем д(Ь) = <Э(У(Ь));
2)
(4) ||En{f2(y)} | < ж,
то мартингал М1 является квадратично интегрируемым с предсказуемой квад-ратической характеристикой [1], определяемой формулой
{М1 ,М1)(г) = Е12Шаё (л*(в)в(в-)) -ШаёА(в)Шаё/2(в-)
¿в —
Ат&/ (з-)Л(з)Е1 + Е* Л *(з)Ма&/ (в-)
¿в,
(5)
{М1 ,Мв)(г) = Е1й\щ (л*(в)в(в-))-й\щ/(в-)Л(в)-Е1Л*(в)^щв(в-)
¿в,
{М9,Мв)(г) = ! [Шаё (Л*(в)в(в-)) - Л*(в)&а%в(в-) - ^а,ёв(8-)Л(в)] ¿в,
о
где р(г) = в(г)/2(У(I)), Е(2 = ^Е* {/2(у)}.
Для произвольных процессов /(г) = в(г)/(У(г)) и д(г) = в(г)д(У(г)) таких, что функции /(•) и д(-) удовлетворяют (4), их смешанная квадратическая характеристика равна
г
(6) {М1 ,Мд )(г) = ! Е 1яй\щ (Л *(з)в(з-)№-
/ (в-)д*(в-)йт Е\(в) + йт %/(а-)Л(а)Е% + Е1 Л *(в)Ша ёд(в-)
¿в,
где Е(а = ^Е* {/(у)д(у)}-
Рассмотрим на исходном вероятностном пространстве с фильтрацией (&, Т, Р, {Тг}ге[о,т]) следующую систему наблюдений на конечном интервале времени [0,Т]:
(7)
У(г) = в(0)У(0)^ ^й[щХ(в)У(в-) + ЕXЛ*(з)в(8-)| ¿в + М¥(г),
о
г
в(г) = в(0) + J л*(s)в(s-)¿s + М9 (г),
о
г г
и (г) = ! А(У (в-^ + ! с (У
где г(г) = (У (г),в*(г))* е Еп х Бп - ненаблюдаемое состояние, представляющее собой СМСП и порождающий его марковский процесс с конечным числом состояний, заданные своими мартингальными разложениями, и (г) е М — скалярный процесс наблюдений, ->л(г) е М - не зависимый от состояния г стандартный винеровский процесс ошибок наблюдений. Без ограничения общности будем считать, что Тг = = Т0г] V г]> Т = Тт- Необходимо отметить, что все представленные ниже в этой
г
г
г
работе результаты сохраняются и в случае векторного процесса наблюдений и(Ь), однако соответствующие выкладки становятся значительно более громоздкими.
Задача оптилшльной в среднеквадратическом смысле полиномиальной фильтрации порядка к состояния г(Ь), Ь £ [0,Т], заключается в нахождении оценки вида
(8) г(Ь) = в(Ь) + ]Г [ Ъ(Ь, п)дир(п),
Р=10
(]3(Ь), 7р(Ь,и),р = 1,...,к искомые функции), минимизирующей критерий (9) 1 (г(Ь)) = Е {\\г(Ь) - г(Ь)\\2} .
г
3. Оптимальная полиномиальная фильтрация: нормированный случай
Для вывода уравнений оптимальной полиномиальной фильтрации будем использовать подход, ранее примененный в [9] для вывода уравнений оптимальной линейной фильтрации состояний СМСП. А именно, расширим векторы состояния и наблюдений таким образом, чтобы, с одной стороны, вновь сформированный процесс наблюдений включал в себя как исходные наблюдения, так и их необходимые степени, а, с другой стороны, полученная система наблюдения была бы замкнутой системой линейных стохастических дифференциальных уравнений по процессам с ортогональными приращениями. Тогда для данной расширенной системы наблюдения искомая оценка оптимальной полиномиальной фильтрации определяется с помощью классического алгоритма оптимальной фильтрации Калмана-Быоси [2,12]. Заметим, что задача оптимальной полиномиальной фильтрации для линейных негаус-совских динамических систем с дискретным временем рассматривалась в [13].
Прежде всего, предположим, что распределения п^, г = 1,.. . ,п, а также функции Л(-) и С(-) в наблюдениях удовлетворяют следующим ограничениям:
(10) \\Еп {у2к} \\ < гс, \\Еп {Л2к(у)} \\ < гс, \\Еп {С2к(у)} \\ < гс.
Тогда, очевидно, корректным образом определены матрицы (И) О^ = Агщ {Еп {Л4(у)Ст(у)у7}} ,
для всех неотрицательных целых д, г, в таких, что д + г + в ^ 2к, а также процессы (12) Ур, ^ ¡(Ь) = д(Ь)и Р(У (Ь)Л (У (Ь))Ст (У (Ь))Уа(Ь)
являются специальными квадратично интегрируе
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.