Автоматика и телемеханика, Л- 9, 2006
Стохастические системы
PACS 05.40.-а
© 2006 г. A.B. БОРИСОВ, канд. физ.-мат. наук (Институт проблем информатики РАН, Москва)
ПРЕДСТАВЛЕНИЕ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ В ОБРАТНОМ ВРЕМЕНИ И СМЕЖНЫЕ ВОПРОСЫ II. ОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ1
Во второй части работы получены решения задач оптимального нелинейного сглаживания (интерполяции) состояния специального марковского скачкообразного процесса по косвенным наблюдениям в присутствии виперовских шумов. Приводится анализ и сравнение полученных оптимальных нелинейных оценок с соответствующими оптимальными линейными оценками, представленными в первой части работы.
1. Введение
Данная работа является продолженном [1] и посвящена теоретическим и практическим аспектам задач оптимального в среднем квадратичоском смысле оценивания состояний специальных марковских скачкообразных процессов (СМСП) с использованием их представлений в прямом и обратном времени.
Статья организована следующим образом. В разделе 2 приводится формальная постановка задач прямой и обратной интерполяции по косвенным наблюдениям в присутствии виперовских шумов.
Раздел 3 содержит утверждения о виде условной переходной вероятности СМСП. возникающей в задаче оптимальной нелинейной фильтрации.
В разделах 4 и 5 приведены основные результаты решение задач оптимальной интерполяции (прямой и обратной) и их связь с представлением СМСП в обратном времени.
В разделе 6 на численных примерах проведены анализ и сравнение численной эффективности и точности линейных и нелинейных оценок, представленных в обеих частях работы.
2. Постановка задачи
Ниже предлагаются формулировки задач оптимального в среднем квадратичоском смысле сглаживания состояния СМСП. При этом все обозначения и определения введены в первой части статьи [1].
1 Работа выполнена при частичной финансовой поддержке Российского фонда фундаментальных исследований, грант № 05-01-00508-а, и программы ОМТВС РАН "Фундаментальные алгоритмы информационных технологий" (проект 1.5).
Рассмотрим следующую систему наблюдений на конечном интервале времени [0,T ]:
(1)
Y t = ^qYQ +
diagA(s)Ys_ + EY Л (s)0.
9t = ^q + J Л*(в)0^8 + M
q
t t
Ut = A(Y s_,(
s)ds
Csdws
ds + m ;
где = (Уг, 0*)* € Еп х 5 - ненаблюдаемый векторный случайный процесс, содержащий в себе информацию о текущем состоянии СМСП У и порождающего его марковского процесса с конечным числом состояний 6г: У г = при этом также Р-почтп наверное (Р-п.н.) верно равенство ©(У;) = иг € Мт - процесс наблю-
дений, wt £ Функции
независимый от состояния z стандартный винеровскии процесс.
A = A(y,<9,t) : En х S x [0,T] ^ Rm, C = Ct : [0,T] ^ R"
удовлетворяют условиям
E | J A*Atdt| < то, (2) 3 M> 0: V t £ [0, T] M/m < CtC*, tr U CtC*dt< то.
Обозначим через иг = а{ия, 0 ^ в ^ 4} - а-алгебру, порожденную наблюдениями и8, полученными та отрезке времени [0,4].
Задача оптимального в среднем, квадратическом смысле нелинейного сглаживания в фиксированной точке в (прямой интерполяции) заключается в нахождении оценки 2(в, 4) = Е{,гя | Ыг}, 0 < в < 4 < Т.
Задача оптимального в среднем. квадратическом смысле нелинейного сглаживания на фиксированном интервале [0, Т] (обратной интерполяции) заключается в нахождении оценки 2(4, Т) = | и?} для 0 ^ 4 ^ Т.
i
m
3. Условная переходная вероятность специального марковского скачкообразного процесса
Исследуемые задачи сглаживания тесно связаны с соответствующей задачей оптимальной нелинейной фильтрации.
Утверждение 1 ([2]). Пусть дана система наблюдения (1), и скалярный сигнальный процесс gt = g(gQ(w), t, z, w) определен стохастическим уравнением
t t t
gt = go + /asds + ¡ b*dMsz + ¡ c*dws,
Q Q 0
_2 / _у _д \ *
где д0 = д0(ш) -измеримое начальное условие, МЬ = 1(МЬ )*, (МЬ )*) - мартингал из представления процесса гЬ (т. первые два уравнения (1)), т - винеров-ские шумы в наблюдениях (т.третье уравнение (1)). Пусть также выполнены следующие условия:
1) начальное уеловие д0, процесс г и шумы т независимы в совокупности; распределения Пг(-), { = 1,... ,п абсолютно непрерывны по мере Лебега с плотностями распределения ф(у), ф(у) = (ф\(у),.. .,Фи(у))*;
2) коэффициенты а8 = а(г8-,в), Ь8 = Ь(г8-,в), св = с(г8-,в) таковы, что функ-
а8 = а(г, в), а8 : Е х Б х М+ ^ М, Ья = Ь(г, в), Ьв : Е х Б х М+ ^ М2п, ся = с(г,в), с8 : Е х Б х М+ ^ Мт
являются кусочно-непрерывными по в при любом фиксированном значении г е £ Е х Б. Тогда
А) решение задачи оптимальной нелинейной фильтрации дЬ = Е{д1\и1} описывается следующей стохастической системой
(3)
а
Ь Ь
= Е{до} + 1 а8<1в + ! (дА* - дЛ* + с**Оа) (СаС*а)-1/2а^а,
V = I (СаС**)-1/2 (¿и - Аа<1в),
о
при этом обновляющий процесс щ является иЬ-согласованным стандартным ви-неровски,м;
Б) если условная плотность распределения ф(у,Ь) процесса У относительно фильтрации {и} существует, то она удовлетворяет уравнению
(4) ф(у,1) = р*Ф(у) + ! [ф(у,в)Х*(в)&(у) + ф*(у)Л (в)в.
о
Ь
+1 ф(у,в) (А(в(у)у, в(у),в) - Ая) * (С3С**)-1/2а^а,
¿в +
где
(5)
а = Е{в4 | Щ = Е{в(У) | и} = у в(у)ф(у,г)<1у,
Е
А = Е {А(Уиви±) | и} = [ А(в(у)у, в(у),±)ф(у,±)в.у.
Е
В [2] были представлены лишь уравнения, описывающие эволюцию во времени
У
плотности приведено не было. Именно этой проблеме посвящен данный раздел.
Переходная вероятность процесса Y для любого B е B(E) определяется как (6) P(x,s,B,t) = P{Yt е B|YS = x} =
= T*(s,t)©(x)IB(x) + I ) P*(s,t)©(x),
где
P (s,t) = P (s,t) — diag T (s,t).
Очевидно, что первое слагаемое в (6) соответствует сингулярной части, в то время как второе является регулярным, т.е. абсолютно непрерывным по мере Лебега. Оказывается, что условная переходная вероятность P(x, s, B,t) = P{Yt е B | UUt, Ys = x}, возникающая при решении задачи оптимальной нелинейной фильтрации, обладает подобным разложением на регулярную и сингулярную части.
Теорема 1. Пусть для системы наблюдения (1) выполнены условия 2) утверждения 1, верны ограничения (2), а также
3) все плотности ФД-), i = 1,...,n имеют кусочно-непрерывные производные, ограниченные на множестве E,
4) функция A(y, 0,t) в уравнении наблюдений (1) ограничена на множестве допустимых значений En х S х [0, T].
Тогда условная переходная вероятность P(x, s, B, t) для любых B е B(E), t е е [0, T] имеет вид
(7) P(x,s,B,t)= §X,s(t)I в (x) + ^ fx,s(y,t)dy,
в
где пара (qx,s(t), rx,s(y,t)) является решением системы стохастических уравнений
t
qx,s(t) = 1 + J A*(u)©(x)qx,s(u)dM+
s
t
+ J qx,s(u) (¿(©(x)x, ©(x),u) — A4x,s(u^*(C„CU)-1/2dVx,s(u),
(8)
qx,s(y,t)^y rx,s(y,u)A*(u)©(y) + Ф*(у)А (u)6x,s(u) du+
s
t
+ J q«,s(y,u) (A(©(y)y, ©(y), u) — Ax,s(u)) (C„CU)-1/2dvx,s(u),
s
qx,s(t) =©(x)qx,s(t)^ ©(y)qx,s(y,t)dy,
E
Alx,s(u) = A(©(x)x, ©(x),u)qx,s(u) + J A(y, ©(y),u)qx,s(y,u)dy,
E
,s(t) = J(C„CU)-1/2 (dU„ — Ax,s(u)du) .
V
Доказательство теоремы 1 приведено в Приложении.
Следствие 1. Выполнение условий теоремы 1 гарантирует, что условная плотность распределения ф(у, Ь) существует и удовлетворяет уравнениям (4) и (5), а также связана с решением уравнения (8) равенством
Ф(у,Ь) = Яу,в(1)'Ф(у,8) + ! г'х,8(у,г)ф(х,в)йх
Е
для любых 0 ^ в ^ Ь ^ Т.
Следствие 2. "Частные" обновляющие процессы их,8(Ь), 0 < в < Ь < Т, х е Е, и "общий" обновляющий процесс иг связаны равенством
г
VI-ие = /их,в(£)ф(х,в)йх^(СпОи) 1/2 ЫИи - ^ф(х,в)й:
¿и I .
4. Уравнения прямой и обратной интерполяции
Прежде всего, приведем теорему, определяющую решение задачи оптимальной прямой интерполяции.
Теорема 2. Пусть для системы наблюдения (1) выполнены условия теоремы 1. Тогда
А) условное математическое ожидание д(в,Ь) = Е{д8|иг} сигнального процесса д8, 0 < в < Ь, определяется следующим, стохастическим уравнением: г
(9) дд(в,1) = д +У (Е {д8Л*(Уи,ви,и)1ии} - д(Ь,и)А*) (СиС*и)-1/2¿ии,
Б) если случайный процесс дг является функцией СМСПУг, т.е. дг = д(Уг) для некоторой функции д = д(у) такой, что \\E-g|| < то, то ее оптимальная оценка прямой интерполяции д(в, Ь) определяется уравнением
(10) д(в,Ь) = д +
Ы д(У8П ЯУв,в(и)Аи(Уа,ва,и) +
+ J гузи(х, в)А*(в(х)х, в(х),и)йх Е
и А - д(в, и) А.
(СиСи )-1/2<1ии,
где пара ((дуьг(в),гуь,г(х, в)) является решением системы (8) со случайным начальным условием У8;
В) условная плотность распределения ф(у, в, Ь) случайного процессаУ8 относительно а-алгебры наблюдений иг, 0 < в < Ь, существует и удовлетворяет системе
Ф(У, = ф(у, в)+
(Н)
+ У ф(у,в,и) (Лу,8(в(у)у, в(у),и) - Аи) * (С8Си)-1/2<1иу88(и), АУе8(в(у)у, в(у),и) =
= ду,8(и)Ау,8(в(у)у, в(у),и) + ! Гу,8(х,и)Ау,8(в(х)х, в(х),и)йх;
Г) пусть P(B,s|x,t) = P{YS G B|Wt,Yt = x} множест,во E замкнуто, а также min ||ф(х)|| > 0, тогда P(B,s|x,t) является решением следующего интегро-дифференциального уравнения:
dP(B, s|x, t)
(12)
dt
ф*(х)Л (t)y 0(v) P(B, s|v, t) - P(B, s|x, t)
E
V>(v,t) -ф(х, t)
dv,
P(B, s|x, s) = Ig(x).
Доказательство пп. А В теоремы 2 абсолютно аналогично доказательству теоремы 1. а доказательство п. Г приведено в Приложении. Обозначим
(13)
a(x, t)
ГИЛ (t)p ^(x,t)
и заметим, что P{0 < a(x,t) < то} = 1 для любых t G [0, T], x G E. Тогда уравнение (12) может быть записано в виде
(14)
где
dP(B,s|x,t) dt
= a(x, t)
P(B,s|x,t) -у ^(x,v,t)P(B, s|v,t)dv
E
, s < t,
(15) ^(x, v,t)
P(B, s|x, s) = Ig(x),
^*(x)A*(t)0(v) P(v,t)
a(x,t) ^(x,t)'
Отметим, что является случайной функцие й, однако при любом ш € Он любых фиксированных t € [0,Т] и х € Е легко убедиться, что / ^(х, = 1, т.е. при
Е
каждом ш € О функция ^(х, является некоторой плотностью распределения на Е.
Из указанных свойств (а(х, 4), ^.(х, V, 4)) следует [8], что при каждом фиксированном ш € О данная пара единственным образом определяет стохастический базис некоторого марковского скачкообразного процесса в обратном времени, переходная вероятность которого Р(В, в|х,4) является единственным решением (14). При этом Р(В, в|х, 4) также дифференцируема по в и является единственным решением уравнения
(16)
dP(B,s|x,t)
dS
s)
— a(y, s)P(dy, s|x, t) +
^(y, v, s)dv
P(dy, s|x, t), s < t,
P(B,t|x,t) = IB (x). Заметим, что для любых B G E s ^ t
P{Ys G B |Ut} = P(x
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.