научная статья по теме ПРЕДСТАВЛЕНИЕ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ В ОБРАТНОМ ВРЕМЕНИ И СМЕЖНЫЕ ВОПРОСЫ II. ОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ Автоматика. Вычислительная техника

Текст научной статьи на тему «ПРЕДСТАВЛЕНИЕ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ В ОБРАТНОМ ВРЕМЕНИ И СМЕЖНЫЕ ВОПРОСЫ II. ОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ»

Автоматика и телемеханика, Л- 9, 2006

Стохастические системы

PACS 05.40.-а

© 2006 г. A.B. БОРИСОВ, канд. физ.-мат. наук (Институт проблем информатики РАН, Москва)

ПРЕДСТАВЛЕНИЕ МАРКОВСКИХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ В ОБРАТНОМ ВРЕМЕНИ И СМЕЖНЫЕ ВОПРОСЫ II. ОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ ОЦЕНИВАНИЕ1

Во второй части работы получены решения задач оптимального нелинейного сглаживания (интерполяции) состояния специального марковского скачкообразного процесса по косвенным наблюдениям в присутствии виперовских шумов. Приводится анализ и сравнение полученных оптимальных нелинейных оценок с соответствующими оптимальными линейными оценками, представленными в первой части работы.

1. Введение

Данная работа является продолженном [1] и посвящена теоретическим и практическим аспектам задач оптимального в среднем квадратичоском смысле оценивания состояний специальных марковских скачкообразных процессов (СМСП) с использованием их представлений в прямом и обратном времени.

Статья организована следующим образом. В разделе 2 приводится формальная постановка задач прямой и обратной интерполяции по косвенным наблюдениям в присутствии виперовских шумов.

Раздел 3 содержит утверждения о виде условной переходной вероятности СМСП. возникающей в задаче оптимальной нелинейной фильтрации.

В разделах 4 и 5 приведены основные результаты решение задач оптимальной интерполяции (прямой и обратной) и их связь с представлением СМСП в обратном времени.

В разделе 6 на численных примерах проведены анализ и сравнение численной эффективности и точности линейных и нелинейных оценок, представленных в обеих частях работы.

2. Постановка задачи

Ниже предлагаются формулировки задач оптимального в среднем квадратичоском смысле сглаживания состояния СМСП. При этом все обозначения и определения введены в первой части статьи [1].

1 Работа выполнена при частичной финансовой поддержке Российского фонда фундаментальных исследований, грант № 05-01-00508-а, и программы ОМТВС РАН "Фундаментальные алгоритмы информационных технологий" (проект 1.5).

Рассмотрим следующую систему наблюдений на конечном интервале времени [0,T ]:

(1)

Y t = ^qYQ +

diagA(s)Ys_ + EY Л (s)0.

9t = ^q + J Л*(в)0^8 + M

q

t t

Ut = A(Y s_,(

s)ds

Csdws

ds + m ;

где = (Уг, 0*)* € Еп х 5 - ненаблюдаемый векторный случайный процесс, содержащий в себе информацию о текущем состоянии СМСП У и порождающего его марковского процесса с конечным числом состояний 6г: У г = при этом также Р-почтп наверное (Р-п.н.) верно равенство ©(У;) = иг € Мт - процесс наблю-

дений, wt £ Функции

независимый от состояния z стандартный винеровскии процесс.

A = A(y,<9,t) : En х S x [0,T] ^ Rm, C = Ct : [0,T] ^ R"

удовлетворяют условиям

E | J A*Atdt| < то, (2) 3 M> 0: V t £ [0, T] M/m < CtC*, tr U CtC*dt< то.

Обозначим через иг = а{ия, 0 ^ в ^ 4} - а-алгебру, порожденную наблюдениями и8, полученными та отрезке времени [0,4].

Задача оптимального в среднем, квадратическом смысле нелинейного сглаживания в фиксированной точке в (прямой интерполяции) заключается в нахождении оценки 2(в, 4) = Е{,гя | Ыг}, 0 < в < 4 < Т.

Задача оптимального в среднем. квадратическом смысле нелинейного сглаживания на фиксированном интервале [0, Т] (обратной интерполяции) заключается в нахождении оценки 2(4, Т) = | и?} для 0 ^ 4 ^ Т.

i

m

3. Условная переходная вероятность специального марковского скачкообразного процесса

Исследуемые задачи сглаживания тесно связаны с соответствующей задачей оптимальной нелинейной фильтрации.

Утверждение 1 ([2]). Пусть дана система наблюдения (1), и скалярный сигнальный процесс gt = g(gQ(w), t, z, w) определен стохастическим уравнением

t t t

gt = go + /asds + ¡ b*dMsz + ¡ c*dws,

Q Q 0

_2 / _у _д \ *

где д0 = д0(ш) -измеримое начальное условие, МЬ = 1(МЬ )*, (МЬ )*) - мартингал из представления процесса гЬ (т. первые два уравнения (1)), т - винеров-ские шумы в наблюдениях (т.третье уравнение (1)). Пусть также выполнены следующие условия:

1) начальное уеловие д0, процесс г и шумы т независимы в совокупности; распределения Пг(-), { = 1,... ,п абсолютно непрерывны по мере Лебега с плотностями распределения ф(у), ф(у) = (ф\(у),.. .,Фи(у))*;

2) коэффициенты а8 = а(г8-,в), Ь8 = Ь(г8-,в), св = с(г8-,в) таковы, что функ-

а8 = а(г, в), а8 : Е х Б х М+ ^ М, Ья = Ь(г, в), Ьв : Е х Б х М+ ^ М2п, ся = с(г,в), с8 : Е х Б х М+ ^ Мт

являются кусочно-непрерывными по в при любом фиксированном значении г е £ Е х Б. Тогда

А) решение задачи оптимальной нелинейной фильтрации дЬ = Е{д1\и1} описывается следующей стохастической системой

(3)

а

Ь Ь

= Е{до} + 1 а8<1в + ! (дА* - дЛ* + с**Оа) (СаС*а)-1/2а^а,

V = I (СаС**)-1/2 (¿и - Аа<1в),

о

при этом обновляющий процесс щ является иЬ-согласованным стандартным ви-неровски,м;

Б) если условная плотность распределения ф(у,Ь) процесса У относительно фильтрации {и} существует, то она удовлетворяет уравнению

(4) ф(у,1) = р*Ф(у) + ! [ф(у,в)Х*(в)&(у) + ф*(у)Л (в)в.

о

Ь

+1 ф(у,в) (А(в(у)у, в(у),в) - Ая) * (С3С**)-1/2а^а,

¿в +

где

(5)

а = Е{в4 | Щ = Е{в(У) | и} = у в(у)ф(у,г)<1у,

Е

А = Е {А(Уиви±) | и} = [ А(в(у)у, в(у),±)ф(у,±)в.у.

Е

В [2] были представлены лишь уравнения, описывающие эволюцию во времени

У

плотности приведено не было. Именно этой проблеме посвящен данный раздел.

Переходная вероятность процесса Y для любого B е B(E) определяется как (6) P(x,s,B,t) = P{Yt е B|YS = x} =

= T*(s,t)©(x)IB(x) + I ) P*(s,t)©(x),

где

P (s,t) = P (s,t) — diag T (s,t).

Очевидно, что первое слагаемое в (6) соответствует сингулярной части, в то время как второе является регулярным, т.е. абсолютно непрерывным по мере Лебега. Оказывается, что условная переходная вероятность P(x, s, B,t) = P{Yt е B | UUt, Ys = x}, возникающая при решении задачи оптимальной нелинейной фильтрации, обладает подобным разложением на регулярную и сингулярную части.

Теорема 1. Пусть для системы наблюдения (1) выполнены условия 2) утверждения 1, верны ограничения (2), а также

3) все плотности ФД-), i = 1,...,n имеют кусочно-непрерывные производные, ограниченные на множестве E,

4) функция A(y, 0,t) в уравнении наблюдений (1) ограничена на множестве допустимых значений En х S х [0, T].

Тогда условная переходная вероятность P(x, s, B, t) для любых B е B(E), t е е [0, T] имеет вид

(7) P(x,s,B,t)= §X,s(t)I в (x) + ^ fx,s(y,t)dy,

в

где пара (qx,s(t), rx,s(y,t)) является решением системы стохастических уравнений

t

qx,s(t) = 1 + J A*(u)©(x)qx,s(u)dM+

s

t

+ J qx,s(u) (¿(©(x)x, ©(x),u) — A4x,s(u^*(C„CU)-1/2dVx,s(u),

(8)

qx,s(y,t)^y rx,s(y,u)A*(u)©(y) + Ф*(у)А (u)6x,s(u) du+

s

t

+ J q«,s(y,u) (A(©(y)y, ©(y), u) — Ax,s(u)) (C„CU)-1/2dvx,s(u),

s

qx,s(t) =©(x)qx,s(t)^ ©(y)qx,s(y,t)dy,

E

Alx,s(u) = A(©(x)x, ©(x),u)qx,s(u) + J A(y, ©(y),u)qx,s(y,u)dy,

E

,s(t) = J(C„CU)-1/2 (dU„ — Ax,s(u)du) .

V

Доказательство теоремы 1 приведено в Приложении.

Следствие 1. Выполнение условий теоремы 1 гарантирует, что условная плотность распределения ф(у, Ь) существует и удовлетворяет уравнениям (4) и (5), а также связана с решением уравнения (8) равенством

Ф(у,Ь) = Яу,в(1)'Ф(у,8) + ! г'х,8(у,г)ф(х,в)йх

Е

для любых 0 ^ в ^ Ь ^ Т.

Следствие 2. "Частные" обновляющие процессы их,8(Ь), 0 < в < Ь < Т, х е Е, и "общий" обновляющий процесс иг связаны равенством

г

VI-ие = /их,в(£)ф(х,в)йх^(СпОи) 1/2 ЫИи - ^ф(х,в)й:

¿и I .

4. Уравнения прямой и обратной интерполяции

Прежде всего, приведем теорему, определяющую решение задачи оптимальной прямой интерполяции.

Теорема 2. Пусть для системы наблюдения (1) выполнены условия теоремы 1. Тогда

А) условное математическое ожидание д(в,Ь) = Е{д8|иг} сигнального процесса д8, 0 < в < Ь, определяется следующим, стохастическим уравнением: г

(9) дд(в,1) = д +У (Е {д8Л*(Уи,ви,и)1ии} - д(Ь,и)А*) (СиС*и)-1/2¿ии,

Б) если случайный процесс дг является функцией СМСПУг, т.е. дг = д(Уг) для некоторой функции д = д(у) такой, что \\E-g|| < то, то ее оптимальная оценка прямой интерполяции д(в, Ь) определяется уравнением

(10) д(в,Ь) = д +

Ы д(У8П ЯУв,в(и)Аи(Уа,ва,и) +

+ J гузи(х, в)А*(в(х)х, в(х),и)йх Е

и А - д(в, и) А.

(СиСи )-1/2<1ии,

где пара ((дуьг(в),гуь,г(х, в)) является решением системы (8) со случайным начальным условием У8;

В) условная плотность распределения ф(у, в, Ь) случайного процессаУ8 относительно а-алгебры наблюдений иг, 0 < в < Ь, существует и удовлетворяет системе

Ф(У, = ф(у, в)+

(Н)

+ У ф(у,в,и) (Лу,8(в(у)у, в(у),и) - Аи) * (С8Си)-1/2<1иу88(и), АУе8(в(у)у, в(у),и) =

= ду,8(и)Ау,8(в(у)у, в(у),и) + ! Гу,8(х,и)Ау,8(в(х)х, в(х),и)йх;

Г) пусть P(B,s|x,t) = P{YS G B|Wt,Yt = x} множест,во E замкнуто, а также min ||ф(х)|| > 0, тогда P(B,s|x,t) является решением следующего интегро-дифференциального уравнения:

dP(B, s|x, t)

(12)

dt

ф*(х)Л (t)y 0(v) P(B, s|v, t) - P(B, s|x, t)

E

V>(v,t) -ф(х, t)

dv,

P(B, s|x, s) = Ig(x).

Доказательство пп. А В теоремы 2 абсолютно аналогично доказательству теоремы 1. а доказательство п. Г приведено в Приложении. Обозначим

(13)

a(x, t)

ГИЛ (t)p ^(x,t)

и заметим, что P{0 < a(x,t) < то} = 1 для любых t G [0, T], x G E. Тогда уравнение (12) может быть записано в виде

(14)

где

dP(B,s|x,t) dt

= a(x, t)

P(B,s|x,t) -у ^(x,v,t)P(B, s|v,t)dv

E

, s < t,

(15) ^(x, v,t)

P(B, s|x, s) = Ig(x),

^*(x)A*(t)0(v) P(v,t)

a(x,t) ^(x,t)'

Отметим, что является случайной функцие й, однако при любом ш € Он любых фиксированных t € [0,Т] и х € Е легко убедиться, что / ^(х, = 1, т.е. при

Е

каждом ш € О функция ^(х, является некоторой плотностью распределения на Е.

Из указанных свойств (а(х, 4), ^.(х, V, 4)) следует [8], что при каждом фиксированном ш € О данная пара единственным образом определяет стохастический базис некоторого марковского скачкообразного процесса в обратном времени, переходная вероятность которого Р(В, в|х,4) является единственным решением (14). При этом Р(В, в|х, 4) также дифференцируема по в и является единственным решением уравнения

(16)

dP(B,s|x,t)

dS

s)

— a(y, s)P(dy, s|x, t) +

^(y, v, s)dv

P(dy, s|x, t), s < t,

P(B,t|x,t) = IB (x). Заметим, что для любых B G E s ^ t

P{Ys G B |Ut} = P(x

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком