научная статья по теме ДИСКРЕТИЗАЦИЯ И ВОССТАНОВЛЕНИЕ КУСОЧНО-ПОСТОЯННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ С ЭРЛАНГОВСКИМ ВРЕМЕНЕМ ПРЕБЫВАНИЯ В СОСТОЯНИЯХ Кибернетика

Текст научной статьи на тему «ДИСКРЕТИЗАЦИЯ И ВОССТАНОВЛЕНИЕ КУСОЧНО-ПОСТОЯННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ С ЭРЛАНГОВСКИМ ВРЕМЕНЕМ ПРЕБЫВАНИЯ В СОСТОЯНИЯХ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2011, № 6, с. 14-27

УПРАВЛЕНИЕ В СТОХАСТИЧЕСКИХ СИСТЕМАХ ^^^^^^ И В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

УДК 621.391

ДИСКРЕТИЗАЦИЯ И ВОССТАНОВЛЕНИЕ КУСОЧНО-ПОСТОЯННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ С ЭРЛАНГОВСКИМ ВРЕМЕНЕМ ПРЕБЫВАНИЯ В СОСТОЯНИЯХ

© 2011 г. Ю. А. Горицкий, В. А. Казаков

Россия, Москва, МЭИ (технических ун-т) Мексика, Мехико, Национальный политехнический ин-т Поступила в редакцию 31.08.10 г., после доработки 29.06.11 г.

Разработана статистическая процедура дискретизации и восстановления для указанного в названии класса случайных процессов. Используются метод фаз Эрланга и рекуррентный пересчет для условных марковских процессов. Получены формулы для апостериорного распределения момента перехода, для соответствующих первых моментов и для интервала дискретизации. В вычислительном отношении процедуры нетрудно реализуемы. Проанализировано влияние параметров процесса на параметры процедур. Приведен иллюстрирующий пример.

Введение. Задача дискретизации и восстановления реализаций случайных процессов анализируется в обширной литературе (см., например, книги [1—6] и библиографические обзоры [7, 8]). В основном задача рассматривается для непрерывных процессов. Статистическое описание процедур дискретизации-восстановления (ПДВ) разрывных (в частности, кусочно-постоянных) процессов представлено крайне слабо. Некоторое исключение составляют работы [9—11], имеются также авторские свидетельства на изобретения [12, 13]. Кусочно-постоянные процессы широко используются при анализе и синтезе различных систем управления и радиосистем (см., например, [14—16]), и потому исследование ПДВ для них представляет как теоретический, так и практический интерес для специалистов систем управления и радиосистем.

Для непрерывных процессов типичным методом является правило условного среднего (см., например, [17] и цитированную там литературу). При описании ПДВ разрывных процессов возникают особенности, которые обсуждались в [18, 19]: необходимость оценки ненаблюдаемого случайного момента перехода, необходимость учета пропуска состояний, неравномерность случайной дискретизации. Метод исследования оказывается другим.

Для цепей Маркова с непрерывным временем задача решена в [18, 19]. Однако в этом случае время пребывания в состоянии подчиняется показательному распределению, для которого среднее значение и стандартное отклонение совпадают. При практическом использовании, при выборе моделей, последнее обстоятельство может оказаться слишком ограничительным. Естественное обобщение заключается в отказе от показательного распределения, но такой процесс перестает быть марковским, и аналитическое решение задачи существенно усложняется. Вариант, когда время пребывания подчиняется произвольному непрерывному распределению, рассмотрен в [20]. Там получены решения в весьма общем интегральном виде, и это затрудняет их практическое использование. В настоящей работе предполагается, что время пребывания подчиняется двухпараметрическому семейству распределений Эрланга (немарковский случай). По сравнению с показательным распределением преимущество состоит в том, что при выборе модели процесса можно исходить из различных значений математического ожидания и стандартного отклонения. Используя метод фаз Эрланга и основное соотношение для условных марковских процессов, в статье получены рекуррентные процедуры, приводящие к нетрудно реализуемым вычислениям.

1. Постановка задачи. Пусть ^(0 — случайный процесс с дискретным множеством состояний 0, 1, ..., N и непрерывным временем. Пусть время пребывания п в состоянии ] определяется распределением Эрланга; интервалы времени между переключениями независимы; переход из состояния] в состояние к происходит с вероятностью рк; в начальный момент ^ = 0 задано начальное состояние = и0.

Предполагается, что нет возможности наблюдать процесс непрерывно, можно лишь измерять его значения в дискретные моменты, которые необходимо определять. Обозначим через ?0, 1Х, ..., П + 1, ... моменты измерений. Пусть в очередной момент имеем Ь(?п) = ип, и все предыдущие измерения известны: ) = щ, ■ = 1,..., п - 1, иI — состояние в момент В этот момент 1п необходимо выполнить следующие действия:

1) в задаче дискретизации: найти временной интервал Тп, определяющий следующий момент дискретизации: 1п + 1 = 1п + Тп так, чтобы для любого следующего состояния к вероятность его пропуска не превышала заданный уровень у

тах^{пропустить ) = ип, ^(¡¡) = и, ■ = 0,..., п -1} = у; (1.1)

к

в дальнейшем, при фиксации Ш, неизвестное Тп обозначается без индекса;

2) в задаче восстановления: при Ь(?п) ^ -1) оценить момент перехода с минимальной дисперсией и указать дисперсию оценки.

2. Пересчет апостериорного распределения для условных марковских процессов. Отказ от показательного времени пребывания в состояниях выводит рассматриваемый процесс из класса марковских. Предположим, что путем расширения фазового пространства можно ввести многомерный марковский процесс, в котором данный немарковский является одной из компонент; в этом случае можно использовать марковскую теорию. Физический смысл дополнительной компоненты поясняется в следующем разделе. Сейчас же формально рассмотрим двумерный процесс и выпишем основное соотношение теории условных марковских процессов [21]. Для наших целей это соотношение удобнее записать в виде [22], сохранив обозначения. Пусть гп = (г0, т1, ..., гп) — последовательность данных, наблюдаемых в моменты ..., п Введем также !„ = (% ¿1, ..., 5п) — последовательность ненаблюдаемых значений; предполагается, что двумерный процесс (тк, 5к), 0 < к < п, является марковским с дискретным множеством состояний. Пусть Р(эк, гк |эк_1, гк_1) — вероятность перехода из (тк_ ь зк- 1п- х) в (тк, 5к; ?п). Нас интересует апостериорное распределение ы(8п\г„) для последнего ненаблюдаемого значения sn. Обозначим его ыр(зп; п) = ы(зп\г„). Справедлив рекуррентный пересчет ы'р,,(8п-п — 1) в ыр(зп; п):

п) = С^ Гп п - 1), (2.1)

«п-1

где Сы — нормирующая константа, определяемая из условия

X п) = 1, (2.2)

что дает

С-1 = X

X Р(эп, Гп К-1, Гп-1)

(Эп-1; п - 1). (2.3)

Формула (2.1) имеет классический характер для марковских процессов с дискретным временем [22]. Вычисленное на шаге п — 1 апостериорное распределение мр($п_{;п -1) умножается на переходную вероятность из шага п — 1 на следующий шаг п. В результате получается апостериорное распределение^рэ(эп,эп-1;п,п - 1), относящееся к двум шагам п и п — 1. Это распределение путем суммирования по значениям зп _ 1 превращается в апостериорное распределение п), относящееся лишь к п-му шагу. Так осуществляется рекуррентный пересчет апостериорных вероятностей с ростом числа шагов. Формула (2.1) описывает общую закономерность пересчетов апостериорных вероятностей. Ее конкретизация к решаемой в статье задаче дается в разд. 3.

3. Двумерный марковский процесс с использованием распределения Эрланга. Плотность распределения Эрланга записывается в виде

Бт(Г;X) = Xе^ = ХРо(т - 1,И), (3.1)

(т -1)!

Рис. 1. Граф процесса (ф(0, ^(0)

k

где целое m > 1 и X > 0 — параметры распределения, Po(k; a) = — e— — обозначение пуассонов-

k!

ской вероятности значения целого k > 0 при параметре a > 0. Соответствующая функция распределения:

m m

Fm(t; X) = P{n < t} = 1 - £M-e^ = 1 - £Po(i - 1,Xt). (3.2)

i = i(i 1)! i = i

Для этого распределения математическое ожидание равно m/X, дисперсия — m/X2. Из этого двух-параметрического семейства можно выбрать распределение с нужными средним и различными дисперсиями. Распределение Эрланга удобно тем, что апостериорное распределение будет задаваться конечным набором из m вероятностей на множестве фаз Эрланга.

Как известно, случайное время с законом Em(t; X) можно представить суммой m независимых показательно распределенных с плотностью E1(t; X) случайных величин

П = Z1 + Z2 + ••• + Cm.

Время пребывания процесса в некотором состоянии представляем в виде последовательного прохождения m фаз с длительностями Z1, Z2, ••• Zm.

Рассматриваем двумерный процесс (ф(0, ^(t)):

ф(0 = х, ^(t) = i, x = 1, 2, „., m,, i = 1, 2, • .., N,

где ^(t) — рассматриваемый наблюдаемый процесс, ф(0 — номер фазы соответствующего состояния i (ненаблюдаемый процесс). Процесс (ф, £,) является марковским, поскольку в каждом состоянии (х, i) он пребывает в течение показательного времени. Граф процесса (ф, £,) представлен на рис. 1.

В нашем случае роль F(sk, rk |sk_1, rk_1) в (1.1) играет вероятность перехода из (х, i) в (y, j) за время Т: P*(y, j|x, i; T) = Р{ф(tn + T) = y, %(tn + T) = j1ф(tв) = x, ^(tB) = i},

роль wps(sn, n) играет распределение W*(y, n + 1) на множестве Y фаз y состояния j в момент tn + 1. Формула (2.1) пересчета

W*(y, n + 1) = C'f£w*(x, n)P*(y, j\x, i;T). (3.3a)

Теперь учтем, что мы рассматриваем такие последовательности ..., 1п, („ + ъ ... , („ + 1 = („ + Тмо-ментов измерений, для которых промежутки Тнастолько малы, что, в силу условия (1.1), вероятность иметь два или более переключений для за время Тпренебрежимо мала, т.е. Р&Тп > 2} < у, где vTи — количество переключений на (1п, + Т). Иными словами, для обеспечения этой "малой" вероятности нужно уменьшать интервал измерения Т до тех пор, пока вероятность пропуска не станет равной у, т.е. удовлетворяющей требованиям пользователя. Устанавливая эту величину, пользователь декларирует, что он согласен пренебречь пропусками переключений, которые характеризуются столь малой вероятностью. Это позволяет приближенно считать, что нам известно случайное число переключений vTи, равное в».

x

Г0, если у = i, [1, если у Ф г.

Вместо вероятности перехода Р*, подразумевающей возможность произвольного числа переключений, в (3.3а) подставим

Р(у, у\х, I, ву, Т) - Р№„ + Т) = у, + Т) = Шп) = х, %Цп) = /, хТп = еу]

- условную вероятность перехода при условии, что \Тп известно и равно ву. Получим рекуррентное соотношение

Ж ¡(у,п + 1) = СкX Ж(х,п)Р(У,У|х,г,ву;Т) = СкXЖ(х,п)Р(у,у |х,г;Т) (3.3б)

х х

Здесь Щу, п + 1) имеет смысл условного распределения на множестве Уу при условии, что количество переключений на всех предыдущих

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком