научная статья по теме ПОСЛЕДОВАТЕЛЬНАЯ ПРОВЕРКА ДВУХ СЛОЖНЫХ СТАТИСТИЧЕСКИХ ГИПОТЕЗ Автоматика. Вычислительная техника

Текст научной статьи на тему «ПОСЛЕДОВАТЕЛЬНАЯ ПРОВЕРКА ДВУХ СЛОЖНЫХ СТАТИСТИЧЕСКИХ ГИПОТЕЗ»

Автоматика и телемеханика, Л- 9, 2006

PACS 02.50.-i

© 2006 г. B.C. ДАРХОВСКИЙ, д-р физ.-мат. наук (Институт системного анализа РАН, Москва)

ПОСЛЕДОВАТЕЛЬНАЯ ПРОВЕРКА ДВУХ СЛОЖНЫХ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Рассматривается задача последовательной проверки двух сложных статистических гипотез. Каждая из гипотез описывается плотностью, зависящей от параметра, который может принадлежать одному из непересекающихся множеств. Предлагается последовательная процедура, минимизирующая максимальный по семейству априорных распределений параметра байесовский риск. Семейство априорных распределений состоит из всех вероятностных распределений па параметрическом множестве, для которых априорная вероятность справедливости одной из сложных гипотез равна заданному значению. Устанавливается, что эта процедура (при дополнительном условии) минимизирует наибольшее по параметру среднее время наблюдения в предположении справедливости любой из гипотез в классе правил, для которых максимальные по параметру вероятности ошибок по превосходят заданных значений. Полученные результаты переходят в классические результаты Вальда для случая проверки простых гипотез.

1. Введение

Проблема проверки статистических гипотез весьма часто возникает во многих приложениях. Последовательная проверка гипотез означает, что время наблюдения случайно (т.е. объем выборки заранее не фиксирован). В ряде случаев применение последовательного способа проверки статистических гипотез позволяет существенно уменьшить среднее время наблюдений, необходимое для принятия решения, при заданных вероятностях ошибочных решений.

В классической теории последовательного анализа Вальда рассматривается задача проверки двух простых гипотез. Хорошо известно (см.. например. [1. 2]). что последовательный критерий отношения правдоподобия для такой задачи является оптимальным в байесовской постановке и минимизирует среднее время наблюдений при справедливости любой из конкурирующих гипотез и ограничении на вероятности ошибок. В [3] результаты Вальда и их естественные обобщения для задач о "разладке" получены на основе общей теории задач об оптимальной остановке.

Для математической статистики и многих приложений весьма интересны задачи последовательного различения сложных гипотез. Особенно часто подобные задачи возникают при управлении сложными динамическими системами, когда требуется по ходу процесса принимать решения, связанные с изменениями условий функционирования системы. Обычно состояние системы не является точно наблюдаемым, и поэтому любой режим ее функционирования может быть описан как (вообще говоря. континуальная) совокупность простых статистических гипотез, иными словами.

как гипотеза сложная. Важно при этом своевременно, по мере поступления наблюдений, принять правильное решение о том, какая именно сложная гипотеза имеет место, т.е. в каком именно режиме функционирует динамическая система.

По-видимому, первой работой, где рассматривалась задача проверки сложной (параметрической) гипотезы Но : д < до против Их : д > дх(> до), где д - параметр семейства, была статья Кифера и Вейсса [4]. Обнаружилось, что в зоне безразличия (до < д < дх) средний объем выборки последовательного теста Вальда для проверки гипотез при значениях параметра соответственно до и д\ может быть значительно больше, чем для выборки с фиксированным объемом и теми же вероятностями ошибок. В связи с этим была поставлена задача Кифера-Вейсса о последовательном тесте, доставляющем минимальный средний объем выборки для некоторого значения параметра и обеспечивающем заданные вероятности ошибок при д0 и д\. Асимптотические решения для задачи Кифера-Вейсса можно найти в работах [5 7].

В работах [8, 9] рассматривалась задача последовательной проверки сложных гипотез, параметризованных двумерным вектором (д, п), по независимым и одинаково распределенным наблюдениям с плотностью из экспоненциального семейства. Параметр п является мешающим, а гипотезы имеют вид: Но : д = до, п € Я; Их : д = д\, П € Я, где Я — заданное множество. Были предложены статистики отношения прав-

п

максималыгого правдоподобия (ОМП) [8] или две ОМП, соответствующие значениям параметра до и дх [9] (очевидно, что если мешающий параметр отсутствует, то получается классический тест Вальда для простых гипотез). Асимптотические свойства этих статистик и их численное исследование проведено в [10]. В [11] (см. также [12]) показано, что свойства оптимальности статистик типа [8, 9] (имеющие место для теста Вальда) не сохраняются без предположения об асимптотическом сближении параметров до и д\, т.е. без гипотезы коптигуальпости.

В обзорных работах [13, 14] приводятся основные известные результаты, связанные с последовательной проверкой гипотез (в том числе сложных) и задачей о "разладке" для сложных гипотез. Анализируется проблема асимптотической оптимальности обобщенного последовательного критерия отношения правдоподобия (ОПКОП) (т.е. последовательного отношения правдоподобия, где вместо неизвестного параметра вставляется его ОМП-оценка) в разных классических проблемах последовательного анализа. В частности, при байесовской постановке задачи для различения гипотезы Но : д < до против альтернативы Нх : д > до для параметра д экспоненциального семейства, имеющего априорное распределение из достаточно широкого класса, ОПКОП асимптотически оптимален (в смысле минимизации байесовского риска). В этих же работах отмечено, что последовательный критерий отношения правдоподобия сохраняет свойства классического теста Вальда, если можно указать инвариантную группу преобразований, сводящую задачу различения сложных гипотез к задаче различения простых гипотез. Заметим здесь, что при рассмотрении задач о "разладке" в случае сложных гипотез в литературе, насколько нам известно, рассматривалась только ситуация, когда распределение до ''разладки" известно.

В этой статье предлагается новая постановка задачи последовательного различения двух сложных гипотез, допускающих параметрическое описание. А именно, ставится задача минимизации максимального по классу априорных распределений обычного байесовского риска. Класс априорных распределений это все вероятностные распределения на параметрическом множестве, для которых априорная вероятность того, что верна одна из сложных гипотез, равна заданному значению. Такую задачу естественно называть лшнилшксно-байесовской. Указывается оптимальная последовательная процедура для минимаксно-байесовской задачи, т.е. процедура, минимизирующая указанный выше риск. Оказывается, что оптимальная процедура использует две статистики верхнюю и нижнюю апостериорные вероят-

ности того, что верна одна из сложных гипотез. Эти статистики выражаются через соответствующие последовательные отношения правдоподобия. При естественных предположениях указанная процедура обладает определенными свойствами оптимальности (уже не связаннылш с наличием априорного распределения параметра), которые являются обобщением свойств оптимальности классического теста Вальда. При переходе к случаю простых гипотез предлагаемая процедура превращается в классическую процедуру Вальда.

Структура статьи такова. В разделе 2 формулируется постановка минимаксно-байесовской задачи и находится оптимальная процедура. В разделе 3 эта процедура рассматривается как последовательный критерий различения двух сложных гипотез (уже без предположения о наличии априорного распределения параметра) и показывается. что при естественном условии этот критерий обладает определенными свойствами оптимальности. Излагаемая работа следует подходу, подробно описанному в [1, 2].

2. Байесовская последовательная процедура

Сформулируем постановку задачи. Пусть <Э - параметрическое множество в конечномерном пространстве, © = ©о U ©ь ©о П ©i = Рассмотрим два семейства вероятностных распределений р = {/(x, 0)}ge0i, i = 0,1 гДе / (x, 0) - плотность по некоторой <7-конечной мере Всюду далее предполагается, что плотность определена в некотором открытом множестве, содержащем ©, и «{x : /(x, 01) = /(x, 02)} > 0, если 01 = 02, откуда следует различимость семейств Ро, P1. Предполагается также, что для («-почти всех x плотность /(x, •) непрерывна и положительна, а мно-©

упрощения изложения и могут быть ослаблены).

Рассматривается задача последовательной проверки двух сложных гипотез на

/( x, 0)

иий:

{Но : 0 е ©о}, {Hi : 0 е ©i}.

Пусть Fq = {F(•)} - семейство вероятностных распределений на © такое, что / dF(0) = q. Предположим, что параметр 0 имеет априорное распределение F(•) eFq. 00

Это означает, что рассматриваются все те априорные распределения на параметрическом множестве, для которых априорная вероятность справедливости гипотезы Но равна q.

Последовательная процедура 5 = (т, d) состоит из момента остановки т = т(5) и заключительного решения d = d(5) (решенне d = i означает принятие гипотезы Hj, i = 0,1). Для процедуры 5 введем "дифференциальные" вероятности ошибок

P (d(5) = 1|Но, 0о е ©о) = ао(5, 0о), P (d(5) = 0|Hi, 0i е ©i) = ai(5, 0i)

и "дифференциальные" средние времена наблюдений до принятия решения

E (т(5)|Но,0о е ©о) = То(5,0о), E (т(5)|Hi,0i е ©i) = Ti(5,0i)

(здесь и далее P(E) - символы вероятности (математического ожидания)).

5

pa F(•) равен

R(5,F) = У [адоао(5,0) + сТо(5,0)] dF(0) + J [wiai(5,0) + cTi(5, 0)] dF(0), 00 01

где адо > 0,^1 > 0 потери от неверного решения, а с > 0 - стоимость одного наблюдения.

Будем называть процедуру лтнилшксно-байесовской, если она минимизирует величину максимального (по заданному классу априорных распределений) риска:

ОДд) = вир ).

В частном случае, когда каждое из параметрических множеств состоит из одной точки, из этого определения получаем определение байесовского критерия для классической задачи Вальда.

п

Обозначим X(п) = (ж1;ж2, ...,хп), Ь(Х (п),0) = П / , 0) и положим

Тогда

(1)

к=1

Л(п) =

/ Ь(Х(п),0)^Д(0)

во_

/ Ь (X(п),0) ¿Д(0). 01

Л*(п)

д тах Ь (х(п),0) 0Ё0о У_/_

(1 - д) тт Ь (X(п),0) ' ее01 V )

д тт Ь (X(п),0)

Л*(п) = М Л(п) =-ее0° У ,-—

^^ ^=,} (1 - д) гпахЬ(Х(п),0

вир Л(п)

^:/ № = Л

во J

0Ё01

Введем верхнюю и нижнюю апо

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком