научная статья по теме СУБОПТИМАЛЬНЫЙ АЛГОРИТМ ОЦЕНИВАНИЯ НА ОСНОВЕ АППАРАТА СГЛАЖИВАЮЩИХ В-СППАЙНОВ Метрология

Текст научной статьи на тему «СУБОПТИМАЛЬНЫЙ АЛГОРИТМ ОЦЕНИВАНИЯ НА ОСНОВЕ АППАРАТА СГЛАЖИВАЮЩИХ В-СППАЙНОВ»

симметричной смесью законов. В то же время умеренная асимметричность наблюдаемого закона практически не сказывается на распределении статистики критерия.

Полученные оценки мощности критерия позволяют судить о его способности обнаруживать наличие линейного и нелинейного трендов.

В качестве распределения статистики критерия при п > 20 можно применять нормальную аппроксимацию (2), которая предпочтительней (3) и при больших п.

Работа выполнена при поддержке Министерства образования и науки РФ (проекты № 15378 и № 02.442.11.7103) и РФФИ (проект № 06-01-00059).

Л и т е р а т у р а

1. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — М.: Наука, 1983.

2. Neumann J. // AMS. — 1941. — V. 12. — P. 367.

3. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: Учебник для вузов. — М.: ЮНИТИ, 1998.

4. Струнов В. И. // Измерительная техника. — 2006. — № 8. — С. 13.

5. Лемешко Б. Ю., Помадин С. С. // Метрология: приложение к журналу «Измерительная техника». — 2004. — № 3. — С. 3.

6. Р 50.1.033—2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Ч. I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2002.

7. Р 50.1.037—2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Ч. II. Непараметрические критерии. — М.: Изд-во стандартов, 2002.

8. Лемешко Б. Ю., Лемешко С. Б. // Измерительная техника. — 2005. — № 12. — С. 9.

Дата одобрения 17.04.2006 г.

621.317

Субоптимальный алгоритм оценивания на основе аппарата сглаживающих В-сплайнов

Д. А. БЕЗУГЛОВ, А. В. СКЛЯРОВ, Р. А. ЗАБРОДИН, И. В. РЕШЕТНИКОВА

Ростовский институт сервиса Южно-российского государственного университета

экономики и сервиса, e-mail: bezuglovda@mail.ru

На основе аппарата сглаживающих кубических нормализованных В-сплайнов синтезирован субоптимальный алгоритм оценивания по критериям Байеса, максимумов правдоподобия и апостериорной плотности без ограничения на гауссовость соответствующих плотностей распределения. Оценена потенциальная точность алгоритма в соответствии с неравенством Крамера — Рао.

Ключевые слова: алгоритм оценивания, сглаживание, В-сплайн, функция распределения.

On the basis of a means smoothing cubic normalized B-splines the suboptimal algorithm of an estimation is synthesized. Analytical expressions for optimum estimations by criteria of a maxima of a probability, Bayes criteria and a maxima of an a posteriori denseness without restriction on gauss the appropriate density functions are obtained. Expression for an estimation of a potential exactitude synthesized algorithm is obtained according to an inequality of Crammer — Rao.

Key words: estimation algorithm, smoothing, B-spline, cumulative distribution function.

Существующие методики обработки результатов измерений [1] базируются на предположении, что измеряемая величина распределена по нормальному закону. В этом случае для получения исчерпывающей информации о ней достаточно по результатам наблюдения определить математическое ожидание и дисперсию. Оценка, получаемая при такой постановке задачи, с учетом приближенного вычисления числовых характеристик закона распределения является субоптимальной. Однако для широкого класса задач [2, 3] предположение о нормальности закона распределения оцениваемой величины является некорректным, и поэтому оценка, найденная в соответствии с [1], не может считаться оптимальной. Следует отметить, что в большинстве практи-

ческих задач остро стоит вопрос о количестве результатов наблюдения. В одних случаях объем выборки ограничен экономическими или временными рамками, в других получение выборки большого объема технически нереализуемо.

Известные непараметические алгоритмы построения сглаженных плотностей вероятности негауссовых случайных распределений, основанные как на принципе усреднения 5-функции [4], так и на представлении плотности распределения разложением в ряд [5], при малом числе измерений не исключают появления отрицательных или не удовлетворяющих условию нормировки оценок плотности распределения. Кроме этого, алгоритм [5] требует подбора базисной функции и весового коэффициента, поскольку правило их

выбора не определено, что серьезно препятствует практическому использованию данного алгоритма. Перечисленные недостатки не позволяют обеспечить высокую точность результатов обработки.

Для получения оптимальной оценки по одному из основных критериев необходимо по результатам наблюдения определить плотность распределения оцениваемой величины. При этом обработку выборки ограниченного объема целесообразно проводить, применяя аппарат сглаживающих нормализованных В-сплайнов (вейвлет-сплайнов) [6].

Ниже синтезирован параметрический алгоритм оценивания с привлечением аппарата сглаживающих кубических нормализованных В-сплайнов с априорной неопределенностью, относящейся к коэффициентам сплайна, которые описывают вид (форму) плотности распределения. Синтезированный алгоритм призван обеспечить субоптимальную оценку по одному из основных критериев оптимальности на основе выборки ограниченного объема.

Оценка плотности распределения. Задачу получения эмпирической плотности распределения по малой выборке будем решать в такой последовательности [6]: по результатам наблюдений определим статистическую функцию распределения, которую затем сгладим нормализованным кубическим В-сплайном, а продифференцировав его аналитически, получим выражение для плотности распределения случайной величины.

Пусть имеется набор результатов измерений х1, х2, ..., х№ После их статистической обработки можно найти функцию распределения вида

^(х)="1 ё п/ (х), ^(х) ^ Г(х) при N -

(1)

/=1

где п (х) — число элементов выборки; N — число наблюдений.

Рассмотрим область Ф = [а; Ь], в которой определена функция /=дI (х). Введем в Ф множество узлов с равным шагом разбиения Л:

А: х0 < х1 = а < Х2 <...< хы = Ь < хы + у

Аналитическое выражение для сплайн-аппроксимации статистической функции распределения (1) найдем в виде системы сглаживающих кубических нормализованных В-сплайнов дефекта [7]:

N + 1

р(х) = Ё Ьеэ (х/з); х/з = "1 (х-х+(п+1)/2).

/ = 0

(2)

где Ь(. — коэффициенты сплайна; х(. + (П + 1) / 2 — координаты средины носителя В-сплайна; п — степень сплайна;

В3 (х/з ) = 4 (2 + Х/ з) ВО +

2-х2 3 Х'3 2

ы+1

■Х/3

з

X/з

-/ + 2

1 (2-X/ з )з В

->/'+з.

ВО =

>(. = [1 пРи х е[х/; х/+1]; 1о при хг [х,-; х,-+1].

Для получения статистической функции распределения по выборке малого объема целесообразно применить аппарат сглаживающих сплайнов, позволяющих эффективно устранять осцилляции аппроксимируемой функции изменением в широких пределах коэффициента сглаживания.

Задачу сглаживания будем решать, минимизируя функционал вида [7]:

Ь 2 N \2

и = р||Г"(х)|2ах +ё((х)- г(х/)) ,

а /=1

где р — коэффициент сглаживания; /г (х,) — значение сглаживаемой функции в узлах сетки; Г(х,) — значение сплайна (2) в точке х(.; | Г"(х)| — модуль второй производной сплайна (2).

Осуществим привязку коэффициентов сплайна к средине соответствующего носителя. Проведя арифметические преобразования и сгруппировав результат относительно коэффициентов сплайна, выражение для статистической функции распределения представим как

N-1

х) = ё йхз (ь,-+2 - зь,+1+зЬ. - ь,-1)+

/=1

+х2 (+1 - 2Ь+ь-1)+2 х(Ь+1- Ь/ -1)+

+ ^ (ь+1 + 4Ь/ + ь -1)), (3)

где х = (х - х) / Л — нормализованная координата сплайна.

При этом для нахождения коэффициентов сплайна необходимо решить систему линейных алгебраических уравнений

Ж = _а_ аь/ аь,

N -1 Х1 +1

р Ё 1 |Р'(х)|2с(х

/=1

N 2

Ё (х,-)- (Ь+1 + 4Ь/ + Ь/ -1)]

= 0, / = 0, N +1. (4)

Матрица коэффициентов системы (4) — семидиагональ-ная и хорошо обусловленная. Поэтому для ее решения целесообразно применить специальные методы [7], что позволит существенно снизить число вычислительных операций.

Дифференцируя (3) аналитически, получаем выражение для оценки плотности распределения оцениваемой величины:

N -1

Р (х) = Ё

/ = 1

(ь+2 - 3Ь,-+1 + 3Ь/ - Ь/ -1) (ь+1 - 2Ь/ + Ь/ -1) +

ь/+1 - ь/ -1 2Ь

Приняв меры по соблюдению условия нормировки плотности распределения, окончательное выражение запишем в виде

X

+

N-1

Р (х) = К X

/=1

(+2 - 3Ь/+1"

3 Ь; - Ь;

7 -1

^ (+1 - 2Ь,- + Ь -1

ь+1 - ь -1 2Л

(5)

где К = 6 (Ьм _ 2 + 4Ьц _ 1 + - Ь2 - 4Ь1 - Ь0)-1 — коэффициент нормировки.

Таким образом, (5) представляет собой апостериорную плотность распределения, полученную по наблюдениям некоторой входной реализации.

Алгоритмы оптимального оценивания. На основе выражения (5) параметрический алгоритм оценивания измеряемого параметра в соответствии с одним из основных критериев оптимальности можно получить в аналитическом виде. В тех случаях, когда можно задать временные, материальные и иные затраты, связанные с ошибочным оцениванием измеряемого параметра, целесообразно применять критерий Байеса. При квадратической функции потерь оптимальная оценка по этому критерию представляет собой апостериорное математическое ожидание [8]:

х* = | ХРрз (х,

(6)

где рр5 — апостериорная плотность распределения.

Область, на которой определен оцениваемый параметр, — отрезок числовой прямой Ф = [а; Ь]. Поэтому, подставив (5) в (6), после вычисления интеграла и приведения подобных членов с учетом того, что х(. + 1 = х(. + Л, окончательно получим

N -1 г

** = К X ( + 2-3Ь;+1 + 3Ь;-Ь;-1)1 А + £

=1

Ч+1

- 2Ь

/+ь -+|-) + (ь+1 - ь - +т) ■ (7)

Выражение (7) представляет собой оптимальную по критерию Байеса оценку измеряемого параметра, заданную в аналитическом виде с использованием аппарата сплайн-аппроксимации.

В ряде задач бывает трудно обоснованно выбрать функцию потерь, и, следовательно, критерий Байеса не применим. Для решения задачи оценивания в такой постановке целесообразно использовать критерий максимума апостериорной плотности измеряемого параметра, уравнение оценивания которого имеет вид [8]:

х * = агдтах {орз (х)}.

х еФ

(8)

Воспользовавшись необходимым условием экстремума, выражение (8) представим как

фps (

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком