научная статья по теме РАСПОЗНАВАНИЕ ОБЪЕКТОВ, ОДНОВРЕМЕННО ПРИНАДЛЕЖАЩИХ НЕСКОЛЬКИМ КЛАССАМ Электроника. Радиотехника

Текст научной статьи на тему «РАСПОЗНАВАНИЕ ОБЪЕКТОВ, ОДНОВРЕМЕННО ПРИНАДЛЕЖАЩИХ НЕСКОЛЬКИМ КЛАССАМ»

РАДИОТЕХНИКА И ЭЛЕКТРОНИКА, 2004, том 49, № 9, с. 1066-1072

СТАТИСТИЧЕСКАЯ РАДИОФИЗИКА

УДК 621.391.01

РАСПОЗНАВАНИЕ ОБЪЕКТОВ, ОДНОВРЕМЕННО ПРИНАДЛЕЖАЩИХ НЕСКОЛЬКИМ КЛАССАМ © 2004 г. Ю. Г. Рындин, Г. П. Тартаковский, В. С. Тшрин

Поступила в редакцию 01.03.2004 г.

Рассмотрена задача многоальтернативного распознавания многофункциональных объектов с допущением неоднозначных решений в случае, когда распознаваемые объекты могут одновременно принадлежать к нескольким классам (выполнять несколько разных функций). Получены байесовское решение задачи и решения при различных видах неопределенности: параметрической априорной неопределенности, неизвестных коэффициентах функции потерь с распространением критерия Неймана-Пирсона на многоальтернативную задачу, непараметрической априорной неопределенности с использованием классифицированной обучающей выборки. В условиях априорной неопределенности предложены новая характеристика и показатель качества распознавания.

ВВЕДЕНИЕ

В работах [1-3] найдены байесовское и адаптивное байесовское решения задачи проверки многоальтернативных гипотез в предположении, что в действительности имеет место одна из них (объект наблюдения относится к одному классу), а данные наблюдения (сигналы) недостаточно информативны, чтобы выбрать лишь одну гипотезу, и поэтому допускается принятие нескольких альтернатив. При этом предполагали, что функция потерь, соответствующая описанной ситуации, известна, а априорная неопределенность, если и существует, то относится лишь к законам распределения для наблюдаемых сигналов. Найдены байесовские решения при наблюдении как при наличии выборок фиксированного объема, так и в рамках процедуры последовательного анализа.

Существуют, однако, задачи, в которых объект наблюдения может относиться сразу к нескольким классам. Так, например, при наблюдении радиолокационными и оптическими средствами спутников (космических объектов) оказывается, что некоторые спутники выполняют сразу несколько задач; при автоматической медицинской диагностике заболеваний встречаются случаи, когда у больного может быть сразу несколько заболеваний; при выявлении экономической ситуации на бирже для определения оптимальной стратегии поведения следует учитывать возможность наличия сразу нескольких ситуаций и т.д. Кроме того, часто встречаются задачи, связанные с различными ситуациями и соответствующими решениями, в которых очень трудно определить функцию потерь. Это имеет место при недостаточной изученности последствий, связанных с различными действиями, а также стоимости самих действий.

При этом уже нельзя использовать байесовские решения, минимизирующие потери в среднем, и следует применять иные критерии оптимальности.

Задачам нахождения оптимальных алгоритмов проверки многоальтернативных гипотез в указанных более сложных условиях, чем рассмотренные ранее, посвящена данная работа.

1. БАЙЕСОВСКОЕ РЕШЕНИЕ ЗАДАЧИ ПРОВЕРКИ МНОГОАЛЬТЕРНАТИВНЫХ ГИПОТЕЗ ДЛЯ ОБЪЕКТОВ НАБЛЮДЕНИЯ, ОТНОСЯЩИХСЯ К НЕСКОЛЬКИМ КЛАССАМ

Обозначим г номера классов объектов (г = = 1, т), а у - номера принимаемых или отвергаемых гипотез (у = 1, т). Будем предполагать, что наблюдается выборка х, где х - совокупность наблюдаемых признаков распознавания. Допустим, что наблюдаемый объект относится к множеству классов X, т.е. X = {гх, , ..., } - некоторое

множество из 1, т .

Обозначим йу = 1 решение о принадлежности объекта к у'-му классу, йу = 0 - противоположное

решение. Множество й = {у': йу = 1} есть приписываемые объекту классы задач (функций).

Тогда уместно ввести следующую функцию потерь:

£(К й) = X О + X %'- кО'Х

' = 1 V

г е X

(1)

г е X /

где Ог - ущерб при нераспознавании г-й функции объекта, когда она имеет место; £у - затраты (по-

т

тери) при принятии у-й гипотезы, при этом предполагаем, что как потери при нераспознавании нескольких выполняемых объектом функций, так и затраты при принятии сразу нескольких гипотез суммируются. Величина кру имеет смысл предотвращенного при правильном принятии у-й гипотезы ущерба (0 < к < 1). Величина Ну(0 < Ну < 1), Ну = 1, определяет степень уменьшения уЩерба при выполнении объектом г-й функции за счет принятия у-й гипотезы. Такое уменьшение ущерба возможно, если действия, совершаемые при принятии у-й гипотезы, в какой-то мере являются общими и для объектов, выполняющих г-ю функцию.

Введенные предположения не являются самыми общими, но вполне логичны и позволяют довести решение до разумного конца.

Апостериорный риск, соответствующий введенной функции потерь, определяется как

Я ( Н, X) = X g(Х, Н ) ра (Х| X) = XX X ) +

где

х г е х

(2)

+ X gу - X НУ'ХРа(Х'1Х)

= XРгРа(г|х) + X йу gj - круXЩуРа(г|х)

у =1

(3)

г = 1

г = 1

йу =

1 при X НуРа( г | X)> Су,

г = 1

т

0 при X НуРа( г | X)< Су,

(4)

Су кв.'

Таким образом, в рассматриваемом случае, связанном с возможностью выполнения объектом наблюдения нескольких функций, правило принятия гипотез имеет тот же вид, что и при выполнении им только одной функции [1]. Однако здесь с прежними порогами сравниваются взвешенные суммы апостериорных вероятностей выполнения нескольких функций. Кроме того, усложняется вычисление апостериорных вероятностей Ра( у IX), так как

Ра (х ^)

Рх Д^)

т

XX РД (X)

+ X gj - у X НуРа(Х I X)

у = 1 I- х г еХ

где Ра(Х^) - апостериорная вероятность выполнения объектом наблюдения множества Х функций.

Выражение (2) может быть преобразовано следующим образом:

т

Я( Н, X) = X XРа(Х;^) +

г = 1 х

где Рх - априорные вероятности выполнения объектом множеств Хг-функций, Рх (X) - плотности вероятности наблюдений (признаков распознавания) X для объектов, выполняющих Хг-функций.

В результате Ра( у IX) =

X Рх.Рх, (X)

Х,_

т

XX РхДХ, (X)

г = 1 х,

где Хг - множество функций объекта, содержащее г-ю функцию, Ра( г IX) = XхРа (ХгIX) - апостериорная вероятность выполнения объектом г-й функции вне зависимости от того, с какими другими функциями она выполняется.

Из выражения (3) вытекает, что минимизация апостериорного риска достигается, если каждое значение йу выбирать следующим образом:

2. БАЙЕСОВСКОЕ и адаптивное БАЙЕСОВСКОЕ РЕШЕНИЯ ЗАДАЧИ

проверки гипотез с оценкой параметров

Решение задачи проверки гипотез, приведенное в предыдущем разделе, может быть обобщено на случай, когда, помимо принятия нескольких гипотез, необходимо оценить совокупность параметров объектов наблюдения, соответствующих принимаемым гипотезам.

Пусть по-прежнему Х - множество выполняемых объектом функций, а ах - вектор, определяющий параметры этого объекта. Тогда ограничимся случаем, в котором ущерб предотвращается только при правильном определении функции объекта, т.е. Ну = 0 при г = у, и введем функцию потерь

g(Х,aх, й, ан) = X Р(а г) +

г е Х

т

г = 1

+ Xйу gj(аау) -ку(ау, <ау)ву(ау

у = 1 V

у

1еХ J

Х

т

т

т

х

т

т

т

т

где аг - параметры, связанные с выполнением где Ах - пространство совокупности параметров объектом г-й функции, а¡ - оценки этих парамет- ах, Ау - пространство параметр°в ау, ров, (ки - оценки параметров объектов при принятии решения о выполнении им и-функций, 5гу -символ Кронекера. Смысл остальных введенных символов, так же как структура выражения (5), вытекает из вышеизложенного.

О(Х, х) = XОг(х), Ог(х) = |о; (а;)д;(а;|х)йа;,

г е X

Ра (у |х) = X Р¿X у\х) =

X ^ Н х)

Предполагаем, что потери при нераспознавании г-й функции объекта зависят от его параметров аг, а потери (затраты) при принятии решения о выполнении объектом у-й функции зависят от оценки параметров, связанных с этой функцией А\

(&у). Степень предотвращения ущерба, определя- Здесь а^ - совокупность параметров, соответст-емая коэффициентом ку, зависит от того, насколь- вующая 1множеству функций объекта X., содержа-

XX (х)

г X¡

Р%,(х) = | Рг,(х| аx1)д^О,)йax1.

ко велики ошибки в оценке параметров а,.

щему г-ю функцию, д^а^) - априорная плот-

Обозначим ду-(ау- |х) апостериорную плотность ность вероятности для этих параметров. вероятности параметров ау, а gx(ax|x) - апостери- Апостериорная плотность вероятности ду(ау |х) орную плотность вероятности совокупности па- определяется как раметров aX при выполнении объектом множества X-функций. Тогда апостериорный риск определяется как

ду (а у|х) =

ду (а у) ру (х| а у)

р (х)

где

Я(и,а и, х) = X} ЗЯ^, и, <а и) gx(аx| х) йах Ра(\\ х) =

X Ax

= X Ра (XI х О г(а г) д г (а г |х) йа ; +

X г е X А■

т

+ Xйу (ау)-XX5 iуРa(Xlх)

у = 1 X г е X

X

х 1 ку(ау, ау)Оу(ау)ду(ау|х)йау

(6)

8 у(а у) -

= XО^, х)Ра(XI х) + X йу

X у = 1

- X Ра( X у|х)} ку (а у, а у) Оу (а у) ду (а у | х) йа у

XУ Ау

= XО(к, х)Ра(XI х) +

X

т

■ X йу £у(ау) - Ра(у I х) 1 ку(ау, а) Оу(ау) ду(ау|х) йа

у = 1 Ау

Ру(х1а у) = X РxУРxУ (х1а у)'

Рxу (х| ау) = 1 px¡ (х| а^) дx¡ - у (аx) - у) йаx) - у,

ъ -у

Р] (х) = 1 Ру(х\ау) ду(ау) йау,

А

а^ - совокупность параметров при выполне-

} ^

нии объектом множества Xу■ - функций за вычетом параметров ау, А^ -у - пространство этих параметров, д^-у(а^ -.) - соответствующая им

} ^ } ^

плотность вероятности. Остальные обозначения введены выше.

Из выражения (6) вытекает, что оптимальное правило решений, минимизирующих апостериорный риск, имеет вид

й =

1 при Ра (х) >

0 при Ра(х) <

8у(&у)

1 ку(ау, а,у)Оу(а у)ду(а у\ х)йау

А

_£у(а)_

1 к у (а у, а у) О у (а у) ду (ау | х) йау

(7)

А

т

Оценки параметров akj должны выбирать из условия

(X j = argmin

(ft j

gj(a j) -

- Pa (j I x) J kj (a,j, cx j) Gj (aj) qj (a;-| x) daj

(8)

Следует заметить, что в большинстве практических задач функции qj (a j), Gj (aj) являются непрерывными, медленно изменяющимися по отношению к апостериорной плотности вероятности qj (<Xj |x), если только выборка x наблюдаемых признаков распознавания обладает достаточно высокой информативностью. При соблюдении этих условий решение (8) достигается практически в

точке maxqj (Оу |x), в которой и функция kj(aj', (kj) (a i)

близка к своему максимуму. Таким образом, параметры aj можно оценивать по максимуму апостериорной плотности вероятности. В случае же гладкости и большой ширины априорного распределения qj (<Xj) эта оценка практиче

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком