РАДИОТЕХНИКА И ЭЛЕКТРОНИКА, 2004, том 49, № 9, с. 1066-1072
СТАТИСТИЧЕСКАЯ РАДИОФИЗИКА
УДК 621.391.01
РАСПОЗНАВАНИЕ ОБЪЕКТОВ, ОДНОВРЕМЕННО ПРИНАДЛЕЖАЩИХ НЕСКОЛЬКИМ КЛАССАМ © 2004 г. Ю. Г. Рындин, Г. П. Тартаковский, В. С. Тшрин
Поступила в редакцию 01.03.2004 г.
Рассмотрена задача многоальтернативного распознавания многофункциональных объектов с допущением неоднозначных решений в случае, когда распознаваемые объекты могут одновременно принадлежать к нескольким классам (выполнять несколько разных функций). Получены байесовское решение задачи и решения при различных видах неопределенности: параметрической априорной неопределенности, неизвестных коэффициентах функции потерь с распространением критерия Неймана-Пирсона на многоальтернативную задачу, непараметрической априорной неопределенности с использованием классифицированной обучающей выборки. В условиях априорной неопределенности предложены новая характеристика и показатель качества распознавания.
ВВЕДЕНИЕ
В работах [1-3] найдены байесовское и адаптивное байесовское решения задачи проверки многоальтернативных гипотез в предположении, что в действительности имеет место одна из них (объект наблюдения относится к одному классу), а данные наблюдения (сигналы) недостаточно информативны, чтобы выбрать лишь одну гипотезу, и поэтому допускается принятие нескольких альтернатив. При этом предполагали, что функция потерь, соответствующая описанной ситуации, известна, а априорная неопределенность, если и существует, то относится лишь к законам распределения для наблюдаемых сигналов. Найдены байесовские решения при наблюдении как при наличии выборок фиксированного объема, так и в рамках процедуры последовательного анализа.
Существуют, однако, задачи, в которых объект наблюдения может относиться сразу к нескольким классам. Так, например, при наблюдении радиолокационными и оптическими средствами спутников (космических объектов) оказывается, что некоторые спутники выполняют сразу несколько задач; при автоматической медицинской диагностике заболеваний встречаются случаи, когда у больного может быть сразу несколько заболеваний; при выявлении экономической ситуации на бирже для определения оптимальной стратегии поведения следует учитывать возможность наличия сразу нескольких ситуаций и т.д. Кроме того, часто встречаются задачи, связанные с различными ситуациями и соответствующими решениями, в которых очень трудно определить функцию потерь. Это имеет место при недостаточной изученности последствий, связанных с различными действиями, а также стоимости самих действий.
При этом уже нельзя использовать байесовские решения, минимизирующие потери в среднем, и следует применять иные критерии оптимальности.
Задачам нахождения оптимальных алгоритмов проверки многоальтернативных гипотез в указанных более сложных условиях, чем рассмотренные ранее, посвящена данная работа.
1. БАЙЕСОВСКОЕ РЕШЕНИЕ ЗАДАЧИ ПРОВЕРКИ МНОГОАЛЬТЕРНАТИВНЫХ ГИПОТЕЗ ДЛЯ ОБЪЕКТОВ НАБЛЮДЕНИЯ, ОТНОСЯЩИХСЯ К НЕСКОЛЬКИМ КЛАССАМ
Обозначим г номера классов объектов (г = = 1, т), а у - номера принимаемых или отвергаемых гипотез (у = 1, т). Будем предполагать, что наблюдается выборка х, где х - совокупность наблюдаемых признаков распознавания. Допустим, что наблюдаемый объект относится к множеству классов X, т.е. X = {гх, , ..., } - некоторое
множество из 1, т .
Обозначим йу = 1 решение о принадлежности объекта к у'-му классу, йу = 0 - противоположное
решение. Множество й = {у': йу = 1} есть приписываемые объекту классы задач (функций).
Тогда уместно ввести следующую функцию потерь:
£(К й) = X О + X %'- кО'Х
' = 1 V
г е X
(1)
г е X /
где Ог - ущерб при нераспознавании г-й функции объекта, когда она имеет место; £у - затраты (по-
т
тери) при принятии у-й гипотезы, при этом предполагаем, что как потери при нераспознавании нескольких выполняемых объектом функций, так и затраты при принятии сразу нескольких гипотез суммируются. Величина кру имеет смысл предотвращенного при правильном принятии у-й гипотезы ущерба (0 < к < 1). Величина Ну(0 < Ну < 1), Ну = 1, определяет степень уменьшения уЩерба при выполнении объектом г-й функции за счет принятия у-й гипотезы. Такое уменьшение ущерба возможно, если действия, совершаемые при принятии у-й гипотезы, в какой-то мере являются общими и для объектов, выполняющих г-ю функцию.
Введенные предположения не являются самыми общими, но вполне логичны и позволяют довести решение до разумного конца.
Апостериорный риск, соответствующий введенной функции потерь, определяется как
Я ( Н, X) = X g(Х, Н ) ра (Х| X) = XX X ) +
где
х г е х
(2)
+ X gу - X НУ'ХРа(Х'1Х)
= XРгРа(г|х) + X йу gj - круXЩуРа(г|х)
у =1
(3)
г = 1
г = 1
йу =
1 при X НуРа( г | X)> Су,
г = 1
т
0 при X НуРа( г | X)< Су,
(4)
Су кв.'
Таким образом, в рассматриваемом случае, связанном с возможностью выполнения объектом наблюдения нескольких функций, правило принятия гипотез имеет тот же вид, что и при выполнении им только одной функции [1]. Однако здесь с прежними порогами сравниваются взвешенные суммы апостериорных вероятностей выполнения нескольких функций. Кроме того, усложняется вычисление апостериорных вероятностей Ра( у IX), так как
Ра (х ^)
Рх Д^)
т
XX РД (X)
1х
+ X gj - у X НуРа(Х I X)
у = 1 I- х г еХ
где Ра(Х^) - апостериорная вероятность выполнения объектом наблюдения множества Х функций.
Выражение (2) может быть преобразовано следующим образом:
т
Я( Н, X) = X XРа(Х;^) +
г = 1 х
где Рх - априорные вероятности выполнения объектом множеств Хг-функций, Рх (X) - плотности вероятности наблюдений (признаков распознавания) X для объектов, выполняющих Хг-функций.
В результате Ра( у IX) =
X Рх.Рх, (X)
Х,_
т
XX РхДХ, (X)
г = 1 х,
где Хг - множество функций объекта, содержащее г-ю функцию, Ра( г IX) = XхРа (ХгIX) - апостериорная вероятность выполнения объектом г-й функции вне зависимости от того, с какими другими функциями она выполняется.
Из выражения (3) вытекает, что минимизация апостериорного риска достигается, если каждое значение йу выбирать следующим образом:
2. БАЙЕСОВСКОЕ и адаптивное БАЙЕСОВСКОЕ РЕШЕНИЯ ЗАДАЧИ
проверки гипотез с оценкой параметров
Решение задачи проверки гипотез, приведенное в предыдущем разделе, может быть обобщено на случай, когда, помимо принятия нескольких гипотез, необходимо оценить совокупность параметров объектов наблюдения, соответствующих принимаемым гипотезам.
Пусть по-прежнему Х - множество выполняемых объектом функций, а ах - вектор, определяющий параметры этого объекта. Тогда ограничимся случаем, в котором ущерб предотвращается только при правильном определении функции объекта, т.е. Ну = 0 при г = у, и введем функцию потерь
g(Х,aх, й, ан) = X Р(а г) +
г е Х
т
г = 1
+ Xйу gj(аау) -ку(ау, <ау)ву(ау
у = 1 V
у
1еХ J
Х
т
т
т
х
т
т
т
т
где аг - параметры, связанные с выполнением где Ах - пространство совокупности параметров объектом г-й функции, а¡ - оценки этих парамет- ах, Ау - пространство параметр°в ау, ров, (ки - оценки параметров объектов при принятии решения о выполнении им и-функций, 5гу -символ Кронекера. Смысл остальных введенных символов, так же как структура выражения (5), вытекает из вышеизложенного.
О(Х, х) = XОг(х), Ог(х) = |о; (а;)д;(а;|х)йа;,
г е X
Ра (у |х) = X Р¿X у\х) =
X ^ Н х)
Предполагаем, что потери при нераспознавании г-й функции объекта зависят от его параметров аг, а потери (затраты) при принятии решения о выполнении объектом у-й функции зависят от оценки параметров, связанных с этой функцией А\
(&у). Степень предотвращения ущерба, определя- Здесь а^ - совокупность параметров, соответст-емая коэффициентом ку, зависит от того, насколь- вующая 1множеству функций объекта X., содержа-
XX (х)
г X¡
Р%,(х) = | Рг,(х| аx1)д^О,)йax1.
ко велики ошибки в оценке параметров а,.
щему г-ю функцию, д^а^) - априорная плот-
Обозначим ду-(ау- |х) апостериорную плотность ность вероятности для этих параметров. вероятности параметров ау, а gx(ax|x) - апостери- Апостериорная плотность вероятности ду(ау |х) орную плотность вероятности совокупности па- определяется как раметров aX при выполнении объектом множества X-функций. Тогда апостериорный риск определяется как
ду (а у|х) =
ду (а у) ру (х| а у)
р (х)
где
Я(и,а и, х) = X} ЗЯ^, и, <а и) gx(аx| х) йах Ра(\\ х) =
X Ax
= X Ра (XI х О г(а г) д г (а г |х) йа ; +
X г е X А■
т
+ Xйу (ау)-XX5 iуРa(Xlх)
у = 1 X г е X
X
х 1 ку(ау, ау)Оу(ау)ду(ау|х)йау
(6)
8 у(а у) -
= XО^, х)Ра(XI х) + X йу
X у = 1
- X Ра( X у|х)} ку (а у, а у) Оу (а у) ду (а у | х) йа у
XУ Ау
= XО(к, х)Ра(XI х) +
X
т
■ X йу £у(ау) - Ра(у I х) 1 ку(ау, а) Оу(ау) ду(ау|х) йа
у = 1 Ау
Ру(х1а у) = X РxУРxУ (х1а у)'
XУ
Рxу (х| ау) = 1 px¡ (х| а^) дx¡ - у (аx) - у) йаx) - у,
ъ -у
Р] (х) = 1 Ру(х\ау) ду(ау) йау,
А
а^ - совокупность параметров при выполне-
} ^
нии объектом множества Xу■ - функций за вычетом параметров ау, А^ -у - пространство этих параметров, д^-у(а^ -.) - соответствующая им
} ^ } ^
плотность вероятности. Остальные обозначения введены выше.
Из выражения (6) вытекает, что оптимальное правило решений, минимизирующих апостериорный риск, имеет вид
й =
1 при Ра (х) >
0 при Ра(х) <
8у(&у)
1 ку(ау, а,у)Оу(а у)ду(а у\ х)йау
А
_£у(а)_
1 к у (а у, а у) О у (а у) ду (ау | х) йау
(7)
А
т
Оценки параметров akj должны выбирать из условия
(X j = argmin
(ft j
gj(a j) -
- Pa (j I x) J kj (a,j, cx j) Gj (aj) qj (a;-| x) daj
(8)
Следует заметить, что в большинстве практических задач функции qj (a j), Gj (aj) являются непрерывными, медленно изменяющимися по отношению к апостериорной плотности вероятности qj (<Xj |x), если только выборка x наблюдаемых признаков распознавания обладает достаточно высокой информативностью. При соблюдении этих условий решение (8) достигается практически в
точке maxqj (Оу |x), в которой и функция kj(aj', (kj) (a i)
близка к своему максимуму. Таким образом, параметры aj можно оценивать по максимуму апостериорной плотности вероятности. В случае же гладкости и большой ширины априорного распределения qj (<Xj) эта оценка практиче
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.