научная статья по теме ОПТИМИЗАЦИЯ ВЫБОРА БИОМЕТРИЧЕСКОГО ЭТАЛОНА ИЗ ПОСЛЕДОВАТЕЛЬНОСТИ Кибернетика

Текст научной статьи на тему «ОПТИМИЗАЦИЯ ВЫБОРА БИОМЕТРИЧЕСКОГО ЭТАЛОНА ИЗ ПОСЛЕДОВАТЕЛЬНОСТИ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 3, с. 72-78

РАСПОЗНАВАНИЕ ОБРАЗОВ И ОБРАБОТКА ИЗОБРАЖЕНИЙ

УДК 004.932.721, 57.087.1

ОПТИМИЗАЦИЯ ВЫБОРА БИОМЕТРИЧЕСКОГО ЭТАЛОНА ИЗ ПОСЛЕДОВАТЕЛЬНОСТИ*

© 2015 г. А. Н. Гнеушев, Д. В. Ковков, И. А. Матвеев, В. П. Новик

Москва, ВЦ РАН, Iritech Inc. Поступила в редакцию 08.12.14 г., после доработки 19.12.14 г.

Рассмотрена задача выбора наилучшего биометрического эталона из группы, построенной по последовательности регистрируемых изображений. Предложен метод, основанный на анализе матрицы расстояний группы эталонов. Осуществлено сравнение со стандартным подходом, использующим признаки качества исходного изображения. Указано, что признаки качества изображения разрабатываются для задачи отбраковки плохих изображений и мало подходят для задачи выбора наилучшего изображения. Вычислительные эксперименты проведены на нескольких базах данных, находящихся в открытом доступе, общим объемом более 70 тыс. изображений. Тесты показывают, что предложенный метод дает несколько лучшее качество выбранных эталонов. При этом он не требует разработки дополнительных мер качества, а использует имеющееся вычисление расстояния.

DOI: 10.7868/S0002338815030075

Введение. Распознавание по изображениям радужной оболочки глаза в настоящее время является ведущей модальностью в автоматических биометрических системах [1, 2]. Системы идентификации по радужке имеют высокие показатели, применяются в проектах национального масштаба, апробируются на мобильных устройствах широкого класса, и в ближайшее время ожидается быстрый рост приложений [1]. Это делает актуальным дальнейшую разработку и исследование методов и алгоритмов, в том числе таких, которые используют не только известные общие подходы, изученные в системах распознавания лица, голоса и прочих модальностей, но и особенности работы систем регистрации изображений радужки.

Одной из таких особенностей является то, что при вводе изображения радужки в действительности обрабатывается последовательность многих изображений [3]. Вплоть до настоящего времени возможность использования последовательностей (не как набора изображений, но с учетом их взаимосвязей) не привлекала большого внимания. Даже в том случае, когда явным образом обрабатывается последовательность и строятся характеристики ее в целом, это чаще всего делается путем анализа составляющих изображений независимо друг от друга [4]. Работы, описывающие использование последовательностей, немногочисленны. Из интересных применений можно назвать публикацию [5], где предложена компоновка биометрического эталона из нескольких сегментов радужки, взятых на разных изображениях; работу [6], в которой рассмотрено применение процедур сверхразрешения для получения качественного изображения радужки из серии низкокачественных; использование последовательностей для определения живости глаза (защиты от подделок) [7]. Также предлагались методы формирования биометрических шаблонов с применением последовательностей изображений. Так, например, в [8, 9] предложено улучшать качество изображения радужной оболочки, используемого для формирования шаблона, построением некоторого "среднего" по нескольким изображениям, в [10] предложено улучшать качество шаблона с помощью оптимизации кода, выполняемой по серии изображений.

В основном обработка последовательностей производится с целью выбора наилучшего изображения для дальнейшего распознавания. Изображение глаза может быть малоконтрастным, за-шумленным или по иным причинам не содержать достаточно хорошей текстуры радужки, при этом из него может быть формально получен биометрический эталон, который будет порождать большое количество ошибок распознавания. Методы улучшения изображений [11] не во всех случаях способны восстановить текстуру. Поэтому требуются процедуры оценки качества используемых изображений, найденных характеристик радужки и полученных биометрических

* Работа выполнена при финансовой поддержке РФФИ (грант № 13-01-00866-а).

эталонов, с тем чтобы исключать из распознавания некачественные данные. Оценке качества изображений радужки посвящено большое количество работ, в том числе специально организованный тест [12]. Однако во всех работах, известных авторам, использующих последовательности для выбора наиболее качественного изображения, рассчитываются характеристики качества каждого отдельного изображения, а потом производится выбор наилучшего по тому или иному критерию [13—16]. По сути, такой подход мало отличается от обработки единичного изображения и отбраковки его в случае низкого качества. Более того, разработка критерия оценки качества изображения, который правильно ранжирует изображения, т.е. имеет более высокое значение для изображений, порождающих меньшее количество ошибок распознавания, является сложной проблемой. Задача выбора лучшего изображения для распознавания на основании такого критерия решена лишь отчасти [12]. С другой стороны, многие изображения, полученные устройством ввода в процессе регистрации, имеют достаточное качество для создания эталонов. В системах распознавания по радужке эталон может быть создан по единственному изображению, таким образом при регистрации можно получить последовательность нескольких эталонов. В статье предложен метод выбора наилучшего эталона по матрице взаимных расстояний между эталонами последовательности. Произведено сравнение со стандартно используемым методом выбора по качеству.

1. Процедура получения ошибки распознавания. В целях упрощения дальнейшего изложения определим процедуру получения ошибки распознавания по множеству или базе изображений. База B = {/1, ..., IM} содержит Мизображений I, принадлежащих Рперсонам. Каждой персонер,

р = 1, P принадлежит одно или более изображений, составляющих множество: Вр = {IPt1, ..., M },

так что £ Mp = М. Нумерация изображений может быть как сквозная одномерная по всей базе,

так и двумерная (персона, номер изображения персоны). По каждому изображению I может быть построен биометрический эталон Т(1). Эталоны сравниваются при помощи функции расстояния d(T, Tj). В данном подходе без ограничения общности можно говорить и о сравнении изображений: d(I, Ij) = d(T(I), T(I)). Сравнение двух изображений d(Ip , I j) называется собственным при р = q, т.е. если изображения принадлежат одной персоне, и чужим в противном случае. Все изображения базы попарно сравниваются между собой, всего происходит М2 сравнений. Можно рассчитать общее число собственных сравнений:

p

NSeif = |{( Ip, h Iq, j): p = q }| = £ Mp

p = i

и число чужих сравнений:

Nalien = I {(Ip, i, Iq, j): p Ф q } I = M2 - Nseif.

Без ограничения общности будем считать расстояние d нормированным к отрезку d е [0; 1]. Используя расстояние как классификатор и взяв порог © е [0; 1], можно определить количество собственных сравнений с расстоянием, большим или равным ©, т.е. число ошибок первого рода (false reject):

Npr(©) = |{( Ip, i, Ij: p = q, d(IPt,, IqJ)>©}\,

количество чужих сравнений с расстоянием, меньшим или равным ©, т.е. число ошибок второго рода (false accept):

Npa(©) = |{( Ip, i, Ij: p ф q, d(IpJ, IqJ)<©}\, и относительные ошибки первого и второго рода:

Epr© = , Epa© = N©-. (1.1)

Ns elf Nalien

Назовем параметрической кривой ошибок (Detection Error Tradeoff, DET-curve) ломаную, проведенную через точки (EFR(©), EFA(©)). По построению

Epr( 0) = 1, Epr( 1) = 0, Epa( 0) = 0, Epa( 1) = 1.

Поэтому существует значение

©EER : EPR(©EER) = EPA(©EER) , (1.2)

S(©Q) =

в котором достигается равная величина относительных ошибок первого и второго рода, эквивалентная ошибка. Эту величину примем как характеристику качества функции расстояния d (а также, в некотором смысле, описанном ниже — качества выбора базы). Случай, когда для некоторого порога © все собственные сравнения дают меньшее расстояние, а все чужие — большее, называется полной разделимостью и принимается Eeer = Efr(©) = EFA(©) = 0. Итак, по базе изображений В генерируются эталоны, функцией d производится их попарное сравнение, строятся зависимости (1.1) и вычисляется ошибка (1.2), что составляет процедуру получения ошибки распознавания (ПОР), которую можно записать как Eeer(B, d).

2. Выбор по качеству. В основных работах, посвященных качеству радужки, равно как в тесте [12], решается задача отбраковки изображений, формулируемая следующим образом: требуется исключить (отбраковать) изображения, по которым строятся эталоны, дающие большое количество ошибок распознавания. Важным условием такой отбраковки является то, что должно быть исключено как можно меньшее количество изображений. Такая постановка отличается от задачи выбора одного наилучшего изображения из последовательности. Поэтому методы оценки качества, оптимизированные для задачи отбраковки, могут не давать хорошего решения задачи выбора. Однако имеющиеся в настоящее время исследования никак не акцентируют внимание на этой проблеме, а просто используют критерии качества, полученные для задачи отбраковки, в задаче выбора.

Для оценки метода отбраковки применяется следующая процедура. Пусть необходимо определить результативность использования отбраковки по численному показателю качества Q(I). Моделируется работа системы, использующей показатель качества Q(I) с порогом ©q, т.е. из базы удаляются все изображения I, для которых Q(I) < ©q:

B ( Tq) = B\ {Im: Q(Im)<©Q }.

Для полученного подмножества В проводится процедура ПОР и вычисляется Eeer(B(©q)), зависящее от порога. Также от порога зависит доля удаленных из базы данных изображений

I B - | B ( © Q ) I

в .

Варьируя значение ©Q, можно построить параметрическую кривую зависимости ошибки классификации от доли отброшенных изображений

E(S) = {(S(©q), E(©q))}. (2.1)

Рассмотрим пару эталонов одной персоны: Tp, j и Tp,, дающих собственное сравнение с расстоянием d(Tp, j, Tp,j). Для этой пары можно определить количество чужих сравнений с меньшим или равным расстоянием, т.е. ошибок второго рода:

a (p, i, j) = |{ q, r, k, l} : d( T , T j) > d( T k, T ,), q Ф r|,

_ _ (2.2)

k = 1, Mq, l = 1, Mr.

Для j-го изображения персоны p можно определить о

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком