научная статья по теме ПОИСК ЦЕНТРА РАДУЖКИ НА ИЗОБРАЖЕНИИ МЕТОДОМ ХАФА С ДВУМЕРНЫМ ПРОСТРАНСТВОМ ПАРАМЕТРОВ Кибернетика

Текст научной статьи на тему «ПОИСК ЦЕНТРА РАДУЖКИ НА ИЗОБРАЖЕНИИ МЕТОДОМ ХАФА С ДВУМЕРНЫМ ПРОСТРАНСТВОМ ПАРАМЕТРОВ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2012, № 6, с. 44-51

РАСПОЗНАВАНИЕ ОБРАЗОВ И ОБРАБОТКА ИЗОБРАЖЕНИЙ

УДК 004.932.721, 51-76, 57.087.1

ПОИСК ЦЕНТРА РАДУЖКИ НА ИЗОБРАЖЕНИИ МЕТОДОМ ХАФА С ДВУМЕРНЫМ ПРОСТРАНСТВОМ ПАРАМЕТРОВ*

© 2012 г. И. ^ Матвеев

Москва, ВЦ РАН Поступила в редакцию 04.05.12 г.

Представлен алгоритм поиска приближенного положения центра радужки на изображении, использующий преобразование Хафа для окружности. Постановка задачи поиска только центра окружности (без определения радиуса) позволяет уменьшить размерность пространства параметров по сравнению с методами, определяющими и центр, и радиус. Кроме того, отказ от определения радиуса дает возможность одновременно задействовать в преобразовании Хафа точки и границы зрачка, и границы радужки, что повышает устойчивость метода, особенно на изображениях с зашумленным зрачком. Алгоритм был протестирован на более чем 95000 изображениях радужек из баз, находящихся в открытом доступе.

Введение. В последнее десятилетие биометрические системы, основанные на обработке изображения радужки глаза, развиваются быстрыми темпами. Важнейшей проблемой при создании таких систем является метод выделения области радужки на изображении. Основой этого выделения служит определение двух окружностей, аппроксимирующих контуры зрачка и радужки глаза. Разработано и практически применяется множество алгоритмов, решающих одну или обе эти задачи. Классический метод предложен Даугманом [1], использует интегродифференциаль-ный оператор, выделяющий радиально-симметричные структуры, имеет высокие точность и устойчивость, но обладает неприемлемой для большинства приложений вычислительной сложностью. Большое количество методов основано на бинаризации изображения с последующим выделением единственного [2] или наиболее подходящего [3—5] объекта в качестве зрачка. Выбор порога бинаризации осуществляется простым методом — как минимума яркости [2, 3, 5], исходя из предположения, что зрачок является наиболее темным объектом изображения, или из более тонкого анализа [4]. Все эти методы показывают хорошие результаты на изображениях с темным зрачком [6, 7], но неработоспособны на иных типах изображений [8, 9]. То же самое относится и к морфологическим методам обнаружения зрачка. Как простые способы, например, определение центра зрачка в качестве точки, наиболее удаленной от светлых областей [10], так и изощренные [11, 12] существенным образом полагаются на то, что зрачок — наиболее темный или хотя бы один из наиболее темных объектов изображения. Еще один значительный класс методов — использование различных видов преобразования Хафа для окружности: от прямого построения трехмерного (две координаты центра и радиус) аккумулятора, как предлагается в классической работе [13], до сложных методов с использованием градиентов [14], предобработки изображения с выделением его областей методами кластеризации [15], преобразования с разделенными аккумуляторами [16]. В целом методы, основанные на выделении границ, в том числе использующие преобразование Хафа, обладают несомненным преимуществом: для их корректной работы не требуются зрачок/радужка интегрально более темные, чем остальное изображение, достаточно лишь локального перепада яркости. Разработано множество других подходов: получение окружности зрачка как описанной окружности для наборов из трех точек (триангуляция) [17], использование активных контуров [18], классификаторов, в том числе Adaboost [19, 20], кратномасштабной обработки [21], в том числе вейвлетов [22], комбинации нескольких методов (например, основанного на выделении областей и на выделении границ) [23, 24].

Однако во всех публикациях, изученных автором, для проверки работоспособности алгоритма используют лишь одну, в лучшем случае — две базы изображений радужек. Каждая такая база содержит изображения одного типа. Как правило, используется база CASIA [6], как наиболее доступная и давно существующая. В этой базе зрачок располагается в центре изображения и в такой области (а часто и на всем изображении) является единственным значимым темным объектом.

* Работа выполнена при финансовой поддержке РФФИ (проект 12-07-00778).

Получить алгоритм, надежно определяющий его координаты и радиус, в этом случае не составляет труда. Базы изображений ND-IRIS [8], а в особенности UBI [9], авторами практически не используются. Следует также отметить, что практически все разработчики методов определения зрачка стремятся сразу (применением одного метода) решить задачу полностью, а именно найти все три параметра аппроксимирующей окружности (x0, y0, r), причем с окончательной точностью. Именно по этой причине большинство имеющихся методов непригодно для работы с изображениями UBI [9], на многих из которых граница зрачка имеет малую контрастность и высокий шум. Лишь в немногих работах [5, 12] используется отдельный метод для поиска лишь координат центра глаза (без определения радиуса зрачка), причем приближенно, для последующего уточнения другими методами. В данной статье предлагается именно такой подход: рассмотрен метод приближенного определения координат центра глаза. Метод основан на преобразовании Хафа как наиболее простом и устойчивом алгоритме, оперирующем с границами, а не областями. Важным свойством преобразования Хафа является также его высокая устойчивость к частичному закрытию объекта (зрачок/радужка закрыты веками/ресницами/бликами). Большинство упомянутых в обзоре подходов (морфология, отчасти классификаторы и активные контуры) имеют меньшую устойчивость к помехам.

1. Метод. Итак, алгоритм должен найти координаты (xc, yc) центра зрачка, задачи определить размер зрачка не ставится. Центр может быть вычислен приближенно, для того чтобы произвести уточнение на следующих шагах обработки. Благодаря такой постановке возможно привлечь для решения задачи не только границу зрачка, но и границу радужки, поскольку центры зрачка и радужки приблизительно совпадают, а их различающиеся радиусы не требуются. Алгоритм должен иметь малую вычислительную сложность (поскольку он является "добавочным" перед основным методом поиска зрачка), точнее, его сложность должна быть такова, чтобы его применение было оправдано снижением количества вычислений на основном этапе благодаря уменьшению области интереса. Данное требование для этого алгоритма, основанного на преобразовании Хафа, во многом удовлетворяется благодаря тому, что размерность аккумулятора снижена до двух (определяются только координаты) вместо трех (координаты и радиус), как это имеет место в других подходах, применяющих преобразование Хафа или аналоги [13, 15, 16, 25, 26].

Алгоритм исполняется как набор последовательных шагов.

Шаг 1. Вычисление градиента. Исходное изображение — дискретный растр X х Y пикселей. Обозначим его яркость b (x, y). Градиент яркости Vb (x, y) = g (x, y) = (gx (x, y), gy (x, y))T будем вычислять на дискретном растре как дискретную свертку gx (x,y) = SxNab(x, y), gy (x,y) = SyNab (x, y), где NCT — дискретное приближение гауссиана exp(-(x2 + y2)/2ü2) со среднеквадратичным отклонением

а = 4.0, Sx = (-1 0 1) и Sy = (1 0 -1) — маски для вычисления производной по направлению. Также на этом шаге рассчитывается норма градиента в каждом пикселе растра G(x, y) =

= (g2x(x, y) + g2y(x, y))12 и строится гистограмма распределения этой величины (округленной до целочисленных значений) Hg(l) = |{(x, y): \_G(x, y)J = l}|, которая используется на следующих шагах. Сложность этого шага алгоритма линейно зависит от числа пикселей растра, т.е. пропорциональна XY. Сложность построения гистограммы линейно зависит от диапазона аргумента l е

0; max |_G(x, y)J . Норма градиента не может превышать диапазона яркости изображения:

_ (x,y) J

G(x, y) < maxb(x,y) - minb(x,y), например, при использовании 8-битных изображений l е [0;255],

(x,y) (x,y)

что существенно меньше типичных значений XY.

Шаг 2. Выбор точек с высоким градиентом. Границами на изображении являются точки с высоким градиентом яркости. При дальнейшей обработке рассматриваются лишь они. Пороговое

значение градиента задается как T1 = max{2V2a, T15%], где a — величина среднеквадратичного отклонения яркости, вызванная шумом (если известна, в противном случае принимается равной нулю), T75% — значение градиента, такое, что 75% пикселей имеют меньший градиент, вычисляется как T75%:

T75%

X H (0 = 0.75Х Hg (0.

l = 0 l

Рис. 1. а — пример исходного изображения глаза; б — карта точек с высоким градиентом, выделенная на шаге 2

На рис. 1, б показаны такие пиксели для изображения рис. 1, а.

Шаг 3. Построение сигнального (голосующего) множества. Пространством параметров (аккумулятором) в алгоритме является пространство координат центра (xc, yc), совпадающее с пространством исходного изображения. Можно искать окружности произвольного радиуса (таким образом, голосовать будут и точки границы зрачка, и точки границы радужки), проводя лучи в аккумуляторе, так что каждый из лучей начинается в пикселе (x, y) и идет в направлении антиградиента яркости исходного изображения в этом пикселе: —Vb(x, y). Используемое множество пикселей определяется на шаге 2. Луч, идущий из точки (x, y) в направлении антиградиента, есть геометрическое место центров всевозможных гипотетических кругов, на границе которых лежит эта точка. Система таких лучей будет иметь сгущения в точках, являющихся центрами округлых темных областей, тем более выраженные, чем более такая область близка к кругу. Здесь радиусы дуг зрачка и радужки ограничены размерами изображения. Имеющий смысл диаметр радужки не может превышать размеров изображения: RM = 0.5 min {X,Y}. Поэтому вместо луча в пространстве параметров проводится отрезок. Назовем его сигнальным отрезком. Пиксели с большим градиентом яркости могут принадлежать как границе зрачка, так и границе радужки. Поэтому следовало бы проводить два сигнальных отрезка для учета обеих гипотез. Чтобы проголосовать за гипотезу о принадлежности точки границе радужки, отрезок должен покрывать все возможные размеры радужки, а значит составлять [Rm;RM], где Rm и RM — минимальное и максимальное

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком