научная статья по теме ИЗВЛЕЧЕНИЕ АДАПТИВНЫХ ПРИЗНАКОВ ДЛЯ ГЕНДЕРНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ ЛИЦ ЛЮДЕЙ Математика

Текст научной статьи на тему «ИЗВЛЕЧЕНИЕ АДАПТИВНЫХ ПРИЗНАКОВ ДЛЯ ГЕНДЕРНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ ЛИЦ ЛЮДЕЙ»

ПРОГРАММИРОВАНИЕ, 2014, No 4, с. 74-82

КОМПЬЮТЕРНАЯ ГРАФИКА -

УДК 681.3.06

ИЗВЛЕЧЕНИЕ АДАПТИВНЫХ ПРИЗНАКОВ ДЛЯ ТЕНДЕРНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ ЛИЦ

ЛЮДЕЙ

© 2014 г. В.В. Хрящев, J1.A. Шмаглит, A.J1. Приоров, A.M. Шемяков

Ярославский государственный университет им. П. Г. Демидова 15000 Ярославль, ул. Советская, 14 E-mail: vhr@yandex.ru, shmaglit@yahoo.com, andcat@yandex.ru, andrey.shemiakov@gmail. com Поступила в редакцию 17.01.2014

Описан алгоритм автоматического распознавания пола людей по изображению лица, основанный на методах машинного обучения. Синтезированный алгоритм состоит из двух этапов: извлечение адаптивных признаков, классификация методом опорных векторов. Проведен сравнительный анализ работы предложенного алгоритма, представлена методика его обучения и тестирования.

1. ВВЕДЕНИЕ

Работа посвящена разработке системы, различающей людей на изображениях по тендерному признаку (разбиение на два класса: "мужчины", "женщины"). Подобные системы находят широкое применение в различных областях: робототехнике, интерфейсах взаимодействия человек-компьютер, системах сбора и оценки демографических показателей, видеонаблюдении, системах интеллектуального представления информации с цифровых носителей, и многих других. К примеру, распознавание пола может использоваться как первый этап при решении задачи идентификации личности. Методы машинного обучения [1], применяемые при построении тендерных классификаторов, носят универсальный характер, что позволяет использовать разработки в области распознавания пола в системах понимания изображений [2] для решения задач классификации любых других объектов.

Существуют всеобъемлющие сравнительные исследования методов распознавания лиц на изображениях [3], методов обнаружения лиц [4, 5], а также методов распознавания выражения лица [6]. Задача распознавания пола на сегодняшний день менее изучена. Сравнительный анализ тендерных классификаторов,

предложенных за последнее время, приведен в работе [7]. Существуют подходы, основанные на нейронных сетях [8], на комбинации вейвлетов Габора и метода главных компонент [9], на анализе независимых компонент и линейном дискриминантном анализе (ЛДА) [10-12]. В работе [13] используется генетический алгоритм для генерации признаков и классификатор на базе метода опорных векторов (MOB) [14]. В работе [15] были предложены локальные бинарные признаки в комбинации с обучающей процедурой AdaBoost [16]. Алгоритм на основе сетей радиальных базисных функций и индуктивных решающих деревьев описан в работе [17].

Предлагаемый алгоритм распознавания пола основан на классификаторе MOB в комбинации с ядерным преобразованием на базе радиальных базисных функций. Для извлечения информации и уменьшения размерности предлагается алгоритм генерации адаптивных признаков, обучение которого осуществляется посредством процедуры оптимизации в соответствии с принципом ЛДА. Для организации полностью автоматической системы распознавание пола используется совместно с алгоритмом выделения лиц на базе бустинга, который отбирает кандидатов для анализа [18, 19]. Выделенные фрагменты подвергаются предобработке для приведения их

ИЗВЛЕЧЕНИЕ АДАПТИВНЫХ ПРИЗНАКОВ ДЛЯ ТЕНДЕРНОЙ КЛАССИФИКАЦИИ 75

С Решение (мужчина/женщина) j

Рис. 1. Схема работы алгоритма АП-МОВ.

к единому разрешению и яркостным характеристикам.

Вначале рассмотрена схема работы предлагаемого алгоритма, в следующем разделе приведена методика его обучения и тестирования, и, наконец, представлены результаты сравнения предлагаемого алгоритма с классическими алгоритмами гендерной классификации.

2. ОПИСАНИЕ ПРЕДЛАГАЕМОГО АЛГОРИТМА

Классификатор строится на базе адаптивных признаков и метода опорных векторов (АП-МОВ). Схема его работы приведена на рис. 1.

Алгоритм АП-МОВ включает в себя следующие шаги: преобразование цветового пространства, масштабирование, вычисление

набора адаптивных признаков, классификацию методом опорных векторов с применением ядерного преобразования. Входное изображение ARGy преобразуется из пространства RGB в цветовое пространство HSV и масштабируется до фиксированного разрешения N х N. Далее вычисляется набор признаков {77HSV }, при этом i-ый признак вычисляется как сумма по строкам и столбцам поэлементного произведения матрицы изображения на матрицу коэффициентов CHSV размерностью N х N, получаемую при обучении:

nHSV =

У , У , АнхN х C

HSV

N N

К полученному вектору признаков применяется ядерное преобразование с использованием

радиальной базисной функции Гаусса:

k(z1,z2) = C exp

-I|zi - Z2I

и

Параметры функции - c и а определяются на этапе обучения. Преобразованный вектор служит входом для линейного классификатора на базе MOB с решающим правилом:

f (Ю = sgn ^Уг, к(Х,П) + ^ .

Набор опорных векторов {Хг}, а также наборы коэффициентов y г, а% и смещен ие b определяются во время обучения классификатора.

3. МЕТОДИКА ОБУЧЕНИЯ И ТЕСТИРОВАНИЯ

Для осуществления обучения и тестирования классификатора необходима достаточно объемная база полноцветных изображений. Существует общепринятая база данных для распознавания лиц - FERET [20], однако, она содержит недостаточное количество лиц различных людей, поэтому нами была составлена собственная база, набранная из различных источников (табл. 1).

На каждом изображении из собственной базы алгоритмом на базе бустинга были выделены лица. Затем вручную были удалены ложные выделения и сформирована база выделенных фрагментов, содержащая 10500 изображений (по 5250 на каждый класс). Эта база была разделена на три независимых выборки: обучающую, контрольную и тестовую. Обучающая выборка использовалась для генерации признаков и построения классификатора на базе MOB. Контрольная выборка была необходима для того, чтобы избежать эффекта переобучения в процессе оптимизации параметров ядерной функции. Проверка работы обученного классификатора осуществлялась с использованием тестовой выборки.

Обучение классификатора АП-МОВ содержало в себе два независимых этапа: генерация признаков, формирование и оптимизация классификатора на базе MOB. Рассмотрим процедуру генерации признаков. Она состоит из следующих основных шагов:

преобразование цветового пространства обучающих фрагментов RGB ^ HSV (далее все операции выполняются независимо для каждой цветовой компоненты);

масштабирование обучающих фрагментов до единого разрешения N х N;

генерация по случайному закону матрицы коэффициентов CHSV;

вычисление значения признака П каждого обучающего фрагмента;

HSV

для

вычисление целевой функции оптимизации как отношения квадрата разности средних значений признака, вычисленных для наборов обучающих изображений "мужчин" и "женщин", к сумме их дисперсий [21]:

F =

№ HSV Im ) - (^ HSV U)2 и{П HSV )м + и{П HSV )ж '

далее в цикле итеративно (до достижения фиксированного максимального числа итераций): генерация по случайному закону матрицы С!ЗУ внутри фиксированной окрестности матрицы С!

HSV

вычисление

HSV

признака П^ для каждого обучающего фрагмента и вычисление целевой функции Ё, переход в новую точку (Ё ^ Ё, С ^ С), если Ё > Ё;

• сохранение по истечении некоторого заданного числа итераций матрицы коэффициентов СН8У; переход к генерации следующего (¿+1-ого) признака.

Представленная процедура оптимизации позволяет извлекать из изображения только ту информацию, которая необходима для разделения классов. При этом признаки, имеющие большее значение целевой функции Ё, обладают большей разделяющей способностью. Настраиваемыми параметрами при генерации признаков являются: разрешение обучающих изображений число обучающих изображений (М), максимальное число итераций (Т). Эмпирически были получены следующие значения, как компромисс между достигаемой разделяющей способностью и скоростью обучения:

N = 65; М = 400; Т = 105.

2

ИЗВЛЕЧЕНИЕ АДАПТИВНЫХ ПРИЗНАКОВ ДЛЯ ТЕНДЕРНОЙ КЛАССИФИКАЦИИ 77 Таблица 1. Параметры предлагаемой обучающей и тестовой базы

Параметр Значение

Общее количество изображений 8 654

Число лиц мужчин 5 250

Число лиц женщин 5 250

Минимальное разрешение изображений 640 х 480

Формат цветового пространства RGB

Положение по отношению к камере фронтальное

Возраст людей от 18 до 65 лет

Раса европеоидная

Освещение, фон, выражение лица требования не предъявляются

Рис. 2. Зависимость уровня верного распознавания от параметров ядерной функции Гаусса: C = 10 k1 и а = 10k2.

Было обучено но 1000 признаков для каждой цветовой компоненты. На втором этане обучения эти признаки извлекались из обучающих изображений и подавались на вход классификатора MOB. При этом методика обучения классификатора включала в себя:

• вычисление набора признаков, сгенерированных на первом этапе, для каждого из обучающих фрагментов;

щем наборе изображений с различными параметрами ядерной функции;

Рис. 3. Зависимость уровня распознавания от параметров процедуры обучения.

• вычисление уровня верного распознавания (Б) по валидационной выборке;

(максимизирующих Б);

с найденными оптимальными параметрами ядра.

Целью этапа формирования классификатора является нахождение решения, обладающих) большей обобщающей способностью, то есть имеющих) минимальную ошибку классификации. Настраиваемыми параметрами являются: число признаков (Ж2), число обучающих изображений (М2), параметр ядра а, параметр ядра с.

Для нахождения оптимальных параметров ядра использовался алгоритм поиска по сетке:

Рис. 4. ROC-кривыо тестируемых алгоритмов распознавания пола.

Рис. 5. ROC-кривыо для алгоритма АП-MÜB при различном объеме обучающей выборки.

классификатор MOB был обучен с C = 10k1 и а = 10k2, где kl и k2 — целые числа; для обучения были использованы все комбинации kl и k2 в интервале [-15 ... 15]; при этом измерялся уровень верного распознавания с использованием валидационной выборки. Результаты поиска оптимальных значений C и а представлены на рис. 2.

Максимальный уровень верного распознавания (порядка 80%) был получен для параметров со значениями: C = 106; а = 108.

Кроме того было проведено исследование зависимости результатов распознавания от количества признаков, извлекаемых из изобра

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком