научная статья по теме МЕТОДЫ БИНАРИЗАЦИИ ИЗОБРАЖЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «МЕТОДЫ БИНАРИЗАЦИИ ИЗОБРАЖЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ»

Пивторацкая С.В., аспирант Национального исследовательского ядерного университета «МИФИ»

МЕТОДЫ БИНАРИЗАЦИИ ИЗОБРАЖЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ

THE BINARIZATION METHODS IN THE PROBLEMS OF PATTERN RECOGNITION

Данная статья посвящена методам бинаризации цифровых изображений. В ней проводится систематизация распространенных способов получения бинарных изображений. Описываются перспективы использования этих изображений в дальнейшем с учетом специфики решения практических задач распознавания образов.

Ключевые слова: бинаризация изображений, пороговая фильтрация, нелинейная фильтрация, морфологические операции, бинарное изображение, задача распознавания образов.

This paper describes the methods for binarization of digital images. The classification of the prevalent binarization techniques of the binary images' receiving is carried out here. Future trends of the using of these images are described with attention to details of the pattern recognition in practical problems' decision.

Keywords: image binarization, threshold filtering, nonlinear filtering, morphologic operations, binary image, problem of pattern recognition.

В настоящее время в задачах обработки изображений и распознавания образов активно используются многоцветные и полутоновые цифровые изображения. На начальном этапе распознавания объектов к таким изображениям явно или неявно применяется бинаризацию, то есть процесс приведения изображения к бинарному виду.

Цифровое изображение можно представить в виде дискретной двумерной функции яркости I(i,j), которая зависит от отсчетов i, j на плоскости изображения. Каждый элемент (i,j) называется элементом изображения или пикселем. Процесс бинаризации делит исходный массив разноцветных пикселей на два множества: множество пикселей, принадлежащих к объектам, или значимых пикселей, и множество пикселей, относящихся к фону, - фоновых пикселей.

Бинарные изображения (БИ), полученные с помощью различных методов бинаризации, можно разделить на следующие типы:

- БИ с областями, которые содержат значимые пиксели, сгруппированные в области на изображении;

- БИ с контурами, на которых выделены границы объектов;

- БИ, на которых после бинаризации остаются «скелеты» объектов;

- преобразованные БИ различного рода, например, с использованием преобразования Фурье и др.

Одним из наиболее распространенных методов бинаризации, который используется для получения БИ с областями, является пороговая фильтрация изображения. Согласно этому методу разделение пикселей изображения на множества значащих и фоновых пикселей производится посредством заданного порога бинаризации. Получим отфильтрованное изображение I'(i,j), применив к цифровому изображению I(i,j) фильтр f(i,j):

I'(i, j) = I(i, j) ■ f(i, j), где фильтр f(i, j) = {1, если I0, j) >1порог . (1)

[0 иначе

Для каждой конкретной задачи формируется правило фильтрации, а также определяется значение порога бинаризации 1порог. Существует несколько способов нахождения порога [12].

Первым и наиболее распространенным способом является использование предварительно вычисленного среднего значения интенсивности всех пикселей:

п-1 т-1

Ц/а л

I = ^^-, (2)

порог. > \ /

п ■ т

где п, т - количество пикселей по вертикали и по горизонтали соответственно.

Следующий способ использует гистограмму распределения яркостей исходного изображения:

И(1г)=ыг, (3)

где 1г - г-ый уровень яркости, Ыг - количество пикселей изображения, имеющих яркость

/г, г = О, Я -1, (Я-1) - максимальная яркость на изображении. Тогда в качестве 1порог выступает наивысший локальный минимум на полученной гистограмме. Для каждого нового изображения гистограмма строится заново, а порог пересчитывается с учетом ее обновленных характеристик.

Возможен третий способ, при котором от сформированной гистограммы изображения отсекается часть пикселей, предположительно принадлежащая обнаруживаемому объекту. Количество отсекаемых пикселей Ыэксп, вычисляется, как

Кт.= , (4)

к=0 к=0

где кэксп. - коэффициент, экспериментально выбираемый в зависимости от свойств объекта. Тогда на основе уравнения (4) определяется количество пикселей N2, имеющих яркость I2, следовательно, порог бинаризации находится как

Iпорог = 12 = * (N2 ) , (5)

где И (N2 ) - функция, обратная функции И(12).

Многообразие способов выбора порога бинаризации изображения обеспечивает существенную вариантность при решении практических задач. Так, в задаче высокоточной ориентации по цифровым изображениям участков звездного неба использование пороговой бинаризации позволило значительно повысить скорость анализа изображений на наличие звезд, а варьирование порога оказало решающее значение на достижение требуемого качества идентификации найденных звезд [8].

При работе с областями, имеющими нечеткие границы, пороговая фильтрация может искажать реальные контуры объектов. Варьирование порога бинаризации может оказаться верным решением только в некоторых случаях. Поэтому часто для уточнения границ объектов, выделенных на изображении с помощью пороговой фильтрации, применяются морфологические операции «эрозия» или «дилатация». Применение подобных морфологических операций максимально эффективно при бинаризации изображений отсканированных документов [5-6].

Эрозия или сужение (© - операция эрозии) используется в том случае, когда необходимо уточнить контуры черных объектов. Она также устраняет светлые шумовые пиксели на черном фоне, часть из которых может представлять собой шумы матрицы ПЗС (прибор с зарядовой связью), часть - шумы аналого-цифрового преобразователя и др.

Дилатация, т.е. расширение (Ф - операция дилатации), позволяет уточнять контуры светлых объектов, а также удалять изолированные черные пиксели на светлом фоне.

Альтернативой пороговой фильтрации при формировании БИ с областями является использование таких методик, как метод Отса, метод Бернсена, метод Эйквеля, метод Ниблэка, а также метод Яновица и Брукштейна [1-3]. Они основаны на работе с гистограммами, а также с контурными фильтрами Собеля и Прюитта.

В том случае, если из исходного многоцветного изображения требуется получить БИ с контурами, можно использовать пороговую фильтрацию в совокупности с «оконтуривани-ем». Различают «внутреннее оконтуривание», которое представляет собой поочередное применение эрозии и вычитание преобразованного изображения из исходного: А - (А0В), где А - преобразуемое изображение, В - единичная матрица размером 3*3; а также «внешнее оконтуривание», предусматривающее поочередное применение дилатации и вычитание исходного изображения из преобразованного: (А Ф В) - А . Результатом этих операций являются однопиксельные контуры всех объектов на изображении. Данная совокупность операций была с успехом применена в задаче идентификации человека по чертам лица для определения положения и ориентации глаз [7].

Другим вариантом получения БИ с контурами из цветных изображений является нелинейная фильтрация. В ее основе лежит приближение к дифференциальным операторам с помощью формирования разностей соседних элементов цифрового изображения [4]. Наиболее простым из таких операторов является оператор Робертса, где используется перемещающееся по изображению окно размерности 2*2 вида:

f^, ] А1+1

1г+\, ] 1г+\, 1+1

Распространенный взвешенный градиентный оператор с размером окна 3х3 - оператор Собеля:

(6)

Ji-l,j-l i-l,j Ji-l, j+l

fi, j-l fu gi,j+l

fi+l, j-l Ui+l,j gi+l,j+l

(7)

Центральному (1,])-му пикселю вместо /¡,1 присваивается значение яркости = (х2 + У2 )1/2 либо = |Х| +|У|, где

(8)

X — [fi-l,j-l + 2fi-\,j + f-l,j+l)- U+W-l + 2 fi+l,j + f+lj+l)

Y — i/i-l, j-l + 2fi,j-l + fi+l,j-l i/i'-l,j+l + 2fi,j+1 + fi+l,j+l )

Приведенные выше методы бинаризации цифровых изображений позволяют выделить на исходном изображении интересующие объекты, устранить присутствующие шумовые наложения, а также получить контуры объектов, подготовив, таким образом, цифровое изображение к распознаванию образов.

ЛИТЕРАТУРА

1. Прэтт У. Цифровая обработка изображений. В 2 т. - М: Мир, l982.

2. Форсайт Д.А., Понс Ж. Компьютерное зрение: современный подход / Д. А. Форсайт, Ж. Понс: пер. с англ.-М.: Издательский дом «Вильямс», 2004. - 928 с.

3. Федоров А. Бинаризация черно-белых изображений: состояние и перспективы развития. [Электронный ресурс]. - Режим доступа: http://iu5.bmstu.ru/~philippovicha/ ITS/IST4b/ITS4/Fyodorov.htm.

4. Быков Р.Е., Фраер Р., Иванов К.В. и др. Цифровое преобразование изображений: Учеб. пособие для вузов. - М.: Горячая линия-Телеком, 2003. - 228 с.

5. Cavalcanti G.D.C., Silva E.F.A., Zanchettin C. and others. A heuristic binarization algorithm for documents with complex background. ICIP 2006, pp. 389-392.

6. Ntogas N., Ventzas D.A binarization algorithm for historical manuscripts. l2th WSEAS International Conference on Communications, Heraklion, Greece, July 23-25, 2008.

7. Кулябичев Ю.П., Пивторацкая С.В. Сравнение лиц на основе антропометрических характеристик при распознавании людей в видеопотоке. // Современные технологии в

задачах управления, автоматики и обработки информации: труды XVII международного научно-технического семинара. Алушта, сентябрь 2008 г. - СПб: ГУАП, 2008. С. 207-208.

8. Пивторацкая С.В., Персев И.В. Высокоточная система ориентации на основе идентификации звезд по изображениям. // Актуальные проблемы российской космонавтики: Труды XXXIV Академических чтений по космонавтике. - М.: Комиссия РАН по разработке научного наследия пионеров освоения космического пространства, 2010. - С. 126-128.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком