научная статья по теме МУЛЬТИФРАКТАЛЬНАЯ СЕГМЕНТАЦИЯ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ Космические исследования

Текст научной статьи на тему «МУЛЬТИФРАКТАЛЬНАЯ СЕГМЕНТАЦИЯ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ»

ИССЛЕДОВАНИЕ ЗЕМЛИ ИЗ КОСМОСА, 2008, № 3, с. 18-26

МЕТОДЫ И СРЕДСТВА ОБРАБОТКИ ^^^^

И ИНТЕРПРЕТАЦИИ КОСМИЧЕСКОЙ ИНФОРМАЦИИ

УДК 528.854

МУЛЬТИФРАКТАЛЬНАЯ СЕГМЕНТАЦИЯ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ

© 2008 г. Н. Г. Макаренко1, 2 , О. А. Круглун2, И. Н. Макаренко2 , Л. М. Каримова3

1Главная астрономическая обсерватория РАН, Санкт-Петербург 2Институт математики МОНРК, Алма-Ата, Казахстан 1 2Е-таИ: ng-makar@mail.ru; chaos@math.kz Поступила в редакцию 24.05.2007 г.

Описана методика мультифрактальной сегментации космических снимков с высоким разрешением. Для оценки показателей сингулярности в рамках микроканонического формализма использованы емкости Шоке. Для этих величин, в отличие от Борелевых мер, не выполняется условие аддитивности, но сохраняется свойство монотонности. Использование емкостей вместо традиционных сумм уровней серого позволяет получить устойчивые локальные оценки Гельдеровских показателей даже для изображений с высокой вариабельностью контраста. Приводятся примеры карт таких показателей для реальных изображений.

ВВЕДЕНИЕ

Дистанционное зондирование является в настоящее время основным методом изучения природных ландшафтов с помощью космической информации. Оно широко используется при описании и классификации региональных структур, исследовании вулканической деятельности, мониторинге разлива нефти на поверхности водоемов, составлении схем линеаментов, поиске признаков минерализации, оценке трещиноватости льдов, составлении и обновлении геологических карт, обнаружении и анализе локальных и глобальных геоинформационных аномалий.

Данные дистанционного зондирования получают с помощью космических аппаратов (КА) в виде цифровых изображений в отдельных участках спектра, либо одновременно в большом наборе каналов от ультрафиолетового излучения до радиоволн. В рамках задач распознавания образов такие снимки представляют собой дискретные множества чрезвычайно высокой размерности. Характерной особенностью таких множеств является эффект концентрации меры [1] и ультра-метричности [2] так что традиционные алгоритмы кластеризации, основанные на методах ближайших соседей, становятся неэффективными. Для моделирования облака точек в пространстве признаков монохроматических изображений используется большой набор математических средств: от Марковских моделей [3] до методов алгебраической топологии [4, 5].

Кроме проблемы высокой размерности, современная обработка ДДЗ встречается и с другой трудностью. Современные сенсоры КА позволяют достигать таких пространственных разрешений, как 2.5 м (Spot), 1 м (Ikonos) или даже 0.7 м

(Quick Bird). Эти изображения, их называют HR (High resolution)-изображениями, содержат качественно иную информацию о земных ландшафтах: они позволяют увидеть множество мелких объектов. Неудивительно, что HR-изображения демонстрируют настолько высокую гетерогенность, что стандартные методы, применяемые для анализа и классификации цифровых данных, становятся неэффективными. Это обстоятельство привело к развитию новых мультифрактальных подходов к обработке HR-изображений [6—9].

Статью предваряет краткое описание традиционных подходов к сегментации изображений и трудностей, которые возникают для HR-изобра-жений. Затем излагаются основные идеи микроканонического формализма, адаптированного для сегментации цифровых изображений. Наконец, обсуждается его модификация, основанная на емкостях Шоке. В заключении этот подход проиллюстрирован численными экспериментами с реальными изображениями.

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ

Первым шагом анализа цифровых изображений является выделение интересующих нас объектов из фона, т.е. их сегментация. В настоящее время существует множество подходов к решению этой проблемы [10—14], однако ни один из существующих методов не является универсальным.

Математически проблема сегментации формулируется следующим образом [15]. Для ограниченной гладкой и открытой области Q е Z х Zна решетке пикселов задано изображение, т.е. цифровая функция I(x) —»- Z, x е Q. Разыскиваются замкнутое "множество ребер" Г и все компонен-

ты связности {О,} е О\Г, I = 1, 2, ..., К, при которых подходящая визуальная (текстурная или фотометрическая) мера ц: I —Я является гладкой либо однородной на каждом О,, но терпит скачки или разрывы на Г. В общем случае мера ц понимается в смысле обобщенных функций (распределений). Каждый фрагмент I] = 1\ п называют паттерном на носителе О,. Здесь запись О\Г обозначает разность двух множеств, а I = 1\ п — ограничение функции 1(х) на подмножество О,-.

Чаще всего имеют дело с так называемой жесткой сегментацией, т.е. таким разбиением О, которое соответствует фиксированному множеству ребер Г. На выходе такой схемы получаются непересекающиеся паттерны 1\ п с носителями из {О,}. Формально жесткая сегментация соответствует разбиению единицы:

к

¡а(х) = X 7П(Х), Х = (х1'Х2) е О,

I = 1

где 1А(х) — индикаторная функция множества А, т.е. 1А(х) = 1, если х е А и 1А(х) = 0 в противном случае. На практике, за исключением редких случаев линейной разделимости, редко удается задать множество ребер Г так, чтобы получить набор непересекающихся паттернов: О,- п Оj = 0, Фу. Поэтому часто предпочитают использовать мягкую сегментацию с мягким разбиением единицы

¡а( х) = X р'( х),

г = 1

где р^ — непрерывные, или гладкие функции, которые можно рассматривать как функции принадлежности для нечеткого аналога !0(х). Используя принцип максимального правдоподобия, мягкую сегментацию легко свести к жесткой.

В стохастических подходах к моделированию изображений мягкая сегментация связана с так называемыми моделями гауссовских смесей [16, 17], которые обобщают известную модель Мит-Югё—Вкак [18]. В ней неизвестный паттерн и находится из решения вариационной задачи с функционалом

т1п^( и, Г |Т) = Ж (Г) + а Г |Уи|2 йх1 л йх2 +

Г, и J

П\Г

+ X |( и -1)2 йх1 л йх2,

где Ж(Г) — Хаусдорфова длина ребра Г.

Предположим, что I допускает разложение на К паттернов: ю = 1, ю = 2, ..., ю = К, где переменная ю нумерует паттерны, и ю(х) является случай-

ной переменной для каждого пиксела х е О. В этом случае р,(х) = РгоЪ[ю(х) = /], I = 1, 2, ..., К. Здесь запись РгоЪ[ю(х) = /] означает вероятность того, что случайная переменная ю(х) принимает значение I. Таким образом, в каждом пикселе могут присутствовать все паттерны, но с разной вероятностью. В модели смеси полагают, что каждый паттерн можно представить гауссовскими полями и1, и2, . , иК, так что для данного пиксела (^□(х) = г) ~ Я (и ,(х), а2), где Я — нормальное распределение.

В рамках этих представлений задача сегментации сводится к вариационной задаче для обобщенного функционала МитГогё—8Иак [15], в котором учтены веса р.. Эти модели до последнего времени с успехом применяются для сегментации изображений в разных областях знаний. Однако приближение среднего поля, которое лежит в их основе, становится некорректным для ИЯ-изоб-ражений.

Суть трудностей заключается в следующем. При увеличении разрешения спектральная изменчивость внутри поля также возрастает и существенно влияет на точность дальнейшей классификации или схему сегментации [6]. Иными словами, изображение содержит все более сложные и детальные локальные текстуры, и характерные объекты в изображениях (поля, здания, реки) уже не являются однородными. Поэтому классические подходы приводят либо к неполной, либо к избыточной сегментации внутри отдельного кадра, в зависимости от неоднородности рассматриваемых объектов, и "затемняют" глобальную информацию. В этой ситуации приходится прибегать к дополнительной предобработке[9, 19].

Статистика природных высококонтрастных изображений имеет свои специфические особенности [20—23]. Гистограммы таких изображений, построенные в переменных (1п|Дх)|, (1п|!(х)|)), отличаются от нормального распределения [20]: они имеют вогнутые "хвосты" с асимметрией и эксцессом. Именно поэтому первоначальные усилия в моделировании изображений, которые ограничивались исследованием статистики второго порядка или оценками двухточечной корреляции, не привели к успеху. Так, например, Фурье-спектры для природных ландшафтов демонстрируют асимптотический степенной закон, который отражает свойство масштабной инвариантности. Как следствие, статистики второго порядка действительно обнаруживают некоторые закономерности, однако большинство основных статистических структур остается скрытыми.

С другой стороны, легко убедиться, что большинство корреляций в изображении остаются после "выбеливания", т.е. выравнивания спектра: контуры объектов после такой предобработки все еще легко распознаются [24]. Это приводит к за-

п

ключению, что негауссовские статистические свойства границ (ребер) паттернов являются столь же важными при описании природных изображений, как и для визуального распознавания объектов, в соответствии с гипотезой Марра [6, 24]. Как раз на них и опираются популярные в последнее время методы марковского моделирования изображений [22, 25]. Упомянутое свойство масштабной инвариантности было подтверждено обнаружением мультифрактальных свойств HR-изображений [26— 28]. Именно поэтому мультифрактальный формализм, созданный для изучения самоподобных сингулярных мер [29], позволяет успешно решать задачи классификации и распознавания образов для таких данных.

Первые применения канонических вариантов формализма к текстурному анализу изображений были описаны в работах группы французских математиков из INRIA [10—12]. Микроканонический вариант мультифрактального формализма в применении к HR-изображениям развивается в настоящее время группой Антонио Туриэля (Institute for Marine Sciences, Барселона — см. например, [6, 28, 30]). Основой подхода является выделение из изображения некоторых фундаментальных компонент — сингулярных многообразий. Каждая из компонент имеет свой показатель "регулярности меры", который позволяет корректно учесть локальные свойства различных участков изображения. Надежда на успех при таком подходе основана на представлении меры, определенной на изображении в естественных параметрах — степенных показателях яркости или контраста. Мы приводим в следующем р

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком