научная статья по теме ВАЛИДАЦИЯ ИНФОРМАЦИОННОЙ ПРОДУКЦИИ ОБРАБОТКИ САМОЛЕТНЫХ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ Космические исследования

Текст научной статьи на тему «ВАЛИДАЦИЯ ИНФОРМАЦИОННОЙ ПРОДУКЦИИ ОБРАБОТКИ САМОЛЕТНЫХ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ»

ИССЛЕДОВАНИЕ ЗЕМЛИ ИЗ КОСМОСА, 2015, № 1, с. 32-43

МЕТОДЫ И СРЕДСТВА ОБРАБОТКИ И ИНТЕРПРЕТАЦИИ КОСМИЧЕСКОЙ ИНФОРМАЦИИ

ВАЛИДАЦИЯ ИНФОРМАЦИОННОЙ ПРОДУКЦИИ ОБРАБОТКИ

САМОЛЕТНЫХ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ © 2015 г. В. В. Козодеров1*, Т. В. Кондранин2, Е. В. Дмитриев3, 2, В. П. Каменцев4

Московский государственный университет им. М.В. Ломоносова 2Московский физико-технический институт (государственный университет) 3Институт вычислительной математики РАН, Москва 4Тверской государственный университет *Е-таИ: vkozod@mail.ru Поступила в редакцию 12.05.2014 г.

В задаче обработки самолетных гиперспектральных изображений основное внимание уделяется построению автоматизированного классификатора, реализующего вычислительные процедуры распознавания лесной растительности разного породного состава и возраста. Валидация получаемой информационной продукции обработки данных гиперспектрального зондирования основывается на нахождении максимума апостериорной вероятности для выбранных классов объектов с использованием современных представлений о Марковских случайных полях, позволяющих определять априорные вероятности для каждого элемента разрешения гиперспектральной аппаратуры. Показана необходимость учета шумовой составляющей аппаратуры для повышения точности решения рассматриваемых прикладных задач. Демонстрируются примеры сравнения данных обработки гиперспектральных изображений с данными наземной лесотаксации выбранной территории.

Ключевые слова: обработка гиперспектральных изображений, распознавание лесной растительности разного породного состава и возраста, информационная продукция, валидация

DOI: 10.7868/50205961415010030

ВВЕДЕНИЕ

Основу автоматизированной обработки аэрокосмических оптических изображений составляют различные аспекты теории видения, которая позиционируется как использование критериев оптимизации соответствующих вычислительных процедур при построении машинно-обучающих алгоритмов распознавания объектов. В процессе формирования изображений воздействия шумов измерительной аппаратуры, атмосферы как помехи служат источниками неопределенностей при интерпретации данных дистанционного зондирования (ДЗ). Поэтому возникает необходимость оптимизации алгоритмов обработки оптических изображений для уменьшения этих неопределенностей 1995).

Оптимизация вычислительных процедур обработки данных предполагает рассмотрение взаимного влияния элементов разрешения (пикселов) для выбранных классов объектов и обоснование возможности объединения спектральных каналов гиперспектрального зондирования без существенного изменения точности распознавания объектов. В первом случае речь идет о контекстуальном распознавании текстур земной поверхности, когда контекст отображает взаимное

влияние соседних пикселов, учет которого повышает точность распознавания (Козодеров, 2012). Например, для лесной растительности разного породного состава и возраста возможно разделение пикселов, соответствующих полностью освещенным, полностью затененным и промежуточным условиям солнечного освещения фитоэле-ментов. Такое разделение способствует решению прикладных задач нахождения связей регистрируемых спектров и указанных параметров состояния лесной растительности (Козодеров и др., 2014). Во втором случае предполагается уменьшение возможной избыточности спектральных каналов при наличии корреляции между соседними каналами фтйпе^ Kozoderov, 2013). В наших исследованиях обработка данных гиперспектрального зондирования предполагает решение задач распознавания природно-техногенных объектов и оценки параметров, характеризующих состояние лесной растительности (Козодеров и др., 2012).

Распознавание по спектральным признакам основывается на вычислительных процедурах разделения классов в многомерном признаковом пространстве. Возможно чисто геометрическое разделение выделенных кластеров в указанном пространстве, но возможны и статистические

подходы к распознаванию на основе распределений вероятности: априорных знаний об объектах и правдоподобия этих знаний и текущих распределений обрабатываемых данных (Bunting, Lucas, 2006).

Для распознавания лесной растительности на гиперспектральных изображениях высокого пространственного разрешения требуется контекстуальное распознавание текстур. При этом учитывается, что каждый спектр пиксела формируется с помощью весовых функций составных элементов соответствующих объектов (end-members) относительно окружающего фона с учетом отношений "сигнал/шум" аппаратуры (Asner, Heidebrecht, 2002).

Основная прикладная цель развития рассматриваемых приложений — повышение эффективности использования вычислительных средств для реализации указанных алгоритмов. Популярные приближения искусственных нейронных сетей (ИНС) — системы взаимодействующих между собой простых процессоров (математическая модель нейронов — нервных клеток), — в зарубежных публикациях подвергаются критике (Dewd-ney, 2001). Критика связана с тем, что компьютерная реализация ИНС требует одновременно многих миллионов баз данных для соответствующих соединений в отличие от головного мозга, который обрабатывает сигналы сразу посредством графа нейронов (идет параллельная обработка сигналов). В наших исследованиях предлагается нахождение максимума апостериорной вероятности байесовского классификатора как иного приближения для распознавания объектов по спектральным и текстурным признакам, которое допускает применение параллельных вычислений на суперкомпьютерах (Козодеров, Дмитриев, 2013).

С точки зрения создания программно-аппаратного комплекса обработки аэрокосмических изображений высокого спектрального и пространственного разрешения, на первый план выходят процедуры валидации получаемой информационной продукции. В традиционных подходах ориентируются на построение полной матрицы ошибок сравниваемых данных: полученных на основе обработки конкретных изображений и "эталонных" карт зондируемой территории. На основе такого сравнения определяются ошибки совпадения результатов на главной диагонали, а вне диагонали — ошибки "ложной тревоги" и "пропуска цели". В реальности сами карты могут нуждаться в обновлении, так что возникает необходимость так называемой "кросс-валида-ции" (Kohavi, 1995) результатов обработки данных ДЗ, когда с помощью классификатора (вычислительной процедуры) путем некоторых специальных преобразований обосновывается реальная точность распознавания объектов.

Указанные преобразования связаны с понятием функции "энергии" отдельного класса на обрабатываемом изображении (Friedland, Rosenfeld, 1992) в существующей байесовской парадигме статистических правил принятия решений о принадлежности соответствующих пикселов к выбранным классам объектов. Ее суть — в нахождении максимума апостериорной вероятности, которая характеризуется априорным предположением о свойствах соответствующей функции распределения и условной вероятностью сравнения исходных данных обрабатываемого изображения для наборов пикселов заданного класса и указанной функции распределения. При этом в форме максимального правдоподобия увязываются конкретные значения спектральной плотности энергетической яркости изображения и свойства используемых теоретических функций распределения отдельных пикселов.

Рассмотрим особенности такой валидации информационной продукции обработки самолетных изображений выбранной тестовой территории, имея в виду развитие современных подходов к тематической обработке многоспектральных и гиперспектральных аэрокосмических изображений (Козодеров и др., 2013б).

ПОСТАНОВКА ЗАДАЧИ

Исходной является следующая модель байесовского правила принятия решений по классификации объектов на обрабатываемом изображении. Пусть 2, = ...,2,j} — регистрируемые спектральные плотности энергетической яркости (СПЭЯ) или некоторые производные величины, составляющие обрабатываемое изображение, состоящее из j

пикселов. Значения £,,-, i е [1, j], рассматриваемые в качестве связанных случайных величин, составляют случайное поле. Пусть также задана теоретическая функция распределения/^) = {f (х1),..., f (xj)}, которая характеризует наше понимание того, к какому классу объектов / принадлежит каждый пиксел ¡. Под x подразумеваются переменные на множестве значений случайных величин £,,-.

Предположим, что имеется ансамбль S = {^(1);...;%(s)}, состоящий из s измерений случайных величин £,,-. Введем статистику d(x) = {dfo),..., d(xj)}, которую будем рассматривать в качестве оценки теоретической функции распределения на основе измерений S. Как уже было упомянуто во введении, типичным для такой классификации является решение, основанное на нахождении максимума апостериорной вероятности (МАВ)

f * = argmax[f )P(f)], i e О

se[1, j]

Условная вероятность (или плотность вероятности) P(tt\fs) рассчитывается на основе известных f(x). Априорная вероятность для каждого класса объектов P(f) моделируется с учетом влияния соседних пикселов, например, с помощью Марковских случайных полей (МСП).

Решение проблемы МАВ-МСП увязывается с аналитическими свойствами функции распределения f(x) модельных данных. Если эта функция постоянна, т.е. ее производная равна нулю, то говорят о нахождении априорной энергии струны (мембраны в двумерном случае). Энергия как интеграл от квадратичной функции производной этой функции имеет равный нулю минимум для такой упрощенной модели или положительна в противном случае. Возможно априорное предположение о постоянстве градиента яркостей на изображении или отдельных его фрагментов, и тогда решается задача нахождения энергии математической модели стрежня, когда вторая производная соответствующей функции равна нулю. Возможно также предположение о постоянстве кривизны соответствующей поверхности, когда равна нулю третья производная указанной функции, и т.д.

Перечисленные особенности учета влияния соседства первого, второго и более высоких порядков для пикселов, характеризующих конкретный класс объектов, способствуют описанию контекста на обрабатываемых изображениях при рассмотрении коррелированных признаков в терминах вероятностей. Находятся оптимальные решения теории вйдения в процессе определения максим

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком