научная статья по теме МЕТОД И АЛГОРИТМЫ ПРОГНОЗИРОВАНИЯ СЕЗОННЫХ ХАРАКТЕРИСТИК ОБЛАСТЕЙ АНТРОПОГЕННОГО ВОЗДЕЙСТВИЯ С ИСПОЛЬЗОВАНИЕМ МНОГОЛЕТНИХ КОСМИЧЕСКИХ ДАННЫХ Кибернетика

Текст научной статьи на тему «МЕТОД И АЛГОРИТМЫ ПРОГНОЗИРОВАНИЯ СЕЗОННЫХ ХАРАКТЕРИСТИК ОБЛАСТЕЙ АНТРОПОГЕННОГО ВОЗДЕЙСТВИЯ С ИСПОЛЬЗОВАНИЕМ МНОГОЛЕТНИХ КОСМИЧЕСКИХ ДАННЫХ»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2015, № 3, с. 79-87

РАСПОЗНАВАНИЕ ОБРАЗОВ И ОБРАБОТКА ИЗОБРАЖЕНИЙ

УДК 519-25

МЕТОД И АЛГОРИТМЫ ПРОГНОЗИРОВАНИЯ СЕЗОННЫХ ХАРАКТЕРИСТИК ОБЛАСТЕЙ АНТРОПОГЕННОГО ВОЗДЕЙСТВИЯ С ИСПОЛЬЗОВАНИЕМ МНОГОЛЕТНИХ КОСМИЧЕСКИХ ДАННЫХ*

© 2015 г. В. Ю. Игнатьев1, А. Б. Мурынин1 2

1 Москва, НИИ АЭРОКОСМОС, 2 ВЦ РАН

Поступила в редакцию 21.01.15 г., после доработки 28.01.15 г.

Предложен метод прогнозирования характеристик областей, подверженных антропогенному воздействию, по данным дистанционного зондирования Земли. Разработанный метод основан на выявлении закономерностей по многолетним периодическим наблюдениям. Данные закономерности применяются к сезонным наблюдениям для текущего года. Метод реализован в комплексе алгоритмов и прогностических моделей. Рассматривается пример применения метода для прогнозирования урожайности различных сельскохозяйственных культур. Описываются процессы обучения и валидации моделей прогнозирования урожайности, основанных на многолетних космических данных о состоянии вегетации. Рассмотрены различные области Российской Федерации, в том числе арктические регионы.

БО1: 10.7868/80002338815030117

Введение. На сегодняшний день методы дистанционного зондирования являются наиболее перспективными и развивающимися в сфере осуществления мониторинга характеристик различных объектов и областей земной поверхности. Одним из достоинств таких методов является относительно низкая ресурсозатратность по сравнению с другими подходами. В качестве источников спутниковой информации можно использовать базы данных со свободным доступом через интернет, хранящие обширные коллекции спутниковых изображений. Еще одним преимуществом методов дистанционного зондирования является оперативность наблюдений за территориями с широким пространственным охватом. Особое место принадлежит методам спутникового мониторинга, которые позволяют получать информацию о состоянии объектов подстилающей поверхности в широком спектральном диапазоне. Доступность данных и возможность обрабатывать изображения с пространственным разрешением от нескольких километров до полуметра в долгосрочных временных сериях являются определяющими факторами для большого круга практических задач.

Регистрируемые сенсором спутника параметры объектов, получаемые из данных дистанционного зондирования Земли (ДЗЗ), используются в ряде методов для оценки и прогнозирования характеристик областей земной поверхности (которые не могут быть получены непосредственно из данных ДЗЗ). Эти методы успешно апробированы для решения таких задач, как прогнозирование ожидаемого урожая [1—6], оценка экологического состояния окружающей среды, в том числе для импактных районов Арктики [7—9], изучение и прогнозирование стихийных бедствий [10].

Большинство методов, предложенных в этих исследованиях, позволяют решать проблему только для определенного типа явления. Сложность реализации и большое количество входных данных приводят к необходимости создания обобщенных методов и программных средств обработки космической информации [8, 9, 11], которые обладают определенной универсальностью и применимы для различных задач прогнозирования.

Более того, возникает потребность в разработке обобщенного подхода к прогнозированию состояния объектов подстилающей поверхности с использованием спутниковых изображений. Метод, позволяющий прогнозировать состояния объектов регионального масштаба [12], описан в данной работе. Метод применяет комплексный подход, сочетающий исторические данные дистанционного зондирования и наземные измерения характеристик изучаемых объектов за предыдущие годы. Наличие такой комбинации исторических данных дает возможность обучать

* Работа выполнена при финансовой поддержке РФФИ (грант № 13-05-12019).

модель прогнозирования и осуществлять заблаговременный прогноз состояния объектов подстилающей поверхности.

Благодаря универсальности описанного ниже подхода расширяется круг задач мониторинга окружающей среды, которые могут быть решены с помощью разработанного метода. При этом нивелируется ограничение на характер антропогенного воздействия на рассматриваемые области подстилающей поверхности, что позволяет осуществлять количественную оценку интересующих характеристик. Таким образом, в процессе мониторинга могут анализироваться как положительные результаты антропогенного влияния на состояния объектов окружающей среды, например значение урожайности сельскохозяйственных культур, так и негативные, например для состояния окружающей среды импактных районов Арктики.

1. Основные концепции метода прогнозирования характеристик наземных областей. Для того чтобы прогнозировать характеристики, описывающие состояние объекта регионального масштаба, требуется учитывать не только наблюдения, которые характеризуют его состояние в данный момент, но и историю наблюдений до этого момента. Такой подход позволяет выявить долгосрочные зависимости в изменении состояния объекта. Здесь термин "объект" используется для описания области на поверхности Земли (и на космическом изображении этой поверхности). Эта область может быть сформирована по определенным физическим или географическим признакам и иметь различную форму и размер.

Примером может служить географический регион, а прогнозируемыми характеристиками — плодородие почвы в этом регионе или урожайность заданной сельскохозяйственной культуры в рассматриваемый период.

Обозначим наблюдения для текущего периода как сезонные наблюдения, которые включают в себя измерение параметров объекта в течение периода интереса до фиксированного момента времени. Количество и типы параметров, рассчитанных по данным дистанционного зондирования, могут варьироваться в зависимости от условий, таких как пространственное разрешение, тип изображения, количество данных, доступных для обработки или физической природы объекта исследования.

В то время как сезонные наблюдения могут быть использованы для извлечения информации об интересующем объекте в течение текущего периода, то долгосрочные наблюдения позволяют определить вид и найти параметризацию предсказательной функции. Долгосрочные наблюдения содержат два типа информации об объекте. Первый тип — это информация, непосредственно извлекаемая из данных дистанционного зондирования, которая отражает изменения в наблюдаемых характеристиках объекта. Продолжительность этого типа долгосрочных наблюдений может иметь размер как только сезонных наблюдений (внутригодовой), так и быть расширена на все доступные наблюдения в течение многих лет с несколькими отсчетами за каждый год. Второй тип долгосрочной исторической информации связан с наземными наблюдениями, которая получается, как правило, из источников, не связанных с дистанционным зондированием. Такая комбинация данных дистанционного зондирования и наземных измерений используется для обучения и валидации моделей прогнозирования. Примером наземных измерений могут быть данные официальной государственной статистики (такие как урожайность для различных регионов и лет).

Цикличность сезонных наблюдений и возможность проводить измерения внутри временного периода с использованием данных дистанционного зондирования позволяют добиться большого числа итераций при обучении моделей прогнозирования. Сезонные данные не обладают статистической однородностью, т.е. изменяются от сезона к сезону в течение календарного года, в то время как долгосрочные наблюдения, как правило, повторяются из года в год. Тот факт, что сезонные наблюдения в составе долгосрочных наблюдений описывают один и тот же период времени, дает возможность обеспечить однородность статистических данных при обучении моделей.

Таким образом, требования к размеру обучающей выборки и однородности статистических данных учитываются при обучении. Двигаясь дальше, необходимо изучить различные виды прогностической функции, а также возможность учитывать наличие каких-либо долгосрочных тенденций. Среди прочего важно определить способ оценки точности прогнозирования. Эти три аспекта (тип модели, долгосрочный тренд и оценка точности) формируют основные концепции предложенного метода.

2. Рабочий процесс обучения и прогнозирования. Предлагаемый метод может быть описан с помощью схемы, приведенной на рис. 1.

Последовательность действий с данными ДЗЗ изучаемого объекта может быть представлена следующими алгоритмическими блоками обработки данных, показанными на рис. 1:

Рис. 1. Схема взаимодействия алгоритмических блоков при прогнозировании состояния объектов подстилающей поверхности

1) блок подготовки данных;

2) блок обучения;

3) блок предсказания;

4) блок валидации моделей.

Блок подготовки данных включает функции определения областей интереса и извлечение необходимых информативных признаков из данных ДЗЗ.

Блок обучения (БО) состоит из создания и обучения модели прогнозирования с использованием многомерной нелинейной регрессии по данным дистанционного зондирования. Вид прогностической функции задается набором предикторов, параметры которых взяты из описания характеристик объектов, мультипликативной поправкой для областей и параметром, учитывающим наличие долгосрочного временного тренда.

При обучении принимается во внимание, что состояние объекта в текущем сезоне должно достаточно надежно предсказываться с помощью функции, параметрами которой являются усредненные (по площади объекта) значения данных дистанционного зондирования в течение периода каждого сезонного наблюдения. Чем полнее известен исторический ход долгосрочных наблюдений, тем точнее можно предсказывать состояние объектов.

В блоке прогнозирования (БП) состояние объектов подстилающей поверхности предсказывается с использованием наблюдений текущего сезона, которые не были задействованы в процессе обучении моделей прогнозирования. Сезонные наблюдения описывают изменения состояния объекта в текущем сезоне, которые предшествуют моменту формирования прогноза. Таким образом, долгосрочные наблюдения используются в сочетании с сезонными. Полезная информация, извлекаемая из долгосрочных наблюдений, учитывается в процессе обучения модели. В свою очере

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком