научная статья по теме ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ТЕМПЕРАТУРНО-ВЛАЖНОСТНОМ ЗОНДИРОВАНИИ АТМОСФЕРЫ Геофизика

Текст научной статьи на тему «ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ТЕМПЕРАТУРНО-ВЛАЖНОСТНОМ ЗОНДИРОВАНИИ АТМОСФЕРЫ»

ИЗВЕСТИЯ РАН. ФИЗИКА АТМОСФЕРЫ И ОКЕАНА, 2014, том 50, № 3, с. 373-380

УДК 551.501.86

ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ТЕМПЕРАТУРНО-ВЛАЖНОСТНОМ ЗОНДИРОВАНИИ АТМОСФЕРЫ

© 2014 г. А. В. Поляков, Ю. М. Тимофеев, Я. А. Виролайнен

Санкт-Петербургский государственный университет 198504 Санкт-Петербург, Петродворец, ул. Ульяновская, 3

E-mail: polyakov@troll.phys.spbu.ru Поступила в редакцию 18.04.2013 г., после доработки 16.08.2013 г.

Описано применение методики обращения радиационных данных на основе искусственных нейронных сетей (ИНС) для метеорологического спутникового зондирования атмосферы. Для повышения эффективности решения обратных задач используется метод главных компонент для профилей температуры и влажности, а также спектров ИК-излучения, что позволяет существенно сократить размерности задач. На основе численных экспериментов проанализированы погрешности температурно-влажностного зондирования по спектрам уходящего ИК-излучения, измеренным с помощью прибора ИКФС-2 с российского спутника "Метеор" при использовании итерационного физико-математического алгоритма (ИФМ), метода множественной линейной регрессии (МЛР), метода, основанного на ИНС. Выявлены заметные преимущества метода на основе ИНС в сравнении с методом МЛР. Так, при температурном зондировании на высотах 1—12 км метод МЛР имеет заметно большую погрешность (разность до 1 К), а ИФМ алгоритм — практически такую же погрешность, как метод ИНС. Погрешность определения относительной влажности составляет около 10% при использовании методики ИНС на высотах 0—12 км. В нижней тропосфере примерно такую же погрешность дает подход с использованием ИФМ, но с ростом высоты возрастают преимущества методики ИНС.

Ключевые слова: спутниковое зондирование, нейронные сети, обратные задачи, атмосферная оптика.

DOI: 10.7868/S0002351514030109

ВВЕДЕНИЕ

Современные системы температурно-влаж-ностного зондирования атмосферы в ИК-области спектра (приборы AIRS, IASI, CrIS и т.п.) характеризуются высокой скоростью получения больших объемов информации за счет большого количества спектральных измерений и пространственного сканирования. Необходимость обработки большого объема информации создает трудности в соблюдении временных требований к обращению результатов спектральных измерений при использовании получаемых данных в численном прогнозе погоды. Для сокращения временных затрат при интерпретации результатов спутниковых измерений используют различные способы повышения эффективности обработки данных:

— применение быстродействующих методик и алгоритмов расчета уходящего излучения, т.е. решения прямой задачи, как, например, [1];

— сжатие спектральной информации на основе использования аппроксимаций с помощью эмпирических ортогональных функций (ЭОФ) [2—4];

— использование на первом этапе анализа результатов измерений методики множественной линейной регрессии (МЛР) [5].

Проблема создания эффективного программно-математического обеспечения (ПМО) стоит и перед будущими спутниковыми экспериментами с аппаратурой ИКФС-2 [6]. Ранее для этого прибора было разработано специализированное ПМО и проанализированы его возможности [7—10]. При обработке результатов измерений предполагается в начальном приближении, используя быструю методику МЛР, получать решение и оценивать его достоверность, сравнивая рассчитанный и измеренный спектры излучения. Если различие велико, то для решения обратной задачи привлекается физико-математический подход, например, итерационный процесс на основе нелинейного обобщения [11, 12] известной методики оптимального оценивания при решении интегрального уравнения переноса теплового излучения.

Численное моделирование показало, что использование МЛР на первом этапе анализа спутниковых данных часто требует последующего не-

Таблица 1. Среднеквадратичные погрешности разложения профилей температуры Г(г) и относительной влажности ЯН(1), % в зависимости от размерности базиса (числа ГК)

Число ГК 1 5 10 11 12 13 14 15 16 17 18 19

T(z), к 8.81 2.21 0.87 0.74 0.64 0.56 0.49 0.43 0.38 0.34 0.29 0.26

RH(z), % 19.3 7.9 3.9 3.5 3.2 2.8 2.5 2.2 2.0 1.8 1.6 1.5

линейного обращения задачи, в особенности при восстановлении профиля влажности атмосферы, что приводит к существенному увеличению времени обработки результатов спутниковых измерений. В ряде работ предложено вместо МЛР использовать методики, основанные на искусственных нейронных сетях (ИНС) [13—16]. В данной статье рассматриваются возможности применения ИНС при интерпретации результатов измерений с помощью российского спутникового Фурье-спектрометра ИКФС-2 [6].

МЕТОДИКА РАСЧЕТОВ

Построение обратного оператора в методике ИНС (как и в методике МЛР) требует использования обширного ансамбля реализаций параметров состояния атмосферы и подстилающей поверхности (обучающей выборки). Для этого используется созданный нами ранее на базе известного набора моделей атмосферы "ТЮЯ" [17, 18] банк данных атмосферных моделей и характеристик поверхностей, дополненный необходимыми для моделирования измерений в спектральной ИК-области параметрами (температура поверхности, отличная от приземной температуры воздуха, излучательная способность (ИС) суши и водной поверхности). Построенная на основе комбинации данных из различных источников статистическая модель представляет собой набор 2311 состояний системы атмосфера—поверхность. Она использовалась в [8, 9].

Решение обратной задачи может осуществляться в пространстве самих искомых функций температуры и влажности атмосферы или в пространстве коэффициентов разложения искомых функций по тому или иному ортогональному базису (метод главных компонент). В данной работе мы использовали для решения обратной задачи метод ИНС в сочетании с методом главных компонент (ГК) по отношению как к искомым функциям, так и к измеренным на ИКФС-2 спектрам уходящего излучения. Это позволило существенно уменьшить объем обрабатываемых с использованием алгоритма решения задачи данных. При этом необходимо выбрать оптимальное число ГК (размерность базиса) для параметризации как искомых вертикальных профилей, так и измеренных спектров. Выбор числа ГК параметризации вертикальных профилей температуры и влажно-

сти осуществлялся на основе сравнения погрешностей параметризации с потенциальными погрешностями решения обратной задачи. В табл. 1 приведены погрешности параметризации вертикальных профилей температуры T(z) и относительной влажности RH(z) для нескольких различных значений числа главных компонент (ГК).

На основе анализа табл. 1 было принято решение использовать для параметризации вертикальных профилей температуры и влажности 17 и 13 ГК соответственно. При этом рост общей погрешности дистанционных измерений за счет параметризации профилей температуры и влажности составляет менее 10%.

При выборе числа ГК параметризации измеренных прибором ИКФС-2 спектров уходящего излучения (общее число измерений по спектру составляет 2701) использовались результаты работы [4], в которой показано, что для этого достаточно 40 ГК. Для обучения ИНС и моделирования ТВЗА по данным измерений на ИКФС-2 были рассчитаны спектры излучения (с добавлением модельной нормально распределенной погрешности измерений) и их ГК для различных случайных зенитных углов наблюдений. Полученная выборка была разбита случайным образом на две части: "обучающую" и тестовую выборки в соотношении 85 : 15. Следуя подавляющему большинству публикаций по использованию ИНС в обратных задачах атмосферной оптики, для решения обратной задачи мы выбрали трехслойный персептрон и гиперболический тангенс как функцию активации нейрона. Подробно методика использования метода ГК в сочетании с ИНС описана в [19].

Важным вопросом организации ИНС является выбор оптимального числа нейронов сети. Количество входных nx и выходных ny сигналов и соответственно нейронов-"датчиков" и выходных нейронов определяется наборами предикторов и предиктантов, но количество нейронов скрытого слоя (НСС) nh является величиной произвольной. Легко оценить, что общее число коэффициентов N, определяемых в процессе обучения ИНС, дается формулой (1):

N = (nx + l)nh + (nh + l)ny. (1)

Например, для nx = 40, nh = 30 и ny = 20 общее число коэффициентов равно 1850. Большое число коэффициентов может приводить к избыточному определению сети, и аппроксимация, реализуе-

Таблица 2. Погрешности определения профиля температуры (К) при различном числе НСС

Число НСС 10 15 20 23 25 30 35

Обучающая выборка 1.67 1.52 1.45 1.41 1.31 1.29 1.26

Тестовая выборка Оптимум 1.76 1.75 1.74 1.67 1.53 1.52 2.06

Конечное значение 1.76 1.76 1.77 1.76 1.54 1.67 2.26

мая такой сетью, будет соответствовать не физическим закономерностям задачи, а особенностям конкретной выборки, включающим случайный шум измерений, поскольку количество определяемых коэффициентов окажется излишним по отношению к информационной обусловленности задачи. С другой стороны, малое число НСС ограничивает возможности нейронной сети в отношении аппроксимации сложных нелинейных зависимостей, что тоже может приводить к росту погрешности решения обратной задачи.

Для анализа зависимости погрешности от числа НСС мы провели серию расчетов. Для ИНС с 40 главными компонентами спектра на входе и 17 главными компонентами профиля температуры на выходе варьировалось число НСС. В табл. 2 приведены среднеквадратические погрешности определения температуры в слое 0—40 км по обучающей и тестовой выборкам моделей атмосферы. Поясним строки 3 и 4 табл. 2. Обучение сети проводится на протяжении 100 итераций, каждая итерация представляет собой выполнение 3000 шагов минимизации. По завершении итерации рассчитываются минимальные значения погрешностей для данной итерации на обучающей и тестовой выборках. Погрешность обучающей выборки может только уменьшаться с номером итерации, так как именно она является объектом минимизации, но погрешность тестовой выборки ведет себя по-другому: ее значение для последней (100-й) итерации не обязательно минимально или близко к минимальному (см. табл. 2 и рис. 1). Поэтому для тестовой выборки мы приводим две погрешности: оптимальную (

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком