научная статья по теме ОЦЕНКА ВЗАИМОДЕЙСТВИЯ КЛИМАТИЧЕСКИХ ПРОЦЕССОВ: ЭФФЕКТ РЕДКОЙ ВЫБОРКИ РЯДОВ АНАЛИЗИРУЕМЫХ ДАННЫХ Геофизика

Текст научной статьи на тему «ОЦЕНКА ВЗАИМОДЕЙСТВИЯ КЛИМАТИЧЕСКИХ ПРОЦЕССОВ: ЭФФЕКТ РЕДКОЙ ВЫБОРКИ РЯДОВ АНАЛИЗИРУЕМЫХ ДАННЫХ»

ИЗВЕСТИЯ РАН. ФИЗИКА АТМОСФЕРЫ И ОКЕАНА, 2013, том 49, № 5, с. 530-539

УДК 551.58;519.23

ОЦЕНКА ВЗАИМОДЕЙСТВИЯ КЛИМАТИЧЕСКИХ ПРОЦЕССОВ: ЭФФЕКТ РЕДКОЙ ВЫБОРКИ РЯДОВ АНАЛИЗИРУЕМЫХ ДАННЫХ

© 2013 г. Д. А. Смирнов*, И. И. Мохов**

*Саратовский филиал Института радиотехники и электроники им. В.А. Котельникова РАН

410019 Саратов, ул. Зеленая, д. 38 E-mail: smirnovda@yandex.ru **Институт физики атмосферы им. А.М. Обухова РАН 119017Москва, Пыжевский пер., д. 3 E-mail: mokhov@ifaran.ru Поступила в редакцию 29.10.2012 г., после доработки 28.02.2013 г.

Показано, что основанный на понятии "причинности по Грейнджеру" подход при однонаправленной связи и достаточно редкой выборке рядов анализируемых данных может приводить к ошибочным выводам о двунаправленной связи. Эффект выявлен при анализе связи вариаций потока солнечного излучения и глобальной приповерхностной температуры. Представлен статистический тест для подтверждения или опровержения предположений о характере связи (однонаправленном или двунаправленном). Соответствующий анализ связи явлений Эль-Ниньо и индийского муссона подтвердил ранее сделанные выводы об их взаимном воздействии.

Ключевые слова: временные ряды, оценки связей, однонаправленная связь, двунаправленная связь, причинность по Грейнджеру, температура, солнечная активность, Эль-Ниньо, Южное колебание, индийский муссон.

Б01: 10.7868/80002351513050118

1. ВВЕДЕНИЕ

Все более актуальными становятся исследования не только связи различных глобальных и региональных климатических процессов, но и направления воздействия, которое может быть не односторонним и меняться во времени, в том числе и вследствие внешних естественных и антропогенных воздействий [1—28]. Для исследования причинно-следственных связей в земной климатической системе полезен подход, основанный на понятии "причинности по Грейнджеру" [29], позволяющий оценивать степень взаимного влияния климатических процессов с учетом внешних воздействий (см., например [13, 14, 18, 19, 21, 23, 25, 26, 28]). Связь двух процессов может быть как однонаправленной (ОС, с воздействием одного из двух исследуемых процессов на другой), так и двунаправленной (ДС, со взаимным воздействием), как, например, было выявлено при анализе причинности по Грейнджеру для явлений Эль-Ниньо и индийского муссона [25, 26].

Система У влияет на систему X "по Грейнджеру", если прогноз будущего поведения X улучшается при учете данных об У по сравнению с прогнозом, основанным только на данных об X. Не-

нулевое улучшение прогноза (УП) ассоциируется с наличием воздействия У на X, а ненулевые УП "в обе стороны" обычно интерпретируются как признак ДС. При этом прогноз осуществляется на один временной шаг А г — интервал выборки. Однако возможна сложная зависимость УП от А?, и в [30, 31] было отмечено, что при достаточно редкой выборке даже в случае однонаправленно связанных систем могут наблюдаться ненулевые УП в обе стороны, т.е. "ложные связи". Это принципиальное обстоятельство необходимо учитывать, в частности, при анализе климатических данных.

В данной работе проведен анализ эффекта редкой выборки при определении взаимосвязи процессов по временным рядам данных на основе причинности по Грейнджеру. Наличие этого эффекта, приводящего к недостоверным выводам о ДС, выявлено при исследовании вариаций глобальной приповерхностной температуры и потока солнечного излучения. Возможность ложных выводов продемонстрирована на примере эталонных стохастических систем с ОС. Представлен статистический тест для различения ОС и ДС, основанный на учете эффекта редкой выборки. С

помощью предложенного теста проверен вывод о ДС между ЭНЮК и индийским муссоном [25, 26].

2. ПРИЧИННОСТЬ ПО ГРЕИНДЖЕРУ

Пусть (X(г),У(г)) — двухмерный случайный процесс, реализации которого регистрируются в дискретные моменты времени с интервалом выборки А г: xn = X(nДt), уп = У(пДг), где п — целое. Для наборов значений х и у до момента времени

п можно ввести обозначения х- = {хп_ки у- = {уп-к }к=1. Из всех возможных способов индивидуального (без учета У) прогноза величины хп наименьший средний квадрат ошибки достигается при х1П = М [хп|х- ^, где М [хп|х- ^ означает условное математическое ожидание хп при условии х-. Обозначим дисперсию этой ошибки = М[(хп - х'п)2]. Наилучший совместный (с учетом У) прогноз дается формулой

= M [xn |xn, yn J и имеет ошибку с дисперсией

¡oí = M[(xn - xJn°')2]. Нормированная величина

УП Gy^x = (vliínd -ст^j°i)/стlind хаРактеРизУет

причинность по Грейнджеру (влияние) в направлении У ^ X. Аналогично определяется влияние X ^ У.

Подобный подход был впервые реализован [29] для стационарных гауссовских процессов (хп, уп). Использовалось то обстоятельство, что такой процесс единственным образом описывается двухмерным линейным уравнением авторегрессии (АР) вида

xn — X ax,kxn-k + X bx,kyn-k + %n, k=1 k=1

Ж Ж

Уп — X ay^n-k + X by,kxn-k + Vn> k=1 k=1

(1)

где (2,п, уп) — двухмерный гауссовский белый шум с нулевым средним, соответствующими дисперсиями компонентов ъ\ и ст2, ковариацией М[2,пуп] = у. Условие, что шум "белый", эквивалентно минимуму ошибки прогноза [32], при этом а? = а2

и

а2 = а2 ¡oi. Далее, процесс xn подчиняется и одномерному уравнению АР, т.е. первому уравнению (1) с

нулевыми bxk и белым шумом дисперсия которо-

2

го <3р

2 2

' x,índ'

Теперь по дисперсиям шумов а ^ а ^

определяется величина УП Gy ^ x. Аналогично определяется величина Gx . У.

Чтобы оценить теоретические величины х и

Ох^у по конечному временному ряду {хп,у}п=у, все суммы в уравнениях (1) ограничиваются членом к = р (вместо к = да), и оцениваются коэффициенты и дисперсии шумов в АР моделях порядка р с помощью стандартного метода наименьших квадратов. В анализируемых далее численных примерах длина ряда N велика, так что величина р выбирается просто настолько большой, чтобы результаты оценивания практически перестали меняться с ее дальнейшим увеличением (а именно, р = 10 оказалось достаточным во всех примерах). При анализе климатических временных рядов для выбора порядка используется критерий Шварца [33]. Статистическая значимость отличия оценок х и от нуля проверяется с помощью /-теста Фишера [34].

Следует отметить, что уравнения (1) при различных А г являются различными справедливыми представлениями исходной системы (X, У). Но как величины х и Ох^ меняются при изменении М? Если нет реального воздействия У ^ X, то логично было бы ожидать Оу = 0 при любом А г или, по меньшей мере, х < 1 и х < Ох^ . Однако эти ожидания не обязательно оправдываются [35], более того, относительная мера «ложной причинности» г = Оу^х/Ох^у может существенно превышать единицу.

3. ЭФФЕКТ РЕДКОЙ выборки

Для оценки влияния интервала выборки на результаты оценки связей проведен анализ стохастических линейных диссипативных осцилляторов с дискретным временем:

X(г) = А^г - 1) + Ах^« - 2) + ВХУ(( -1) + Е(/)

У (г) = аг уУ(г -1) + Аг 2У (г - 2) + ByX (г -1) + ¥(г),( )

где 5, Т — независимые гауссовские белуге шумы с

нулевым средним и дисперсиями а| и ст^, Bx и ВУ — коэффициенты связи. Собственный период колебаний X (положение пика в спектре мощности) и его время релаксации (определяет ширину пика) даются выражениями Ах д = 2соз(2п/ Тх )exp(-1/ т x) и Ах 2 = - ехр(- 2/ т x) [36]. Соответствующие выражения для У аналогичны. В качестве стартовых значений для анализа использовались значения периодов колебаний Тх = Ту = 4.4 и времен релаксации тx = тУ = 4, дисперсий шумов = а= 1, коэффициентов связи Вх = 0 и ВУ = 0.3 (ОС X ^ У). Величины УП оценивались по временным рядам

достаточно большой длины N = 105, так что статистические флуктуации были пренебрежимо малы. Согласно рис. 1 (кружки) ОС адекватно характери-

о

0.004 0

(а)

12 А?

°х—у 0.16 0.12 0.08 0.04

0

12 А?

г

0.2

0.1

0

(в)

10 А?

4

8

4

8

6

2

4

8

Рис. 1. Характеристики причинности по Грейнджеру для однонаправленно связанных осцилляторов (2) при Тх = Ту = 4.4 с прореживанием (кружки, сплошные линии) и с прореживанием и осреднением (ромбики, штриховые линии).

о

(а)

0.001

о

оу—х 0.012

0.008

0.004

0

(д)

468

г

10

1 0.1 0.01

г

0.08

10 т

10 т

°у—х 0.08 0.06 0.04 0.02 0

(ж)

''у.»

0.4 0.8 1.2 1.6 2.0 _2

г

10 1 0.1 0.01 0.001

г

0.12 0.08 0.04

0

(г)

0.4 0.8 1.2 1.6 2.0

2

Рис. 2. Характеристики причинности по Грейнджеру для однонаправленно связанных осцилляторов (2) в зависимости от различных параметров системы при остальных фиксированных из базового набора Тх = Ту = 5, тх = ту = 4,

2 2

Ом = о^ = 1, Вх = 0, Ву = 0.3. д — т = тх (черные кружки), е — т = Ту (ромбики).

V

V

зуется величинами УП при А г = 1 : Оу^х = 0 и Ох^у > 0. Однако с ростом А г положительными становятся и значения Оу ^ х, эта "ложная связь" и есть проявление эффекта редкой выборки. Значение Оумаксимально при Аг = 3, где г = 0.1 означает, что УП в направлении у ^ х, не соответствующем реальному воздействию, достаточно велико — составляет 10% от УП в направлении реального воздействия х ^ у. При А г ^ да зависимость между значениями х, у в сильно удаленные последовательные моменты пропадает и величины Оу _+х, близки к 0 (см. рис. 1а, 1б, А г = 15) — процесс (х„, у„) становится белым шумом.

Следует отметить для интерпретации ненулевых Оупри Аг > 1, что X — марковский процесс второго порядка и вектор (х(г), х(г - 1)) содержит полную информацию о распределении будущих значений х(г + I) при любом I > 0. В этом случае (х(г), х(г - 1)) полностью определяет состояние процесса Xв момент времени ? без УП процесса X

при учете У. При А г > 1 прогноз х(г + I) на основе {х (г), х (г - А г), х (г - 2А г), ...} не является наилучшим, так как значение х (г - 1) не может быть в точности восстановлено по прореженным данным для X. При этом дополнительная прогностическая информация может быть получена по данным об У за счет корреляции между х(г - 1) и наблюдаемыми значениями У, тем самым приводя к положительному УП Оу ^ х, не соответствующему реальному воздействию. Таким образом, источник "ложных связей" — неполнота информации о состоянии ведущей системы в наблюдаемых данных.

Положительны

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком