научная статья по теме АНАЛИЗ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ МЕЖДУ ВРЕМЕННЫМИ РЯДАМИ С ПОМОЩЬЮ ФАЗОВОГО СПЕКТРА Геофизика

Текст научной статьи на тему «АНАЛИЗ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ МЕЖДУ ВРЕМЕННЫМИ РЯДАМИ С ПОМОЩЬЮ ФАЗОВОГО СПЕКТРА»

ИЗВЕСТИЯ РАИ. ФИЗИКА АТМОСФЕРЫ И ОКЕАНА, 2007, том 43, № 5, с. 602-616

УДК 551.501

АНАЛИЗ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ МЕЖДУ ВРЕМЕНИ ЫМИ РЯДАМИ С ПОМОЩЬЮ ФАЗОВОГО СПЕКТРА

© 2007 г. М. И. Фортус

Институт физики атмосферы им. А.М. Обухова РАН 119017 Москва, Пыжевский пер., 3 Поступила в редакцию 28.06.2006 г., после доработки 30.01.2007 г.

В связи с проблемой выявления причинно-следственных связей между различными климатическими характеристиками обсуждаются методы определения зависимости между временными рядами с помощью выборочных авто- и кроссковариационных функций, а также периодограмм, выраженных через коэффициенты Фурье исходных рядов. Реальные ряды далеко не всегда удовлетворяют условиям статистической стационарности, поэтому требуется сочетание статистического и детерминированного подходов к их анализу. Обсуждается возможность использования перечисленных выше числовых характеристик в применении к таким рядам. Подробно исследуется специфика описания конечных отрезков временных рядов с помощью их коэффициентов Фурье. Основное внимание уделено вопросу определения временных сдвигов (задержек), на которых ковариация между рядами максимальна. Обсуждаются проблемы, возникающие при практическом применении метода периодограмм для оценки сдвига. Получена необходимая для дальнейших исследований неизвестная ранее формула, связывающая преобразование Фурье выборочной корреляционной функции с периодограммой ряда.

1. ВВЕДЕНИЕ

Данная работа выполнена в процессе обработки реальных рядов самой различной природы (как палеоклиматических, состоящих из данных о содержании газов в ледяном керне и колонках морских и океанических осадков, так и рядов, состоящих из данных спутниковых измерений мерцаний звезд через стратосферу). Несмотря на совершенно разные проблемы, для решения которых использовались эти ряды (в первом случае конечная цель анализа палеоклиматических рядов - это выяснение вопроса о причинах современного потепления климата; во втором случае - это использование измерений мерцаний для определения трехмерной пространственной статистической структуры поля флуктуаций плотности воздуха на высотах от 25 до 70 км), необходимо решать одну и ту же задачу математической статистики - для данной пары временных рядов найти относительный временной сдвиг для одного ряда, при котором он имеет максимальную корреляцию с другим рядом. Нахождение такого временного сдвига позволяет, во-первых, осуществить привязку рядов к общей временной шкале (для климатических рядов) и синхронизировать ряды (для измерений мерцаний звезды в разных частотных диапазонах). Во-вторых, величина и знак временного сдвига для палеоклиматических рядов помогает установить причинно-следственные связи долговременны х изменений

температуры и концентрации парниковых газов в атмосфере [1-3].

В последнее время интенсивно изучаются причинно-следственные связи между различными параметрами земной климатической системы [1, 2]. В частности, весьма актуальной является задача нахождения совокупностей таких климатических характеристик, в вариациях которых явно прослеживается связь, но, возможно, со сдвигом по времени. Климатическими характеристиками называют не только прямые, такие как температура, влажность и т.п., но и косвенные - содержание в атмосфере и океане различных газов, данные о древесных кольцах и т.д., если они могут быть индикаторами изменений климата, на что может указать наличие устойчивых корреляционных связей между соответствующими временными рядами наблюдений. Если же такие связи проявляются со сдвигом по времени, то можно говорить о наличии причинно-следственных связей между климатическими характеристиками. Задача оценивания сдвига будет рассмотрена в данной работе.

Климатические ряды содержат уникальные сведения о временном поведении климатических характеристик. Существенными трудностями, с которыми сталкиваются при их анализе, являются их нестационарность и недостаточная длина. Наша цель - на основе конечных реализаций таких временных рядов извлечь максимум ин-

формации, имеющей отношение к поставленной задаче. Все это вызывает необходимость сочетания детерминированного и статистического подходов.

Полезную информацию могут содержать низкочастотные составляющие, которые в данном контексте можно назвать детерминированными. Их характерные времена сравнимы с длиной периода наблюдения, а поведение описывается медленно меняющимися функциями времени, которые можно получить, например, скользящим осреднением. Вопрос о наличии связи между рядами в области самых низких частот (в частности, о временном сдвиге) в некоторых случаях может быть решен путем простого сравнения низкочастотных составляющих.

В области временных масштабов, на порядки меньших периода наблюдения, такой детерминированный подход не работает. Для таких масштабов статистический подход - это не только вполне адекватный, но и единственно возможный. Он позволяет обнаружить статистические закономерности в рядах, которые выглядят как хаотические флуктуации относительно медленно меняющегося фона. Если оба ряда содержат общий сигнал, который проявляется во втором ряде с постоянной временной задержкой, то можно использовать модель стационарных случайных функций и соответствующий аппарат ковариационных функций и спектров. Однако следует учесть, что стационарное распределение вероятностей, характеристики которого оцениваются по конечным реализациям (если даже оно существует), в лучшем случае имеет место лишь в среднем, т.е. приближенно.

Обычно для определения сдвига между рядами (задержки) используют кроссковариационные функции (ККФ). Так, например, если эмпирическая ККФ (т) имеет максимум в области значений |т| ^ Т, где она оценивается достаточно надежно, то точка максимума и определяет величину задержки. С ростом |т| точность оценивания

снижается, и (т) постепенно теряет сходство

с "истинной" ККФ. Так что (т) все более утрачивает смысл статистической характеристики, являясь способом эмпирического описания связи между рядами на конечном интервале наблюдения и отражая специфические особенности именно данной выборки. Однако наша цель - не точное определение статистических характеристик (не зависящих от особенностей имеющейся индивидуальной выборки), а оценка сдвига путем анализа выборочных корреляционных функций (КФ) и спектров, которые рассматриваются не столько

как статистические, сколько как числовые характеристики, отвечающие конкретным реализациям двух временных рядов. Поэтому в некоторых случаях мы считаем возможным использовать КФ и для аргументов т, сравнимых с длиной реализации Т, а спектры - для всего диапазона временных масштабов.

Анализ спектральных характеристик позволяет определить спектральный состав общего для двух рядов сигнала. Ниже более подробно будет рассмотрен спектральный метод определения сдвига. Для этого предварительно мы остановимся на специальных вопросах, связанных с представлением временного ряда с помощью его преобразования Фурье.

В разд. 2 кратко изложены определения и формулы теории двумерных стационарных случайных последовательностей, на которые мы далее будем опираться.

В разд. 3-8 рассматриваются различные характеристики, полученные на основании имеющейся конечной выборки (конечного ряда). В разд. 3 обсуждается представление ряда с помощью его коэффициентов Фурье (КОФ). В дальнейшем используется только конечный набор КОФ - тот, который обычно получают с помощью быстрого преобразования Фурье. Обсуждаются некоторые вопросы, связанные со спецификой описания ряда с помощью КОФ. В частности, поясняется, почему с помощью КОФ невозможно судить о реальном поведении во времени составляющих ряда, относящихся к ограниченному интервалу масштабов.

Разд. 4 посвящен специальному случаю, когда имеется априорная информация о наличии резкого скачка в поведении какой-то гармоники обеих компонент двумерного ряда. Такую гармонику предлагается выделить путем фильтрации. Сравнение моментов скачка модулей комплексных КОФ и/или их аргументов у каждой из компонент может служить указанием на наличие временного сдвига между ними в соответствующем интервале масштабов.

В разд. 5 кратко описан один из способов определения временного сдвига с помощью аргументов комплексных КОФ для случая, когда этот сдвиг имеет место для достаточно протяженного интервала временных масштабов.

Только начиная с разд. 6 существенно используется гипотеза о том, что имеющийся ряд - это отрезок двумерной стационарной случайной последовательности. Нам кажется, что в литературе, посвященной оцениванию различных спектральных характеристик по периодограмме (являющейся матричной функцией частоты), недостаточно по-

дробно объясняется, почему возникает необходимость ее дополнительного сглаживания. Здесь этот принципиально важный вопрос подробно освещен.

В разд. 7 рассмотрена оценка матричной КФ двумерного ряда , наиболее подходящая для задачи определения сдвига. Показано, что при конечном интервале наблюдения периодограмма является Фурье-преобразованием не этой КФ, а другой функции, которая является матричной ковариационной функцией двумерного ряда, определенного в конечном числе точек окружности. В результате установлено, что связь между выборочной КФ

Вд и периодограммой более сложная, чем это принято считать. Это важно, в частности, для сравнительного анализа двух методов оценивания сдвига между компонентами ряда - ковариационного и спектрального.

Рассмотренный в разд. 8 пример модельного ряда иллюстрирует выводы, полученные в предыдущих разделах.

Принятые обозначения: КФ - матричная ковариационная функция, АКФ - автоковариационная функция, ККФ - кроссковариационная функция, КОФ - коэффициенты Фурье, ПФ - преобразование Фурье.

2. ОПРЕДЕЛЕНИЯ И ФОРМУЛЫ ТЕОРИИ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Сначала напомним кратко необходимые определения и соотношения теории случайных стационарных двумерных последовательностей x(t) = = {x1(t), x2(t)}, t = 0 , ±1, ... Для подробного знакомства с обсуждаемыми вопросами отсылаем читателя к книгам A.M. Яглома [4], Дженкинса и Ваттса [5] и Отнеса и Эноксона [6].

Будем считать, что E(

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком