научная статья по теме ВЛИЯНИЕ ПАРАМЕТРОВ СОЛНЕЧНОГО ВЕТРА НА УРОВЕНЬ ФЛУКТУАЦИЙ ГЕОМАГНИТНОГО ПОЛЯ Космические исследования

Текст научной статьи на тему «ВЛИЯНИЕ ПАРАМЕТРОВ СОЛНЕЧНОГО ВЕТРА НА УРОВЕНЬ ФЛУКТУАЦИЙ ГЕОМАГНИТНОГО ПОЛЯ»

КОСМИЧЕСКИЕ ИССЛЕДОВАНИЯ, 2004, том 42, № 4, с. 368-375

УДК 523.78

ВЛИЯНИЕ ПАРАМЕТРОВ СОЛНЕЧНОГО ВЕТРА НА УРОВЕНЬ ФЛУКТУАЦИЙ ГЕОМАГНИТНОГО ПОЛЯ

© 2004 г. А. А. Русанов, А. А. Петрукович

Институт космических исследований РАН, г. Москва Поступила в редакцию 15.12.2003 г.

Исследована зависимость индекса геомагнитной активности Кр от скорости и плотности солнечного ветра и величины межпланетного магнитного поля (ММП). Для построения модели использовалась трехслойная нейронная сеть. Степень влияния входных параметров на Кр определялась по величине среднего и среднеквадратичного отклонений модельных от истинных значений индекса. Установлено, что наибольший вклад в Кр-индекс дают 2-компонента ММП, скорость и плотность солнечного ветра, измеренные с задержками 0 и 3 часа по отношению к исследуемому значению Кр, и предшествующее значение самого индекса. Для модели с таким набором входных параметров коэффициент корреляции между модельным и реальными рядами составляет ~0.89. Анализ отклонений от реальных значений Кр показал, что большие индексы моделируются хуже малых. Для решения этой проблемы распределения данных было приведено к равномерному по Кр, что значительно уменьшило среднеквадратичные отклонения для больших значений Кр.

Воздействие солнечного ветра на магнитосферу Земли вызывает спорадические вариации геомагнитного поля. Для описания изменений поля, вызываемых подобными нерегулярными причинами, используют индексы геомагнитной активности. Наиболее распространенные из них: Кр, АЕ и Д.г. Индекс характеризует амплитуду кольцевого тока в период магнитных бурь, АЕ - интенсивность авроральных токов, Кр - уровень флук-туаций магнитного поля [9].

Кр-индекс является обобщением локального индекса К, который вычисляется по данным конкретной геомагнитной обсерватории за трехчасовой интервал путем вычитания регулярной части из изменений магнитного поля. Полученная величина преобразуется в квазилогарифмическую шкалу в диапазоне от 0 (<5 нТл) до 9 (>500 нТл). Далее значения К-индекса корректируются для соответствующей геомагнитной широты обсерватории, поскольку амплитуда вариаций поля меняется с широтой, и усредняются по 13 обсерваториям. При этом девятибалльная шкала расширяется до двадцативосьмибалльной добавлением третьих долей - минус, ноль и плюс: 0°, 0+, 1-, 1°, 1+, ..., 8-, 8°, 8+, 9-, 9°, где 0° соответствует невозмущенному магнитному полю, а 9° - очень сильной активности.

Из-за временного разрешения и географического расположения обсерваторий Кр-индекс можно рассматривать лишь как обобщенную меру геомагнитной активности. Например, достаточно затруднительно исследовать на основе Кр разные фазы магнитных бурь во время солнечного максимума и в течение завершающей стадии солнечного цикла [6, 13]. Однако, Кр широко использу-

ется при моделировании (в том числе, при прогнозе и в реальном времени) и оценке влияния солнечного ветра и межпланетного магнитного поля (ММП) на степень общей возмущенности магнитного поля Земли. На данных Кр-индекса базируются статистические модели распространения горячих электронов на геостационарных орбитах [8, 10] и модели прогнозирования рисков появления аномальных ситуаций на спутниках Meteostat-3 и Tele-X, разработанные на основе нейронных сетей [15]. Kp используется для определения вероятности появления токов высокой амплитуды, наводимых на электростанциях и линиях электропередач во время повышенной геомагнитной активности [5].

Для предсказания Кр-индекса и поиска факторов, влияющих на генерацию и развитие геомагнитных возмущений, использовались статистические модели [1, 7, 12] и модели, основанные на нейронных сетях [4, 14]. В ряде работ [4, 7, 11] было изучено влияние Z-компоненты ММП (Bz), плотности (n) и скорости (V) солнечного ветра (для данного трехчасового интервала) на значение Кр индекса и смоделирована зависимость Кр от этих параметров. При этом корреляция модельного ряда значений Кр с реальным индексом составила 0.76. В данной работе исследована зависимость Кр не только от текущего, но и от предшествующего состояния солнечного ветра, а также от предыдущих значений самого индекса.

1. Данные, использованные при анализе. В работе использовалась информация из базы данных OMNI с 1966 по 2002 годы. Для корректного выполнения математических операций значения Кр были переведены из стандартной

шкалы (1) в числовую, в которой все целые доли (0°, 1° и т.д.) соответствуют числам 0, 10, 20, ..., 90; доли с отрицательным индексом - числам 7, 17, 27, ..., 87, и доли с положительными - 3, 13, 23, ..., 83. Таким образом, числовой диапазон ^„имеет следующий вид: 0, 3, 7, 10, 13, 17, ..., 90. Параметры солнечного ветра: У- и 2-компоненты ММП (Ву и Вг), плотности (п) и скорости (V) были усреднены по трехчасовым интервалам для соответствия временному разрешению измерений Кр-индекса. Для оценки влияния скачков плотности и скорости вычислялась также разность между их максимальными и минимальными значениями в течение трех часов (Ап, А^. Временная задержка любого из параметров по отношению к исследуемому значению Кр далее показывается в круглых скобках после названия параметра, например Кр(0) означает текущее значение индекса, V(1, 2) - два значения скорости солнечного ветра с трех- и шестичасовой задержкой. Типы модели обозначаются с помощью квадратных скобок, например, Кр(0)[Вг(0), М(0), Кр (1)] - модель зависимости Кр(0) от параметров Вг(0), ^0) и Кр(1).

2. Методы оценивания. Зависимость Кр моделировалась с использованием трехслойной нейронной сети с обратным распространением ошибки. Модели сравнивались по трем критериям: коэффициенту корреляции модельного ряда индекса с реальными значениями Кр:

N

C = ÄtaV- Х( ^ 1) - < KPm0d»:

N °real°mod

i = 1

X( KPreal ( i ) - < » '

(1)

preal

где (Кр ), < Кр) - средние значения реального

и модельного ряда Кр-индекса, N - количество элементов сравниваемых рядов, агеа1, атой - их дисперсии; среднему отклонению модельного ряда от значений реального Кр:

N

А( KPreal) = N-1( KPmd ( i ) - KPreal) '

(2)

i = 1

и дисперсии модельного ряда:

KPreal) =

1 У

N KP mod

( i ) - KPreal)

(3)

причем отклонения в (2) и (3) рассчитывались отдельно для каждого значения Кр (от 0 до 90).

3. Архитектура нейронной сети. Нейронная сеть, используемая в работе, состоит из одного входного, одного скрытого и одного выходного слоев. В скрытом слое, который состоит из 10 узлов, в качестве функции активации используется гиперболический тангенс; в выход-

ном слое применяется обычный линейный сумматор. Выбранная схема оказалось оптимальной в том смысле, что увеличение числа узлов в скрытом слое, либо добавление еще одного скрытого слоя не приводили к заметным изменениям в характеристиках модели. При уменьшении числа узлов в скрытом слое качество обучения сети, оцениваемое по суммарной квадратичной ошибке, падало на несколько десятков процентов.

Подстройка параметров нейронной сети, как известно [3], сводится к минимизации (в статистическом смысле) суммарной квадратичной ошибки

Е = d(i) - а(i)]2,

(4)

где N - общее число элементов данных, на основе которых производится настройка параметров модели, d(i) - реальное значение выходного параметра модели (в данном случае значение K^-индек-са), a(i) - модельное значение выходного параметра. Во время так называемого обучения сети происходит изменение ее параметров w в соответ-

дЕ

ствии с величиной градиента - -г— , который опре-

dw

деляет направление в пространстве w, вдоль которого ошибка меняется наибольшим образом. Изменение параметров сети происходит после каждой эпохи, т.е., после предъявления на вход сети всей группы данных общим числом N, вычисления среднеквадратичной ошибки и соответствующих ей значений градиента.

Для оптимизации процесса нахождения глобального минимума ошибки в пространстве параметров w, их подстройка осуществлялась на основе алгоритма Левенберга-Марквардта [3], корректирующее правило весов для которого в матричной форме имеет вид:

^new = wold - (JJ + ^/)-1/rE(wold), (5)

где wold, wnew - векторы со старыми и новыми зна-

. дЕ

чениями параметров, J = ^ - матрица градиентов, E(wold) - вектор среднеквадратичных ошибок, I - единичная матрица и X - скаляр. Величина X фактически определяет алгоритм нахождения минимума: при малых X - это метод Ньютона, при больших - метод градиентного спуска. Начальное значение параметра X было равно 0.001. При увеличении ошибки (4) в конце эпохи этот параметр умножался на коэффициент 10, при уменьшении ошибки - на 0.1.

При настройке сети все данные были перегруппированы случайным образом и разбиты на три класса: 80% использовались для обучения сети, 10% для проверки параметров модели в процессе обучения и 10% для проверки статистичес-

N

370

РУСАНОВ, ПЕТРУКОВИЧ

Варианты моделей и их общее качество (коэффициент корреляции между модельным рядом и реальным индексом). Номера моделей соответствуют обозначениям на рисунках

RMSE = N

(6)

Номер Характеристика модели Коэфф. корр.

1 Kp(0)[Bz(0), V(0)] 0.77

2 Kp(0)[Bz(0, 1), V(0, 1)] 0.83

3 Kp(0)[Bz(0, 1), V(0, 1), B/0, 1), n(0, 1)] 0.88

4 Kp(0)[Bz(0, 1), V(0, 1), B/0, 1), n(0, 1), Kp(1)] 0.89

5 Kp(0)[Bz(0, 1), V(0, 1), By(0, 1), n(0, 1), Kp(1, 2)] 0.89

6 Kp(0)[Bz(0, 1, 2), V(0, 1, 2), By(0, 1), n(0, 1)] 0.88

7 Kp(0)[Bz(0, 1), V(0, 1), By(0, 1)] 0.84

8 Kp(0)[Bz(0, 1), V(0, 1), n(0, 1)] 0.87

9 Kp(0)[Bz(0, 1), V(0, 1), n(0, 1), An(0), AV(0)] 0.87

10 Kp(0)*[Bz(0, 1), V(0, 1), n(0, 1)] 0.87

* Модель, построенная по распределению, приведенному к равномерному по Kp.

кой состоятельности представленных выборок. Параметры сети на этапе обучения определяются стандартным образом по величине корня из среднеквадратичной ошибки:

Kp (real) 90

80 70 60 50 40 30 20 10

0 10 20 30 40 50 60 70 80 90

Kp (model)

Рис. 1. Зависимость модельного и реального ряда Kp для модели Kp (0) [Bz (0), V(0)]:

Kp (model), Kp (real) - модельные и реальные значения Kp, соответственно. Кружками обозначены точки зависимости, пунктирной линией прямая Kp (model) = Kp (real) и сплошной - приближение линейной функцией, подобранной методом наи

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком