научная статья по теме О ПОЛЬЗЕ НОРМИРОВАНИЯ Геофизика

Текст научной статьи на тему «О ПОЛЬЗЕ НОРМИРОВАНИЯ»

ВУЛКАНОЛОГИЯ И СЕЙСМОЛОГИЯ, 2009, № 6, с. 74-77

УДК 550.343.4,551.21.03

О ПОЛЬЗЕ НОРМИРОВАНИЯ1

© 2009 г. Э. А. Боярский, А. В. Дещеревский

Институт физики Земли РАН, Москва, 123995 Поступило в редакцию 29.09.2008 г.

Обсуждается методика поиска статистических связей между катастрофическими событиями, такими как землетрясения и извержения вулканов, с одной стороны, и астрономическими или географическими данными, с другой. Указано на необходимость обязательного нормирования данных перед выполнением статистико-вероятностного анализа. Приводятся примеры работ, в которых из-за отсутствия корректного нормирования данных авторы приходят к заведомо ложным выводам.

Одно из "вечных" направлений в геофизике -поиск статистических связей между различными явлениями. Особенно это относится к землетрясениям и извержениям вулканов, где важно обнаружить пусть даже слабую, но статистически значимую зависимость этих катастрофических явлений от известных или измеряемых величин. Пионером в исследованиях такого рода был Пере, который полтора столетия назад обратил внимание на зависимость частоты возникновения землетрясений от фаз Луны [4].

К сожалению, не все исследования выполняются на достаточно строгом методическом уровне. Здесь мы остановимся только на одной, но повторяющейся ошибке, а именно на отсутствии надлежащего нормирования данных перед анализом зависимости их распределения от каких-либо факторов. В качестве примера сошлемся на работы Н.П. Булатовой [1] и В.М. Федорова [2, 3]. В обоих случаях анализ ненормированных данных искажает смысл статей и ставит под сомнение результаты.

В [3] изучается зависимость частоты вулканических извержений от эклиптической широты Луны. Построены таблицы и графики, из которых автор заключает, что извержения происходят чаще, когда эклиптическая широта Луны ф близка к экстремальным значениям, а это якобы указывает на некую причинную связь.

Как известно, изменение эклиптической широты Луны происходит не по линейному, а по синусоидальному закону с незначительной амплитудной модуляцией, обусловленной возмущениями лунной орбиты (рис. 1). Луна сравнительно быстро проходит область вблизи нулевой эклиптической широты и, наоборот, "задерживается" вблизи экстремальных значений ф. Это наглядно видно на гистограмме (рис. 2), построенной по фактическим значениям ф за 2001-2008 годы. Поэтому вероятность попадания значения ф в тот или иной интер-

вал не одинакова, а описывается в первом приближении хорошо известным косинус-распределением. Вообще говоря, любое событие, более или менее равномерно распределенное во времени, будет гораздо чаще происходить при экстремальных значениях любой переменной, которая изменяется по гармоническому закону.

Чтобы избежать ошибочных выводов, нужно от числа извержений, произошедших при определенных значениях ф, перейти к числу извержений в единицу времени. Для этого достаточно разделить число извержений в каждом диапазоне ф на то время, в течение которого значение ф находится в пределах этого диапазона. Такое нормирование

л

о

^

и

л &

л м

сЗ

н о

«

л м

о ^

к н к к ч м т

Январь Февраль Март Апрель Май 2007

Июнь

1 Публикуется в дискуссионном порядке.

Рис. 1. Изменение эклиптической широты Луны. Точками отмечено положение Луны через каждые 24 ч. Заливкой выделены два интервала из табл. 1.

я

а

й 6

5 4 3 2 1 0 -1 -2 -3 -4 -5 -6 Эклиптическая широта ф Луны, градусы

Рис. 2. Гистограмма нахождения Луны на разной эклиптической широте за 8 лет. Заливкой выделены те же интервалы, что на рис. 1.

необходимо было выполнить ив [3], поскольку продолжительность пребывания Луны в диапазонах, выбранных автором, различается в три с лишним раза. На протяжении одного драконического месяца значения ф примерно 2.5 сут находятся в диапазоне [4.56; 5.32] и лишь около 0.7 сут - в таком же по величине диапазоне [0.00; 0.76].

Вместо нормирования числа извержений, автор мог бы воспользоваться теоретическим распределением извержений, учитывающим время пребывания Луны в каждом из выбранных диапазонов. Это свело бы вероятностно-статистический анализ к испытанию нулевой гипотезы, по которой связь между широтой ф и возникновением извержения отсутствует. Если вероятность фактически наблюденных данных при нулевой гипотезе меньше некоторой доверительной вероятности (скажем, 5 или 1%), нулевую гипотезу отвергают и заключают, что связь между изучаемыми явлениями существует. Для проверки согласия между теоре-

тическим и фактическим распределениями математическая статистика традиционно пользуется критерием %2.

В табл. 1 первые две колонки взяты из [3]. Согласно В.М. Федорову, по нулевой гипотезе в равных по величине диапазонах ф следует ожидать одинакового числа извержений, т. е. их равномерное распределение (колонка 3). В этом и состоит ошибка. Если ее не заметить, нулевая гипотеза, конечно, будет отвергнута: вероятность наблюденного распределения получается намного меньше 0.01%. Если же учесть, что Луна проводит разное время в одинаковых по величине диапазонах, то для нулевой гипотезы нужно взять число извержений из колонки 4. И тогда значению %2= 8.5 соответствует вероятность около 20%, означающая, что только в 20% согласие фактических данных с нулевой гипотезой могло бы быть еще лучше. Таким образом, имеющиеся данные никак не позволяют сделать вывод о существовании статистической связи между эклиптической широтой Луны и вероятностью извержения. Сказанное иллюстрирует рис. 3 - фактические данные прекрасно согласуются с теоретическим распределением, соответствующим нулевой гипотезе.

Существо дела в [3] затуманено и тем, что термин автора "суточная вероятность" не соответствует общепринятому пониманию термина "вероятность" и искажает смысл рассчитанной величины. Подпись "сутки" на оси абсцисс рис. 1 в [3] также вводит читателя в заблуждение, поскольку индекс на оси абсцисс - всего только номер интервала, но никак не число суток.

Аналогичное нормирование отсутствует и при рассмотрении В.М. Федоровым других трех астрономических показателей (расстояние от Земли до Солнца, разность геоцентрических долгот Солнца и Венеры, Солнца и Марса). Все перечисленные переменные меняются приблизительно по гармо-

160 140

Й 180 на

о

со

а ап

& 120

я

«

и н

е

М

р

е

я

со

и о л с

и

&

100 80 60 40 20

1

- 2 - 3

А Д -¡у

Д А^Ж

6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 Эклиптическая широта Луны

Рис. 3. Число вулканических извержений при разных значениях эклиптической широты Луны.

76

БОЯРСКИЙ, ДЕЩЕРЕВСКИЙ

Таблица 1. Наблюденное и ожидаемое число извержений

Эклиптическая широта Луны ф от ... до Число извержений Ожидаемое число извержений (нулевая гипотеза)

равномерное распределение подлинное распределение

1 2 3 4

-5.32... -4.56 170 170.48

-4.56... -3.80 80 92.40

-3.80. -3.04 61 69.39

-3.04. -2.28 62 59.88

-2.28.-1.52 50 54.13

-1.52.-0.76 51 51.19

-0.76.0.00 55 везде 49.25

0.00.0.76 58 73.5714 48.73

0.76 .1.52 47 48.96

1.52.2.28 60 50.37

2.28.3.04 60 53.60

3.04.3.80 62 60.29

3.80.4.56 76 77.84

4.56.5.32 138 143.48

Всего 1030 1030.00 1030.00

2 X -критерии 226.3 8.5

Таблица 2. Число землетрясений в разных широтных зонах по каталогу землетрясений [5]

Зона, градусы Число землетрясений Относительная площадь зоны, % Нормированное число землетрясений

-90.-80 0 0.7596 0.00

-80.-70 0 2.2558 0.00

-70.-60 0 3.6834 0.00

-60.-50 4 4.9990 5.51

-50.-40 25 6.1628 27.91

-40.-30 908 7.1394 875.09

-30.-20 518 7.8990 451.21

-20.-10 584 8.4186 477.31

-10.0 735 8.6824 582.47

0.10 317 8.6824 251.21

10.20 1426 8.4186 1165.48

20.30 954 7.8990 831.00

30.40 4971 7.1394 4790.80

40.50 4173 6.1628 4659.00

50.60 1293 4.9990 1779.66

60.70 6 3.6834 11.21

70.80 3 2.2558 9.15

80.90 0 0.7596 0.00

Итого 15917 1.0000 15.917

ническому закону, и поэтому нулевой гипотезе отвечают различные варианты косинус-распределения на всех четырех графиках [3, рис. 1]. В связи с этим лишены физического смысла и все последующие выводы В.М. Федорова, базирующиеся на некорректной интерпретации указанного рисунка.

Рассмотренная ошибка неоднократно повторена и в монографии В.М. Федорова [2]. Обе работы В.М. Федорова вводят в заблуждение недостаточно подготовленного читателя, акцентируя его внимание на иллюзорных эффектах и отвлекая тем самым от действительно интересных вопросов о возможном влиянии приливных волн на вулканическую активность. Такой анализ вполне возможен по имеющимся у В.М. Федорова данным.

Подобную ошибку совершает и Н.П. Булатова [1], анализируя число землетрясений на разных широтах Земли. Разделив поверхность Земли на зоны по 10° широты, Н.П. Булатова "забыла" поделить число землетрясений на площадь зоны, хотя площадь десятиградусной зоны у полюса в 11 с лишним раз меньше площади экваториальной зоны 0°-10°. Далее автор детализирует распределение землетрясений, взяв широтные зоны шириной по 1°. Здесь уже площадь приполярной зоны меньше экваториальной в 114 раз! Не смутившись этим, автор переходит к вычислению статистической до-

стоверности и изучению влияния на сейсмичность как внешних источников (Луна, Солнце), так и внутреннего строения Земли.

Нормированные значения (табл. 2) нами были пропорционально изменены, чтобы сохранить их сумму 15917 для правомочности последующего обращения к критерию %2. Естественно, произошло некоторое перераспределение данных в пользу более высоких широт. К счастью для автора, сейсмическая активность в полярных широтах настолько низкая, что отсутствие нормирования гистограммы землетрясений не приводит к несуразным выводам. Тем не менее, это ставит под сомнение корректность выполненных расчетов и статистическую достоверность получаемых выводов, какие бы они ни были.

Печально, но подобные публикации дискредитируют саму идею поиска статистических связей между космическими и земными процессами, а ведь обнаружение таких связей часто служит основой для построения физической модели. Наша планета постоянно подвергается мощному воздействию со стороны Луны, Солнца и других небесных тел, реализующемуся посредством гравитационных и электромагнитных сил. И

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком