научная статья по теме НЕСМЕЩЕННАЯ ОЦЕНКА СТАТИСТИЧЕСКОЙ ЭНТРОПИИ ГИДРОЛОГИЧЕСКИХ РЯДОВ Геофизика

Текст научной статьи на тему «НЕСМЕЩЕННАЯ ОЦЕНКА СТАТИСТИЧЕСКОЙ ЭНТРОПИИ ГИДРОЛОГИЧЕСКИХ РЯДОВ»

УДК 556.011.556.16

Несмещенная оценка статистической энтропии гидрологических рядов

С. К. Давлетгалиев*

Исследована зависимость энтропии рядов годового стока от числа лет наблюдений. Построены номограммы для оценки несмещенного значения энтропии в зависимости от числа лет наблюдений и числа градаций. Номограммы построены для распределения Пирсона III типа по смоделированным ря дам.

Речной сток в заданный момент времени, как и всякая случайная величина, характеризуется числом возможных состояний и распределением вероятностей этих состояний. Однако эти величины, взятые в отдельности, хотя и могут отражать степень неопределенности наших наблюдений, но не дают ее количественной меры, особенно в сложных случаях. Такая количественная мера в теории информации называется энтропией. Для случайных дискретных величин она имеет следующий вид [9, 10]:

Н(х) = -¿P (X, )ln P (х,). (1)

i = 1

Как вид но из (1), эн тро пия опреде ляет ся чис лом возмож ных со стоя ний n и распределением вероятностей P(x0, но не множеством конкретных значений наблюдаемых явлений. В этой формуле вместо неизвестной априорной вероятности Pi обычно используют ее оценку Pi = m/N (i = 1, 2, ..., S), где mi — частота исхода xi в выборке объема N. Такая статистическая оцен ка ис поль зует ся в раз ных при ложе ни ях, напри мер, в гид роло гии и метеорологии для решения ряда практических задач [1, 3, 5, 11, 12]. Формулу (1) используют также при моделировании и прогнозировании сложных систем в экономике, транспорте ([6] и др.).

Величина Н(х), вычисленная по данным выборочных наблюдений, является смещенной величиной. Смещенность этропии, вычисленной по формуле (1) для независимых нормально распределенных случайных величин, показана в работе [2]. Согласно [2], величина Н(х) является смещенной, состоятельной, асимптотически нормальной оценкой энтропии, и среднее значение ее имеет следующий вид:

S - 1 1

M[H] = Н(х) - ---lg, e + o — , (2)

L J ^ 2N 2 ^ N2)

где S — число градаций; N — объем выборки.

* Казахский национальный университет им. Аль-Фараби; e-mail: sdavletgaliev@mail.ru.

В данной работе рассматривается возможность оценки несмещенного значения энтропии асимметрично распределенных случайных величин. Задачу можно решить аналогичным способом, как это было решено в работе [8] для оценки точности параметров кривой распределения, т. е. с использованием метода статистических испытаний (метод Монте-Карло) и разных типов кривой распределения.

Расчеты выполнены с учетом возможных изменений параметров наблюдаемых гидрологических рядов (Cv = 0,1; 0,3; 0,5; 0,7; 0,9; 1,1; 1,3; 1,5; CJCv = 1, 2, 3, 4 и Cs = 0), при разных объемах выборок (n = 20, 40, 60, 80, 100, 200, 300, 500, 1000, 5000, 10 000, 25 000 и 50 000) и при разных значениях коэффициентов автокорреляции между смежными членами ряда (r = 0; 0,3; 0,5). Смоделированная последовательность чисел объема N разбивается на выборки меньшего объема n. Число таких выборок равно l = N/n.

Моделирование годового стока производилось с использованием математического аппарата нормальной корреляции для нормально распределенных случайных последовательностей с дальнейшей их трансформацией в заданный закон распределения.

Для статистического моделирования гидрологических рядов применен метод канонического разложения [4, 8]:

Qt = mQi + £ <p,F,, (3)

i = 1

где mQi — математическое ожидание случайных величин Q;-; Vi — случайные некоррелированные величины, математическое ожидание которых равно нулю; ф, — неизвестные функции, называемые координатами.

Неизвестные функции ф, и дисперсии случайных величин Vi определяют ся по дан ным на блюде ний с помощью ре кур рен тных формул [4, 8]. Случайные величины Vi определяются по стандартной программе GAUSS. Вычислив по формуле (1) значение Q;-, определяем вероятность его наступления с помощью стандартной программы NDTR. Далее осуществляется переход от вероятности к обеспеченности. Зная обеспеченность величины Qi для заданных значений Cv и Cs, по соответствующей таблице Крицкого — Менкеля путем интерполяции можно определить модульный коэффициент стока. Для этой цели используется интерполяционная формула Ньютона. Алгоритм моделирования подробно описан в работе [7].

Результаты статис ти чес ко го моде ли ро ва ния гид роло ги чес ких ря дов методом канонического разложения показали достаточную надежность метода. Последний почти полностью обеспечивает сохранение параметров кривой распределения исходных и смоделированных рядов.

По смоделированным значениям модульных коэффициентов для заданного значения интервала определяются число попаданий Ki в каждый интервал и его вероятность попадания в i-й интервал. Затем по формуле (1) вычисляются значения энтропии. Расчетное значение ее для n лет определяется как среднее из выборок. Энтропии вычислены для разных значений числа градаций S = 6, 8, 10 и 12.

Результаты расчетов показывают уменьшение значения статистической энтропии по мере увеличения значения коэффициентов вариации, напри-

0 2 _|_|_|_|_|_|_|_

'"о,2 0,3 0,5 0,7 0,9 1,1 1,3 1,5 Н

1 2 3 5 79

0,7 0,9 1,1 1,3 1,5 1,7 1,9 Н

Рис. 1. Зависимость между смещенными и несмещенными оценками энтропии для распределения Пирсона III типа при разных объемах выборки N и S = 8 (а), S = 10 (б).

Жравно: 1) 5000; 2) 1000; 3) 500; 4) 300; 5) 200; 6) 100; 7) 80; 8) 60; 9) 40.

мер при числе градаций S = 12 и при коэффициентах Cv = 0,3 и Cv = 1,5 значения энтропии соответственно равны 2,04 и 1,28 при продолжительности ряда n = 80 лет. Заметно уменьшение энтропии по мере увеличения коэффициентов асимметрии, например при Cs = 0,80 энтропия равна 2,04, при Cs = 1,20 — 1,95. Особо следует отметить уменьшение величины энтропии по мере увеличения числа лет n. При S = 12, n = 60 и Cv = 0,7, Cs = 0,14 величина энтропии равна 1,92, а при n = 50 000 — 1,33. Такая закономерность наблюдается во всех случаях, и это дает основание сделать вывод о положительной смещенности энтропии коротких рядов.

Результаты расчетов при r =0и представлены на рис. 1 в виде

номограммы для определения несмещенного значения энтропии по смещенному значению и по числу лет наблюдений. В статье приведены графики для числа градаций S = 8 и 10.

На рис. 2 приведены зависимости величины статистической энтропии конкретных рек с длинными рядами наблюдений от числа лет n. На рис. 3 аналогичная зависимость построена по смоделированным рядам. На рис. 2

Рис. 2. Зависимость энтропии от числа лет наблюдений при 5=8.

1) р. Неман — с. Смалинский; 2) р. Венерен — п. Сьеотроп; 3) р. Влтава — г. Прага; 4) р. Ниагар — п. Куестон.

Я

видно, что значения энтропии до п = 90 лет имеют тенденцию как повышения, так и понижения. Энтропия годового стока постепенно уменьшается по мере увеличения п. В изменении энтропии стока рек Венерен и Влтава чередуются небольшие подъемы и спады. На рис. 3 видно, что энтропия смоделированных рядов только уменьшается с увеличением объема смоделированных рядов при разных значениях коэффициента вариации. Однако по мере увеличения значения коэффициента Су величина энтропии уменьшается.

Оцен ка ве ли чи ны энтропии по смоделированным рядам показала слабую за ви си мость ее от кор ре ли ро ван нос ти ря дов (таблица). Как видно из дан ных табли цы, раз ли-чие значений энтропии при г = 0 и г = 0,50 заключается лишь в сотых долях. На этом основании можно утверждать, что при оценке энтропии стока величину автокорреляции можно не учитывать,

V, —♦— - —»1

1-1 1- —ш2

----- А 3

—К4

400

800

1200

Рис. 3. Зависимость энтропии от продолжительности смоделированных рядов при г = 0, С5 = 2Су, 5 = 12.

1) Су = 0,30; 2) Су = 0,70; 3) Су = 1,1; 4) Су = 1,5.

Значения энтропии для независимых и коррелированных случайных величин при 5 = 10

Число лет Коэффициент вариации

0,1 0,3 0,5 0,7 0,9 1,1 1,3 1,5

60 1,87 1,85 1,80 1,73 1,61 1,45 1,29 1,15

1,88 1,86 1,81 1,74 1,63 1,48 1,31 1,18

100 1,84 1,82 1,76 1,67 1,53 1,36 1,19 1,05

1,85 1,83 1,78 1,69 1,56 1,39 1,23 1,09

500 1,72 1,68 1,62 1,49 1,30 1,11 0,94 0,82

1,73 1,70 1,63 1,51 1,32 1,14 0,96 0,84

1000 1,67 1,63 1,55 1,47 1,21 1,02 0,85 0,73

1,69 1,65 1,57 1,49 1,24 1,05 0,88 0,76

Примечание. В первой строке таблицы приведены значения энтропии при г = 0, во второй — при

г = 0,50.

если принять во внимание, что коэффициент автокорреляции в рядах годового стока в основном не превышает г = 0,5.

Таким образом, статистическая энтропия рядов годового стока является положительно смещенной величиной. По мере увеличения числа лет наблюдений энтропия уменьшается. Она также уменьшается по мере увеличения значений коэффициентов вариации и асимметрии. Зависимость энтропии от коррелированности рядов незначительна.

Литература

1. Багров Н. А. Статистическая энтропия как мера неопределенности и связанности случайных величин. — Метеорология и гидрология, 1957, № 9, с. 43—48.

2. Башаринов Г. П. О статистической оценке энтропии последовательности независимых случайных величин. /В кн.: Теория вероятности и ее применение, 1959, т. IV, вып. 3, с. 361— 364.

3. Бусалаев И. В. Выбор кривых распределения речного стока и оценка их параметров методом минимакса энтропии. — Метеорология и гидрология, 1982, № 6, с. 82—90.

4. Бусалаев И. В., Давлетгалиев С. К., Ку-перман И. Г. Моделирование гидрографа речного стока методом канонического разложения. /В сб.: Труды IV Всесоюзного гидрологического съезда. — Л., Гидрометеоиз-дат, 1975, т. 3, с. 146—155.

5. Валь Е. Статистическое энтропическое соотношение как вспомогательное средство для решения проблемы прогноза. /В сб.: Вопросы предсказания погоды. — Л., Гидрометеоиз-дат, 1958, с. 295—303.

6. Вильсон А. Д. Энтропийные методы моделирования сложных систем. — М., Наука, 1978, 246 с.

7. Давлетгалиев С. К. Совместное моделирование рядов годового стока рек методом канонического разложения. — Метеорология и гидрология, 1991, № 10, с. 102—108.

8. Пугачев В. С. Теория случайных функций. — М., Физматгиз, 1962, 884 с.

9. Рождественский А. В. Оценка точности кривых распределения гидролог

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком