научная статья по теме СТАТИСТИЧЕСКАЯ МОДЕЛЬ ВОССТАНОВЛЕНИЯ РЕГИОНАЛЬНОЙ СТРУКТУРЫ ГЕОФИЗИЧЕСКИХ ПОЛЕЙ Геофизика

Текст научной статьи на тему «СТАТИСТИЧЕСКАЯ МОДЕЛЬ ВОССТАНОВЛЕНИЯ РЕГИОНАЛЬНОЙ СТРУКТУРЫ ГЕОФИЗИЧЕСКИХ ПОЛЕЙ»

УДК 551,509,314

Статистическая модель восстановления региональной структуры геофизических полей

А. И. Чавро», Е. В. Дмитриев*

Предлагается статистический метод решения обратных задач восстановления мелкомасштабных геофизических полей по крупномасштабным полям, полученным с помощью модели общей циркуляции атмосферы. Вводятся понятия надежности модели и информативности входных данных. Исследуется возможность с помощью параметра надежности модели заблаговременно отфильтровывать события, когда обратная задача будет решаться с низкой точностью. Исследуется зависимость точности решения обратной задачи от точности входных данных модели. Приводятся результаты численных экспериментов.

Введение

В работах [1, 6, 7] рассмотрены задачи восстановления детальной структуры региональных полей среднемесячных значений приземной температуры и высоты поверхности 500 гПа по пространственно осреднен-ным, крупномасштабным полям среднемесячных значений этих величин. Эта проблема в англоязычной литературе получила название "(1о\¥тса1-и рассматривалась также в работах [2, 9—14] и других.

Для решения такого рода задач были предложены [1, 6, 7] многомерные статистические модели, основанные на использовании статистической априорной информации. Статистическая модель включает в себя: формулировку прямой задачи; метод построения оператора, с помощью которого получается оценка решения обратной задачи; оценку погрешности решения, Эти работы направлены на исследование возможности предсказуемости детальной структуры региональных геофизических полей на основе прогноза с помощью моделей общей циркуляции атмосферы осредненных по пространству и времени метеорологических полей. Проведенные численные эксперименты показали, что предложенные методы позволяют решать указанные обратные задачи [1, 6] с точностью ~ 30%.

Точность оценки решения обратной задачи, по-видимому, может быть повышена с помощью привлечения дополнительной априорной информации. Важной задачей в этом направлении является также выработка требований к приемлемой точности прогнозирования осредненных значений геофизических полей, по которым восстанавливается значение регионального поля.

* Институт вычислительной математики Российской академии наук.

При построении методов решения многомерных обратных задач в качестве входных данных обычно используется информация с окружающих регионов. Если задача решается для определенного региона, то важно оценить, какое влияние оказывают другие регионы, т. е. оценить информативность входных данных с других регионов. Кроме того, при построении статистической модели можно использовать для априорной информации разные банки данных наблюдений. В этом случае мы получим набор (или множество) моделей решения задачи, однако при этом необходимо ответить на вопрос — какая модель более надежная при решении обратной задачи в каждом конкретном случае?

В этой статье будет оценена точность решения обратной задачи в зависимости от точности входных данных, а также введены понятия информативности входных'данных и надежности статистических моделей и получены для них оценки.

Методика

По аналогии с работами [1, 6, 7] будем рассматривать линейные задачи в виде

| = Ж + V, (1)

где I; е Я" — известный вектор крупномасштабного поля. Координатами этого вектора являются пространственно осредненные значения мелкомасштабного поля в отдельных регионах. Г е — искомый вектор мелкомасштабного поля, V € К" — вектор погрешности А — линейный оператор.

Для решения обратной задачи, т. е. восстановления вектора Г по известному вектору $, в работах [1, 6, 7] предложено использовать методы статистических оценок с минимальной среднеквадратичной погрешностью [3, 5].

Решение обратной задачи (1) сводится к построению такого оператора Л, подействовав которым на соотношение (1), получим наилучшую сред-

Л ,

неквадратичную оценку Ш вектора Мей, Здесь V — линейный оператор, действующий из Кт в /?* и определяющий информацию, которую необходимо получить о векторе 1 В нашем случае оператор V будет выделять из всего набора компонентов вектора Г те, которые принадлежат региону, в котором восстанавливается мелкомасштабное поле. Например, если это будет один компонент /¡, 0 < » < т, то оператор и имеет вид

1 2 3 ... 1 ... т

и = [0 0 0 ... 0 1 0 ... 0],

если вектор Щ имеет два компонента £ и £ с номерами 0 < /, ] < т, то

1 2 3 ... ; ... ] ... т

_ Гооо ... 010... о ... о 1 000 ... 0 ... 010 ... о

и так далее. В случае, когда <Г> = 0и<у>=0 (<> — символ осреднения) и <(у*> = о (т. е. векторы Г и V не коррелированы), оператор Я можно найти из условия минимума правой или левой частей соотношения для среднеквадратичной погрешности решения обратной задачи [3, 5]

Е\\Я£ - т\\2 = Е\\{ЯА -Ц){ + Л>||2, (2)

где Е — символ математического ожидания. Минимизируя функционал

Ф(Д) = Е\\(ЯА - -ь

получим

я, = иЕЛ'2-\ (3)

где О, = АРА* + Еу — ковариационная матрица обобщенной ошибки вектора = <П"*> иХ„ = <уу*> — ковариационные матрицы векторов {и V соответственно. Таким образом, интересующая нас оценка получается из соотношения

(4)

Среднеквадратичная априорная погрешность решения обратной задачи, приведенная к одной координате искомого вектора, определяется соотношением

где

А, = пи(Е - ЕА'д-'АЕ)!/' (6)

дисперсия вектора погрешности решения обратной задачи.

Если минимизируется функционал в виде левой части соотношения (2)

то получим

Ф(Я) = Е\\Щ ~ Щ|2,

^2 — > О)

ст<2) и и/

где

/?2 - йг^Е^-

£(// = <тШ)' >,1{ =<Ш'>Лигл = <(М)Г>.

Когда известны оператор А, а также ковариационные матрицы Р и Е„, то говорят, что задана модель [А, Р, X„]. Заметим, что матрицы F иЕ„ мож-

41

но оценить по разным выборкам, и для каждой выборки они могут оказаться разными. Тогда мы получим разные модели: fit = [Л,/г(1),£(у1>], fi2 = ... и соответственно разные операторы: й(|), Rm, ....

Другими словами, мы получим некоторый класс моделей М.

Возникает вопрос — какую модель выбрать для решения обратной задачи? Для решения этого вопроса можно ввести понятие надежности модели [3]. Пусть в принятой модели [A, F,XV] задачи (1) про вектор v достоверно известно, что он имеет нормальное распределение JV(0, £v). Тогда задача вычисления надежности модели состоит в проверке нулевой гипотезы:

) = N{Ai,Qm),

где | и f — математические ожидания случайных векторов £ и f. Для проверки гипотезы Н0 построим контрольную величину

= 11<Г1/2(£ -Af)\2, (Ю)

которая при верной гипотезе Но имеет %2-распределение. Зададимся уровнем значимости а и определим границу критической области tan, которая определяется условием t„> t". Тогда вероятность Р(/„ > t°) того, что контрольная величина tn лежит в критической области, определяется соотношением

00

P(t. >0 = \р(п)г(х)сЬс = а, (11)

J х

i"

где р("} — плотность вероятности %2-распределения с л степенями свобо-

х'

ды. При заданном уровне значимости а соотношение (11) позволяет вычислить границу критической области t ".

Затем по известному значению £ по формуле (10) вычисляется конкретное значение /„. Если tn > ta„, то t„ лежит в критической области и наша гипотеза Н0 должна быть отвергнута. Если же /л < t", то можно утверждать только то, что гипотеза не противоречит конкретному наблюдению §,

В [3] по аналогии с уровнем значимости а было введено понятие надежности модели /л относительно известного вектора которая вычисляется по формуле

Q0

\pin)(x)dx= а. (12)

>. *'

Как видно из этого соотношения, надежность модели можно трактовать как минимальную вероятность ошибочно отвергнуть гипотезу Но, или как минимальную вероятность ошибки первого рода.

Параметр надежности модели можно использовать при решении обратной задачи двояким образом. Во-первых, если стоит вопрос о выборе модели р., из класса моделей М, то можно воспользоваться принципом мак-

симальной надежности модели [3], суть которого состоит в следующем. Пусть нам известно, что истинная модель ¡л принадлежит классу моделей М. Методом максимальной надежности называется метод выбора модели /16 М, основанный на наблюдении вектора при котором

3p(g) = inax^a^jjj eMj. (13)

Во-вторых, мы можем установить минимальный порог надежности атт и выбирать для интерпретации только те события, для которых а >amin.

Поскольку вектор | в задаче (1) представляет собой конечный набор единичных значений т. е. осредненных по отдельным регионам значений f, то возникает вопрос: какое влияние оказывает каждый отдельный регион на результат и погрешность восстановления поля Ш и насколько каждое значение согласуется с математической моделью ц! Ответ на этот вопрос дает метод рекуррентной редукции [4], который по сути близок к фильтрации Калмана — Бьюси [8]. Этот метод позволяет:

1) получить решение обратной задачи с минимальной среднеквадратичной погрешностью;

2) исследовать информативность каждой координаты т. е. каждого региона;

3) априори определить его влияние на результат и погрешность редукции;

4) вычислить надежность используемой математической модели.

Кроме того, следует заметить, что алгоритм рекуррентной редукции позволяет избежать в процессе вычисления редукции обращения матриц, что делает его более предпочтительным в вычислительном плане. Метод рекуррентной редукции для модели [А, F, Е, ] можно сформулировать в виде следующего алгоритма.

Если в (1) случайные величины vu v2, ..., v„ не коррелированы, т. е. Ev,v, =

= 0, / * j, Evf = а), i,j = 1, 2, ..., л, а оператор Q = AFA* + Iv не вырожден,

» 1 »

то редукция Ui = Щ, погрешность редукции \ = trU(F - FA Q AF)U и значения функционала tn(f) для любого линейного оператора U такого, что ||t/|| < оо, могут быть получены из рекуррентных соотношений

fW = f(*->> +F(*-4 g*~J>*'f(*~"> ; (14)

'(*) _ I7(*-I) V a*

(F(k-X)&k)(Fik'l)mk)*

(15)

r(*> = г11"1» + (16)

(a tiFik'4k) + а2

за n шагов с начальными условиями:

/(0) =0;FW=F;T(0) = 0

так, что

т= т(п)', л = 1г[С//^(я>С/]; 1п = г(я);

при этом векторы а* являются транспонированными строками матрицы оператора А и выполняется условие (а*, ''а*) + а\ > 0 для всех к = 1, 2, п.

Заметим, что для фиксированного к верно соотношение = £[Т -- - 1(4>)

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком