научная статья по теме ПРИМЕНЕНИЕ МОДИФИЦИРОВАННОЙ НЕЙРОННОЙ СЕТИ ХОПФИЛДА ДЛЯ ОБРАБОТКИ ЗАШУМЛЕННЫХ МАГНИТОТЕЛЛУРИЧЕСКИХ ДАННЫХ Геофизика

Текст научной статьи на тему «ПРИМЕНЕНИЕ МОДИФИЦИРОВАННОЙ НЕЙРОННОЙ СЕТИ ХОПФИЛДА ДЛЯ ОБРАБОТКИ ЗАШУМЛЕННЫХ МАГНИТОТЕЛЛУРИЧЕСКИХ ДАННЫХ»

ФИЗИКА ЗЕМЛИ, 2007, № 3, с. 31-38

УДК 550.837

ПРИМЕНЕНИЕ МОДИФИЦИРОВАННОЙ НЕЙРОННОЙ СЕТИ ХОПФИЛДА ДЛЯ ОБРАБОТКИ ЗАШУМЛЕННЫХ МАГНИТОТЕЛЛУРИЧЕСКИХ ДАННЫХ

© 2007 г. И. В. Попова1, Я. Огава2

1Центр геоэлектромагнитных исследований ИФЗ им. О.Ю. Шмидта РАН, г. Троицк Моск. обл. 2Токийский институт технологий, г. Токио, Япония Поступила в редакцию 15.05.2006 г.

Представлен новый подход к обработке зашумленных магнитотеллурических (МТ) временных рядов, основанный на нейросетевом алгоритме, который обеспечивает структуризацию данных, устранение в них помех и искажений для последующей корректной оценки МТ функций отклика. Метод был проверен на реальных данных, загрязненных антропогенными помехами.

PACS: 91.25.Qi

Ключевые слова: обработка данных, помехи, передаточная функция, магнитотеллурика, нейронная сеть.

1. введение

Загрязнение магнитотеллурических (МТ) данных различными типами помех как искусственного, так и естественного происхождения, требует тщательного анализа МТ временных рядов и аккуратной оценки по ним передаточных функций. Стандартная обработка временных рядов подразумевает оценивание импеданса 2 в частотной области по необработанным предварительно электрическим и магнитным временным рядам е(0 и Ь(0. В теоретических исследованиях в области МТ методов зондирования [Бердичевский, Жданов, 1981] было показано существование линейной взаимосвязи между компонентами электромагнитного (ЭМ) поля. При определенных условиях возбуждения поля [Бердичевский, Дмитриев, 1992], в частности, в модели возбуждения плоской волны, электрическое поле е и магнитное поле Ь связаны в частотной области следующим образом

е = Ь 2 + £, (1)

где £ - помеха. Минимизация остатка дает

2 = (еЬ*)(ЬЬ* )-1, (2)

где элементы (еЬ*) и (ЬЬ*) - усредненные авто-и взаимные спектральные оценки по доступным данным, * означает комплексно-сопряженный вектор.

Применение классического спектрального анализа и среднеквадратичной регрессии справедливо,

если данные удовлетворяют условию стационарности, а помехи - Гауссовой модели. В действительности эти условия нарушаются из-за геомагнитных, антропогенных и инструментальных помех. Для того, чтобы преодолеть эти ограничения, активно развиваются робастные схемы оценок передаточных операторов, которые мало чувствительны к умеренному числу нестационарных эффектов и отскоков или к небольшому несоответствию предложенной модели.

Следующим шагом в развитии обработки МТ временных рядов было применение метода "удаленной базы" (remote reference или сокращенно RR), который использует дополнительные синхронные наблюдения с другой станции. Обычно используется горизонтальное магнитное поле b' для того, чтобы минимизировать эффект смещения амплитуд импеданса [Gamble et al., 1979]. Использование RR-метода вместе со взвешиванием среднеквадратичных построений передаточных функций приводит к надежным оценкам импеданса:

Z = (w ebr*)(wbbr* )Л (3)

где w - матрица весов для отдельных сегментов [Huber, 1981].

В работе [Szarka, 1986] был сделан подробный обзор возможных способов устранения антропогенных электромагнитных возмущений. Различные робастные алгоритмы со взвешиванием осредняемых данных для корректной оценки передаточной функции были предложены в [Jones, Jodicke, 1984; Egbert, Booker, 1986]. В работе [Lars-

en, 1989] сделана робастная оценка передаточной функции с использованием взвешивания оценок во временной и частотной области по очереди, что позволило устранить эффект отскоков в обеих областях. В исследовании [Egbert, 1997] была предложена робастная многомерная оценка передаточных функций для того чтобы реализовать реальную схему робастной обработки данных для ряда МТ станций. Ускоренный ро-бастный алгоритм для оценки электромагнитных (ЭМ) передаточных функций, полученных одновременно от наблюдений с нескольких станций, был разработан в работе [Varentsov et al., 2003 a] и продемонстрирован на данных эксперимента BEAR (Baltic Electromagnetic Array Research). Метод разделения сигнал-шум (signal-noise-separation method или, сокращенно, SNS) [Lars-en et al., 1996] был оптимизирован слиянием SNS- и RR-методов [Larsen et al., 2001] в SNS(RR)-метод, который был успешно тестирован на реальных данных.

Одним из недостатков перечисленных методов является устранение помех отдельно во временной и в частотной областях или только в одной из них. Кроме того, новые системы наблюдения требуют новых подходов к оценке передаточных функций, которые могут полностью автоматически обрабатывать массивы данных огромной размерности, принимая во внимание синхронность выполняемых наблюдений.

В данной статье предлагается принципиально другая схема, основанная на нейросетевом (НС) подходе, которая позволяет учитывать новые требования к обработке МТ временных рядов.

2. нейронная сеть хопфилда

Нейронная сеть Хопфилда [Hopfield, 1982] является мощным инструментом для решения таких задач, как распознавание образов, классификация, фильтрация, оптимизация и т.п. [Hopfield, Tank, 1985]. Такая нейронная сеть называется сетью без учителя, так как обучающее правило не устанавливается из взаимосвязи между входом и выходом на стадии обучения.

Сеть Хопфилда состоит из полностью взаимосвязанных N-нейронов, которые образуют одноуровневую структуру. Нейроны рассматриваются как вычислительные элементы, которые преобразуют взвешенную сумму входных сигналов посредством пороговой функции. Каждый i-ый нейрон характеризуется выходным состоянием щ, весом связи Wy с нейроном j и нелинейной передаточной функцией F, которая преобразует взвешенные входные сигналы Xj от оставшихся нейронов в соответствии с уравнением:

ui = F

1

V j

wijxj

(4)

Существует большое разнообразие передаточных функций [Cichocki, Unbehauen, 1993]. В стандартном алгоритме Хопфилда используется пороговая передаточная функция, применение которой ограничивает состояния нейронов только двумя значениями: -1 и 1. В нашем исследовании используется функция:

F=

a, x > a x, - a < x < a -a, x < -a.

(5)

При применении такой передаточной функции нейроны имеют непрерывные действительные значения, меняющиеся в пределах пороговых значений, а ее использование дает возможность подавлять большие ошибки и получать более гладкое решение по сравнению с использованием обычной пороговой функции.

Функция энергии сети Хопфилда описывается следующим образом:

E = -111 w'Jx'xJ. i = i j = i

(6)

Если веса Wy симметричны и wti = 0, тогда может быть показано [Tank, Hopfield, 1986], что энергия E не будет расти при изменении состояний нейронов х^. В сети Хопфилда, которая используется в задачах распознавания образов, весовая матрица формируется как автоассоциативная память. Она хранит ряд обучающих паттернов в соответствии с правилом обучения Хебба [Hebb, 1957]:

wi, =

1

S = 1

s s ij

(7)

где х5 - 7-ая компонента 5-го обучающего паттерна, М - полное число обучающих паттернов. Автоассоциативная матрица памяти симметрична, так как вес связи между 7-ым и /-ым нейронами равен весу связи между нейронами 7 и/. Таким образом, сеть с энергией (6) и матрицей памяти (7) будет сходиться к стабильному состоянию, называемому аттрактором, в котором энергия минимизируется. Процедура сходимости определяется как градиентный спуск функции энергии по времени:

xi (n +1) = F

1 wijxj( n)

V =i

(8)

применение модифицированной нейронной сети хопфилда 33

В точке аттрактора значение x, перестанет меняться и состояние будет устойчивым. Было показано [Бражник и др., 1987], что ХНН с памятью (7) может быть использована для восстановления входов и удаления помех.

Другой нелинейной ассоциативной моделью памяти является Brain-State-in-a-Box (BSB) модель [Anderson, 1977]. Для BSB алгоритма процедура сходимости (8) меняется следующим образом:

Xi (n +1) = F

N

Y Xi (n) + ß* WjXj (n)

j = i

(9)

где в - коэффициент обратной связи, у - константа распада, а передаточная функция имеет вид (5). BSB-алгоритм аналогичен по виду функции энергии алгоритму Хопфилда, однако, используется, как алгоритм кластеризации, а не автоассоциативной памяти. В нашем исследовании применяется аналогичная модификация этого алгоритма для кластеризации данных при обработке МТ временных рядов.

3. нейросетевая обработка мт временных рядов

При обработке многомерного массива МТ данных важно автоматизировать процесс редактирования и сделать его быстрым и эффективным. Качество оценки передаточных функций часто зависит от выбора соответствующих временных сегментов с небольшим уровнем шума. Основная идея частотного и временного взвешивания в робастных схемах заключается в уменьшении влияния зашумленных сегментов и увеличении веса свободных от помех данных.

На первом шаге обработки выполняются стандартные процедуры препроцессинга первичных временных рядов. Они включают в себя удаление больших отскоков, разрывов, линейных трендов и дополнительную фильтрацию. На следующем шаге выбирается длина отрезка записи (окна) таким образом, чтобы получить хорошее разрешение в частотной области и достаточное число спектральных оценок [Varentsov et а1., 2003а].

В нашей работе для выбранного отрезка записи, содержащего постоянное число временных сегментов, выполняется предварительная оценка импеданса в частотной области (см. уравнение (2)) в направлении временной оси. Таким образом, начальный массив временных рядов преобразуется в МТ функцию ¿(ю, 0, зависящую от времени и частоты. После этого она масштабируется и рассматривается в качестве функции энергии Хопфилда, которая затем минимизируется. В результате этой процедуры находятся локальные минимумы, которые определяют автоматическое

разделение (кластеризацию) на иерархию подокон с весами, соответствующими размеру этих подокон. Такая иерархическая кластеризация данных позволяет извлекать отскоки, находить временные сегменты с низким уровнем помех и оценивать передаточную функцию по лучшим из них.

Итак, рассмотрим преобразованный массив импеданса ¿(ю, {) как начальное окно данных. Обок

значим каждый элемент этого массива как , где 1 - индекс, соответствующий номеру частоты (1 = = 1, ..., N)), а к - индекс, соответствующ

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком