научная статья по теме НЕЙРОННАЯ СЕТЬ ОБОБЩЕННОЙ РЕГРЕССИИ КАК СРЕДСТВО ДЛЯ АВТОМАТИЧЕСКОГО КАРТИРОВАНИЯ ДАННЫХ РАДИАЦИОННОГО МОНИТОРИНГА Энергетика

Текст научной статьи на тему «НЕЙРОННАЯ СЕТЬ ОБОБЩЕННОЙ РЕГРЕССИИ КАК СРЕДСТВО ДЛЯ АВТОМАТИЧЕСКОГО КАРТИРОВАНИЯ ДАННЫХ РАДИАЦИОННОГО МОНИТОРИНГА»

< 3

ИЗВЕСТИЯ АКАДЕМИИ НАУК ЭНЕРГЕТИКА

2009

УДК 004.89.032.26:551.577

© 2009 г. КУЛИК Ю.А., САВЕЛЬЕВА Е.А., ТИМОНИН В.А., УТКИН С.С., ШИРОКОВА И.В.

НЕЙРОННАЯ СЕТЬ ОБОБЩЕННОЙ РЕГРЕССИИ КАК СРЕДСТВО ДЛЯ АВТОМАТИЧЕСКОГО КАРТИРОВАНИЯ ДАННЫХ РАДИАЦИОННОГО МОНИТОРИНГА*

Рассмотрен метод обобщенной регрессии, формализованной в виде искусственной нейронной сети, как возможный подход к картированию данных радиационного мониторинга. Алгоритм настройки параметров модели позволил адаптировать ее для использования в полностью автоматическом режиме, без участия эксперта. Внимание уделено возможности сопровождения пространственной оценки уровнем ее неопределенности (статистической мерой ошибки оценки). Рассмотрено влияние количества данных мониторинга на результат прогнозирования.

Введение. В настоящее время повышается ответственность за радиационную безопасность населения и окружающей среды, что вызывает необходимость тщательного мониторинга состояния окружающей среды в районах дислокации радиационно-опасных объектов. Расстановка современных датчиков, разработка надежных систем передачи, сбора и хранения информации предполагают развитие средств для обработки и картирования этих данных в полностью автоматическом режиме.

В работе рассматривается возможность использования искусственной нейронной сети (ИНС) обобщенной регрессии (НСОР) в системе регулярного радиационного мониторинга потенциально опасных объектов. Для использования в такой системе пригодны только методы, работающие в режиме реального времени, т.е. обладающие достаточно большой скоростью реакции полностью в автоматическом режиме, абсолютно без участия эксперта. Кроме того, любая оценка на основе данных мониторинга должна сопровождаться оценкой уровня неопределенности, например, статистической мерой ошибки оценки.

НСОР формализует в форме ИНС метод ядерной интерполяции, разработанный на основе непараметрического моделирования функции плотности распределения [1-3]. Этот метод имеет разработанную теоретическую основу, и ряд преимуществ, делающих его применение привлекательным. Ядерная интерполяция - изначально нелинейный метод, он не требует никакого специально подобранного преобразования для преодоления линейности. Учет пространственной корреляции данных, в т.ч. и возможной пространственной анизотропии, осуществляется за счет параметров модели ядра НСОР. Параметры ядра являются единственными настраиваемыми параметрами, их подбор легко осуществляется в автоматическом режиме на основе минимизации среднеквадратичной ошибки. По сравнению с традиционными нейронными сетями (многослойным персептроном) НСОР обладает устойчивостью при обучении, независимостью от начального задания значения параметров. Таким образом, основными преимуществами метода можно считать его простоту для использования и интерпрета-

* Работа выполнена при частичной финансовой поддержке РФФИ. Грант № 07-08-00257.

ции результатов. Единственным недостатком НСОР можно считать возможность сглаживания оценки, эта проблема будет специально рассмотрена далее.

В данной работе применение НСОР иллюстрируется тремя примерами исходных данных - два набора данных распространялись в рамках международного соревнования по сравнению методов пространственной интерполяции (Spatial Interpolation Comparison, SIC-2004) [4], третий описывает загрязнение почвы 137Cs Западной части Брянской обл. после аварии на Чернобыльской АЭС [5]. Для SIC-2004 использовались данные мониторинга радиационной обстановки в районе действующей атомной станции и искусственные данные, моделирующие аварийный выброс на ней [4]. Рассматриваемые наборы данных различаются по уровню сложности поверхности загрязнения. В работе приведены свойства прогноза НСОР при плотной и разреженной сети мониторинга.

В данной работе внимание уделено процедуре моделирования неопределенности полученной оценки. Неопределенность описывается с помощью центрированного статистического момента второго порядка и с помощью моделирования локальной условной функции распределения. Проверена возможность получения оценки неопределенности простейшим способом без дополнительной перенастройки параметров модели.

Проведенные исследования демонстрируют перспективность НСОР для использования в автоматизированных системах принятия решений, как средства анализа данных мониторинга в режиме реального времени.

Математические основы метода обобщенной регрессии

Рассмотрим формальные основы метода ядерной интерполяции. Пусть задача состоит в оценке пространственной функции 2(х), которая в реальности задана набором N измерений г, в точках, задаваемых пространственными координатами х,. Моделируемую функцию представим в виде суммы двух компонент

2 (х) = т( х) + е( х), (1)

где т(х) - локальное среднее, аккумулирующее всю основную информацию о функции 2(х:); е(х) - остаточный член, установлено, что он обладает нулевым средним и отсутствием пространственной корреляции, т.е.

Е[е( х)] = 0 Ух; Е[е( х )е( у)] = {°*у х = У, (2)

10 х Ф у.

Задача состоит в реконструкции функции 2(х), т.е. в построении оценки, которую будем обозначать как 2*(х), на основе имеющихся примеров {(х,, г,) 1. Функция т(х) может быть представлена, как регрессия г по х,

2*(х) = Е[г|х] = | г/,(г|х)йх, (3)

где/г(г | х) - плотность условной вероятности г при заданных х. Из теории вероятности известно

/г( г|х) = /х, 2 (х, г) /х (х), (4)

где /х(х) - плотность вероятности х; /х х, г) - плотность совместной вероятности х и г. После подстановки (4) в (3) получается основная формула регрессионной оценки

2*(х) = | г/х, г(х, г)йг//х(х). (5)

Пользуясь свойством интегрирования совместной плотности вероятности, можно записать

fx(x) = J fx, Z(x, z)dz. (6)

В нашем случае совместная плотность вероятности fx Z(x, z) неизвестна. Чтобы ее оценить, можно использовать непараметрический ядерный метод Парсена-Розенбла-та [6, 7]. Основой оценки является ядро K(x), которое имеет математические свойства, схожие со свойствами плотности распределения: непрерывность, ограниченность, объем под поверхностью равен единице. В дополнение к этим свойствам ядро обладает свойством симметричности функции относительно точки, где оно принимает максимальное значение, обычно максимальным значением характеризуется 0.

Предполагая, что (xi, z) - независимые векторы, оценку совместной плотности вероятности можно записать через ядерную функцию от расстояния

N

П, (x, z) = K(xix)K(ziz) x e R', z e r1, (7)

где сглаживающий параметр h - положительное число, которое контролирует размах ядра; N - количество данных, использующихся для оценки функции распределения. При N ^ <х> оценка плотности вероятности стремится к реальной плотности вероятности, и получается хорошая оценка среднего [8, 9]. В [10] показано, что это количество, необходимое для правильного воспроизведения функции, зависит от структуры данных.

Используя (6) и интегрируя f Z (x, z) из (7) по z, получаем

N

f* (x) = — Z K(^ x e R'. (8)

h'N~ l h )

При этом предполагается, что

lim E[f*(x)] = fx(x). (9)

N

Используя (7), можно переписать (5) как

n + ^

Jzr* z(x, z)dz = KJ z^-h1)dz. ( 1 0)

Используя свойство симметричности ядра, можно записать

N

J zf* z(x' z) dz = hFN Z z^-lF). (11)

Таким образом, получаем выражение для моделируемой функции (5)

N N

Z* (x) = IzK^yi^). (12)

i=1 i=1

Существуют различные ядерные функции, часто используется Гауссово ядро, где параметр разброса (h) более нагляден

„(x - xi\ 1 K l -h-) = -—2 eXP

v h J (2nh )'

2

■ | x - x ,■ | | 2h2

i =1, ..., N. (13)

Первый промежуточный

Входной слой

Второй промежуточный (персептронный) слой

Выходной слой

Рис. 1. Архитектура НСОР С ядром (13) оценка моделируемой функции (5) или (12) выглядит следующим образом:

2 * (х) = £ zi ехр

/ I, | N

1 = 1

2 Н

£ ехР

Г 11х х||

/ 1 = 1

(14)

N

Интерпретация ядерного метода обобщенной регрессии в виде искусственной нейтронной сети

Ядерный метод обобщенной регрессии удобно интерпретировать в виде искусственной НСОР [3]. Схема такой нейронной сети приведена на рис. 1. Она состоит из четырех слоев: входного, первого промежуточного (слой радиальных элементов), второго промежуточного (слой, на котором формируется взвешенная сумма для соответствующего элемента выходного слоя - персептроны) и выходного. Каждый слой рассмотрим подробнее.

1. Входной слой передает сигналы, поступающие на нейронную сеть, на первый промежуточный слой нейронов. Количество входных нейронов (размерность входного пространства) определяется количеством аргументов моделируемой функции (К). Входной вектор обозначается как х = (хк), где к = 1, ..., N.

2. Первый промежуточный слой содержит столько же нейронов, сколько элементов используется для обучения сети. Эти нейроны несут в себе информацию о данных обучающих слоев или же их кластерах и передают ее во второй промежуточный слой. На уровне первого промежуточного слоя происходит вычисление расстояния между входным вектором и значением соответствующего нейрона в выбранной метрике (например, Евклидовой). Расстояние используется для вычисления значения ядра. Так как в данной работе используется гауссово ядро, то и формулы будут приводиться для такой формы ядра (13). Таким образом, для нейрона ■ вычисляется значение

ехр (—| х - Х;|| 2/2Н2).

3. Второй промежуточный слой состоит из двух нейронов. Один нейрон вычисляет взвешенную сумму ядер, весом является значение функции z1■, соответствующее вектору аргументов х{

N

£ zi ехр (—| х - х;|| 2/2Н2).

1 = 1

Второй нейрон вычисляет сумму ядер, своего рода нормировочный коэффициент

N ( и ц2Л х - хм

£

ехр

1

2 Н2

т.е. эти нейроны вычисляют числитель и знаменатель (14).

4. Выходной слой обычно состоит из одного нейрона и вычисляет значение функции Х*(х) по формуле (14).

Обучение ИНС - это процесс, во время которого сеть "знакомится" с данными, определяющими задачу, для решения которой она строится и адаптируется для максимально корректной работы с ними. ИНСОР имеет единственный параметр (сглаживающий параметр к), требующий настройки. Но этот параметр существенно влияет на качество получаемой оценки [8, 9]. М

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком