научная статья по теме НЕЙРОСЕТЕВАЯ СТРУКТУРА ДЛЯ МОДЕЛИРОВАНИЯ СЛОЖНОЙ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ ПО ВЫБОРКАМ ДАННЫХ Кибернетика

Текст научной статьи на тему «НЕЙРОСЕТЕВАЯ СТРУКТУРА ДЛЯ МОДЕЛИРОВАНИЯ СЛОЖНОЙ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ ПО ВЫБОРКАМ ДАННЫХ»

ИЗВЕСТИЯ РАИ. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2007, № 1, с. 73-82

== КОМПЬЮТЕРНЫЕ МЕТОДЫ ^

УДК 004.032.26(06)

НЕЙРОСЕТЕВАЯ СТРУКТУРА ДЛЯ МОДЕЛИРОВАНИЯ СЛОЖНОЙ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ ПО ВЫБОРКАМ ДАННЫХ*

© 2007 г. Е. В. Гаврилова, О. А. Мишулина, М. В. Щербинина

Москва, МИФИ (государственный ун-т) Поступила в редакцию 17.08.06 г.

Рассматривается задача аппроксимации функции многих переменных, которая измеряется на фоне аддитивной помехи и характеризуется качественно разными динамическими свойствами в отдельных подобластях своего определения. Предлагается решение поставленной задачи с использованием специализированной модульной нейросетевой структуры ЛИНА, формулируются правила ее обучения и функционирования. В качестве примера применения разработанной нейросетевой технологии приводится решение навигационной задачи для летательного аппарата по измерениям дальностей до радиомаяков.

Введение. Построение математической модели функции многих переменных по экспериментальным данным является важнейшей задачей многочисленных прикладных исследований. В качестве примера можно привести математическую модель аэродинамических характеристик летательного аппарата (ЛА), зависящих от углов атаки и скольжения, высоты и скорости полета, угловых скоростей и других переменных. В практически важных случаях (отрывное обтекание крыла, режимы штопора, упругие деформации конструкции самолета) только нелинейная модель аэродинамических характеристик может адекватно описать полет ЛА [1]. Для создания подобных нелинейных моделей привлекаются данные лабораторных и летных испытаний.

Еще один пример моделирования функции многих переменных связан с оцениванием критического теплового потока при кипении теплоносителя в системе охлаждения реакторной установки. В настоящее время не существует исчерпывающей физической модели явления кризиса теплообмена при произвольных значениях режимных параметров теплоносителя (давление, массовая скорость, паросодержание), поэтому для построения математической модели функции критического теплового потока используются экспериментальные данные, накопленные в различных ядерных научных центрах [2]. Сложный характер исследуемой функциональной зависимости, определяемый физической природой кризиса теплообмена, делает задачу формирования математической модели нетривиальной [3, 4].

В обоих примерах рассматриваются непрерывные функцииДх), х е X, где X- ограниченная об-

* Работа выполнена при финансовой поддержке РФФИ (проект < 05-08-01421).

ласть определения функции, X с К". Особенностью зависимости Дх) являются ее принципиально разные динамические свойства в подобластях

- т

X, у = 1, т, и X = X, отражающие особые физические закономерности изучаемого явления. Таким образом, функциюДх), х е X, можно рассматривать как "склеенные" функции Д(х), х е X, у =

1, т при обеспечении требуемой гладкостиДх) на

границах подобластей X, у = 1, т. Такая интерпретация свойств функциональной зависимости Дх) дает основание для ее обозначения как сложной или составной. Заметим, что в приведенных примерах первостепенным выступает требование точности математической модели. Использование построенной математической модели в режиме реального времени выдвигает дополнительное требование ограниченной вычислительной сложности.

Классическая теория аппроксимации ориентирована главным образом на функции одной переменной [5-12]. Переход в классической теории к функциям многих переменных многократно увеличивает вычислительную сложность решения задачи ("проклятие размерности") и потому практически неприемлем в приложениях.

Известно, что многослойные нейронные сети (МНС) с сигмоидальными активационными характеристиками нейронов являются универсальной математической моделью для приближения функций многих переменных по выборкам данных [13, 14]. Принципиальная особенность нейросетевого подхода состоит в том, что сложность порождаемой им аппроксимационной модели не растет экспоненциально с размерностью пространства аргументов функции многих переменных, как это имеет место в классических моделях. Таким образом,

при заданной точности неиросетевои подход может дать существенный выигрыш по вычислительной сложности многомерной модели.

Специальные методики создания нейросете-вых моделей функций многих переменных предлагаются в ряде публикаций [15-19]. В их числе -нейросетевая кодирующая структура СМАС и ее модификации [15, 16], модульная нейросетевая сплайн-аппроксимация [17], а также нейросете-вые аппроксиматоры, ориентированные на решение задач управления [18, 19]. В статье развивается технология синтеза нейросетевого аппрокси-матора функции многих переменных, которая основана на композиции локальных нейросете-вых аппроксимирующих функций в ограниченных областях определения исследуемой зависимости. Композиция или "сшивка" локальных аппроксимирующих функций организуется таким образом, чтобы не нарушалась гладкость синтезируемой модели, и достигается также с применением нейронной сети, настраиваемой по выборочным данным.

Одна из реализаций подобного принципа аппроксимации, основанного на гладкой "сшивке" нейросетевых аппроксимирующих функций, изложена в [17]. В этой работе авторы комбинируют идеи построения полиномиальных сплайнов и аппроксимации функций на многослойных пер-септронах для синтеза нейросетевого аппроксима-тора модульной архитектуры. Требование гладкой "сшивки" локальных аппроксимирующих функций приводит к необходимости введения дополнительных обучаемых параметров и двухэтап-ной процедуры обучения модульных нейросетей по специальным частным критериям. Предложенная в [17] методика иллюстрируется на примере аппроксимации функций одной и двух переменных. Следует заметить, что вычислительная сложность изложенного в [17] метода нейросете-вой сплайн-аппроксимации существенно возрастает с размерностью вектора аргументов.

Предлагаемый в статье подход не повторяет идеи, изложенные в [17]. Развивается оригинальное нейросетевое решение задачи аппроксимации, которое дает более общую и эффективную вычислительную схему. Особенности метода демонстрируются на решении прикладной задачи определения координат ЛА по измерениям дальностей до радиомаяков, которая сводится к аппроксимации трехмерной векторной функции от четырех аргументов.

1. Постановка задачи. Имеется непрерывная векторная функция п переменных/х) е СЧ(Х), х е X, где X - компактное множество, на котором определена функция/(.х), Xс 1Кп, С9(Х) - пространство действительных и непрерывных в X функций размерности д. Значения у = /(.х), х е X, принадлежат компактному множеству У, У с Аналитиче-

ское выражение для /(.х) неизвестно. Располагаемая относительно /(.х) информация состоит в следующих трех фактах.

1. В области определения непрерывная функция /(.х) имеет ограниченные производные

д Л(х)

д .к

< с

1кэ

1 = 1, д, к = 1, п.

(1.1)

2. Существуют компактные подмножества (подобласти или классы) Х^ с X, у = 1, т,

= , Ху = X, в которых функция/х) имеет каче-

3 1

ственно разные свойства. Число классов т предполагается заданным.

3. Известны измерения ¿(р), р = 1, Р, векторной функции/х) при неточном знании аргумента х(р) и

на фоне аддитивной помехи

■+р),

(1.2)

П(р) = х(р) ■

г( р) = /(х(р)) + р),

р = Г7Р.

Случайные ошибки измерений и считаются независимыми и центрированными. Их закон распределения вероятностей неизвестен. Предполагается также, что ошибки измерений ограничены

Ир)|<С

I Ък | — Ъш

к( р)1 <£ \Ъ1 — Ъш

к = 1, п, 1 = 1

р = 1, Р, р = 1, Р.

(1.3)

В (1.1)—(1.3) и далее нижний индекс указывает номер координаты вектора, а верхний - порядковый номер измерения. Функцию, которая аппроксимирует моделируемую функцию/х), будем далее обозначать ф(х), а ее локальные аппроксиматоры

на множествах X,у = 1, т , - ф3(х),у = 1, т .

Допустим, что известна информация о принадлежности всех выборочных измерений (п(р), ¿(р)),

р = 1, Р, соответствующим классам. Такая идентификация выборочных данных может быть выполнена, если определены границы между классами. Учитывая, что выборочные данные содержат как значения аргументов, так и значения функции, можно определять классы как на множестве X, так и на множестве У. Выбор зависит от содержания решаемой задачи. Рассмотрим особенности определения классов на примере их формирования на множестве X значений аргументов функции /х). В приведенной в конце статьи прикладной задаче классы формируются на множестве У значений векторной функции/х).

Границы В,к между классами X, и Xk,у, к = 1, т , 3 Ф к, если они не являются пустыми множествами, предполагается размытыми. Граница В,к принадлежит обоим классам у и к: В,к с X, В,к с Xk, так что

к

X п Xk Ф 0. Введение нечетких границ между классами связано с двумя обстоятельствами: отсутствие в большинстве практических приложений четкой информации о границах классов вследствие ограниченных знаний о природе моделируемой функции Дх) и необходимость обеспечения гладкой "сшивки" локальных аппроксимирующих функций фу(х),у = 1, т , на границах классов. Нужно также принять во внимание тот факт, что в соответствии с (1.2) данные регистрируются неточно и при использовании четких границ зарегистрированное измерение не всегда может быть однозначно отнесено к единственному классу.

Степень размытости границы между классами X/ и Xk определяется ее шириной. Под шириной Sjk(x) границы В/к в точке х е Вук будем понимать расстояние р(х', х") между точками х' е XjBjк и х" е X¡\Bjk, которые задаются следующими выражениями:

р(х, х') = р(х, х") =

min р( х,х),

X]j Bjk

min р( х,х).

(1.4)

Таким образом, х' и х" являются ближайшими к х точками, принадлежащими классам X/ и Xk и в то же время не относящимися к их общей размытой границе Вук. При расчете расстояния между двумя точками используется евклидова метрика

sjk(x) = IIх'- х"Н =

Х( х - хГ)2

ч 1/2

\г = 1

(1.5)

Функции Sjk(x),/, к = 1, т,/ Ф к, предполагаются заданными. Если граница не размытая (четкая), то Ух е В к ее ширина Sjk(x) = 0.

Примеры задания классов и размытых границ между ними постоянной и переменной ширины приведены на рис. 1, а-в. На рис. 1, а и в постр

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком