научная статья по теме ТЕОРЕТИКО-ГРУППОВАЯ МОДЕЛЬ ФОРМАЛЬНОГО НЕЙРОНА Автоматика. Вычислительная техника

Текст научной статьи на тему «ТЕОРЕТИКО-ГРУППОВАЯ МОДЕЛЬ ФОРМАЛЬНОГО НЕЙРОНА»

Автоматика и телемеханика, Л- 4, 2007

Вычислительная техника в управлении

PACS 07.05.Mh

© 2007 г. Г.М. АЛАКОЗ, д-р техн. наук, A.A. САЛОМАТОВ

(Военно-воздушная инженерная академия им. профессора Н.Е. Жуковского, Москва)

ТЕОРЕТИКО-ГРУППОВАЯ МОДЕЛЬ ФОРМАЛЬНОГО НЕЙРОНА

Синтезирована и исследована теоретико-групповая модель формального нейрона, которая позволяет решать задачи оптимального синтеза пейро ЭВМ па конечном множестве целочисленных вариаций весового и порогового векторов. Такая модель создает предпосылки для прямого отображения задач пользователя пейро ЭВМ па квантовые процессы папоэлектроппых систем, фундаментальные свойства которых определяются и описываются группами симметрий.

1. Введение

За всю историю развития вычислительной техники интерес к нейрокомпыотер-ным технологиям возрастал каждый раз. когда наступал либо застой в области архитектурных решений ЭВМ. либо прогресс в области элементной базы. Современный повышенный интерес к нейрокомпыотерным технологиям [1 3] фактически совпал по времени с наметившимся прорывом в области нанотехнологий. где в качестве «рабочего тела» выступают квантовые системы различной степени сложности: от одноэлектронных транзисторов [4. 5] и до квантовых компьютеров [6]. Схемотехнический парадокс традиционной нейроподобной элементной базы [7] вызван тем. что в этом случае логические функции реализуются через арифметические. Это предопределяет повышенные затраты традиционных логических вентилей, которые сначала расходуются на реализацию арифметических преобразований формальных нейронов и только после этого на реализацию логических преобразований блоков и устройств вычислительной техники, построенных на формальных нейронах. Объединение возможностей нейрокомпыотерных программных [1] и ианотехиологиче-ских [8] инструментальных платформ позволяет преодолеть или хотя бы ослабить последствия этого парадокса за счет прямого отображения функций пользователя на квантовые системы, фундаментальные свойства которых определяются и описываются различными группами симметрий [9].

Цель статьи синтезировать и показать эффективность использования теоретико-групповой модели классического (много)порогового элемента в задачах оптимального синтеза нейроподобных ЭВМ.

2. Формально-логические предпосылки

Классическая (много)пороговая модель [10] формального нейрона отражает основные электпрофшиологические свойства реального нейрона [11], и систему ее преобразований можно представить в импликативной форме:

(1) ( ls(Xsn, Wn) = £xS\ e (hj-1, hj] ^ fs := bj.

Здесь: ХП = (xsn, xsn_ 1,..., x\) - n-мерный входной вектор с компонентами x? e {щ};

\{vi}\ = 9i', i = 1,n; s = 0, Q; Q = П gi — 1; компоненты «весового» вектора

i=i

Wn = (wn, wn-1,..., w1) принимают значения wi e (—ж, +ж); индекс s представ-

ls Xns

лярной оси L; fs e {bj} - значения реализуемой логической функции Fa(Xn) = = (fo,fi, ...,fs,. ..Jq); \{bj }\ = Y max 7 = k; \{Fa(Xn )}\ = kQ+1, а вектор порогов Hx = (hi,..., hx) разбивает множество {ls} скалярных произведений входного и «весового» векторов на (х + 1) пороговых полуинтервалов (hj-1 ,hj]; hj e (—ж, +ж); j = 1,х', (7 — 1) < X < Q ^ - отношение следования; := - оператор подстановки (присваивания).

Задачи оптимального синтеза (много)пороговых моделей сформулированы В.II. Варшавским (предисловие к [10]):

1. Нахождение условий реализуемости произвольной логической функции той или иной многопороговой моделью.

2. Синтез многопороговой модели по заданной логической функции и некоторому критерию качества.

3. Синтез сети из многопороговых моделей по заданной логической функции и некоторому критерию качества.

Характеристики структурной сложности, связывающие задачи 1 + 3 в единую схему оптимального синтеза многопороговых моделей, введены Л.А. Шоломо-вым [12]:

а) сложность (много)пороговой модели:

n

(2) j(M) = в1 + в2 * X,

i=1

где ви в2 > 0 - некоторые одновременно не равные нулю «стоимостные» коэффициенты реализации «единицы» веса и одного порога соответственно:

б) сложность логической функции Fa(Xn, Wn) = J0J1,..., Js,...Jq)-

(3) j(Fa) = min j(M ),

где минимум берется по всем многопороговым моделям типа (1):

в) сложность класса логических функций {Fa(Xn)} (функция Шеннона):

(4) j(k, n) = maxj(Fa),

где максимум берется по всем k-значным логическим функциям Fa(Xn) e {Fa(Xn)}■ В такой постановке, как и в любой задаче поисковой оптимизации, основная сложность связана с реализацией критерия (4), который требует полного перебора всех логических функций из некоторого класса, а основная трудность связана с неопределенностью выбора шага вариации (AWn) n-мерного весового вектора Wn.

Структура индексных зон первого октанта.

Решая методом случайного поиска задачи оптимального синтеза (много)пороговых моделей. А.Т. Бахарев и Л.А. Растригин [13] обнаружили, что с позиций поиска минимума размерности вектора порогов Нх значение имеют только те вариации весового вектора которые нарушают отношение порядка (по индексу в) между

значениями свертки ^ та скалярной оси Ь. Например, для п = 3 и х| €{0,1} (рис. 1) вариации весового вектора W3 в пределах пирамид с вершиной в начале координат и с основаниями (Л^Л^Л^, (Л2,Л3,Л4), (Л1,Л3,Л5) и т.д. дают фиксированный порядок следования индексов в упорядоченных по возрастанию значений свертки

¡е: (Л1,Л2,Лз) - ¡0 <¡1 <¡2 <¡3 <14 <15 <1б < ¡7, (А2,Аз,А4) - ¡о <11 <12 < к < <¡3 <¡5 <¡6 < ¡7, (ЛЬЛ3, А5) - ¡0 < ¡2 < ¡1 < ¡3 < ¡4 < ¡6 < ¡5 < ¡7■

Вариации весового вектора ДWn, которые сохраняют отношение порядка (по индексу в) между значениями свертки ¡в(ХП ,Wn), получили название индексных зон [13]. Они позволяют заменить непрерывные вариации и = (-те, конеч-

ным набором целочисленных значений {и^}, отвечающих одному и тому же порядку в

формальных нейронов:

абстрактно-логический, который осуществляется на множестве подстановок ин-{в}

го)пороговой модели:

Нх

ном целочисленном множестве {в}, к Wn и Нх с непрерывными значениями компонент.

Учитывая быстрое нарастание размерности задач оптимального синтеза (много )пороговых моделей до гиперкомбинаторной, ограничим конкретные примеры и характеристики теоретико-групповой модели классом булевых функций от п < 4 переменных.

3. Теоретико-групповая модель

Для булевых функций имеем х\ € {0,1} Q = 2П - 1; € {0,1} а = (0, 22™ - 1) а оператор линейной свертки можно записать:

(5) ¡3(ХП ^)= £

в Хз Х2 Х1 Шз = 4, Ш2 = 2, Ш1 =1 Шз = 4, Ш2 = 1, Ш1 =2 Шз = 2, Ш2 = 4, Ш1 =1 Шз = 2, Ш2 = 1, Ш1 =4 Шз = 1, Ш2 = 4, Ш1 = 2 Шз = 1, Ш2 =2, ш1 =4

{¡*} {¡*} {1} {¡*} {1} {¡*} {1} {¡*} {£} {¡*} {¡*}

0 0 0 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0 ¡0 = 0

1 0 0 1 11 = 1 ¡1 =2 ¡2 =1 ¡1 = 1 ¡1=1 ¡1 =4 ¡2 =1 ¡1 =2 ¡4 = 1 ¡1 =4 ¡4 = 1

2 0 1 0 12 =2 ¡2 =1 ¡1 =2 ¡2 =4 ¡4 = 2 ¡2 =1 ¡4 = 2 ¡2 =4 ¡1 =2 ¡2 =2 ¡2 =2

3 0 1 1 ¡з = 3 ¡з = 3 ¡з = 3 ¡з = 5 ¡5 =3 ¡з = 5 ¡6 =3 ¡з = 6 ¡5 =3 ¡з = 6 ¡6 =3

4 1 0 0 ¡4 =4 ¡4 =4 ¡4 =4 ¡4 = 2 ¡2 =4 ¡4 = 2 ¡1 =4 ¡4 = 1 ¡2 =4 ¡4 = 1 ¡1 =4

5 1 0 1 15 =5 ¡5 =6 ¡6 =5 ¡5 =3 ¡з = 5 ¡5 =6 ¡з = 5 ¡5 =3 ¡6 =5 ¡5 =5 ¡5 =5

6 1 1 0 ¡6=6 ¡6 =5 ¡5 =6 ¡6=6 ¡6=6 ¡6 =3 ¡5 =6 ¡6 =5 ¡з = 6 ¡6 =3 ¡з = 6

7 1 1 1 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7 ¡7 =7

Таблица 2. Группа подстановок для п = 3

в Хз Х2 Х1 Шз = 4, Ш2 = 2, Ш1 = 1 Шз = 4, Ш2 = 2, Ш1 = —1 Шз = 4, Ш2 = —2, Ш1 =1 Шз = 4, Ш2 = —2, Ш1 = —1

{¡*} {¡*} {1} {¡*} {¡*}

0 0 0 0 ¡0 = 0 ¡0 = 0 ¡1 = —1 ¡0 = 0 ¡2 = —2 ¡0 = 0 ¡з = —3

1 0 0 1 ¡1 = 1 ¡1 = —1 ¡0 = 0 ¡1 = 1 ¡з = —1 ¡1 = —1 ¡2 = —2

2 0 1 0 ¡2 =2 ¡2 =2 ¡з = 1 ¡2 = —2 ¡0 = 0 ¡2 = —2 ¡1 = —1

3 0 1 1 ¡з = 3 ¡з = 1 ¡2 =2 ¡з = —1 ¡1 = 1 ¡з = —3 ¡0 = 0

4 1 0 0 ¡4 = 4 ¡4 =4 ¡5 =3 ¡4 =4 ¡6 =2 ¡4 =4 ¡7 = 1

5 1 0 1 ¡5 =5 ¡5 =3 ¡4 =4 ¡5 =5 ¡7 =3 ¡5 =3 ¡6 = 2

6 1 1 0 ¡6 = 6 ¡6 = 6 ¡7 = 5 ¡6 =2 ¡4 =4 ¡6 =2 ¡5 =3

7 1 1 1 ¡7 = 7 ¡7 = 5 ¡6 = 6 ¡7 =3 ¡5 =5 ¡7 = 1 ¡4 = 4

где суммирование ведется по тем г, для которых х? = 1, т.е. в случае булевых функций входной вектор X ?? используется как «маска», определяющая правило «ассоциативного» суммирования компонент весового вектора {ш^}.

Не изменяя значений конечного множества весовых коэффициентов {ш^, их можно расположить в произвольном порядке (по г) над компонентами входного вектора {х?}, что соответствует группе подстановок N (порядок группы = п!). В результате изменятся правила суммирования весовых коэффициентов в (5), что индуцирует изоморфную группу подстановок значений свер тки 1?, а вместе с ними и индексов в на скалярной оси Ь. Например, при п = 3 (табл. 1) получим 6 подстановок индексов в в упорядоченной по возрастанию последовательности значений свертки {¡в}, из которых одна соответствует лексикографическому порядку в := 0,1, 2, 3,4, 5, 6, 7.

Группа инверсии знаков (|^| = 2П) при неизменных абсолютных значениях компонент весового вектора индуцирует изоморфную группу подстановок

(табл. 2) значений свертки ¡?, а с ними и индексов в та скалярной оси Ь.

в

которые отвечают прямому произведению групп Б? = * . Элементы групп Б? индуцируются элементами группы переименования переменных = * N (|^| = = 2П * п!).

В непрерывной группе вращений весового вектора Шп имеется еще один источник подстановок значений свертки ¡8, а вместе с ними и индексов в на ска-

Таблица 2 (продолжение)

W3 = -4 W3 = -4, Wз = -4 Wз = -4

s Хз Х2 Х1 W2 = 2 W2 = 2 W2 = -2 W2 = -2,

W1 1 W1 = -1 W1 = 1 Wi = -1

{ls } {ls} {ls} {ls} {ls} {ls} {ls} {ls}

0 0 0 0 lo = 0 l4 = -4 lo = 0 l5 = -5 lo = 0 le = -6 lo = 0 lr = -7

1 0 0 1 li = 1 l5 = -3 li = -1 l4 = -4 li = 1 lr = -5 li = -1 le = -6

2 0 1 0 I2 = 2 le = -2 l2 =2 lr = -3 l2 = -2 l4 = -4 l2 = -2 l5 = -5

3 0 1 1 1з = 3 lr = -1 l3 = 1 le = -2 1З = -1 l5 = -3 1з = -3 l4 = -4

4 1 0 0 I4 = -4 lo = 0 l4 = -4 li = -1 l4 = -4 l2 = -2 l4 = -4 1З = -3

5 1 0 1 I5 = -3 li = 1 l5 = -5 lo = 0 l5 = -3 1з = -1 l5 = -5 l2 = -2

6 1 1 0 le = -2 l2 =2 le = -2 1З = 1 le = -6 lo = 0 le = -6 li = -1

7 1 1 1 lr = -1 1з = 3 lr = -3 l2 =2 lr = -5 li = 1 lr = -7 lo = 0

Таблица 3. Вторая часть группы подстановок Пз * Zs для n = 3

s Хз Х2 Xi wз = 4, W2 = 3, Wi = 2

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком