научная статья по теме ГЕОМЕТРИЧЕСКАЯ МОДЕЛЬ РАЗЛИЧЕНИЯ ОРИЕНТАЦИЙ ЛИНИИ, ОСНОВАННАЯ НА СУБЪЕКТИВНЫХ ОЦЕНКАХ И ЗРИТЕЛЬНЫХ ВЫЗВАННЫХ ПОТЕНЦИАЛАХ Биология

Текст научной статьи на тему «ГЕОМЕТРИЧЕСКАЯ МОДЕЛЬ РАЗЛИЧЕНИЯ ОРИЕНТАЦИЙ ЛИНИИ, ОСНОВАННАЯ НА СУБЪЕКТИВНЫХ ОЦЕНКАХ И ЗРИТЕЛЬНЫХ ВЫЗВАННЫХ ПОТЕНЦИАЛАХ»

ЖУРНАЛ ВЫСШЕЙ НЕРВНОЙ ДЕЯТЕЛЬНОСТИ, 2004, том 54, № 2, с. 237-249

ФИЗИОЛОГИЯ ВЫСШЕЙ НЕРВНОЙ (ПСИХИЧЕСКОЙ) ^^^^^^ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА

УДК 612.721.8

ГЕОМЕТРИЧЕСКАЯ МОДЕЛЬ РАЗЛИЧЕНИЯ ОРИЕИТАЦИЙ ЛИНИИ, ОСНОВАННАЯ НА СУБЪЕКТИВНЫХ ОЦЕНКАХ И ЗРИТЕЛЬНЫХ

ВЫЗВАННЫХ ПОТЕНЦИАЛАХ

© 2004 г. Ч. А. Измайлов, С. Г. Коршунова, Е. Н. Соколов, Ю. А. Чудина

Московский государственный университет им. М.В. Ломоносова, e - mail: ch_izmailov@mail.ru Поступила в редакцию 10.07.2002 г. Принята в печать 14.01.2003 г.

В работе рассматривается геометрическая модель различения ориентации линии, основанная на субъективных оценках межстимульных различий и на регистрации зрительных вызванных потенциалов, записанных в ответ на мгновенную смену стимулов. Модель представляет собой замкнутую траекторию точек на плоскости, где каждая точка представляет определенную ориентацию стимула в зрительном поле, а межточечные расстояния прямо пропорциональны воспринимаемым различиям между стимулами. Угол радиус-вектора точки на плоскости характеризует ориентацию стимула в зрительном поле, а две ортогональные оси интерпретируются как два оппонентных канала нейронной сети детектирования ориентации. Первый канал максимально активируется на вертикальную ориентацию стимула и максимально тормозится при горизонтальной ориентации, а второй канал имеет максимум активации при ориентации стимула 45 град. и максимум торможения при ориентации 135 град. Компонентный анализ зрительных вызванных потенциалов показывает, что информация об ориентации стимула, обрабатываемая в этих каналах, по-разному отражается в межпиковой амплитуде компонентов P130-N180 и N180-P230. Активность первого канала нейронной сети детектирования ориентации проявляется как в амплитуде P130-N180, так и в N180-P230, тогда как активность второго канала проявляется только в межпиковой амплитуде компонентов N180-P230. На этом основании первый канал обозначается как специфический канал детектирования ориентации, активность которого вызвана прямым действием стимула, а второй - как неспецифический (фоновый), информационная активность которого определяется тормозным влиянием первого канала. В результате анализа пространственных и метрических свойств модели в терминах двухканальной нейронной сети выдвигается гипотеза о метрической динамике процесса различения стимулов в зрительной системе. В соответствии с этой гипотезой взаимодействие нейронов этой сети характеризуется линейной метрикой city-block, а квадратичная евклидова метрика субъективных оценок возникает вследствие нелинейного эффекта насыщения активности нейронов-детекторов, на базе которых формируется эта оценка. Амплитуды зрительных вызванных потенциалов как промежуточные показатели работы зрительной системы характеризуются соответственно промежуточной метрикой между city-block и евклидовой.

Ключевые слова: зрительные вызванные потенциалы, оценки различий, ориентация линий, геометрическая модель, детекторы ориентации, нейронная сеть, метрика зрительных различий.

A Geometric Model for Perceived Line Orientation Based on Dissimilarity

Estimates and Human VEP Data

Ch. A. Izmailov, S. G. Korshunova, E. N. Sokolov, Yu. A. Chudina

Lomonosov State University, Moscow

A geometric model in proposed based on subjertive dissimilatity estimates among differently oriented line segments in the frontal plane and on visual evoked potentials (VEP) recorded in responde to abrupt changes in the orientation of such a line segment. The orientations are represented by points constituting a clised planar curve, with interpoint distances corresponding to interstimulus dissimilarities. The angle of the radius-vertor connecting the center of the configuration with its circumference encodes the orientation of the line stimuli in the visual field, and two Cartesian axes drawn through the center are interpreted as two orientation-opponent chennels in the neuronal network processing line orientation. The first channel (the ordinate axid) gives maximal positive and maximal negative responses to, respectively, vertical and horizontal orientations, whereas the second channel (the abscissa axis) gives maximal positive and maximal negative responses to, respectively, 45 and 135 degrees orientations. The VEP analysis shows that the activity of the first channel affects the interpeak amplitudes of both the P1-N2 (P130-N180) and N2-P2 (N180-P230) components, whereas the second channel affects only the late component N180-P230. We propose the hypothesis according to which outputs of the two channels are connect-

ed linearly (which is reflected in the city-block metric obtained when distances are computed directly from neuronal activity), but the growth rate of the overall output is inhibited nonlinearly when it reaches large absolute values. This inhibition effectively transforms the "true" city-block metric of the line orientation space into the Euclidean metric one obtains when distances are computed from subjective dissimilarity estimates. vEp amplitudes as intermediate characteristics of visual processing between neuronal activity and subjective estimates represent intermediate metric (between city-block and Euclidean).

Key words: opioids, casomorphins, anxiety, intranasal administration.

Современные подходы к анализу трехмерных сцен с помощью систем компьютерного зрения придают большое значение таким конфигуратив-ным признакам изображения, как линия, угол, стрелка и другие, поскольку они позволяют успешно восстановить трехмерную сцену по контурной проекции на фронтальную плоскость [7, 13]. Число базисных признаков, на которых основывается построение изображения, оказывается достаточно ограниченным. В работе [18], например, было выделено всего 8 таких признаков, а в работе [14] - 11. Психофизические исследования различения человеком знаковых конфигураций методом многомерного шкалирования показывают, что для зрительной системы человека основным конфигуратив-ным признаком является "угловая характеристика" знака [10, 12]. Угловая характеристика конфигурации означает ее изрезанность, наличие пересекающихся под разными углами линий. И хотя интуитивно понятно, почему одна конфигурация воспринимается более угловатой, чем другая, однозначно указать в общем случае меру угловатости для любой конфигурации нельзя. С геометрической точки зрения любой контурный рисунок можно рассматривать как некоторую комбинацию прямых линий различной длины, расположенных под определенными углами друг к другу. В этом случае набор линий разной ориентации может рассматриваться, как исходный массив однотипных элементов, из которых путем простых комбинаций конструируются уже более сложные признаки - типа угла, стрелки и других узловых характеристик контура. В работе [12] было показано, что буквы русского алфавита разделяются по этому признаку на три класса: в первом классе доминируют остроугольные элементы, во втором - прямоугольные, а в третьем - округлые. Аналогичное разделение было получено в работе [10] не только для букв русского, но и латинского алфавита, цифр, а также для некоторых искусственных знаков. Варьирование комбинаций остроугольных, прямоугольных и тупоугольных элементов у знаков позволило выявить, что эти три класса являются качественно различными, а не представляют непрерывную шкалу одной и той же конфигуративной характеристики знака. Принадлежность отдельного знака к данному классу определяется соотношением всех этих признаков в конфигурации. В работах [5, 21, 22] показано, что отдельные отрезки линий и угол, составленный из двух пересекающихся линий, так же

как фигура, составленная из трех пересекающихся линий типа "стрелки" или "вилки", для зрительной системы являются стимулами одинакового уровня сложности, т.е. их можно рассматривать как элементы зрительного алфавита. С другой стороны, в работах [16, 31] показано функциональное различие между детекцией линии и детекцией угла, как специфического образования из двух пересекающихся линий, на основании чего линия и угол рассматриваются соответственно как признаки "первого" и"второго" порядка.

Совместить эти данные можно в рамках гипотезы о трехуровневом строении нейронной сети, ответственной в зрительной системе за построение конфигурации. На первом уровне этой сети происходит формирование базисной единицы в виде линий разной ориентации. Назначение этого уровня -собрать информацию о направлении протяженных перепадов яркости, границ, линий. Иными словами, акцент ставится только на ориентации. На втором уровне из этих ориентаций комбинируется небольшое число элементов, аналогичных "узлам" Гузмана, в число которых входит и линия, как отрезок. В этом случае значение определяется не ориентацией линии, а тем, что как отрезок она ограничена с одного или обоих концов и представляет собой равноправный "узел" контура. И на третьем уровне из разных узлов-признаков, как из элементов алфавита, составляются конфигурации, определяющие контурную форму предметов в поле зрения, аналогично тому, как из букв составляются слова. Линия в этой нейронной сети конструирования конфигураций выступает в двух качествах. С одной стороны - как исходный материал, из которого формируются все узловые элементы, т.е. весь конфигуративный алфавит, а с другой -как один из элементов алфавита (ограниченная линия, отрезок). Такая гипотеза позволяет понять наличие в первичной проекционной зоне коры высших позвоночных большого числа детекторов ориентации линий [11, 20, 31] и приписать им роль "квазирецепторов", выполняющих те же входные функции при анализе формы, какие выполняют рецепторы сетчатки при анализе спектрального состава излучения. В этом случае сетчатка и некоторые подкорковые структуры выполняют предварительный анализ пространственного распределения интенсивности светового излучения, необходимого для выделения ориентации линии как границы в уровне освещенности соседних облас-

тей. Эта информация представлена детекторами ориентации - корковыми нейронами с простыми рецептивными полями. А в корковых нейронах, имеющих сложные и сверхсложные рецептивные поля, прои

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком