научная статья по теме ВЛИЯНИЕ ВЕЙВЛЕТНОЙ ФИЛЬТРАЦИИ ИЗОБРАЖЕНИЙ ТЕКСТОВ НА ХАРАКТЕРИСТИКИ ДВИЖЕНИЙ ГЛАЗ ПРИ ЧТЕНИИ Биология

Текст научной статьи на тему «ВЛИЯНИЕ ВЕЙВЛЕТНОЙ ФИЛЬТРАЦИИ ИЗОБРАЖЕНИЙ ТЕКСТОВ НА ХАРАКТЕРИСТИКИ ДВИЖЕНИЙ ГЛАЗ ПРИ ЧТЕНИИ»

СЕНСОРНЫЕ СИСТЕМЫ, 2013, том 27, № 1, с. 3-9

_ зрительная _

система

УДК 612.819.33

влияние вейвлетной фильтрации изображений текстов на характеристики движений глаз при чтении

© 2013 г. А. м. Ламминпия, О. А. Вахрамеева, Д. В. Райт, С.В. Пронин, Ю. Е. Шелепин

Институт физиологии им. И.П.Павлова РАН 199034 Санкт-Петербург, наб. Макарова, 6 E-mail: aino6886@mail.ru, yshelepin@yandex.ru

Поступила в редакцию 01.10.2012 г.

В работе исследовали изменение характера движений глаз в процессе чтения текстов, изображения которых были подвергнуты цифровой фильтрации при помощи вейвлетов. Были получены данные, демонстрирующие зависимость характера движений глаз от пространственно-частотной структуры тестовых изображений. Для объяснения полученных результатов рассмотрена роль магно- и парвосистем в обработке зрительной информации в пределах зрительного поля.

Ключевые слова: чтение, движения глаз, магно- и парвоканалы зрительной системы, вейвлетная фильтрация, восприятие размытых текстов.

ВВЕДЕНИЕ

Начиная с ранних работ А.Л. Ярбуса (Ярбус, 1965), регистрация движений глаз является одним из важнейших инструментов для исследования когнитивных процессов, связанных с восприятием и анализом визуальных сцен. Новые возможности в этой области открывает использование синтезированных при помощи компьютера визуальных стимулов, избирательно воздействующих на различные подсистемы зрительного анализатора. В данной работе этот подход был использован для исследования роли магно- и парвосистем в управлении движением глаз в процессе чтения.

В 60-е годы XX века было установлено, что передача информации о пространственно-временных свойствах окружающего мира от глаза к мозгу осуществляется при помощи ряда каналов, имеющих различные пространственно-временные характеристики (Campbell, Robson, 1968). Нейрофизиологической основой этих каналов являются системы рецептивных полей нейронов зрительной системы. В последние двадцать лет из всего многообразия рецептивных полей основное внимание уделяется двум классам с отличающимися свойствами. Это система нейронов, представленная крупными клетками с большими

рецептивными полями и толстыми аксонами -магносистема и система нейронов, представленная малыми клетками с малыми рецептивными полями - парвосистема. На самом деле имеется большее число групп нейронов с различными свойствами, но эти две системы наиболее легко разделяемы в настоящих условиях. Магносисте-ма чувствительна к сигналам, имеющим высокие временные и низкие пространственные частоты, тогда как парвосистема более чувствительна к высоким пространственным и низким временным частотам.

В соответствии с современными представлениями основную роль в управлении саккадами играет магносистема, но имеются данные (Snowden, 2002; Leonard, Luck, 2011), что парвосистема также участвует в управлении окуломоторной активностью. Известно также, что при чтении текстов длина саккад определяется угловым размером знаков (Morrison, Rayner, 1981). Однако для восприятия формы и размеров знаков требуется анализ преимущественно высокочастотной информации, что также свидетельствует в пользу участия парвосистемы в управлении саккадами. Очевидно, дальнейшие исследования роли магно- и пар-восистем в управлении окуломоторной активностью представляют значительный интерес.

Естественный подход к исследованию этих систем - использование визуальных стимулов, избирательно воспринимаемых либо магно-, либо парвосистемой, и анализ изменений в характере движений глаз при предъявлении этих двух групп изображений. Возможны различные подходы к формированию таких стимулов. В частности, в работе (Snowden, 2002) при формировании стимулов для парвосистемы была использована "цветовая слепота" магносистемы: все участки тестовых изображений имели равную яркость, различаясь лишь по цвету. Альтернативный подход заключается в пространственной фильтрации изображений. Выделяя в изображении при помощи цифровой фильтрации высокочастотную или низкочастотную части, можно сформировать набор тестовых стимулов, избирательно воздействующих либо на магно-, либо на парвосистему. Преимущество этого подхода заключается в использовании для активации обеих систем только монохромных изображений, что позволяет исключить возможные побочные эффекты, связанные с разницей в восприятии цветных и монохромных изображений. Поэтому для проведения экспериментов был выбран именно этот способ.

В качестве тестовых изображений нами были выбраны тексты. Они являются удобным инструментом для исследования магно- и парвосистем, так как содержат как высокочастотные составляющие, описывающие форму отдельных знаков, так и низкочастотные, описывающие крупномасштабную структуру текста (строки и абзацы).

МЕТОДИКА

В исследовании принимали участие 25 наблюдателей. При помощи 17' ЭЛТ-монитора с разрешением экрана 1280^1024 последовательно предъявляли шесть тестовых изображений -фрагментов текста черными буквами на сером фоне (рис. 1). Фрагменты текста в среднем содержали 600 знаков, включая пробелы и знаки препинания, и были предварительно подвергнуты вейвлетной фильтрации при помощи многомасштабного разложения изображения с использованием DoG-функций (DoG - Difference of Gaussians) - вейвлетов, представляющих собой разность двух двумерных функций Гаусса:

fx, y, v) = exp(-(x2 + y2)/(2v2)) -2rv2

--Vt exp(-(x2 + У2)/(2N2 v2)),

2rN2 v2

где v - стандартное отклонение, N - масштабный коэффициент, в данном случае равен двум.

Основанием для использования данного типа вейвлетов является модель первичных этапов обработки изображения зрительным анализатором. Данная модель, предложенная рядом авторов (Глезер, Цуккерман, 1961; Марр, 1987), построена на основании экспериментальных данных С. Кафлера (Kuffler, 1953). Согласно Д. Марру (Марр, 1987), наилучшей моделью для них служит обработка изображения набором VG-филь-тров, где V2 - оператор Лапласа (d2/dx2 + d2/dy2), а G - функция Гаусса. Обработка изображения V2G-фильтром позволяет выделить на изображении резкие перепады яркости, соответствующие границам объектов, причем, изменяя ширину гауссоиды G, можно осуществлять выделение границ на различных уровнях масштаба. Марром было предложено представление V2G-фильтров при помощи разности двух гауссиан, т.е. DoG-функции.

Аналогом DoG-функций в зрительном анализаторе являются рецептивные поля с круговой симметрией, характерные, например, для сетчатки и латерального коленчатого тела. Оптимальным стимулом для таких клеток, т.е. изображением, на которое реагирует только небольшая группа нейронов с близкими по характеристикам рецептивными полями, является компактное изображение, не превышающее углового размера рецептивного поля, причем его пространственно-частотный спектр должен лежать внутри полосы частот, на которую реагирует данная группа клеток. Этим требованиям отвечают либо сами DoG-функции, либо фрагменты изображения, подвергнутого цифровой фильтрации с использованием DoG-функций. В программе был использован эффективный алгоритм обработки изображений набором V2G-фильтров, аппроксимируемых DoG-функциями, предложенный П. Бартом и Е. Эдельсоном (Burt, Adelson, 1983). Данный алгоритм позволяет разложить исходное изображение в "пирамиду лапласианов" - набор двумерных массивов коэффициентов, каждый из которых представляет собой результат применения к исходному изображению операции свертки с DoG-функцией и последующей субдискретизации. Общее число уровней пирамиды было равно шести. Чем больше номер уровня пирамиды, тем больше ширина гауссоид в DoG-функции и соответственно тем крупнее масштаб деталей, описываемых на данном уровне. Ширина DoG-функции на двух соседних уровнях пирамиды отличалась в 2 раза. В качестве числовой характеристики размера DoG-функции удобно использовать расстояние между двумя минимумами в диаметральном

Бы напили езды в Зоквп дс краев. Си погон. Бозпа бонага потат буланки* ftotST ôwtsv для одноГтдпуж зу.тзпок ецс нэйдатсн место е бокаге? Попробуйте. Начните бросать булавки и считайте их. брос-эть нгдо осг-х>тритсльмз: бср<ж-о погружзйта оетрие в соду .1 затем осторожно выпускайте булаву ил руки. толчка или давление, чтобы сотря;сниог4 не рмпгсскать эоды. Сд-а. дс«. три Зулоони упали «г дне -уровень воды остался некэм?нныгл Дгсятъ, двадцать, тридцать булавок...Жидгость мс оь-ливзстся. Пятьдесят, шсс-^дссят, сеиьде^яг...Целая сотня Зулавеи лежит на дм», а вода из боклпа всс еще i;c оылиаается.

Не ТОЛМО не •ЫГМЬМТСЯ. КЗ Д1»0 и ив поднятие* еюомо-н^дя эаметгьм обрами над >ра«ии Продолжайте добавлять Сути* Втсрая, третья, четвертая сотня булааос очутилась ■ сосуда - им« одна илпя к перелилась черев «рай, но теперь 1»е «идхз. и< поверхность воды влдулась, »омышаясь исмкуо над 1ра«ии бо«ала В »то« »иутии *ся рагад<а непонятного явления Вода мало смаивает спало, «ом оно аотя нсимсго аафяхоо шреи; «рая »о Соит-ш и >ся употребляемая нами посуда - неиабеяхо по«р»яается следами жура от грмосиоасмм пальцев Не смачиаая >раса. »ода. вытесняемая булавяами ив Солги, обратует в^тлость

Уровень 1

Уровень 2

рис. 1. Примеры тестовых изображений с изображениями текстов, пропущенных через фильтры с различными пространственно-частотными полосами пропускания, которые предъявлялись наблюдателю.

сечении вейвлета, расположенными по обе стороны от центрального пика. Это расстояние связано со стандартным отклонением V выражением

D = 2v

32ln(2)

3

Размер вейвлетных элементов на шести уровнях "пирамиды" в нашем случае был следующим: для уровня 1 - 8 пикселей, для уровня 2 - 16, для уровня 3 - 32, для уровня 4 - 64, для уровня 5 -128, и для уровня 6 - 256 пикселей, что соответст-

вует 0.23; 0.46; 0.93; 1.86; 3.71; 7.42 угл. град. Размер букв оставался постоянным и в среднем составлял 5 мм (0.52 угл. град) в ширину, 7 мм (0.73 угл. град) в высоту, толщина ножки буквенного знака - 0.9 мм (0.09 угл. град).

Наблюдателю давали задание читать текст с экрана до тех пор, пока это возможно. Расстояние от глаз испытуемого до монитора, на котором предъявлялись тестовые изображения с текстами, составляло 60 см. Для регистрации движения глаз в процессе чте

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком