СЕНСОРНЫЕ СИСТЕМЫ, 2013, том 27, № 1, с. 3-9
_ зрительная _
система
УДК 612.819.33
влияние вейвлетной фильтрации изображений текстов на характеристики движений глаз при чтении
© 2013 г. А. м. Ламминпия, О. А. Вахрамеева, Д. В. Райт, С.В. Пронин, Ю. Е. Шелепин
Институт физиологии им. И.П.Павлова РАН 199034 Санкт-Петербург, наб. Макарова, 6 E-mail: aino6886@mail.ru, yshelepin@yandex.ru
Поступила в редакцию 01.10.2012 г.
В работе исследовали изменение характера движений глаз в процессе чтения текстов, изображения которых были подвергнуты цифровой фильтрации при помощи вейвлетов. Были получены данные, демонстрирующие зависимость характера движений глаз от пространственно-частотной структуры тестовых изображений. Для объяснения полученных результатов рассмотрена роль магно- и парвосистем в обработке зрительной информации в пределах зрительного поля.
Ключевые слова: чтение, движения глаз, магно- и парвоканалы зрительной системы, вейвлетная фильтрация, восприятие размытых текстов.
ВВЕДЕНИЕ
Начиная с ранних работ А.Л. Ярбуса (Ярбус, 1965), регистрация движений глаз является одним из важнейших инструментов для исследования когнитивных процессов, связанных с восприятием и анализом визуальных сцен. Новые возможности в этой области открывает использование синтезированных при помощи компьютера визуальных стимулов, избирательно воздействующих на различные подсистемы зрительного анализатора. В данной работе этот подход был использован для исследования роли магно- и парвосистем в управлении движением глаз в процессе чтения.
В 60-е годы XX века было установлено, что передача информации о пространственно-временных свойствах окружающего мира от глаза к мозгу осуществляется при помощи ряда каналов, имеющих различные пространственно-временные характеристики (Campbell, Robson, 1968). Нейрофизиологической основой этих каналов являются системы рецептивных полей нейронов зрительной системы. В последние двадцать лет из всего многообразия рецептивных полей основное внимание уделяется двум классам с отличающимися свойствами. Это система нейронов, представленная крупными клетками с большими
рецептивными полями и толстыми аксонами -магносистема и система нейронов, представленная малыми клетками с малыми рецептивными полями - парвосистема. На самом деле имеется большее число групп нейронов с различными свойствами, но эти две системы наиболее легко разделяемы в настоящих условиях. Магносисте-ма чувствительна к сигналам, имеющим высокие временные и низкие пространственные частоты, тогда как парвосистема более чувствительна к высоким пространственным и низким временным частотам.
В соответствии с современными представлениями основную роль в управлении саккадами играет магносистема, но имеются данные (Snowden, 2002; Leonard, Luck, 2011), что парвосистема также участвует в управлении окуломоторной активностью. Известно также, что при чтении текстов длина саккад определяется угловым размером знаков (Morrison, Rayner, 1981). Однако для восприятия формы и размеров знаков требуется анализ преимущественно высокочастотной информации, что также свидетельствует в пользу участия парвосистемы в управлении саккадами. Очевидно, дальнейшие исследования роли магно- и пар-восистем в управлении окуломоторной активностью представляют значительный интерес.
Естественный подход к исследованию этих систем - использование визуальных стимулов, избирательно воспринимаемых либо магно-, либо парвосистемой, и анализ изменений в характере движений глаз при предъявлении этих двух групп изображений. Возможны различные подходы к формированию таких стимулов. В частности, в работе (Snowden, 2002) при формировании стимулов для парвосистемы была использована "цветовая слепота" магносистемы: все участки тестовых изображений имели равную яркость, различаясь лишь по цвету. Альтернативный подход заключается в пространственной фильтрации изображений. Выделяя в изображении при помощи цифровой фильтрации высокочастотную или низкочастотную части, можно сформировать набор тестовых стимулов, избирательно воздействующих либо на магно-, либо на парвосистему. Преимущество этого подхода заключается в использовании для активации обеих систем только монохромных изображений, что позволяет исключить возможные побочные эффекты, связанные с разницей в восприятии цветных и монохромных изображений. Поэтому для проведения экспериментов был выбран именно этот способ.
В качестве тестовых изображений нами были выбраны тексты. Они являются удобным инструментом для исследования магно- и парвосистем, так как содержат как высокочастотные составляющие, описывающие форму отдельных знаков, так и низкочастотные, описывающие крупномасштабную структуру текста (строки и абзацы).
МЕТОДИКА
В исследовании принимали участие 25 наблюдателей. При помощи 17' ЭЛТ-монитора с разрешением экрана 1280^1024 последовательно предъявляли шесть тестовых изображений -фрагментов текста черными буквами на сером фоне (рис. 1). Фрагменты текста в среднем содержали 600 знаков, включая пробелы и знаки препинания, и были предварительно подвергнуты вейвлетной фильтрации при помощи многомасштабного разложения изображения с использованием DoG-функций (DoG - Difference of Gaussians) - вейвлетов, представляющих собой разность двух двумерных функций Гаусса:
fx, y, v) = exp(-(x2 + y2)/(2v2)) -2rv2
--Vt exp(-(x2 + У2)/(2N2 v2)),
2rN2 v2
где v - стандартное отклонение, N - масштабный коэффициент, в данном случае равен двум.
Основанием для использования данного типа вейвлетов является модель первичных этапов обработки изображения зрительным анализатором. Данная модель, предложенная рядом авторов (Глезер, Цуккерман, 1961; Марр, 1987), построена на основании экспериментальных данных С. Кафлера (Kuffler, 1953). Согласно Д. Марру (Марр, 1987), наилучшей моделью для них служит обработка изображения набором VG-филь-тров, где V2 - оператор Лапласа (d2/dx2 + d2/dy2), а G - функция Гаусса. Обработка изображения V2G-фильтром позволяет выделить на изображении резкие перепады яркости, соответствующие границам объектов, причем, изменяя ширину гауссоиды G, можно осуществлять выделение границ на различных уровнях масштаба. Марром было предложено представление V2G-фильтров при помощи разности двух гауссиан, т.е. DoG-функции.
Аналогом DoG-функций в зрительном анализаторе являются рецептивные поля с круговой симметрией, характерные, например, для сетчатки и латерального коленчатого тела. Оптимальным стимулом для таких клеток, т.е. изображением, на которое реагирует только небольшая группа нейронов с близкими по характеристикам рецептивными полями, является компактное изображение, не превышающее углового размера рецептивного поля, причем его пространственно-частотный спектр должен лежать внутри полосы частот, на которую реагирует данная группа клеток. Этим требованиям отвечают либо сами DoG-функции, либо фрагменты изображения, подвергнутого цифровой фильтрации с использованием DoG-функций. В программе был использован эффективный алгоритм обработки изображений набором V2G-фильтров, аппроксимируемых DoG-функциями, предложенный П. Бартом и Е. Эдельсоном (Burt, Adelson, 1983). Данный алгоритм позволяет разложить исходное изображение в "пирамиду лапласианов" - набор двумерных массивов коэффициентов, каждый из которых представляет собой результат применения к исходному изображению операции свертки с DoG-функцией и последующей субдискретизации. Общее число уровней пирамиды было равно шести. Чем больше номер уровня пирамиды, тем больше ширина гауссоид в DoG-функции и соответственно тем крупнее масштаб деталей, описываемых на данном уровне. Ширина DoG-функции на двух соседних уровнях пирамиды отличалась в 2 раза. В качестве числовой характеристики размера DoG-функции удобно использовать расстояние между двумя минимумами в диаметральном
Бы напили езды в Зоквп дс краев. Си погон. Бозпа бонага потат буланки* ftotST ôwtsv для одноГтдпуж зу.тзпок ецс нэйдатсн место е бокаге? Попробуйте. Начните бросать булавки и считайте их. брос-эть нгдо осг-х>тритсльмз: бср<ж-о погружзйта оетрие в соду .1 затем осторожно выпускайте булаву ил руки. толчка или давление, чтобы сотря;сниог4 не рмпгсскать эоды. Сд-а. дс«. три Зулоони упали «г дне -уровень воды остался некэм?нныгл Дгсятъ, двадцать, тридцать булавок...Жидгость мс оь-ливзстся. Пятьдесят, шсс-^дссят, сеиьде^яг...Целая сотня Зулавеи лежит на дм», а вода из боклпа всс еще i;c оылиаается.
Не ТОЛМО не •ЫГМЬМТСЯ. КЗ Д1»0 и ив поднятие* еюомо-н^дя эаметгьм обрами над >ра«ии Продолжайте добавлять Сути* Втсрая, третья, четвертая сотня булааос очутилась ■ сосуда - им« одна илпя к перелилась черев «рай, но теперь 1»е «идхз. и< поверхность воды влдулась, »омышаясь исмкуо над 1ра«ии бо«ала В »то« »иутии *ся рагад<а непонятного явления Вода мало смаивает спало, «ом оно аотя нсимсго аафяхоо шреи; «рая »о Соит-ш и >ся употребляемая нами посуда - неиабеяхо по«р»яается следами жура от грмосиоасмм пальцев Не смачиаая >раса. »ода. вытесняемая булавяами ив Солги, обратует в^тлость
Уровень 1
Уровень 2
рис. 1. Примеры тестовых изображений с изображениями текстов, пропущенных через фильтры с различными пространственно-частотными полосами пропускания, которые предъявлялись наблюдателю.
сечении вейвлета, расположенными по обе стороны от центрального пика. Это расстояние связано со стандартным отклонением V выражением
D = 2v
32ln(2)
3
Размер вейвлетных элементов на шести уровнях "пирамиды" в нашем случае был следующим: для уровня 1 - 8 пикселей, для уровня 2 - 16, для уровня 3 - 32, для уровня 4 - 64, для уровня 5 -128, и для уровня 6 - 256 пикселей, что соответст-
вует 0.23; 0.46; 0.93; 1.86; 3.71; 7.42 угл. град. Размер букв оставался постоянным и в среднем составлял 5 мм (0.52 угл. град) в ширину, 7 мм (0.73 угл. град) в высоту, толщина ножки буквенного знака - 0.9 мм (0.09 угл. град).
Наблюдателю давали задание читать текст с экрана до тех пор, пока это возможно. Расстояние от глаз испытуемого до монитора, на котором предъявлялись тестовые изображения с текстами, составляло 60 см. Для регистрации движения глаз в процессе чте
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.