ВОСПРИЯТИЕ ВЕРТИКАЛЬНОГО ДВИЖЕНИЯ ЗВУКОВОГО ОБРАЗА, ИМИТИРУЕМОГО ПРИ ПОМОЩИ НЕИНДИВИДУАЛИЗИРОВАННЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ГОЛОВЫ

АЛЬТМАН Я.А.; АНДРЕЕВА И.Г.; МАЛИНИНА Е.С.

СЕНСОРНЫЕ СИСТЕМЫ, 2007, том 21, № 3, с. 226-236

СЛУХОВАЯ И ВЕСТИБУЛЯРНАЯ СИСТЕМЫ

УДК 612.85

ВОСПРИЯТИЕ ВЕРТИКАЛЬНОГО ДВИЖЕНИЯ ЗВУКОВОГО ОБРАЗА, ИМИТИРУЕМОГО ПРИ ПОМОЩИ НЕИНДИВИДУАЛИЗИРОВАННЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ГОЛОВЫ

Институт эволюционной физиологии и биохимии им. И.М. Сеченова РАН, 194223, Санкт-Петербург, просп. М. Тореза, д. 44 1 Институт физиологии им. И.П. Павлова, 199034, Санкт-Петербург, наб. Макарова, д. 6

E-mail: malinina@iephb.ru Поступила в редакцию 07.01.2007 г.

В созданной нами модели вертикального движения виртуального источника звука отрезки белого шума фильтровались при помощи неиндивидуализированных передаточных функций головы восьми субъектов (банк передаточных функций предоставлен CIPlC laboratory, University of California, Davis). Передаточные функции соответствовали последовательным положениям источника звука с шагом 5.6° между точками пространства с координатами по элевации -45 и +45° при азимуте 0°. Способность к различению направления движения виртуальных стимулов (вверх или вниз) была оценена психофизическим методом у 18 слушателей. Различение направления движения варьировало для стимулов, синтезированных при помощи передаточных функций различных субъектов (от 45 до 89% правильных ответов при усреднении по всем испытуемым), а для функций шести субъектов превысило 75%. Анализ показал, что восприятие направления движения связано со специфическими динамическими особенностями спектра и интенсивности виртуальных стимулов. Предварительный отбор виртуальных стимулов с учетом динамических характеристик их спектров и обучение испытуемых распознаванию направления движения способствуют улучшению локализации на основе неиндивидуализированных передаточных функций головы.

Ключевые слова: пространственный слух, вертикальная плоскость, передаточные функции головы, восприятие движения.

ВВЕДЕНИЕ

Исследование механизмов, ответственных за локализацию движущегося источника звука, тесно связано с разработкой моделей виртуального движения. В последние годы основным методическим приемом при создании виртуальных пространственных стимулов стало использование так называемых передаточных функций головы (head-related transfer function). Передаточная функция головы формируется за счет преобразования широкополосного звукового сигнала при его переходе из свободного поля к барабанной перепонке. Данное преобразование обусловлено дифракцией звуковых волн туловищем, головой и наружным ухом и выражается в усилении одних частотных компонентов и ослаблении других. Спектральные неравномерности в звуковом сигнале определяются как спектральные дирекциональные (т.е. связанные с направлением звукоизлучения) признаки локализации. Поскольку передаточная функция головы отражает преобразование для данного положения источника звука, ее спектральные характеристики соответствуют именно этому конкретному положению источника звука в про-

странстве. Цифровая обработка передаточных функций, синтез на их основе виртуальных стимулов и предъявление их через наушники делают звук "внешним", т.е. вынесенным в точку пространства, близкую к реальному положению стимулов в свободном поле (Hartmann, Wittenberg, 1996; Wightman, Kistler, 1989а,Ь). Виртуальные пространственные стимулы отражают комбинацию локализационных признаков - монаураль-ных (поскольку первоначальная фильтрация осуществляется каждым ухом отдельно) дирекцио-нальных спектральных признаков, критичных для локализации источника звука в вертикальной плоскости, и бинауральных признаков - межушных различий по времени и интенсивности стимуляции, отражающих азимут источника звука. Варьирование этих признаков теоретически позволяет имитировать стационарное положение источника звука в любой точке пространства и его перемещение по любой траектории, а использование множества передаточных функций обеспечивает возможность создания виртуального акустического пространства. Несмотря на перечисленные перспективы, проблема формирования

виртуального акустического пространства остается нерешенной. Причина состоит в индивидуальных различиях в форме наружного уха, и как следствие - в ухудшении локализации на основе неиндивидуализированных, т.е. чужих передаточных функций (Wenzel et al., 1993). Поскольку измерение индивидуальных передаточных функций для каждого потенциального слушателя не представляется реальным, для решения проблемы предлагается снижение величины индивидуальных различий передаточных функций. Такое снижение может быть обеспечено либо частотным шкалированием передаточных функций (Middle-brooks, 1999a,b), либо сглаживанием "тонких" индивидуальных вариаций в передаточных функциях за счет разнообразных способов их фильтрации (Grantham et al., 2005; Kulkarni, Colburn, 1998; 2004; обзор: Huopaniemi et al., 1999). Следует признать, что интенсивно ведущиеся работы по снижению индивидуализации спектральных дирекци-ональных признаков пока не решили проблемы создания обобщенных виртуальных пространственных стимулов. Вместе с тем эти работы показали, что адекватная локализация сохраняется при изменении передаточных функций в весьма широком частотном диапазоне (до 1/2 октавы) (Kulkarni, Colburn, 1998; Kulkarni et al.,1999; Langendijk, Bronkhorst, 2002). Этот факт, а также возможность обучения человека локализовать источник звука не только на основе собственных нормальных спектральных ди-рекциональных признаков, но и на основе измененных (Hofman et al., 1998; Wightman, Kistler, 1998), заставляет еще раз обратиться к вопросу об использовании в локализационных моделях неиндивидуализированных передаточных функций. В цитируемой выше работе, показавшей снижение локализационных возможностей человека на основе чужих передаточных функций, указывается, что при этом большинство слушателей (14 из 16) все-таки были способны получать нужную информацию из чужих спектральных дирекциональных признаков (Wenzel et al., 1993). Отмечается также, что возможность адекватной локализации повышалась при использовании неиндивидуализированных передаточных функций, записанных у отдельных субъектов с хорошими локализаци-онными способностями. Приведенные данные относительно локализации на основе неиндивидуализированных передаточных функций относятся к неподвижным звукам, для движущихся звуков она не оценивалась. Особенно важна такая оценка для движения в вертикальной медианной плоскости, где вероятность ошибок локализации спереди-сзади и вверху-внизу (front-back и up-down confusions) для статических звуков повышалась (Wenzel et al., 1993). Следует отметить, что моделирование динамических звуков на основе передаточных функций вообще пока недостаточно развито по сравнению с моделированием ста-

тических звуков, и созданные модели (в основном для азимутального движения) требуют проверки в психоакустических и электрофизиологических экспериментах (Альтман и др., 2005; Андреева и др., 2004).

Задача настоящей работы - создание системы имитации вертикального движения источника звука на основе неиндивидуализированных передаточных функций головы и поиск критериев для отбора сигналов, вызывающих наиболее отчетливое опознание направления движения источника звука в вертикальной плоскости (вверх или вниз).

МЕТОДИКА

В экспериментах приняли участие 18 оплачиваемых испытуемых (7 мужчин и 11 женщин) в возрасте от 17 до 30 лет (средний возраст 22 года) с нормальным слухом по результатам тональной пороговой аудиометрии и самооценке. Испытуемыми были студенты и аспиранты высших учебных заведений: 16 испытуемых были праворуки-ми, два с наклонностью к амбидекстрии (левору-кие, переученные в детстве на праворуких). Каждый испытуемый участвовал в исследовании однократно.

Формирование и запись виртуальных звуковых стимулов, имитирующих перемещение источника звука в вертикальной медианной плоскости, осуществляли в среде Matlab (MathWork Co., USA). Звуковой стимул длительностью 940 мс включал 17 посылок белого шума. Полоса шума составляла 0.5-16 кГц, частота дискретизации 44.1 кГц, разрешение по амплитуде - 24 бит. Длительность каждой посылки составляла 50 мс, время нарастания-спадения 5 мс. Межимпульсный интервал между посылками шума внутри стимула был подобран таким образом, что перепад интенсивности между ними отсутствовал, - тем самым была обеспечена непрерывность звучания посылок шума внутри стимула (схема на рис. 1, а). Пространственное положение посылок шума внутри стимула определялось результатом их фильтрации комплектами передаточных функций восьми субъектов. Банк передаточных функций 45 субъектов предоставлен CIPIC laboratory, University of California, Davis. Далее для обозначения комплектов передаточных функций используются номера субъектов из этого банка. Передаточные функции соответствовали последовательным положениям источника звука с шагом по элевации 5.6°. Пошаговая фильтрация отрезков шума функциями, отражающими положение источника звука от -45 до +45° по элевации при 0° азимута имитировала движение источника звука вверх, фильтрация в обратном направлении имитировала движение вниз. Таким образом, траектория движения звуковых образов составляла 90°, ско-

5 мс

/ F1 X F2 X F3 X F4 X

5 мс

50 мс

940 мс

а

Рис. 1. Схема сигнала (а) и примеры динамических изменений сигналов, имитирующих движение вверх (для левого уха) на основе комплектов передаточных функций трех субъектов (б-г). На схеме а - F1, F2, F3, F4 ... последовательные шумовые посылки.

На I - амплитудные спектры посылок шума, формирующих движущиеся звуковые образы. № комплекта передаточных функций - слева. По оси X - частота, Гц; по оси Y - номера посылок шума от 1 до 17, отражающих регулярное смещение источника звука от -45 до + 45° по элевации при азимуте 0°; по оси Т - амплитуда, дБ. На II - форма движущихся звуковых образов. По оси абсцисс - время, с; по оси ординат - амплитуда, дБ. Динамические изменения сигналов, имитирующих движение вниз, симметричны представленным.

рость движения - около 96°/c. Виртуальные стимулы формировали отдельно для левого и правого уха и записывали как монофайлы в формате w

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Текст научной статьи на тему «ВОСПРИЯТИЕ ВЕРТИКАЛЬНОГО ДВИЖЕНИЯ ЗВУКОВОГО ОБРАЗА, ИМИТИРУЕМОГО ПРИ ПОМОЩИ НЕИНДИВИДУАЛИЗИРОВАННЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ГОЛОВЫ»