научная статья по теме ВОСПРИЯТИЕ ФОНЕМ С ВЫСОКОЙ И НИЗКОЙ ЧАСТОТОЙ ОСНОВНОГО ТОНА Биология

Текст научной статьи на тему «ВОСПРИЯТИЕ ФОНЕМ С ВЫСОКОЙ И НИЗКОЙ ЧАСТОТОЙ ОСНОВНОГО ТОНА»

СЕНСОРНЫЕ СИСТЕМЫ, 2010, том 24, № 3, с. 255-262

СЛУХОВАЯ И ВЕСТИБУЛЯРНАЯ СИСТЕМЫ

УДК 612.85

ВОСПРИЯТИЕ ФОНЕМ С ВЫСОКОЙ И НИЗКОЙ ЧАСТОТОЙ

ОСНОВНОГО ТОНА

© 2010 г. А. Н. Соловьев, А. Н. Шестакова, Е. Е. Ляксо

Санкт-Петербургский государственный университет, Биолого-почвенный факультет 199034 Санкт-Петербург, Университетская наб. д. 7-9, E-mail: ¡1оп@20та1.сот.иа, shestako@mappi.helsinki.fi, lyakso@gmail.com

Поступила в редакцию 25.01.2010 г.

Проведены магнитоэнцефалографическое и психоакустическое исследования восприятия русских гласных [и] и [а] с разными значениями частоты основного тона (ЧОТ) русскоязычными испытуемыми. В магнитоэнцефалографическом исследовании при пассивном бинауральном прослушивании гласных с высокими и низкими значениями ЧОТ регистрировался возбуждаемый магнитным полем компонент М100. Было обнаружено, что амплитуды ответов М100 компоненты гласных [и] и [а] независимо от их ЧОТ больше в правом полушарии, чем в левом. Также установлено, что ла-тентность и амплитуды М100 ответов фонем различны в правом и левом полушарии. Левослыша-щие и правослышащие испытуемые с ведущей правой рукой (определенные по тесту Эдинбурга) имеют разную MCE амплитуду потенциалов при восприятии обеих групп фонем. Так, у левослы-шащих испытуемых усредненный максимум амплитуды больше в правом полушарии, чем в левом; у правослышащих - инверсная картина. Латентность М100 компоненты правослышащих испытуемых меньше в правом полушарии, чем в левом для обеих групп фонем. В психоакустическом эксперименте обнаружено, что гласные фонемы категории [а] с высокими значениями ЧОТ распознаются всеми испытуемыми с меньшим количеством ошибок, чем гласные фонемы [и].

Ключевые слова: речь, восприятие; картирование, магнитоэнцефалография (МЭГ), M100, фонема, основной тон.

ВВЕДЕНИЕ

В современных психоакустических и нейрофизиологических исследованиях восприятия гласных фонем мозгом человека внимание исследователей сфокусировано на поиске нейронных коррелятов обработки первых трех формант и картировании их в мозге человека (Eulitz, 1995; Diesch, Luce, 2000). Идея отображения акусти-ко-фонетических свойств в коре головного мозга была выдвинута сравнительно недавно (Diesch et al., 1996; Diesch, Luce 1997; Poeppel et al., 1997; Obleser et al., 2003). Данные, полученные с использованием различных методов, подтверждают, что категории гласных могут быть представлены отдельными нейронными популяциями в коре головного мозга (Shestakova et al., 2002; Shestakova et al., 2004; Diesch et al., 1996; Diesch, Luce, 1997; Ohl, Scheich, 1997; Poeppel et al., 1997). Принцип фонотопического картирования, основанный на том, что в мозге человека нейрональный ответ на каждую фонему зависит от ее категории, был

взят за основу построения экспериментов многими группами исследователей (Ohl, Scheich, 1997; Diesch, Luce, 2000; Obleser et al., 2003). Известно, что значения двух первых формант являются значимыми для идентификации гласных различных категорий (Чистович, 1976). Однако частотные значения некоторых гласных на двухформантной плоскости располагаются в областях, не соответствующих частотным характеристикам гласных данных категорий (Obleser et al., 2003). В то же время гласные с такими характеристиками при распознавании правильно относятся к надлежащим категориям. Этот факт позволяет предположить существование механизмов, основанных на анализе не формантных частот, а их соотношений, отражающих частотные изменения в спектральной картине гласных. С подобным явлением исследователи встречаются при анализе гласных детской речи с высокими значениями ЧОТ и значениях формантных частот, не соответствующих данным для взрослой речи (Lyakso, Frolova, 2007; Pols et al., 2006). Можно предположить, что су-

ществуют другие дополнительные механизмы мозга, которые могут отвечать за вариативные частотные изменения формант внутри каждой категории фонем.

Только небольшое число исследований посвящено вопросу о том, как акустические параметры, такие, как основной тон, влияют на ответы нейронов при восприятии фонем. Группа исследователей во главе с Облезером (Obleser et al.,

2003) выдвинула предположение, что приходящая речевая информация может кодироваться не только по принципу фонемохронии и фонотопии, но и тонохроническим образом. Еще Г. Гельмгольц выдвинул предположение, что кодирование слуховой информации может происходить по принципу места и времени (временное кодирование). В гипотезе тонохронии относительно речевого сигнала предполагается, что свойства речевого сигнала, отображаемые максимумом латентности М100, также могут быть кодированы не только в пространстве, но и во времени (Roberts et al.,

2004). Ранее Робертс с соавторами показали, что латентность М100 компоненты аудиторов чувствительна к значениям основного тона: у синтезированных гласных с высокой ЧОТ она короче (Roberts et al., 1996). Различие в восприятии гласных с разными значениями ЧОТ может быть объяснена с позиции принципа тонохронии, показывающей, что значения амплитуды и латент-ности М100 могут отражать отличие в качестве восприятия гласных.

В 2004 г. Робертс с соавторами показали в двух альтернативных экспериментах классификации гласных, что для фонемы [у] М100 латентности были более длительными, чем для фонемы [a], что коррелировало с задержкой ответной реакции в 100 мс диапазоне. Они объяснили обнаруженный эффект отличием частоты первой форманты (F1) у разных категорий гласных. Однако не было проведено эксперимента по влиянию значений ЧОТ на идентификацию гласных. Действительно, F1, как правило, несет максимум энергии, при этом возможно взаимное влияние ЧОТ и первой форманты (Кодзасов, 2001; Деркач, 1983).

Робертс с соавторами использовали только мо-ноуральное прослушивание стимулов правым ухом и игнорировали значение ЧОТ, которое может влиять на изменение частотных характеристик гласного при его восприятии. Таким образом, в этом исследовании вероятная межполушарная асимметрия латентности в восприятии гласных с разными значениями ЧОТ осталась незатронутой.

Анализ литературных данных свидетельствует об отсутствии сведений о нейрофизиологических исследованиях влияния ЧОТ на восприятие глас-

ных звуков, что позволило сформулировать направление настоящей работы.

Цель исследования - изучение особенностей отражения в электрической активности мозга человека гласных с высокими и низкими значениями ЧОТ, максимально различающихся по своим акустико-фонетическим характеристикам, при их бинауральном предъявлении.

Конкретными задачами исследования явилось исследование межполушарных отличий в процессе восприятия гласных с разными значениями ЧОТ; возможного влияния разных значений ЧОТ гласных [и] и [а] на амплитуду и латентность потенциалов в магнитоэнцефалографическом исследовании (МЭГ).

МАТЕРИАЛЫ И МЕТОДЫ

Авторами было проведено два исследования -МЭГ и психоакустическое.

В МЭГ-экспериментах участвовали одиннадцать здоровых, нормально слышащих русскоговорящих испытуемых (добровольцев) от 20 до 36 лет (девять мужчин и пять женщин), которые подписали информированное согласие на участие в эксперименте.

Каждый испытуемый заполнял анкету, содержащую вопросы, в том числе к какому уху он подносит телефон при разговоре. При помощи теста Единбурга (ОЫАеИ, 1971) определяли полушар-ную доминантность. Все испытуемые имели ведущую правую руку, девять испытуемых предпочитали левое ухо при телефонной беседе и пять правое: левослышащие (восемь мужчин и одна женщина) и правослышащие (четыре женщины и один мужчина).

В психоакустическом эксперименте участвовало десять испытуемых от 20 до 30 лет (четверо мужчин и шесть женщин). Все испытуемые были русскоговорящими и без патологических отклонений слуха.

Стимульный материал. Для проведения эксперимента нами были выбраны две группы русских гласных фонем [а] и [и]. Из речевой базы ^а1оипоу et а1., 2002) было отобрано 40 экземпляров каждой фонемы [а] и [и] (по 20 в каждой группе), произнесенными разными русскоязычными дикторами. Для исследований выбирали только мужские голоса. Каждая группа фонем была поделена на две категории: десять гласных с высокими значениями ЧОТ и десять гласных с низкими значениями ЧОТ (табл.1 и 2).

Выбранные группы гласных [а] и [и] расположены в вершинах формантного треугольника русских гласных [у], [а], [и] на двухформантной плоскости с координатами значений первой и второй

Таблица 1. Значения частоты основного тона гласных [а], [и], Гц. СО - стандартное отклонение

Гласные Высокий ОТ (СО) Низкий ОТ (СО)

[ а ] 184.3 (14.7) 97.3 (4.2)

[ и ] 194.7 (16.9) 107.9 (4.2)

Таблица 2. Формантные характеристики гласных, Гц.

Гласные [ а ] [ и ]

Форманты F1 F2 F1 F2

Высокий ОТ (Гц) 757.2 1292.7 409.7 1776.0

Низкий ОТ (Гц) 659.5 1241.5 346.5 1814.5

формант (F1/F2) (Деркач, 1983) и различаются по своим акустико-фонетическим характеристикам (Бондарко, 1991). Стимулы были записаны через телефонный канал стандарта ISDN с характеристиками передающего канала 8000 Гц и 16 бит. Длительность гласных составила 250±50 мс (с учетом 10 мс нарастающего и убывающего звукового сигнала в начале и конце каждого стимула). Амплитуды всех стимулов были RMS (Root Means Square алгоритм) нормализованы. Каждый стимул был произнесен дикторами отдельно как название буквы русского алфавита (Galounov et al., 1998).

МЭГ тестирование. В МЭГ-исследовании стимулы бинаурально подавали через пластиковые трубки с использованием программы Presentation (Version 9.13, Neurobehavioural Systems Inc., Albany, USA) с постоянным межстимульным интервалом 900 мс и интенсивностью 55 дБ выше среднего порога слышимости, предварительно оцененного на тех же стимулах. Из каждой категории в случайной последовательности подавали по 3-4 стимула соответственно.

Записывали МЭГ ответы при помощи специального магнитометра для изучения токов мозга (306 каналов, Vectorview system, Elekta Neuromag, Helsinki, Finland). Движения глаз и моргание регистрировалось с помощью вертикальных и горизонтальных биополярных электроокулограмм (EOG). Временной диапазон записи МЭГ ответов (частота дискретизации - 603

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком