научная статья по теме ХАРАКТЕРИСТИКИ ГЛАСНЫХ ЗВУКОВ, ИМИТИРУЕМЫХ ГОВОРЯЩИМИ ПТИЦАМИ Биология

Текст научной статьи на тему «ХАРАКТЕРИСТИКИ ГЛАСНЫХ ЗВУКОВ, ИМИТИРУЕМЫХ ГОВОРЯЩИМИ ПТИЦАМИ»

СЕНСОРНЫЕ СИСТЕМЫ, 2004, том 18, № 3, с. 199-205

ВОСПРОИЗВЕДЕНИЕ ^^^^^^^^^^^^ И ВОСПРИЯТИЕ РЕЧИ

УДК 591.582.2

ХАРАКТЕРИСТИКИ ГЛАСНЫХ ЗВУКОВ, ИМИТИРУЕМЫХ ГОВОРЯЩИМИ ПТИЦАМИ

© 2004 г. К. О. Уплисова

Санкт-Петербургский государственный университет 199034 Санкт-Петербург, Университетская наб., 7/9 Поступила в редакцию 25.02.2004 г.

В данной работе анализировались гласноподобные звуки, выделенные из слов, имитируемых четырьмя птицами. Анализ амплитудно-динамической формы звуков и их спектра показал, что имитируемые гласные звуки не всегда можно отнести к гармоническим, поэтому определялись значения частоты и амплитуды спектральных составляющих, достаточных для описания огибающей спектра сигнала. Значения двух наиболее выраженных спектральных максимумов для различных категорий гласноподобных звуков в значительной степени совпадали. Характер зависимости отношений амплитуд от частот спектральных максимумов оказался различным для каждой категории гласноподобных звуков. Из полученных в работе результатов следует, что существует возможность разделения различных категорий гласных звуков человеческой речи, имитируемых говорящими птицами, на основе отличий расположения спектральных максимумов по частоте и отношению их амплитуд.

Ключевые слова: имитация, гласноподобные, говорящие птицы.

ВВЕДЕНИЕ

Возросший в последнее время интерес к птицам-пересмешникам связан с разработкой вопроса о признаках, определяющих различные категории гласных звуков при разных условиях их генерации. Так как при прослушивании имитационных звуков птиц люди способны относить гласные к определенным фонетическим категориям, можно предположить, что в сходных по фонетической принадлежности гласноподобных присутствуют некие специфичные различительные признаки. Их поиску было посвящено небольшое количество работ, в которых анализировались акустические характеристики гласных звуков, имитируемых птицами-пересмешниками (Силаева, 1998; Ильичев, 1999; Klatt, Stefanski, 1974; Patterson, Pepperberg, 1994). Из них только в одной работе (Patterson, Pepperberg, 1994) был проведен последовательный инструментальный анализ речеподобных звуков из имитационного репертуара двух птиц: серого и амазонского попугаев. Было показано, что у обеих птиц частота основного тона довольно велика (около 300 Гц) и значения формант их гласноподобных звуков не совпадают со значениями формант различных категорий гласных звуков, произносимых человеком, хотя для человеческой речи они определяют категориальную принадлежность. Использование других способов разделения категорий гласных звуков, имитируемых этими птицами помимо значений формант, не привело к результатам, позволяющим сделать однозначный вывод.

Возникает вопрос, чем руководствуется человек для определения категорий гласноподобных звуков, имитируемых птицей, несмотря на их высокую частоту основного тона и иной механизм звукогенерации.

Цель данной работы - определение стабильных признаков для гласноподобных звуков, имитируемых говорящими птицами.

МАТЕРИАЛ И МЕТОДИКА

Анализировались гласноподобные звуки, выделенные из слов, имитируемых четырьмя птицами, относящимися к различным видам: священная майна (Gracula religiosa), обыкновенная канарейка (Serinus canaria) и две разновидности серых попугаев (Psittacus erithacus), прибрежный и крас-нохвостый.

Материал по майне и канарейке был любезно предоставлен сотрудниками кафедры зоологии позвоночных Е.А. Кречмаром и И.В. Ильинским из фонотеки голосов животных А.С. Мальчевско-го. Записи были проведены А.С. Мальчевским в октябре 1969 г. на магнитофон "Репортер-3" с микрофоном Д-55.

Сигналы прибрежного серого попугая, принадлежащего В.Р. Дольнику, регистрировались в домашних условиях на магнитофон SONY WM-D6C (неравномерность ±3 дБ в частотном диапазоне 40-15000 Гц). Запись краснохвостого серого попугая, принадлежащего Ä.A. Тихомирову, была проведена на магнитофон SONY TC-D5 Pro II

(неравномерность ±3 дБ в частотном диапазоне 40-17000 Гц), также в домашних условиях.

Оцифровка записей была произведена на компьютере 1MB Pentium II с использованием 16-разрядной звуковой карты Creative Labs AVE 64, с частотой дискретизации 44100 Гц.

Из всего вокального репертуара птиц выделялись имитации слов человеческой речи. Помимо них, в записи присутствовали видовые сигналы птиц и имитации механических звуков. Осуществлялся инструментальный анализ гласных звуков, выделенных из четко произнесенных слов человеческой речи. Гласноподобные выделялись по равномерности звучания на слух, по однородности динамической спектрограммы и амплитудно-динамической формы представления сигнала.

На рис. 1 представлена амплитудно-динамическая форма имитаций майной слов "Чика" женским голосом и "ЧитаЧита" мужским голосом, их динамическая спектрограмма с выделенными гласноподобными "и".

Спектральный анализ звуковых сигналов осуществлялся на основе быстрого преобразования Фурье, данные взвешивались с помощью окна Хемминга с 1024 фильтрами (для уточнения нахождения спектральных максимумов в некоторых случаях использовалось сглаживание при более низкой частоте фильтрации).

Так как имитационные гласные птиц, в большинстве случаев, не являлись гармоническими, анализировались все спектральные максимумы, необходимые для определения контура огибающей спектра сигнала. По возможности выделялась несущая и модулирующая частоты анализируемого звука.

Был проведен аудиторский анализ двухсот гласноподобных звуков, выделенных из имитаций слов серого попугая. Аудиторская серия состояла из пятидесяти произнесений, каждое из которых повторялось по 3 раза с интервалом 400 мс, различные звуки были разделены двух с половиной секундным интервалом. Серии предъявлялись различным группам студентов, ранее не слышавшим эти звуки. Перед аудиторами ставилась задача обозначить, какой гласный звук (любой) они слышат, или поставить прочерк, если предъявляемый звук нельзя распознать как гласноподобный. Было получено двенадцать вариантов ответа.

На основании полученных данных, по значению частоты и амплитуды спектральных максимумов строились распределения зависимости отношений амплитуд спектральных максимумов от их частоты для каждого звука. Достоверность различий распределений определялась по критерию Колмогорова-Смирнова.

РЕЗУЛЬТАТЫ

Имитационный репертуар у канарейки состоял из многократно повторявшихся фраз "Вот ка-

кие птичкн, миленькие птички, Пинчи, Пинчи, Пинчи" чередовавшихся с видовыми свистами. Из пятиминутной записи вокализаций было выделено 42 сигнала "и".

Майна повторяла слова "Таня", "Чика", "Кто пришел", "Как дела" и др. мужским или женским голосом. Также птица имитировала смех, кашель. Присутствовали имитации инструментальных звуков (стук) и видовые сигналы. Имитируемые слова различались очень четко. Из девятиминутной записи имитации речи было выделено 29 звуков "о", 46 звуков "а" и 40 звуков "и".

Вокальный репертуар серых попугаев был наиболее богат. В четырех с половиной часовой записи прибрежного попугая имитации речи различной степени четкости составили около восьмидесяти минут. Присутствовали такие слова и фразы как "Рома", "Витя", "Коля", "упал", "уронил", "спать", "в клетку, кто хочет" и другие. Эти сигналы различались четко. Также присутствовали имитации телефонного разговора, в которых был различим только общий фон речи (неразборчивый разговор). Присутствовали инструментальные звуки и видовые сигналы. Из записи были выделены 95 звуков "а" и 98 звуков "о" и 26 звуков "и".

Запись краснохвостого жако составила полтора часа, тринадцать минут из которых занимали имитации речи человека. Присутствовали имитации слов "привет", "орешек", "что ты хочешь", "давай", "Кузя", "иди сюда", "не стыдно", "свинья", "собаки" и др. В записи также присутствовали видовые сигналы, имитации инструментальных звуков (стуки, скрип, звук тонального набора телефона). Было выделено 303 звука "а", 53 звука "о", 171 звук "и" и 102 звука "у".

Анализ частот спектральных максимумов

Анализ амплитудно-динамических форм и спектральных характеристик показал, что гласноподобные звуки всех птиц содержали ампли-тудно-модулированные участки в значительно большем количестве, чем обладающие гармонической структурой. В спектрах таких звуков имелась максимально выраженная спектральная составляющая с частотой, соответствующей несущей частоте. Рядом с ней присутствовали добавочные компоненты, отделенные расстоянием, равным модулирующей частоте. По спектрам таких звуков было невозможно определить частоту основного тона и выделить в них гармоники, но выделение двух наиболее выраженных спектральных максимумов в большинстве случаев оказалось возможным.

Так как для различения категорий гласных звуков человеком именно значения двух наиболее выраженных спектральных максимумов играют основную роль, было проведено разделение гласноподобных звуков птиц на основании этого же признака.

20000 18000 16000 14000 12000 10000 8000 6000 4000 2000

отн. ед, 30000 25000 20000 15000 10000 5000 0

-5000 -10000 -15000 -20000 -25000 -30000

дБ -12 -24 -36 -48 -60 -72 -84 -96

мс

0.178 0.184 0.190 0.196 0.202 0.208 0.214 мс д

0.250 0.260 0.270 0.280 0.290 0.300 мс

е

220 440 880 17603520704014080

Гц

220 440 880 17603520704014080

Гц

Рис. 1. Акустические характеристики произнесения майной слова "Чика" женским голосом и сочетания "ЧитаЧита" мужским голосом.

а, в, д - динамический спектр, амплитудно-динамическая форма и спектр соответственно произнесения "Чика"; б, г, е -то же для произнесения "ЧитаЧита". Динамические спектры вокализаций птицы с выделенными фрагментами соответствующими звукам "и". По оси абсцисс - время, мс; по оси ординат - частота, Гц. Амплитудно-динамические формы выделенных звуков. По оси абсцисс - время, мс; по оси ординат - амплитуда, отн. ед. Спектры выделенных звуков. По оси абсцисс - частота, Гц; по оси ординат - амплитуда, дБ.

Распределение значений частот спектральных максимумов гласноподобных звуков попугаев и майны на двухформантной плоскости показало, что занимаемые этими звуками области не соответствуют принятым для гласных звуков взрослой речи и н

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком