научная статья по теме ВЛИЯНИЕ ИНДИВИДУАЛЬНЫХ ОСОБЕННОСТЕЙ ЧЕЛОВЕКА НА АКУСТИЧЕСКИЕ КОРРЕЛЯТЫ ЭМОЦИОНАЛЬНОЙ ИНТОНАЦИИ РЕЧИ Биология

Текст научной статьи на тему «ВЛИЯНИЕ ИНДИВИДУАЛЬНЫХ ОСОБЕННОСТЕЙ ЧЕЛОВЕКА НА АКУСТИЧЕСКИЕ КОРРЕЛЯТЫ ЭМОЦИОНАЛЬНОЙ ИНТОНАЦИИ РЕЧИ»

ЖУРНАЛ ВЫСШЕЙ НЕРВНОЙ ДЕЯТЕЛЬНОСТИ, 2009, том 59, № 5, с. 538-546

ФИЗИОЛОГИЯ ВЫСШЕЙ НЕРВНОЙ (ПСИХИЧЕСКОЙ) ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА

УДК 612.821

ВЛИЯНИЕ ИНДИВИДУАЛЬНЫХ ОСОБЕННОСТЕЙ ЧЕЛОВЕКА НА АКУСТИЧЕСКИЕ КОРРЕЛЯТЫ ЭМОЦИОНАЛЬНОЙ ИНТОНАЦИИ РЕЧИ

© 2009 г. Е. С. Дмитриева, В. Я. Гельман, К. А. Зайцева, А. М. Орлов

Институт эволюционной физиологии и биохимии им. И.М.Сеченова РАН, Санкт-Петербург,

e-mail: dmit49@mail.ru Поступила в редакцию 04.12.2008 г.

Принята в печать 09.01.2009 г.

Сравнительное исследование акустических коррелятов эмоциональной интонации проведено на различном речевом материале: осмысленных речевых высказываниях и коротких бессмысленных словах. Методом актерского моделирования создавался массив речевых сигналов различной эмоциональной интонации (радость, гнев, печаль, страх и нейтральная). Участвовали дикторы 20—70 лет, выборка включала как профессиональных драматических актеров, так и не актеров. Для всех испытуемых русский язык был родным. В полученном массиве проводился анализ следующих акустических параметров: средних значений и стандартных отклонений звуковой мощности, частоты основного тона, частот первой и второй формант, длительности произнесения. В результате сравнения значений параметров каждой из рассматриваемых эмоциональных интонаций с соответствующими параметрами нейтральной интонации было обнаружено, что наиболее выраженными в процентном отношении были отклонения частот основного тона и первой форманты. Было показано, что направленность этих отклонений не зависит от семантического содержания речевого высказывания и его длительности, от возраста, пола и актерской подготовки говорящего, хотя на абсолютные значения частот индивидуальные особенности говорящих оказывали влияние.

Ключевые слова: эмоциональная интонация, возрастные и гендерные особенности человека, речевое высказывание, акустические характеристики.

Influence of Human Personal Features on Acoustic Correlates of Speech Emotional Intonation Characteristics

E. S. Dmitrieva, V. Y&. Gelman, K. A. Zaitseva, A. M. Orlov

Sechenov Institute of Evolutionary Physiology and Biochemistry, Russian Academy of Sciences, St. Petersburg, e-mail: dmit49@mail.ru

Comparative study of acoustic correlates of emotional intonation was conducted on two types of speech material: sensible speech utterances and short meaningless words. The corpus of speech signals of different emotional intonations (happy, angry, frightened, sad and neutral) was created using the actor's method of simulation of emotions. Native Russian 20-70-year-old speakers (both professional actors and non-actors) participated in the study. In the corpus, the following characteristics were analyzed: mean values and standard deviations of the power, fundamental frequency, frequencies of the first and second formants, and utterance duration. Comparison of each emotional intonation with "neutral" utterances showed the greatest deviations of the fundamental frequency and frequencies of the first formant. The direction of these deviations was independent of the semantic content of speech utterance and its duration, age, gender, and being actor or non-actor, though the personal features of the speakers affected the absolute values of these frequencies.

Key words: emotional intonation, human age and genderfeatures, speech utterance, acoustical characteristics.

Эмоционально-выразительная функция речи играет важнейшую роль в общении людей друг с другом. Интонация голоса человека — это один из важнейших источников информации об его эмоциональном состоянии и она способна передавать эту информацию независимо от лексико-семантического аспекта высказывания. Изучение характеристик экспрессии и распознавания эмоциональных интонаций человеком представляет значительный интерес для исследования его эмоционального интеллекта, а также для решения ряда прикладных задач: проблемы автоматического распознавания эмоционального состояния говорящего по голосу, оптимизации интерфейса человек — компьютер, задачи дистанционной оценки состояния оператора и др. В связи с этим в последнее время интенсивно проводились исследования по выявлению акустических коррелятов эмоций в речи (например, обзор [11]), однако в этих работах изучение проводилось на массивах речевых сигналов в основном западноевропейских языков. До недавнего времени данные по акустическим признакам эмоциональной интонации русского языка были очень немногочисленны [5, 10]. В последние годы были предприняты попытки создания массивов высказываний с различной эмоциональной интонацией и анализа акустических коррелятов рассматриваемых эмоций на материале русского языка [9, 12, 13]. Однако до сих пор в существующей литературе нет однозначных данных как об основных акустических характеристиках речевого сигнала, обусловливающих передачу слушателю эмоционального содержания речи, независимых от семантического аспекта высказывания, так и о зависимости их изменений от возрастных, гендер-ных, физиологических и социо-культурных факторов [1, 11, 17—19]. Одним из объяснений присутствующих в работах различий, по-видимому, можно считать малые размеры исследуемых выборок (например, в работе [19] в эксперименте участвовали всего два диктора) и большую вариабельность акустических характеристик произношения различных дикторов. Нет также общепринятого мнения о минимальной длительности речевого отрезка, необходимого для распознавания эмоциональной интонации говорящего. В некоторых работах отмечалось, что к 14-летнему возрасту для опознавания эмоциональных интонаций достаточно отрезка сигнала, равного двусложному слову [2, 7, 8].

Целью настоящей работы являлось исследование влияния на наиболее существенные акустические корреляты эмоциональной интонации речи индивидуальных особенностей человека (пола, возраста, актерской подготовки говорящего). Кроме того, нам представлялось интересным провести сравнение акустических параметров осмысленных речевых высказываний и короткого бессмысленного слова с целью выявления акустических признаков эмоциональных интонаций различных типов, не зависимых от лексико-семантиче-ского аспекта высказывания и его длительности.

МЕТОДИКА

Для решения поставленной задачи в настоящей работе было проведено сравнительное исследование на речевом материале двух типов: законченных высказываниях и бессмысленных двусложных словах. В ходе исследования создавался массив речевых сигналов различной эмоциональной интонации и проводился анализ их акустических характеристик.

При создании массива применялся метод имитации эмоциональных интонаций (актерского моделирования) в одном и том же речевом высказывании. Метод позволяет выделить акустические корреляты эмоциональной выразительности и все структурные акустические изменения отнести только за счет изменения эмоциональной интонации речевого высказывания (однако не позволяет с уверенностью судить об эмоциональном состоянии говорящего) [2, 4, 5, 15].

Для сбора двух типов речевого материала применялись следующие способы. В первом варианте в качестве экспериментального материала были выбраны простые повествовательные предложения, содержащие часто встречаемые слова. Три фразы нейтрального содержания, состоящие из 8 слогов (1. "Брат поехал на стадион", 2. "Прости, я сам все расскажу", 3. "Остались только перышки"), произносились с пятью различными эмоциональными интонациями (радость, гнев, печаль, страх, безэмоционально). Каждый испытуемый произносил речевой материал 3 раза. Во втором варианте исследования произносилась и записывалась семантически нейтральная фраза, содержащая двусложное бессмысленное слово и в дальнейшем анализировалось только это слово (например, "Диут находится

Таблица 1. Средние акустические характеристики речевых высказываний Table 1. An average acoustic characteristics of speech utterances

Параметр F1 F2 P T

Эмоция среднее SD* среднее SD среднее SD среднее SD среднее SD

Первый вариант исследования

Радость 215.17 42.20 496.63 135.77 1614.76 386.57 35.03 6.98 1.53 0.25

Нейтральная 171.27 32.35 437.02 117.88 1562.63 361.13 19.97 5.81 1.60 0.32

Гнев 191.18 30.27 486.58 125.00 1568.28 393.44 31.91 7.19 1.54 0.31

Печаль 170.92 27.75 434.91 128.22 1592.22 363.86 18.92 5.57 1.74 0.39

Страх 199.71 30.86 440.45 139.01 1590.73 383.04 24.40 5.69 1.48 0.35

Второй вариант исследования

Радость 239.91 39.04 488.43 81.81 1320.53 281.30 34.18 4.10 0.420 0.05

Нейтральная 187.93 16.14 446.48 72.26 1306.12 261.68 22.52 3.51 0.415 0.06

Гнев 218.01 24.50 507.04 77.81 1273.95 267.98 35.80 4.27 0.422 0.07

* SD — стандартное отклонение.

Таблица 2. Фрагмент результатов дисперсионного анализа Table 2. Fragment of MANOVA results

Фактор Пол Возраст Вид эмоции Пол х Вид эмоции Возраст х Вид эмоции

Зависимые переменные F значимость р < F значимость р < F значимость р < F значимость р < F значимость р <

Первый вариант исследования (все возрастные группы)

T 18.64 0.000 6.85 0.001 10.40 0.000 1.70 0.149 7.81 0.000

F0 892.62 0.000 52.46 0.000 49.82 0.000 6.47 0.000 3.22 0.001

F1 441.86 0.000 154.97 0.000 67.22 0.000 6.17 0.000 12.39 0.000

F2 1179.97 0.000 23.06 0.000 7.81 0.000 6.00 0.000 2.01 0.044

P 0.96 0.326 3.35 0.400 30.72 0.000 0.48 0.748 0.56 0.811

Первый вариант исследования (20—34 года)

T 36.97 0.000 - - 3.98 0.004 2.31 0.060 - -

F0 526.64 0.000 - - 16.98 0.000 3.73 0.006 - -

F1 389.27 0.000 - - 20.45 0.000 1.69 0.155 - -

F2 388.11 0.000 - - 1.57 0.185 1.18 0.322 - -

P 0.76 0.385 - - 55.13 0.000 3.34 0.012 - -

Второй вариант исследования

T 17.01 0.000 - - 1.04 0.355 10.81 0.000 - -

F0 332.76 0.000 - - 65.10 0.000 24.89 0.000 - -

F1 19.25 0.000 - - 6.49 0.002 1.62 0.200 - -

F2 4.31 0.039 - - 0.41 0.665 0.36 0.698 - -

P 1.54 0.215 - - 192.64 0.000 4.53 0.011

здесь"). Были выбраны 18 слов: биут, боут, ба- произносились с тремя различными эмоцио-ут, пиут, поут, паут, диут, доут, даут, тиут, тоут, нальными интонациями (радость, гнев, без-таут, гиут, гоут, гаут, киут, коут, каут. Фразы эмоционально). Последовательность произ-

несения ф

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком