научная статья по теме АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РУССКИХ ДВУХФОРМАНТНЫХ ГЛАСНЫХ РАЗНЫХ ФОРМ РЕЧИ Математика

Текст научной статьи на тему «АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РУССКИХ ДВУХФОРМАНТНЫХ ГЛАСНЫХ РАЗНЫХ ФОРМ РЕЧИ»

ДОКЛАДЫ АКАДЕМИИ НАУК, 2014, том 457, № 1, с. 114-116

= ФИЗИОЛОГИЯ

УДК 612.85:534.78

АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РУССКИХ ДВУХФОРМАНТНЫХ ГЛАСНЫХ РАЗНЫХ ФОРМ РЕЧИ

© 2014 г. Н. Г. Андреева , Г. А. Куликов

Представлено академиком А.Д. Ноздрачевым 26.12.2013 г. Поступило 15.01.2014 г.

БОТ: 10.7868/8086956521419030Х

В настоящее время общепризнано, что основным признаком, характеризующим фонетическую принадлежность гласных устной речи, служат частотные значения их первых формант [1, 2]. Вместе с тем "формантный ключ", значимый для речи взрослых, не может быть распространен на речевые сигналы с высокими частотами основного тона (ЧОТ), такие, как гласные детей первых лет жизни, певческие гласные. Однако, согласно теории формантных отношений [3], гласные различаются не на основе значений формант как таковых, а их отношений. Предполагается, что использование формантных отношений может уменьшить или даже элиминировать возрастные и гендерные отличия в акустическом описании гласных [4, 5]. Ранее нами показано [6, 7], что для идентификации гласных [а], [о], [у] при значениях частоты основного тона, характерной для речи детей первых лет жизни, ни абсолютные значения формант, ни соотношение их частот не могут рассматриваться в качестве различительных признаков. Решающим в этом случае становится частотно-зависимое соотношение амплитуд спектральных компонентов. Существенно, что по данному признаку одноформантные гласные речи детей и взрослых оказываются сходными [8].

Задача настоящей работы состояла в определении акустических характеристик двухформант-ных гласных русского языка [и], [ы], [э] с целью выявления общих признаков, характеризующих фонетическую принадлежность звука при обычной (вокализованной) и шепотной речи, т.е. вне зависимости от формы его реализации. Полученные данные свидетельствуют о том, что перцептивно-значимыми для этих гласных оказываются

Санкт-Петербургский государственный университет

высотно-зависимые отношения частот двух первых спектральных максимумов.

Материалом для исследования служили звуки, зарегистрированные у 45 детей 3-5-летнего возраста и 240 женщин (возраст 18—20 лет), а также гласные, произнесенные шепотом (140 мужчин и женщин в возрасте 18—20 лет). Регистрацию, спектральный анализ и определение характеристик звуков проводили так же, как и в предшествующих работах [8, 9]. У всех гласных оценивали частоту и амплитуду первой и второй формант, а также спектральных максимумов, включая (для вокализованных звуков) максимум, соответствующий частоте основного тона (ЧОТ). В ряде случаев для уточнения спектрального максимума, достаточного для сохранения фонетического качества гласного, проводили дополнительный аудиторский анализ звука с подавлением амплитуды его отдельных спектральных составляющих. Приведены результаты, касающиеся гласных, высоко достоверно отнесенных аудиторами к одной и той же фонетической категории.

Проведенный анализ женских звуков (п = 2142, среди них 891 гласная [и], 511 [ы], 740 [э]) показал, что абсолютные частотные значения формант далеко не всегда отражают фонетическую принадлежность гласных: в традиционном представлении на двухформантной плоскости выявляют области перекрытия для звуков [и]—[ы] и [ы]—[э]. Вместе с этим отношение частот двух первых спектральных максимумов гласных [и], [ы], [э], изменяясь по-разному в зависимости от ЧОТ, может служить признаком, позволяющим эти звуки разделить. Статистический анализ показал, что для каждого типа гласных между значениями ЧОТ и отношением частот первых двух спектральных максимумов выявляется высокодостоверная (р < 0.01) взаимосвязь. Аналогичная картина выявляется при анализе гласных, произнесенных детьми. Диапазон частот основного тона в зарегистрированных у них звуках составил

АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ

115

220—480 Гц, и, подобно взрослым, для каждой фонетической категории гласных (n = 427, среди них 192 гласных [и], 78 [ы], 157 [э]) обнаружена высокодостоверная корреляция этих показателей.

У гласных, произнесенных шепотом (n = 376, среди них 175 гласных [и], 65 [ы], 136 [э]), распределение спектральных максимумов на двухфор-мантной плоскости оказывается смещенным в более высокочастотную сторону по сравнению с аналогичными звуками взрослых и детей, что соответствует данным литературы [5, 10, 11].

С целью сравнения характеристик исследуемых вокализованных звуков с гласными, произнесенными шепотом и, следовательно, лишенными такого признака, как основной тон [5], оценивали отношения частот первых двух спектральных максимумов (Fmax2/Fmax1) в зависимости от величины max1. Показано, что во всех трех формах реализации исследуемых фонем (вокализованная речь детей и взрослых и шепот) проявляется одинаковая тенденция — при возрастании частоты первого максимума этот показатель снижается, причем для звуков [и] и [ы] в большей степени, чем для [э] (рис. 1а—в). Отметим, что с учетом характеристик детских звуков, зарегистрированных в данной работе, в анализ включены гласные женской речи с частотами основного тона 220—480 Гц (n = 1633, из них 666 гласных [и], 397 [ы], 570 [э]).

Оказалось, что в пределах указанного диапазона ЧОТ значения частотных отношений спектральных максимумов у гласных одной и той же фонетической категории детской и взрослой речи оказываются сходными (рис. 1а, б). Максимальные и минимальные значения этого показателя составили: 16-6 и 17-6 ([и]); 9-4 и 9-5 ([ы]); 4.2-2 и 4.3-2.4 ([э]) для взрослых и детей соответственно. Примечательно, что и шепотные гласные демонстрируют по данному признаку сходство с вокализованными звуками. Для них частотные отношения изменялись в пределах 12.7-5.7; 6.1-3; 4.1-2 для звуков [и], [ы], [э] соответственно (рис. 1в).

Таким образом, действительно, фонетически разные гласные [и], [ы], [э] в значительной степени отличаются по частотным отношениям их спектральных максимумов (формант). Однако это не означает полного соответствия теории фор-мантных отношений, поскольку для каждого из исследованных звуков характерен определенный диапазон изменений данного признака. В качестве акустических коррелятов фонетической принадлежности гласного частотные отношения могут выступать лишь при учете высотности звука. Так, шепотные звуки, отличающиеся по значениям частот спектральных максимумов от вокализованных гласных, тем не менее оказываются сход-

0

200

max2/max1 18

16 14 12 10 8 6 4 2 0 18 16 14 12 -10 -8 6 4 2 0 18 16 14 -12 10 8 6

400 600

800 1000

200

400 600 800 1000

200

400

600

800 1000 max1 (Гц)

Рис. 1. Зависимость частотных соотношений двух первых спектральных максимумов у гласных речи взрослых (а) и детей (б), а также у шепотных гласных (в). По оси абсцисс - частота первого максимума (Гц), по оси ординат - отношения частот первого и второго максимумов.

Символами +, □, О обозначено положение отдельных звуков и области представительства гласных [и], [ы], [э] соответственно; линии внутри каждой из областей построены методом взвешенных относительно расстояния наименьших квадратов, эллипсы на б-в включают 95% звуков.

4

2

ДОКЛАДЫ АКАДЕМИИ НАУК том 457 № 1 2014

8*

116

АНДРЕЕВА, КУЛИКОВ

max2/max1 16

14

12 10 8

100 200 300 400 500 600 700 800 900 1000

max1 (Гц)

Рис. 2. Частотные отношения спектральных максимумов гласных [и], [ы], [э] вокализованной и шепотной речи. Символами О, □, Л, обозначены средние значения отношений частот первого и второго максимумов в разных диапазонах для звуков детей (штриховая линия), взрослых (сплошная линия) и звуков, произнесенные шепотом (пунктирная линия) соответственно. Крупные значки — [и], средние — [ы], маленькие — [э]. Вертикальные линии — величина стандартного отклонения. Остальные обозначения, как на рис. 1.

ными с одноименными гласными обычной речи взрослых соответствующей высотности (рис. 2).

В целом полученные данные свидетельствуют о том, что для гласных [и], [ы], [э] разных форм речи общими признаками, характеризующими фонетическую принадлежность звука, могут являться вы-сотно-зависимые отношения частот спектральных максимумов.

СПИСОК ЛИТЕРАТУРЫ

1. Petersen L.C., Barney H.L. // J. Acoust. Soc. Amer. 1952. V. 24. № 1. P. 175-184.

2. Hillenbrand J., Getty J.A., Clark M.J., Wheeler K. // J. Acoust. Soc. Amer. 1993. V. 97. № 5. P. 3099-3111.

3. LloydR.J. // Phonetische Studien. 1890. B. III. P. 251278.

4. Potter R.K., Steinberg J. // J. Acoust. Soc. Amer. 1950. V. 22. № 2. P. 807-820.

5. Peterson L.C. // J. Speech Hear. Res. 1961. V. 4. № 1.

P. 10-29.

6. Андреева Н.Г., Куликов Г.А., Самокищук А.П. // Акуст. журн. 2002. Т. 48. № 5. С. 711-713.

7. Андреева Н.Г., Куликов Г.А., Самокищук А.П. // Сенсор. системы. 2002. Т. 16. № 3. С. 230-237.

8. Андреева Н.Г., Куликов Г.А. // ДАН. 2012. Т. 445. № 1. С. 106-108.

9. Андреева Н.Г., Куликов Г.А. // ДАН. 2009. Т. 429. № 1. С. 132-134.

10. Tartter V.C. // Perception & Psychophysics. 1991. V. 49. № 4. P. 365-372.

11. Уплисова К.О., Соколова Т.С. // Сенсор. системы. 2012. Т. 27. № 3. С. 230-237.

ДОКЛАДЫ АКАДЕМИИ НАУК том 457 № 1 2014

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком