научная статья по теме АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РЕЧЕВОГО СИГНАЛА КАК ПОКАЗАТЕЛЬ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ЧЕЛОВЕКА Биология

Текст научной статьи на тему «АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РЕЧЕВОГО СИГНАЛА КАК ПОКАЗАТЕЛЬ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ЧЕЛОВЕКА»

УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК, 2014, том 45, № 1, с. 57-95

УДК 612.821

АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РЕЧЕВОГО СИГНАЛА КАК ПОКАЗАТЕЛЬ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ

ЧЕЛОВЕКА

© 2014 г. Н. Н. Лебедева, Е. Д. Каримова

Федеральное государственное бюджетное научное учреждение Институт высшей нервной деятельности и нейрофизиологии РАН,

Обзор посвящен анализу возможностей и эффективности использования экстралингвистических (т.е. несемантических) характеристик речевого сигнала для оценки функционального состояния человека - при выполнении операторской деятельности, эмоциональном напряжении, при моделировании (актерском и неактерском) различных эмоциональных состояний, при депрессии.

Ключевые слова: функциональное состояние, речевой сигнал, акустические характеристики, человек-оператор, эмоции.

ВВЕДЕНИЕ

Проблема объективной оценки различных состояний человека относится к числу наиболее актуальных как в физиологии труда, так и в клинической медицине. В прикладной физиологии - это эффективность и надежность функционирования человеческого звена ("человеческий фактор") в сложных системах управления, когда простота сенсомоторного действия человека-оператора сопровождается большим нервным напряжением, вызванным высокой ответственностью за результаты деятельности (авиадиспетчеры, операторы радиолокационных станций и объектов атомной энергетики и т.п.). Такие нервные нагрузки приводят к быстрому утомлению, при котором нарушаются вегетативные функции, ослабевает внимание, повышаются пороги сенсорных систем, что, в свою очередь, может привести не только к снижению эффективности, но и к появлению угрозы пропуска значимых сигналов наряду с появление ложных немотивированных команд [116]. Своевременное выявление начальных изменений состояния оператора, установление вида и уровня этих изменений, принятие надлежащих мер для восстановления работоспособности - практическая задача, которая стоит перед специалистами.

Для диагностики функциональных состояний (ФС) широко используется ряд физиологических, психофизиологических и биохимических показателей. Различным видам ФС соответствуют характерные изменения ЭЭГ, ЭКГ, КГР, величины

артериального давления, частоты дыхания и др. Так, было показано, что в начальных стадиях утомления появляется реакция десинхронизации альфа-ритма в сочетании с появлением медленно-волновой активности. При нарастании утомления продолжительность этих периодов увеличивается с возникновением картины гиперсинхронизации ЭЭГ [16, 25]. Анализ электрофизиологических показателей в различные фазы работоспособности [65] показал, что в период врабатывания наряду с повышением показателей качества работы и общей активности возрастала активность определенных зон коры головного мозга, при этом фокус ЭЭГ-активности был локализован в левой лобной области. В фазе устойчивой работоспособности, несмотря на высокие показатели качества деятельности, наблюдалось постепенное снижение общего уровня кортикальной активности с переходом фокуса в нижнетеменные и затылочные зоны правого полушария. В фазе прогрессирующего снижения работоспособности на ЭЭГ отмечалось разрушение структуры доминирующего ритма. Характерный ЭЭГ-паттерн формируется при развитии состояния монотонии во время длительной монотонной операторской деятельности [48].

Для выявления динамики ФС наиболее часто используют показатели сердечно-сосудистой (ССС) системы. По данным литературы, наиболее точными показателями эмоционального состояния являются частота сердечного ритма [94, 104] и форма кардиограммы [2, 120]. Было показано [2], что в аварийной ситуации у железнодорожных диспетчеров, наряду с увеличением

артериального давления значительно учащается сердечный ритм, а в ряде случаев наблюдается смещение Л5Т-сегмента электрокардиограммы ниже изоэлектрической линии и уплощение Т-зубца. Изменение частоты сердечных сокращений (ЧСС) наблюдалось и при развитии утомления. Показано, что в период длительной нагрузки через некоторое время ЧСС начинает снижаться [93]. В настоящее время для оценки работы ССС чаще всего используют метод вариационной кардиометрии [8, 48, 95] - регистрация синусового сердечного ритма (кардиоинтервало-граммы - КИГ) с последующим математическим анализом его структуры. КИГ представляет собой непрерывную последовательность измеренных значений продолжительности последовательных кардиоциклов. В структуре ритма заложена информация, отражающая состояние адаптационно-компенсаторных элементов целостного организма. Применение КИГ позволяет судить не только об исходном вегетативном тонусе, но и о вегетативной реактивности и вегетативном обеспечении деятельности [47].

Еще одним общепринятым методом исследования ФС является регистрация кожно-гальва-нической реакции (КГР) [55]. Была доказана непосредственная связь характера электрокожных реакций с изменением активности ретикулярной формации. Таким образом, КГР может рассматриваться как показатель уровня общей активности.

Другой менее популярный способ оценки ФС человека - величина мышечного микротремора -использовался для определения уровня стресса студентов во время экзамена. Для этого применяли акселерометр, который измерял частоту и интенсивность микродвижений руки. Было показано, что интенсивность микротремора перед экзаменом в среднем увеличилась на 50% у девушек и на 90% у мужчин по сравнению с обычным их состоянием [135].

Для анализа ФС широко используются показатели зрительной работоспособности, т.к. зрительный анализатор несет нагрузку практически во всех видах деятельности. Наблюдалось снижение остроты зрения, сужение поля зрения, удлинение последовательного отрицательного образа и снижение электрической чувствительности глаза быстроты цветоощущения у радистов, режиссеров и ассистентов телестудии, у летчиков после длительных беспосадочных полетов [6, 93]. Для оценки зрительной чувствительности используется тест определения критической частоты слияния мельканий (КЧСМ). При утомлении наблюдалось заметное снижение величины этого

показателя, снижалась временная разрешающая способность зрения [16, 67].

Для изучения утомления широко используется анализ динамики двигательной активности человека. Чаще всего используется группа методик определения времени реакции при выполнении различных сенсомоторных задач. Выделение в моторном компоненте латентного периода и собственно исполнительской части дает возможность анализа механизма процессов принятия решений, регуляции двигательного акта и др. [66]. Так, при изучении ФС, вызванного дозированным приемом этанола, с использованием тестов на определение простой двигательной реакции и времени двигательной реакции со слежением и выбором было показано, что углубление состояния опьянения дает выраженные сдвиги в сторону замедления всех реакций [35].

Однако использование для оценки ФС физиологических и психофизиологических методов в реальных условиях сопряжено со значительными трудностями. Во-первых, наложение различного рода датчиков создает значительный дискомфорт и помехи в работе оператора. Во-вторых, для реализации электрографических и психофизиологических записей требуются дополнительные каналы связи.

В этом смысле более перспективными представляются методы оценки ФС с помощью речи. Во-первых, речь как источник информации о говорящем может быть показателем индивидуальных психофизиологических особенностей, а также сигнализировать о текущем ФС - утомлении, эмоциональном напряжении. Во-вторых, речевой канал имеет ряд важных преимуществ: при записи речи не требуется наложение контактных датчиков, для передачи информации не требуются дополнительные каналы связи, в случае необходимости запись речи можно производить скрытым микрофоном. В целом ряде работ [7, 53, 57, 72, 77, 111] было показано, что информация о состоянии человека может быть заключена как в особенностях восприятия речевого сигнала, так и в лексико-грамматических особенностях построения высказывания, в акустико-фонети-ческих, интонационных характеристиках его оформления, темпе речи. При изучении состояния человека-оператора в ряде случаев единственным источником информации является его речевое оформление. В особенности это касается летчиков, космонавтов, парашютистов, авиадиспетчеров, где своевременность и точность ведения радиообмена отражает общую работоспособность оператора, его эмоциональный настрой,

что проявляется в семантической и спектральной структуре его речи [78].

Проблема определения эмоциональной компоненты функционального состояния человека на основе акустических характеристик речи представляет интерес, как в теоретическом плане, так и для решения различных прикладных задач. Особое значение эта проблема приобретает при объективном определении состояния человека по звучанию его голоса в различных сферах деятельности, в частности в экстремальных условиях, когда говорящий находится вне пределов видимости.

Диагностика состояния человека по речевому сигналу часто осуществляется в таких условиях, когда такой сигнал является единственным источником информации о состоянии человека, например, по материалам радиооператоров со службами управления полетом, диспетчеров аэропорта, операторов подводных лодок и т.д. Запись речевого сигнала также необходима в судебной и медицинской психологии, при разработке систем автоматического распознавания речи, в психиатрии, неврологии и т.д. В многочисленных исследованиях показано, что эмоциональное состояние человека изменяет характеристики его голоса и речи [12, 19, 29, 85, 109, 126, 143, 153, 171, 173, 179, 180]. В процессе общения эмоциональная информация (радость, печаль, гнев, страх, удивление), характеризующая эмоциональное состояние индивида, -одна из наиболее важных. Возросший интерес к моделированию эмоций в речевом сигнале в контексте задачи синтеза естественно звучащей речи объясняется изменением в оценке перспектив речевых технологий. В настоящее время в данном вопросе преобладает утилитарный подход, в рамках которого наиболее перспективными выглядят следующие приложения:

- применение речевого интерфейса людьми с ограниченными возможностями, например с заб

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком