УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК, 2014, том 45, № 1, с. 57-95
УДК 612.821
АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РЕЧЕВОГО СИГНАЛА КАК ПОКАЗАТЕЛЬ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ
ЧЕЛОВЕКА
© 2014 г. Н. Н. Лебедева, Е. Д. Каримова
Федеральное государственное бюджетное научное учреждение Институт высшей нервной деятельности и нейрофизиологии РАН,
Обзор посвящен анализу возможностей и эффективности использования экстралингвистических (т.е. несемантических) характеристик речевого сигнала для оценки функционального состояния человека - при выполнении операторской деятельности, эмоциональном напряжении, при моделировании (актерском и неактерском) различных эмоциональных состояний, при депрессии.
Ключевые слова: функциональное состояние, речевой сигнал, акустические характеристики, человек-оператор, эмоции.
ВВЕДЕНИЕ
Проблема объективной оценки различных состояний человека относится к числу наиболее актуальных как в физиологии труда, так и в клинической медицине. В прикладной физиологии - это эффективность и надежность функционирования человеческого звена ("человеческий фактор") в сложных системах управления, когда простота сенсомоторного действия человека-оператора сопровождается большим нервным напряжением, вызванным высокой ответственностью за результаты деятельности (авиадиспетчеры, операторы радиолокационных станций и объектов атомной энергетики и т.п.). Такие нервные нагрузки приводят к быстрому утомлению, при котором нарушаются вегетативные функции, ослабевает внимание, повышаются пороги сенсорных систем, что, в свою очередь, может привести не только к снижению эффективности, но и к появлению угрозы пропуска значимых сигналов наряду с появление ложных немотивированных команд [116]. Своевременное выявление начальных изменений состояния оператора, установление вида и уровня этих изменений, принятие надлежащих мер для восстановления работоспособности - практическая задача, которая стоит перед специалистами.
Для диагностики функциональных состояний (ФС) широко используется ряд физиологических, психофизиологических и биохимических показателей. Различным видам ФС соответствуют характерные изменения ЭЭГ, ЭКГ, КГР, величины
артериального давления, частоты дыхания и др. Так, было показано, что в начальных стадиях утомления появляется реакция десинхронизации альфа-ритма в сочетании с появлением медленно-волновой активности. При нарастании утомления продолжительность этих периодов увеличивается с возникновением картины гиперсинхронизации ЭЭГ [16, 25]. Анализ электрофизиологических показателей в различные фазы работоспособности [65] показал, что в период врабатывания наряду с повышением показателей качества работы и общей активности возрастала активность определенных зон коры головного мозга, при этом фокус ЭЭГ-активности был локализован в левой лобной области. В фазе устойчивой работоспособности, несмотря на высокие показатели качества деятельности, наблюдалось постепенное снижение общего уровня кортикальной активности с переходом фокуса в нижнетеменные и затылочные зоны правого полушария. В фазе прогрессирующего снижения работоспособности на ЭЭГ отмечалось разрушение структуры доминирующего ритма. Характерный ЭЭГ-паттерн формируется при развитии состояния монотонии во время длительной монотонной операторской деятельности [48].
Для выявления динамики ФС наиболее часто используют показатели сердечно-сосудистой (ССС) системы. По данным литературы, наиболее точными показателями эмоционального состояния являются частота сердечного ритма [94, 104] и форма кардиограммы [2, 120]. Было показано [2], что в аварийной ситуации у железнодорожных диспетчеров, наряду с увеличением
артериального давления значительно учащается сердечный ритм, а в ряде случаев наблюдается смещение Л5Т-сегмента электрокардиограммы ниже изоэлектрической линии и уплощение Т-зубца. Изменение частоты сердечных сокращений (ЧСС) наблюдалось и при развитии утомления. Показано, что в период длительной нагрузки через некоторое время ЧСС начинает снижаться [93]. В настоящее время для оценки работы ССС чаще всего используют метод вариационной кардиометрии [8, 48, 95] - регистрация синусового сердечного ритма (кардиоинтервало-граммы - КИГ) с последующим математическим анализом его структуры. КИГ представляет собой непрерывную последовательность измеренных значений продолжительности последовательных кардиоциклов. В структуре ритма заложена информация, отражающая состояние адаптационно-компенсаторных элементов целостного организма. Применение КИГ позволяет судить не только об исходном вегетативном тонусе, но и о вегетативной реактивности и вегетативном обеспечении деятельности [47].
Еще одним общепринятым методом исследования ФС является регистрация кожно-гальва-нической реакции (КГР) [55]. Была доказана непосредственная связь характера электрокожных реакций с изменением активности ретикулярной формации. Таким образом, КГР может рассматриваться как показатель уровня общей активности.
Другой менее популярный способ оценки ФС человека - величина мышечного микротремора -использовался для определения уровня стресса студентов во время экзамена. Для этого применяли акселерометр, который измерял частоту и интенсивность микродвижений руки. Было показано, что интенсивность микротремора перед экзаменом в среднем увеличилась на 50% у девушек и на 90% у мужчин по сравнению с обычным их состоянием [135].
Для анализа ФС широко используются показатели зрительной работоспособности, т.к. зрительный анализатор несет нагрузку практически во всех видах деятельности. Наблюдалось снижение остроты зрения, сужение поля зрения, удлинение последовательного отрицательного образа и снижение электрической чувствительности глаза быстроты цветоощущения у радистов, режиссеров и ассистентов телестудии, у летчиков после длительных беспосадочных полетов [6, 93]. Для оценки зрительной чувствительности используется тест определения критической частоты слияния мельканий (КЧСМ). При утомлении наблюдалось заметное снижение величины этого
показателя, снижалась временная разрешающая способность зрения [16, 67].
Для изучения утомления широко используется анализ динамики двигательной активности человека. Чаще всего используется группа методик определения времени реакции при выполнении различных сенсомоторных задач. Выделение в моторном компоненте латентного периода и собственно исполнительской части дает возможность анализа механизма процессов принятия решений, регуляции двигательного акта и др. [66]. Так, при изучении ФС, вызванного дозированным приемом этанола, с использованием тестов на определение простой двигательной реакции и времени двигательной реакции со слежением и выбором было показано, что углубление состояния опьянения дает выраженные сдвиги в сторону замедления всех реакций [35].
Однако использование для оценки ФС физиологических и психофизиологических методов в реальных условиях сопряжено со значительными трудностями. Во-первых, наложение различного рода датчиков создает значительный дискомфорт и помехи в работе оператора. Во-вторых, для реализации электрографических и психофизиологических записей требуются дополнительные каналы связи.
В этом смысле более перспективными представляются методы оценки ФС с помощью речи. Во-первых, речь как источник информации о говорящем может быть показателем индивидуальных психофизиологических особенностей, а также сигнализировать о текущем ФС - утомлении, эмоциональном напряжении. Во-вторых, речевой канал имеет ряд важных преимуществ: при записи речи не требуется наложение контактных датчиков, для передачи информации не требуются дополнительные каналы связи, в случае необходимости запись речи можно производить скрытым микрофоном. В целом ряде работ [7, 53, 57, 72, 77, 111] было показано, что информация о состоянии человека может быть заключена как в особенностях восприятия речевого сигнала, так и в лексико-грамматических особенностях построения высказывания, в акустико-фонети-ческих, интонационных характеристиках его оформления, темпе речи. При изучении состояния человека-оператора в ряде случаев единственным источником информации является его речевое оформление. В особенности это касается летчиков, космонавтов, парашютистов, авиадиспетчеров, где своевременность и точность ведения радиообмена отражает общую работоспособность оператора, его эмоциональный настрой,
что проявляется в семантической и спектральной структуре его речи [78].
Проблема определения эмоциональной компоненты функционального состояния человека на основе акустических характеристик речи представляет интерес, как в теоретическом плане, так и для решения различных прикладных задач. Особое значение эта проблема приобретает при объективном определении состояния человека по звучанию его голоса в различных сферах деятельности, в частности в экстремальных условиях, когда говорящий находится вне пределов видимости.
Диагностика состояния человека по речевому сигналу часто осуществляется в таких условиях, когда такой сигнал является единственным источником информации о состоянии человека, например, по материалам радиооператоров со службами управления полетом, диспетчеров аэропорта, операторов подводных лодок и т.д. Запись речевого сигнала также необходима в судебной и медицинской психологии, при разработке систем автоматического распознавания речи, в психиатрии, неврологии и т.д. В многочисленных исследованиях показано, что эмоциональное состояние человека изменяет характеристики его голоса и речи [12, 19, 29, 85, 109, 126, 143, 153, 171, 173, 179, 180]. В процессе общения эмоциональная информация (радость, печаль, гнев, страх, удивление), характеризующая эмоциональное состояние индивида, -одна из наиболее важных. Возросший интерес к моделированию эмоций в речевом сигнале в контексте задачи синтеза естественно звучащей речи объясняется изменением в оценке перспектив речевых технологий. В настоящее время в данном вопросе преобладает утилитарный подход, в рамках которого наиболее перспективными выглядят следующие приложения:
- применение речевого интерфейса людьми с ограниченными возможностями, например с заб
Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.