научная статья по теме ОЦЕНКА СКОРОСТИ РАБОТЫ НЕЙРОКОМПЬЮТЕРНОГО ИНТЕРФЕЙСА, ОСНОВАННОГО НА ТЕХНОЛОГИИ SSVEP Кибернетика

Текст научной статьи на тему «ОЦЕНКА СКОРОСТИ РАБОТЫ НЕЙРОКОМПЬЮТЕРНОГО ИНТЕРФЕЙСА, ОСНОВАННОГО НА ТЕХНОЛОГИИ SSVEP»

ИЗВЕСТИЯ РАН. ТЕОРИЯ И СИСТЕМЫ УПРАВЛЕНИЯ, 2014, № 1, с. 121-129

КОМПЬЮТЕРНЫЕ ^^^^^^^^^^^^^^ МЕТОДЫ

УДК 004.5

ОЦЕНКА СКОРОСТИ РАБОТЫ НЕЙРОКОМПЬЮТЕРНОГО ИНТЕРФЕЙСА, ОСНОВАННОГО НА ТЕХНОЛОГИИ SSVEP © 2014 г. С. В. Борзунов, С. Д. Кургалин, А. В. Максимов, Я. А. Туровский

Воронеж, Воронежский государственный ун-т Поступила в редакцию 21.01.13 г., после доработки 06.06.13 г.

Представлена модель на основе детектирования устойчивых зрительных вызванных потенциалов, которая была использована для анализа скорости функционирования нейрокомпью-терного интерфейса. Установлено, что при определении параметров, при которых работа данного типа нейрокомпьютерных интерфейсов в принципе возможна, наиболее значимыми являются: параметр, выражающий отношение числа отсчетов в анализируемом сигнале к частоте дискретизации, а также частотный диапазон, в котором осуществляется детектирование устойчивых зрительных вызванных потенциалов. В случае если требуется определить факторы, лимитирующие скорость работы интерфейса, значимыми предикторами оказываются отношение частотного диапазона к числу возможных частот устойчивых зрительных вызванных потенциалов и отношение числа отсчетов в анализируемом сигнале к частоте дискретизации. Представленные в статье результаты позволяют моделировать параметры нейрокомпьютерных интерфейсов, исходя из требований к конкретному устройству и имеющихся технических возможностей, что еще до непосредственной его сборки, программирования и тестирования существенно сокращает время отладки подобных систем.

DOI: 10.7868/S0002338813060061

Введение. Активная интеграция цифровых и биомедицинских технологий привела к появлению в 90-х гг. прошлого века первых работающих с приемлемой скоростью и достаточной степенью точности нейрокомпьютерных интерфейсов (НКИ), в целом представляющих собой результат дальнейшего развития технологий биологической обратной связи [1]. Однако скорость и точность современных интерфейсов мозг—компьютер (синоним понятия "нейрокомпьютерный интерфейс") по-прежнему значительно ниже традиционных каналов коммуникации человек-компьютер. Как следствие — двумя основными направлениями совершенствования технологий НКИ в последнее время являются: поиск новых феноменов мозговой активности, которые могут служить командами для внешних устройств, и оптимизация уже существующих интерфейсов. Для второго направления основное внимание привлекают два интерфейса, основанных на использовании когнитивного потенциала P300 [2] или потенциала SSVEP (Steady-State Visual Evoked Potential — устойчивого зрительного вызванного потенциала — УЗВП) [3]. В настоящее время для технологии SSVEP накоплен большой массив эмпирических данных, связанных с анализом влияния на скорость и точность работы для данного варианта НКИ: цвета сигнала используемых для фотостимуляции светодиодов [4]; различий между результатами фотостимуляций с применением светодиодов или мониторов компьютеров [4, 5]; различных частот фотостимуляций [4, 6] или вида изображаемых на экране фигур [4]. Однако, несмотря на лидирующие позиции среди всех интерфейсов (по скорости функционирования) именно тех НКИ, которые базируются на технологии SSVEP [7], важным вопросом остается теоретическое определение максимально возможных параметров скорости для данного конкретного типа НКИ применительно к различным условиям регистрации и обработки данных на основе преобразования Фурье.

Целью настоящего исследования является моделирование работы НКИ, основанных на выделении и использовании устойчивых зрительных вызванных потенциалов головного мозга, для оценки и прогноза скорости работы таких НКИ.

1. Модель для оценки скорости работы НКИ. Рассмотрим модель, позволяющую оценить скорость работы НКИ, который базируется на применении потенциала SSVEP.

Основой данной модели является выделение устойчивого зрительного потенциала, возникающего в зрительной коре затылочной доли головного мозга и представляющего собой колебания электрического поля амплитудой ~0.5—10 мкВ. Значительную роль в формировании величины и

О

о

Команда на устройство эффектор

ЭЭГ-усилитель, фильтры

V

Выделение ВП

V

Обработка и классификация ВП

Рис. 1. Принципиальная схема НКИ, основанного на выделении и использовании потенциала 88УБР

формы потенциала этого поля играет селективное внимание испытуемого: при попадании не только в поле зрения, но и в проекцию центральной ямки сетчатки глаза светового потока от двух или более светодиодов частота колебаний потенциала 88УБР будет соответствовать частоте того светодиода, на который человек смотрит более внимательно.

Классический тип интерфейса, основанного на этом виде вызванных потенциалов (ВП), выглядит следующим образом (см. рис. 1): из регистрируемой электроэнцефалограммы (ЭЭГ), как правило, методом когерентного накопления выделяется сигнал, содержащий 88УБР. Затем методом спектрального оценивания с использованием преобразования Фурье или иным методом выделяется нужный частотный пик. В дальнейшем классификатор определяет наличие наиболее выраженных частотных компонент в сигнале и соотносит их с той или иной частотой стимуляции пользователя. Каждая из частот в свою очередь "привязана" к определенной команде внешнего устройства-эффектора. Этот процесс и обеспечивает передачу команд непосредственно с головного мозга на внешние устройства.

Как известно [7], частоты устойчивых ВП, имеющих максимальную амплитуду, сгруппированы в диапазоне, близком к диапазону а-ритма ЭЭГ [8], но при росте частоты стимуляции амплитуда потенциала падает [6, 7], хотя феномены 88УБР зарегистрированы до частот 84—90 Гц [7]. При этом фотостимуляция может осуществляться разными способами: использованием свето-диодов, мигающих с определенной частотой; инверсией изображения шахматного паттерна, когда белые клетки на экране монитора становятся черными и наоборот, с определенной частотой; изменением яркости и цвета различных элементов изображений на экране. Амплитуда потенциала 88УБР ~0.5—10 мкВ, а амплитуда сигнала фоновой ЭЭГ в данной области может достигать величин 100 мкВ в спокойном расслабленном состоянии испытуемого, существенно уменьшаясь при умственной нагрузке [8]. Именно поэтому для выделения полезного сигнала применяют алгоритмы когерентного накопления, в которых опорной точкой является время стимуляции. Таким образом, для получения пригодного для обработки сигнала необходимо определенное время, требующееся для накопления нужного числа повторений реакции ЭЭГ на стимул и улучшения отношения сигнал/шум до приемлемых для дальнейшей обработки величин. Изменение отношения сигнал/шум по мере увеличения числа накоплений сигнала можно описать как [9]

А/А )п = л /л8\4П,

где Л5 — амплитуда полезного сигнала (в нашем случае — потенциала 88УБР); Ле — амплитуда шумового компонента в сигнале; п — число суммаций; индексом 1 обозначено отношение амплитуд в единичном сигнале, а индексом п — отношение амплитуд в сигнале после п накоплений.

Следовательно, при имеющемся фоновом соотношении сигнал/шум для ЭЭГ число суммаций для достижения отношения 1/2 должно быть не менее 30 (см. рис. 2) , где по оси абсцисс — отношение сигнал/шум в одиночной регистрации ЭЭГ в ответ на стимул, по оси ординат — требуемое число суммаций для получения определенного отношения сигнал/шум: 0.25 (треугольные маркеры), 0.5 (ромбовидные маркеры) и 1 (квадратные маркеры).

Число суммаций 10000

1000

100 -

10 -

0.02 0.04 0.06 0.08 0.10 Начальное отношение сигнал/шум

Рис. 2. Число суммаций для получения требуемого отношения сигнал/шум в ходе выделения вызванных потенциалов 88УБР

1

0

Отношение сигнал/шум 0.18

11

13

15 17 19 Число суммаций

Рис. 3. Отношение сигнал/шум на разных частотах фотостимуляции, выражаемых в Гц

7

9

Исходя из зависимостей, представленных на рис. 2, можно оценить время, затраченное на накопление полезных сигналов при стимуляции испытуемого световыми импульсами различной частоты. Поскольку необходимо обеспечить устойчивое накопление полезного сигнала, порожденного всеми частотами фотостимуляции, то фактором, лимитирующим время накопления, будет именно значение нижней частоты сигнала. В случае 30 накоплений сигнала при нижней частоте фотостимуляции 8 Гц время накопления составит 3.75 с. Отсюда можно сделать вывод, что отношение сигнал/шум (т.е. отношение амплитуд исследуемых ВП и фоновой ЭЭГ) для каждой из частот стимуляции (см. рис. 3), значения потенциалов которых были накоплены за время, достаточное для формирования требуемого отношения сигнал/шум на частоте 8 Гц, также будут иметь вид, аналогичный представленному на рис. 3.

Как видно из рис. 3, при фиксированном временном отрезке, который обеспечивает накопление нужного количества данных: 30 стимулов для частоты 8 Гц (ромбовидные маркеры), 40 стимулов для той же частоты (квадратные маркеры) и 50 стимулов для той же частоты (треугольные маркеры), различия между отношениями амплитуд исследуемого ВП и фоновой ЭЭГ для высокочастотных фотостимуляторов в 1.5 раза больше, чем для низкочастотных.

Рассмотрим факторы, влияющие на скорость функционирования данного типа НКИ, считая, что частотные компоненты сигнала выделяются с помощью преобразования Фурье, исходя из сравнения амплитуд значений спектральной плотности мощности на частотах, соответствующих частотам фотостимуляции.

Время т, затрачиваемое НКИ на передачу команд от мозга устройству-эффектору, можно определить следующим образом:

-IV ^ Ь о-1»

[/ 1, 5 > Ь,

Таблица 1. Максимально возможное число функционирующих на разных частотах фотостимуляторов для генерации в мозге устойчивых зрительных вызванных потенциалов

Частота дискретизации, Гц Число отсчетов в накопленном сигнале

100 200 250 500 1000 2000 2500 5000

100 250 500 5/2 2/1 1/0 10/5 4/2 2/1 12/6 5/2 2/1 25/12 50/25 100/50 125/62 250/125 100/50

10/5 5/2 20/10 40/20 50/25

10/5 20/10 25/12 50/25

1000 0/0 1/0 1/0 2/1 5/2 10/5 12/6 25/12

2500 0/0 0/0 0/0 1/0 2/1 4/2 5/2 10/5

5000 0/0 0/0 0/0 0/0 1/0 2/1 2/1 5/2

где s — число состояний ("букв" алфавита, используемого при формировании команд или команд на

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком