научная статья по теме ИЗМЕРЕНИЕ ПАРАМЕТРОВ ПОРЯДКА НА ОСНОВЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ Метрология

Текст научной статьи на тему «ИЗМЕРЕНИЕ ПАРАМЕТРОВ ПОРЯДКА НА ОСНОВЕ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ»

МЕДИЦИНСКИЕ И БИОЛОГИЧЕСКИЕ ИЗМЕРЕНИЯ

613.1:612.014

Измерение параметров порядка на основе

нейросетевых технологий

Ю. В. ВОХМИНА, В. М. ЕСЬКОВ, Т. В. ГАВРИЛЕНКО, О. Е. ФИЛАТОВА

Сургутский государственный университет Ханты-Мансийского автономного округа — Югры, Сургут, Россия, e-mail: filatovmik@yandex.ru, kafedra_bin@mail.ru

Продемонстрирована сходимость процедуры многократного обучения нейронной сети, когда при многократном повторении решения задачи бинарной классификации на основе неизменных пакетов обучающих выборок нейроэмулятор может демонстрировать первоначально хаотический набор значений весов признаков, который с увеличением числа итераций сводится к некоторому ранжированному ряду.

Ключевые слова: биосистема, параметры порядка, нейросеть, теория хаоса-самоорганизации.

When the problem of binary classification based on an unchanged set of learning samples is solved many times, the neural emulator can exhibit chaotic originally set values of the features weights, which with increased number of iterations converges to a certain number of the ranked features weights.

Key words: biosystem, order parameters, neural network, theory of chaos-self-organization.

Возникновение синергетики связано с возможностью и необходимостью решения проблемы идентификации параметров порядка и создания теории системного синтеза в целом. Несмотря на огромные усилия ученых за последние 40 лет существенных достижений в области формализации процедуры идентификации параметров порядка и всего системного синтеза не было. Идентификация параметров порядка остается уникальной процедурой для отдельных избранных задач. Универсальная формализация системного синтеза отсутствует в настоящее время для сложных систем, к которым, в первую очередь, относятся биосистемы [1, 2].

Вместе с тем, существует определенный класс задач и систем, где такая формализация возможна при применении нейросетевых технологий. В последние годы нейроэму-ляторы широко используют при идентификации наиболее важных диагностических признаков в медицине и биологии, однако результат, получаемый при их применении, не всегда однозначен, а значит, использовать нейроэмуляторы в практических целях не имеет смысла. Существует ли выход из этой ситуации? Ответ представлен в настоящей статье на примере бинарной классификации, т. е. при попытках выделения параметров порядка и ранжирования весов диагностических признаков — компонентов х/ вектора состояния системы х = х(?).

Непараметрическое распределение весовых признаков нейроэмулятора. Задача бинарной классификации с помощью нейро-ЭВМ очень распространена в медицине, так как позволяет обобщенно, без отдельного анализа динамики изменения каждого компонента вектора состояния орга-

низма человека (ВСОЧ) x=x(t)=(x1,

xm)T установить, чем

отличается одна группа больных (например, без лечения) от другой группы (с тем или иным видом лечения). На основе бинарной классификации можно сравнивать группы пациентов, получающих разные виды помощи (лекарства, физиотерапию и т. д.) [2, 3], устанавливать эффективность оздоровительных мероприятий и влияние экологических факторов среды, оценивать тренерскую работу в спорте.

После выявления нейроэмулятором различий надо оценить значимость (вес) того или иного /-го диагностического признака (/ = 1, 2,..., т, где т — размерность фазового пространства), т. е. компонент ВСОЧ х, что особенно важно, когда эти признаки характеризуют состояние разных функциональных систем организма человека. Указания врачу (на что ему следует обратить внимание) необходимы для формального решения задачи бинарной классификации, а определение наиболее значимых диагностических признаков —

Диаграмма распределения весовых коэффициентов каждого из параметров х: для каждого у-го обучения (метод градиентного спуска) искусственной нейронной сети (у = 1, ..., 50)

важный раздел клинической медицины — для выявления, например, региональных (эндемических) особенностей протекания заболеваний или при переходе к индивидуализированной медицине, когда параметры порядка у каждого больного могут быть разными при одинаковом заболевании [4, 5].

Изучение особенностей протекания заболевания у конкретного пациента или группы больных можно подтвердить при решении задачи бинарной классификации путем ранжирования весов признаков, т. е. каждого х. Однако при хаотическом задании начальных весов wi0 признаков x, wj0 в

момент t = 0, т. е. до начала настройки нейросети (j = 1, 2,..., p — итерации настройки нейронной сети, образующие группу итераций l = 1, 2,..., p, состоящую из p итераций каждая) и при следующих повторах решения задачи (переходу от l к l+1

и т. д.) бинарной классификации, веса признаков wjk (k —

вес в конце каждой настройки сети) получаются различными. Характерный пример представлен на рисунке, где изображена диаграмма идентификации конечных весов wjk признаков для диагностики различий в состоянии кардиореспи-раторной функциональной системы (группы из 19 испытуемых, у которых измерялось m = 13 параметров ВСОЧ, т. е. x, где i = 1, 2, ...,13 при p = 50 повторах решения задачи бинарной классификации, j = 1,..., p, где p = 50; 100; 1000. Здесь x1 — NN — значение кардиологических интервалов в выборке; x2 — SpO2 — концентрация оксигемоглобина в крови; x3 — SlM — индекс активности симпатического отдела вегетативной нервной системы; x4 — PAR — индекс активности парасимпатического отдела вегетативной нервной системы; x5 — SDNN — стандартное отклонение измеряемых кардиологических интервалов; x6 — HRV — отношение общего числа кардиологических интервалов к количеству интервалов с наиболее часто встречающейся длительностью (амплитуде моды); x7 — IB — индекс напряжения (по Р. М. Баевскому); x8 — VLF, x9 — LF, x10 — HF — спектральные мощности очень низких частот, низких и высоких частот, соответственно; x11 — LF/HF — отношение низкочастотной составляющей к высокочастотной.

На рисунке показано 50 повторений (итераций настройки нейро-ЭВМ) для каждого из 13 диагностических признаков, не совпадающих в каждой итерации. После 50 итераций получали выборки весов признаков по каждой i-й координате фазового пространства состояний, которые на каждом l-м шаге статистически обрабатывали (находили средние (wjk) по всем j для l-й группы итераций и их дисперсии). Выборки не совпадали при малых p, они получались из разных генеральных совокупностей.

Идентификация параметров порядка на основе сходимости весов признаков. Установлено, что для группы из 19 человек (измерения параметров ВСОЧ проводили до работы испытуемых в ночную смену и после) при 50 повторах нейроэмулятор каждый раз разделяет эти группы, но веса wjk признаков x-t при этом получаются разные и не удовлетворяют закону нормального распределения (получали разные функции распределения). При нарастании числа повторов p обучения нейросети при одинаковых выборках наблюдается сходимость усредненных значений весов признаков по каждому признаку xt к некоторому среднему значению (wl \

Хаотические /^ колебания четко проявляются в двух последних значащих цифрах. Иными словами, если проводятся измерения в пределах двух значащих цифр (р<100), то относительная амплитуда колебаний будет высока. При переходе к 100<р<1000 удерживается первая значащая цифра, а при переходе к 1000<р<10000 — две значащие цифры и т. д. Набор из I выборок по р весов Ш/ в каждой с увеличением р показывает сходимость получаемых для каждого диагностического признака /, при этом для каждого признака / может быть разной.

В табл. 1, 2 приведены результаты расчета двух типов выборок по р = 100; 1000 итераций в каждом 1-й группе в режиме бинарной классификации. Параметры Ш/ — это показатели сердечно-сосудистой системы людей перед их работой в ночную смену и после. Из таблиц следует, что амплитуда колебаний средних значений весов признаков при

р = 100 значительно больше, чем при р = 1000. Представлены также интервалы разброса средних значений весов признаков (ш^ по каждой из четырех выборок по р = 100 вместе с р = 400 (общая выборка). Если по первому признаку интервал изменений составляет <Аш/ > = 0,121 для р = 100, то для р = 1000 интервал разброса уменьшается почти в десять раз и <Аш, > = 0,0117. Расчет проводили до р = 106, на миллионе итераций наблюдали сходимость разброса к четырем первым значащим цифрам.

Отметим еще одну закономерность: законы распределения при р < 100 для каждого набора повторов настроек нейросетей (р1 < 100, р2 < 100, ...) не удовлетворяют нормальному закону распределения и каждый раз возникает генеральная совокупность с выборкой и различными функциями распределения. Иными словами, хаос проявляется в малых выборках, но при больших р > 103 нарастает упорядоченность в работе нейроэмулятора, хотя распределения остаются непараметрическими и могут различаться. Можно предположить, что аналогично работают и нейросети мозга, когда при малом числе ревербераций в гиппокампе человек не получает правильного решения задачи, так как не может долго удерживать в сознании решение задачи.

В процессе эволюции в биосфере тоже могут происходить подобные эффекты: при малых повторах мутаций (р < 100) не получается новый эффект (например, возникновение нового свойства организма или нового вида), но с течением времени при нарастании р биологический процесс начинает устойчиво сходиться к первым значащим цифрам. При р > 100 неизменной будет первая цифра из трех, при р > 1000 — это уже будут две значащие цифры из четырех и т. д. Подобные проблемы описаны в [4] группой ученых из Стен-форда, которые изучали организацию движений. Можно сделать вывод, что при многократных повторах (тренингах) точность выполнения движений увеличивается [5, 6].

Таким образом, при увеличении числа итераций р получаются определенные значения весов признаков, позволяющие ранжировать значения весов ш и определять параметры порядка. Точность идентификации значимости конкретного диагностического признака повышается и при переходе к р > 106 параметры порядка можно устойчиво ранжировать.

Т а б л и ц а 2

Усредненные значения отдельных координат весов признаков w/ век

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком