УДК 534.6; 615.9
Исследование нейронных сетей в задаче идентификации личности по электрокардиосигналу,
зарегистрированному устройством CardioQVARK
The study of neural networks in the problem personal identification by electrocardiosignals,
registered CardioQVARK devices 

Р.В. Исаков1 , О.В. Сунцова2
R.V. Isakov1, O.V.Suntsova2
Isakov-RV@mail.ru, cardio@qvark-med.ru 
1Владимирский государственный университет имени Александра Григорьевича
и Николая Григорьевича Столетовых
2Медицинский проект CardioQVARK

Аннотация
В данной статье приводятся результаты исследования эффективности применения технологии искусственных нейронных сетей для задачи идентификации (верификации) личности человека по одноканальному электрокардиосигналу (ЭКС), зарегистрированному устройством CardioQVARK в I отведении.   Предложены подходы к обработке ЭКС для формирования пространства входных признаков (образов). Исследованы два подхода к идентификации личности: по форме кардиоцикла и по вариабельности сердечного ритма, а также несколько структур персептронных нейронных сетей. Результаты исследования показали возможность применения персептронных нейронных сетей для идентификации личности по форме кардиоцикла. 
Abstract
In this paper results of research on the effectiveness of artificial neural networks technology application  to the problem of identification (verification) of a person's identity on the single-channel electrocardiosignals (ECS), a registered CardioQVARK device in I lead. Suggests approaches to the processing ECS for the formation of the space of input features (images). Studied two approaches to the identification of the person: the shape of the cardiac cycle and heart rate variability, as well as several structures perceptron neural networks. The results showed the possibility of using perceptron neural networks for identification in shape of the cardiac cycle.

Ключевые слова: 
Многослойный персептрон, электрокардиография, вариабельность сердечного ритма, идентификация 
Keywords: 
Multilayer perceptron, electrocardiography, heart rate variability, identification

Введение
В настоящее время, электрокардиография (ЭКГ) является одним из ведущих методов инструментального исследования сердечно-сосудистой системы, который остается наиболее распространенным и доступным для широкого круга людей. В основе этой методики лежит регистрация биопотенциалов возникающих в сердце [1]. 
Внедрение дистанционного телеметрического контроля функционального состояния человека по электрокардиосигналу в последнее время получило активное развитие. Типовым решением для индивидуального использования является использование смартфонов в паре с блоком регистрации биосигналов. Смартфон при этом осуществляет коммуникационную функцию, отправляя физиологическую информацию на сервер, и принимает результаты анализа.  Примером такого подхода является система CardioQVARK. 
Основное назначение данной системы заключается в мониторинге функционального состояния человека в течение его жизнедеятельности. Ключевым моментом в анализе динамики состояний конкретного человека является отсутствие попадания в набор его данных по ошибке записей от других людей, записанным тем же устройством. Это вызовет противоречивость и недостоверность последующего анализа. Так как данная ситуация потенциально возможна, особенно при использовании в быту, то требуется разработка специальных методов и средств для верификации записей перед включением их в базу данных исследуемого субъекта.
В таком случае, наиболее удобным биометрическим показателем является электрокардиосигнал (ЭКС). Он обладает необходимой информацией не только для оценки функционального состояния человека, но и содержит информацию об его индивидуальных особенностях.
В данной работе был исследован подход к идентификации (верификации) человека по его ЭКС, зарегистрированном устройством CardioQVARK в I отведении. Для выделения модели индивидуальных особенностей человека в работе была использована технология персептронных искусственных нейронных сетей (ИНС).
Данная технология получила в последнее время широкое распространение благодаря развитию ЭВМ и уникальным свойствам моделирования нейропластичности, обучаемости, адаптированности к реальным данным и автоматическим построением модели под конкретные условия. 
Эти факторы позволяют применять ИНС в широких областях сложных прикладных задач, таких как идентификация личности по ЭКС.

Материалы и методы решения 
Для проведения исследования был использован набор данных, состоящий из 10 записей идентифицируемого человека и 10 записей разных людей. В обучающую и тестовую базу данных попали по 5 записей из обоих наборов таким образом, чтобы данные в них не пересекались. Большее количество записей использовать не целесообразно, так как объем обучающей базы данных определяет необходимый минимум записей для создания биометрической модели человека.
Для валидации, полученных в исследовании результатов, использовался набор из 40 различных записей, среди которых присутствовали записи идентифицируемого человека. Данные из валидационного набора не пересекаются с записями из обучающей и тестовой базы данных. Результаты валидации оценивают работу системы идентификации в реальных условиях.
В работе исследовалось два разработанных подхода к построению пространства входных признаков для нейросетевой системы: по форме обобщенного кардиоцикла и по корреляционной ритмограмме ЭКС. 
В первом подходе входные образы формируются на основе гипотезы об индивидуальности формы P-QRS-T комплекса, вследствие особенностей анатомического строения сердца. Для исключения естественных вариаций параметров кардиокомплекса применяется усреднение кардиокомплексов по ансамблю, синхронизация происходит по максимуму R-зубца. Унификация динамического диапазона кардиоциклов реализуется с помощью нормализации до диапазона от 0 до 1.

Алгоритм подготовки образов:
1) Загрузка электрокардиосигнала (ЭКС);
2) Фильтрация ЭКС полосовым КИХ-фильтром с полосой частот 0.5 … 45 Гц;
3) Локализация R-зубцов;
4) Выделение участков ЭКС, относительно максимума R-зубца 0.2 с в левую и  0.3 с в правую стороны (временные окна подобраны эмпирически исходя из соотношения информативности и размерности входных образов);
5) Нормализация ЭКС в выделенных диапазонах до диапазона 0…1 по амплитуде;
6) Удаление нетипичных кардиоциклов;
7) Расчет обобщенного кардиоцикла, путем нахождения арифметического среднего  выделенных кардиоциклов;
8) Нормализация обобщенного кардиоцикла до диапазона 0…1 по амплитуде;
9) Передискретизация до частоты 500 Гц для снижения размерности образа.

Пример, полученного образа, приведен на рисунке 1.


Рисунок 1 – Образ ЭКС записи

На рисунках 2, 3 можно видеть визуальное представление набора образов, полученных представленным алгоритмом, для двух анализируемых классов: «Свой», «Чужой».


 
Рисунок 2 – Набор образов ЭКС идентифицируемого человека (класс «Свой»)


 
Рисунок 3 – Набор образов ЭКС не принадлежащих идентифицируемому человеку (класс «Чужой»)

Из рисунков видны отличия в морфологии P-QRS-T комплексов обоих классов.
Входные образы во втором подходе формировались на основе гипотезы об индивидуальности особенностей вариабельности сердечного ритма. Проблема использования данного подхода заключается в том, что вариабельность ритма сердца сильно зависит от текущего функионального состояния человека и поэтому может меняться. Однако, применение такого подхода позволит уменьшить требования к измерительной части системы. Для снижения влияния функционального состояния человека на результат идентификации, ритмограмма центрировалась относительно своего среднего значения (моды).

Алгоритм подготовки образов:
1) Загрузка электрокардиосигнала (ЭКС);
2) Фильтрация ЭКС полосовым КИХ-фильтром с полосой частот 0.5 … 45 Гц;
3) Локализация R-зубцов;
4) Вычисление RR-интервалограммы (RRi=Ri+1-Ri );
5) Центрирование ритма относительно моды RR-интервалограммы RRi=RRi-Mo;
6) Расчет скаттерограммы центрированных RR-интервалов;
7) Расчет 2D матрицы частот попадания точек скаттерограммы на квадратные сектора размером 14x14 мс в пределах от -200 до +200 мс (см. рис.4);

 
 А)                                                                                       Б)        
Рисунок 4 – Преобразование скаттерограммы (А-наложение секторов, Б-результат преобразования)

8) Линеаризация матрицы частот построчно сверху вниз, в результате чего получается вектор строк, выставленных последовательно;
9) Нормализация вектора линеаризованной матрицы до диапазона 0…1 по амплитуде (рис. 5).


Рисунок 5 – Образ скаттерограммы

На рисунках 6, 7 можно видеть визуальное представление набора образов, полученных представленным алгоритмом, для двух анализируемых классов: «Свой», «Чужой».


Рисунок 6 – Набор образов ВСР идентифицируемого человека (класс «Свой»)
 

Рисунок 7 – Набор образов ВСР не принадлежащих идентифицируемому человеку (класс «Чужой»)

Визуальный анализ также показал присутствие отличий в исследуемых классах.
В качестве основной модели искусственной нейронной сети (ИНС) был выбран многослойный персептрон, т.к. он показывал по результатам литературных и экспериментальных исследований положительные результаты. Важными параметрами, определяющими эффективность нейросетевой системы являются количество нейронов и количество слоёв. Положительные результаты могут дать также введение линейного выхода. 

Поэтому были использованы следующие структуры ИНС: 
1. Многослойный персептрон с 2 слоями сигмоидальных нейронов (SS)
2. Многослойный персептрон с 2 равными или сужающимися слоями нейронов и линейным выходом (SSP, SSPD)
3. Многослойный персептрон с 3 сужающимися слоями нейронов и линейным выходом (SSSPD)

Первой моделью ИНС, применяемой в исследовании, является классическая структура многослойного персептрона, изображенная на рисунке 8.


Рисунок 8 – Многослойный персептрон

Многослойный персептрон с 2 равными или сужающимися слоями нейронов и линейным выходом (SSP, SSPD) является развитием первой, путем добавления к нейронным слоям линейной функции с весовыми коэффициентами (рис. 9).  Данная модификация позволяет использовать второй нейронный слой более эффективно, т.к. его размер увеличивается, а выход формируется путем линейного взвешенного суммирования.


Рисунок 9 – Многослойный персептрон с линейным выходом

В отличие от первого варианта (SS), нет строгого определения соотношения числа нейронов в скрытых слоях. Для целей обобщения информации подходят сужающиеся структуры [2], также имеет смысл рассмотреть равный размер скрытых слоев.
Поэтому, в исследовании применялись две вариации данной структуры:
- SSPD - сужающаяся с соотношением нейронов в скрытых слоях 2:1;
- SSP – равная с соотношением нейронов в скрытых слоях 1:1.
Для оценки целесообразности увеличения количества слоев была использована еще одна структура ИНС (SSSPD), в которой дополнительно добавлен один слой нейронов (рис. 10). 


Рисунок 10 – Многослойный персептрон с тремя слоями нейронов и линейным выходом

Соотношение нейронов в скрытых слоях соответствует равномерно сужающейся структуре: 3:2:1. 
Основной проблемой при разработке нейросетевой системы является отсутствие аналитических методов расчета количества нейронов в скрытых слоях. Данный параметр имеет существенное значение, т.к. определяет соотношение обобщающей способности и точности результатов нейросети [2]. Обобщающая способность определяет возможности ИНС правильно определять образы, которые никогда не встречались ей во время обучения, на основе накопленного опыта (сформированной модели знаний). Точность определяет величину допустимого отклонения выходного значения.
Обычно оптимальное количество нейронов скрытых слоев определяется сложностью задачи. Для более сложной задачи зачастую требуется большее число нейронов. 
Для нахождения оптимального числа нейронов требуется провести вычислительный эксперимент путем обучения и тестирования серии ИНС с разным размером.

Методика исследования:
1) Установка значения размера первого скрытого слоя от 10 до 1000;
2) Создание ИНС с заданными параметрами и случайно распределенными синапсическими связями;
3) Обучение ИНС на обучающей выборке алгоритмом обратного распространения ошибки. Критерий остановки: градиент среднеквадратичной ошибки обучения <=0.00001;
4) Тестирование ИНС на тестовой выборке;
5) Расчет показателей эффективности (чувствительность и специфичность) по результатам тестирования;
6) Повторение пунктов 1 – 5 для всего диапазона размеров скрытого слоя ИНС;
7) Выбор размера скрытого слоя ИНС при наилучшем сочетании значений чувствительности и специфичности процесса идентификации. Наилучшим считается значение количества нейронов при наибольшем одновременном повышении обоих показателей;
8) Валидация выбранной ИНС путем подачи независимого валидационного набора данных и определения количества корректно идентифицированных записей.

Результаты исследования ИНС
Было проведено несколько исследований двух подходов к идентификации человека для всех описанных выше структур ИНС. Решение об обнаружении идентифицируемого человека принимается при повышении уровня выходного сигнала больше 0.5.
Сравнение полученных результатов для разных нейросетевых структур представлено в таблице 1.

Тип классификатора Тестирование Валидация
Чувствительность Специфичность Свой Чужой
SS по ЭКГ 100% 100% 96% 71%
SSPD по ЭКГ 100% 100% 91% 88%
SSP по ЭКГ 100% 100% 100% 82%
SSSP по ЭКГ 100% 100% 100% 75%
SS по ритму 60% 60% 74% 53%
SSPD по ритму 60% 100% 65% 71%
SSP по ритму 60% 100% 26% 88%
SSSPD по ритму 80% 60% 74% 47%

Таблица 1. Сводная таблица результатов исследования ИНС в задаче идентификации человека

Из таблицы видно, что идентификация по форме ЭКГ дает существенно лучшие результаты, чем по ритму сердца (скаттерограмме). Это объясняется большой зависимостью ритма сердца от текущего функционального состояния человека, что вносит в идентификационную информацию много помех.
Результаты тестирования всех используемых нейросетевых структур при идентификации по форме ЭКГ сигнала показали максимальную эффективность на тестовой выборке. Выбор конкретной структуры производился по результатам валидации (форвард-тестирования) на независимой выборке. 
Рекомендуемой для практического применения является структура двухслойной персептронной нейронной сети равного размера скрытых слоев с добавлением линейного выхода. Такая структура дает наилучшее обнаружение искомого субъекта, что является приоритетным в задачах верификации. 
Близким по эффективности оказалась структура двухслойной персептронной нейронной сети с сужающимися скрытыми слоями с добавлением линейного выхода. Такая ИНС позволяет за счет снижения эффективности обнаружения искомого субъекта (на 9%) понизить вероятность ошибочно идентифицировать чужую запись (на 6%).
Дальнейшее повышение числа слоев не приводит к существенному улучшению эффективности системы.

Заключение
В данной работе была разработана и исследована методология биометрической идентификации человека на основе электрокардиосигнала и нейросетевого метода анализа.
 Предложено два подхода к идентификации: по форме ЭКГ и по корреляционной ритмограмме (скаттерограмме) ритма сердца.
Для реализации процесса идентификации требуется получить первоначальный набор записей от исследуемого субъекта (в рамках исследования применялись 5 записей) и обучить на их основе ИНС методом обратного распространения ошибки до получения порогового значения (10-5) градиента среднеквадратической ошибки обучения. Данную сеть (гиперматрицу весов сети) требуется хранить с привязкой к данному субъекту.
Затем при получении новой ЭКС, её образ нужно подать на обученную сеть и при появлении на её выходе значения выше 0.5, принять решение о положительной идентификации. 
Также рекомендуется обновлять обученную сеть на новых, проверенных данных от идентифицируемого субъекта.

Литература
1. Суворов А. В. Клиническая электрокардиография. /Нижний Новгород. Изд-во НМИ, 1993. 124 с.
2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. – 2-е изд., стереотип. – М.: Горячая линия-Телеком, 2002. – 382 с.:ил.
3. www.cardioqvark.ru