УДК 621.37
Оценка регулярности в порядке следования и длине кардиоинтервалов методами математической статистики

C.В. Моторина, А.Н. Калиниченко
motorina_sv@mail.ru, ank-bs@yandex.ru
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»

Исследован подход, основанный на статистической оценке регулярности в порядке следования и длине RR-интервалов (расстояний между соседними R-зубцами кардиограммы).
Ключевые слова: автоматический анализ ЭКГ, мерцательная аритмия, методы кластеризации.
The approach proposed in this work, based on statistical analysis of cardiac intervals order and length regularity opens a perspective for the further improvement of atrial fibrillation detection procedures.
Keywords: automatic ECG analysis, atrial fibrillation, clustering methods.

Одна из основных причин смертности в развитых странах – заболевания сердечно-сосудистой системы, проявляющиеся в первую очередь как нарушения сердечного ритма. Среди наиболее важных функций систем контроля сердечного ритма – выявление мерцательной аритмии (фибрилляции предсердий).
Мерцательная аритмия входит в число наиболее опасных нарушений сердечного ритма, поэтому своевременное и надёжное распознавание этой патологии является важнейшей задачей систем контроля сердечного ритма человека. Мерцательная аритмия проявляется на ЭКГ в виде хаотично следующих желудочковых комплексов, в промежутках между которыми наблюдаются волны спонтанной предсердной активности (нижний график на рис. 1).

примеры ЭКГ при различных видах сердечного ритма ЛЭТИ CardioQVARK
Рис. 1. Примеры ЭКГ при различных видах сердечного ритма. Сверху вниз: нормальный ритм; предсердная экстрасистолия; мерцательная аритмия

На сегодняшний день существует множество алгоритмов выявления этого нарушения, при этом чувствительность лучших из них не превышает 94,5%.
Эти алгоритмы распознавания мерцательной аритмии можно подразделить на три основные группы. В первую группу входят алгоритмы, основанные на выявлении нерегулярностей в последовательности RR-интервалов. К ним относятся алгоритм Moody и Mark [1], в котором для выявления данной нерегулярности применяется марковская модель; алгоритм Logan и Healey [2], использующий дисперсионный ана-лиз; алгоритм Linker [3], использующий комби-нации статистических окон; алгоритм Tatento и Glass [4], основанный на применении модели Колмогорова−Смирнова; алгоритм Cerutti и др. [5], в котором применяется авторегрессионная модель. Ко второй группе относятся алгоритмы, основанные на установлении факта отсутствия P-волны в кардиограмме, в частности, алгоритм Slocum и др. [6], в котором используется спектральный анализ ЭКГ. В третью группу входят алгоритмы, сочетающие в себе оба описанных выше подхода. К ним относятся алгоритм Schmidt и др. [7], построенный на сочетании модели марковской цепи и спектрального анализа; алгоритм Babaeizadeh и др. [8], сочетающий выявление нерегулярности RR-интервалов с исследованием положения и морфологии P-волны; алгоритм Couceiro и др. [9], основанный на применении нейронных сетей.
Цель работы – разработка алгоритма для оценки регулярности сердечного ритма.
В настоящей работе представлено исследование подхода, основанного на применении методов статистического анализа к нескольким различным формам графического представления последовательности RR-интервалов. Данный подход позволяет оценить не только соотношения между величинами кардиоинтервалов, но и порядок их следования.

Исследуемые способы представления данных

Скатерограмма. Скатерограмма представляет собой множество точек, абсцисса каждой из которых равна длине текущего RR-интервала, а ордината – последующего (рис. 2).

скатерограмма сердечного ритма ЛЭТИ CardioQVARK
Рис. 2. Скатерограмма: а – нормальный синусовый ритм; б – экстрасистолия; в – мерцательная аритмия

Векторы фазового портрета. Здесь под фазовым портретом подразумевается график, построенный из прямых линий, последовательно соединяющих точки скатерограммы. Каждая линия фазового портрета представляется в виде вектора (рис. 3). На рисунке: L – длина, α – направление вектора, RRi – длина предыдущего RR-интервала, RRi+1 – длина текущего RR-интервала, RRi+2– длина следующего RR-интервала).

линия фазового портрета ЛЭТИ CardioQVARK
Рис. 3. Линия фазового портрета в виде вектора

Векторы строятся в полярной системе координат, а далее координаты их концов отображаются в виде точек в декартовой системе координат (рис. 4).
Здесь RRx и RRy − соответственно значения длин RR-интервалов, откладываемые по осям абсцисс и ординат.

оценка регулярности кардиоинтервалов методами математической статистики ЛЭТИ CardioQVARK
Рис. 4. Графики концов векторов в декартовой системе координат: а – нормальный синусовый ритм; б – экстрасистолия, в – мерцательная аритмия

Двумерное пространство направлений векторов. Данные отображаются в двумерном пространстве в виде точек, абсцисса каждой из которых равна длине текущего вектора, а ордината – последующего. Точки, расстояние до которых от начала координат меньше заданного порога, исключаются из дальнейшего рассмотрения, как относящиеся к смежным парам интервалов фонового («нормального») ритма [10]. Оставшиеся данные отображаются в двумерном пространстве направлений, где абсцисса равна направлению текущего вектора (в градусах), а ордината – последующего (рис. 5).

Трехмерное пространство направлений векторов. Аналогично двумерному пространству строится трехмерное пространство направлений векторов, где абсцисса – направление предыдущего вектора, ордината – текущего, а аппликата – следующего (рис. 6).
Для всех описанных способов представления данных в случае экстрасистолии характерно формирование нескольких компактных кластеров, а в случае мерцательной аритмии – отсутствие отчётливо выраженных кластеров. Это позволяет предположить, что эффективными показателями, характеризующими тип сердечного ритма, являются внутригрупповой и межгрупповой разброс при кластеризации.

оценка регулярности кардиоинтервалов методами математической статистики ЛЭТИ CardioQVARK
Рис. 5. Двумерное пространство направлений векторов: а – экстрасистолия; б – мерцательная аритмия

оценка регулярности кардиоинтервалов методами математической статистики ЛЭТИ CardioQVARK
Рис. 6. Трехмерное пространство направлений векторов: а – экстрасистолия; б – мерцательная аритмия

Используемые методы математической статистики
В математической статистике под кластерами понимают сравнительно однородные группы объектов, определенных в пространстве признаков. В рамках проведенного исследования объектами являются точки скатерограммы, концы векторов и точки в пространстве направлений векторов.
Для кластеризации наиболее часто применяются методы одиночной и полной связи, метод
Уорда, метод k-средних и графовые методы, в частности метод выделения связных компонент [11]. Для корректного использования этих методов необходимо знать количество кластеров, что затрудняет их применение к исследуемым представлениям данных. При отсутствии априорной информации о количестве кластеров применяются статистические критерии, называемые правилами остановки. В данном исследовании использовались следующие критерии:
критерий Дэвиса−Болдина [12], который характеризует расстояние между кластерами по отношению к дисперсии объектов в составе кластера;
критерий Дуда−Харта [13], с помощью которого проверяется гипотеза об объединении данных в единый кластер.
К каждому способу представления данных поочередно применяются описанные методы кластеризации. При этом для каждого метода последовательно перебирается возможное количество кластеров (от двух до числа, равного количеству объектов), и на каждой итерации вычисляется критерий Дэвиса−Болдина. Промежуточное оптимальное количество кластеров определяется по минимуму критерия. С целью оценки однородности данных для этого промежуточного количества вычисляется критерий Дуда−Харта и сравнивается с его критическим значением при заданном уровне значимости. Гипотеза о едином кластере принимается, если рассчитанное значение больше критического. Конечная кластеризация выполняется с учетом оптимального количества кластеров. Для кластеризованных данных рассчитываются внутригрупповой и межгрупповой разбросы.

Результаты и обсуждение
Исследование способов представления данных проводилось на обучающей выборке,
которая включала 129 фрагментов последовательностей RR-интервалов, относящимся к трём
различным типам сердечного ритма: фоновому ритму, мерцательной аритмии, другим видам аритмий.
В пространстве внутригруппового и межгруппового разбросов наилучшим образом данные разделяются при применении метода выделения связных компонент к двумерному пространству направлений векторов. При этом информативным признаком оказывается только внутригрупповой разброс, по которому и выполняется распознавание типа ритма. Пороговое значение, относительно которого данные разделяются на мерцательную аритмию и другие типы ритма, найдено методом минимизации ошибки и составляет 35 кв. град.
Для оценки эффективности предложенного подхода к выявлению мерцательной аритмии использовалась база данных Atrial Fibrillation Database, содержащая записи ЭКГ с мерцательной аритмией и доступная на сайте “www.physionet.org” [14]. Результаты тестирования приведены в таблице. Также в ней приведены данные по другим описанным в литературе алгоритмам, которые проходили проверку на той же базе данных.
По данным таблицы видно, что показатели эффективности предложенного подхода соответствуют уровню других современных алгоритмов, решающих аналогичную задачу.

Таблица 1. Показатели эффективности алгоритмов
оценка регулярности кардиоинтервалов методами математической статистики ЛЭТИ CardioQVARK

Результаты представленных исследований положены в основу практического алгоритма распознавания
фибрилляции предсердий, который реализован в виде программы на языке программирования С++ и внедрен в состав программного обеспечения системы дистанционного контроля ритма сердца CardioQVARK [15]. Данная система включает в себя устройство съёма ЭКГ на основе смартфона iPhone и облачный сервис, обеспечивающий автоматический анализ кардиограмм и ведение базы данных пациентов и наблюдений. Информация с облачного сервиса доступна врачу через специализированное клиентское приложение, которое может быть установлено на смартфоне, планшетном компьютере, ноутбуке или на стационарном компьютере.
Работа выполнена при финансовой поддержке следующих проектов: проект Российского фонда фундаментальных исследований (договор №16-07-00722\16 от 04.02.2016) и проект Министерства образования и науки РФ (соглашение №14.578.21.0122 от 28.10.2015 г.).

Литература
1. Moody G.B., Mark R.G. A new method for detecting atrial fibrillation using R-R intervals // Computers in Cardiology. 1983. № 10. Р. 227−230.
2. Logan B., Healey J. Detection of Atrial Fibrillation for a Long Term Telemonitoring System // Computers in Cardi-ology. 2005. № 32. Р. 619−622.
3. Linker D.T. Long-Term Monitoring for detection of Atrial Fibrillation. Seattle, US: Patent Application Publication. 2006. 498 р.
4. Tatento K., Glass L. Automatic detection of atrial fibrilla-tion using the coefficient of variation and density histo-grams of RR and RR intervals // Medical& Biological En-gineering & Computing. 2001. № 39. Р. 664−671.
5. Cerutti S., Mainardi L.T., Porta A., Bianchi A.M. Analysis of the dynamics of RR interval series for the detection of atrial fibrillation episodes // Computersin Cardiology. 1997. № 24. Р. 77−80.
6. Slocum J., Sahakian A., Swiryn S. Diagnosis of Atrial Fi-brillation From Surface Electrocardiograms Based on Computer-detected Atrial Activity // Journal of Electrocar-diology. 1992. № 25. Р. 1−8.
7. Schmidt R., Harris M., Novac D., Perkhun M. Atrial Fibril-lation Detection. Eindhoven, Netherlands: Patent Coopera-tion Treaty. 2008. 731 р.
8. Babaeizadeh S., Gregg R., Helfenbein E., Lindauer J., Zhou S. Improvements in atrial fibrillation detection for real-timemonitoring // Journal of Electrocardiology. 2009. № 42 Р. 522−526.
9. Couceiro R., Carvalho P., Henriques J., Antunes M., Harris M., Habetha J. Detection of Atrial Fibrillation using model-based ECG analysis // 19th International Conference on Pattern Recognition. Tampa. 2008. Р. 1−5.
10. Моторина С.В., Калиниченко А.Н. Алгоритм распоз-навания мерцательной аритмии на основе графических методов // Известия СПбГЭТУ «ЛЭТИ». 2014. № 10. С. 55−60.
11. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика. 1989. 607 с.
12. Бондарев В.А., Лисицына А.В., Меньшутина Н.В. При-менение правил остановки кластерного анализа в слу-чае слабой и сильной иерархии кластеров на примере белковых структур // Успехи в химии и химической технологии. 2007. №1. С. 105−109.
13. Яцкив И., Гусарова Л. Методы определения количества кластеров при классификации без обучения // Transport and Telecommunication. 2003. №1. С. 23−28.
14. Physionet: the research resource for physiologic signals. www.physionet.org
15. Сайт проекта CardioQVARK:www.cardioqvark.ru

Evaluation of cardiac intervals order and length regularity with the use of mathematical statistics methods

S.V. Motorina
Post-graduate Student, Department of Biotechnical Systems, Saint Petersburg Electrotechnical University «LETI»
E-mail: motorina_sv@mail.ru
A.N. Kalinichenko Dr.Sc. (Eng.),
Professor, Department of Biotechnical Systems, Saint Petersburg Electrotechnical University «LETI»
E-mail: ank-bs@yandex.ru

This work is devoted to the development of new cardiac rhythm analysis methods for the automatic ECG monitoring devices and systems. The approach based on different forms of cardiac intervals sequence representation statistical analysis is presented. The following forms of cardiac intervals graphical presentation were considered: Poincare plots (a set of points having coordinates equal to two adjacent RR-interval values). Phase portrait vectors (set of lines connecting consequent points of Poincare plot) and sets of points in 2-D and 3-D domains of these vectors directions. Each of the listed above representation forms produce compact groups of points in case of normal rhythm or extrasystoles while for atrial fibrillation the uniform distribution of these points is characteristic.
The most adequate clusterization method was defined for each form of presentation. The optimal number of clusters was determined with the use of Davies-Bouldin and Duda-Hart criteria. The intergroup and intragroup distances between formed clusters were used as indexes for the differentiation between atrial fibrillation and other types of cardiac rhythm.
The best differentiation was achieved in case when the joint components method was applied to the 2-D representation of the vectors directions values. Only intergroup variance works as an informative index in this case. The threshold value corresponding to minimal error of atrial fibrillation detection was determined. The obtained values of the presented method quality estimations correspond to the level of the best published atrial fibrillation detection algorithms.

REFERENCES
1. Moody G.B., Mark R.G. A new method for detecting atrial fibrillation using R-R intervals // Computers in Cardiology. 1983. № 10. Р. 227−230.
2. Logan B., Healey J. Detection of Atrial Fibrillation for a Long Term Telemonitoring System // Computers in Cardiology. 2005. № 32. Р. 619−622.
3. Linker D.T. Long-Term Monitoring for detection of Atrial Fibrillation. Seattle, US: Patent Application Publication. 2006. 498 р.
4. Tatento K., Glass L. Automatic detection of atrial fibrillation using the coefficient of variation and density histograms of RR and RR intervals // Medical& Biological Engineering & Computing. 2001. № 39. Р. 664−671.
5. Cerutti S., Mainardi L.T., Porta A., Bianchi A.M. Analysis of the dynamics of RR interval series for the detection of atrial fibrillation episodes // Computersin Cardiology. 1997. № 24. Р. 77−80.
6. Slocum J., Sahakian A., Swiryn S. Diagnosis of Atrial Fibrillation From Surface Electrocardiograms Based on Computer-detected Atrial Activi-ty // Journal of Electrocardiology. 1992. № 25. Р. 1−8.
7. Schmidt R., Harris M., Novac D., Perkhun M. Atrial Fibrillation Detection. Eindhoven, Netherlands: Patent Cooperation Treaty. 2008. 731 р.
8. Babaeizadeh S., Gregg R., Helfenbein E., Lindauer J., Zhou S. Improvements in atrial fibrillation detection for real-timemonitoring // Journal of Electrocardiology. 2009. № 42 Р. 522−526.
9. Couceiro R., Carvalho P., Henriques J., Antunes M., Harris M., Habetha J. Detection of Atrial Fibrillation using model-based ECG analysis // 19th International Conference on Pattern Recognition. Tampa. 2008. Р. 1−5.
10. Motorina S.V., Kalinichenko A.N. Algoritm raspoz-navanija mercatel'noj aritmii na osnove graficheskih metodov // Izvestija SPbGJeTU «LJeTI». 2014. № 10. S. 55−60.
11. Ajvazjan S.A., Buhshtaber V.M., Enjukov I.S., Meshalkin L.D. Prikladnaja statistika: Klassifikacija i snizhenie razmernosti. M.: Finansy i statistika. 1989. 607 s.
12. Bondarev V.A., Lisicyna A.V., Men'shutina N.V. Primenenie pravil ostanovki klasternogo analiza v sluchae slaboj i sil'noj ierarhii klasterov na primere belkovyh struktur // Uspehi v himii i himicheskoj tehnologii. 2007. №1. S. 105109.
13. Jackiv I., Gusarova L. Metody opredelenija kolichestva klasterov pri klassifikacii bez obuchenija // Transport and Telecommunication. 2003. №1. S. 23−28.
14. www.physionet.org Physionet: the research resource for physiologic signals.
15. Sajt proekta CardioQVARK:www.cardioqvark.ru