УДК 615.471
Множественный дискриминантный анализ для распознавания электрокардиосигналов в частотной области

Л.А. Манило
lmanilo@yandex.ru
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»

Рассмотрен метод распознавания различных форм электрокардиосигнала по спектральному описанию с применением множественного дискриминантного анализа. Обоснован выбор весовых функций, приближающих критерий Фишера к оценке точности классификации объектов. Приведены примеры решения задач распознавания опасных аритмий, в том числе обнаружения желудочковой фибрилляции сердца на ранних стадиях ее появления.
Ключевые слова: анализ электрокардиосигнала в частотной области, линейный дискриминант Фишера, распознавание аритмий.
The method for various forms of electrocardiosignal recognition according to their spectral description with application of the multiple discriminant analysis is considered. The choice of the weight functions approaching Fischer's criterion to the accuracy assessment of objects classification is substantiated. Examples of the solution of dangerous arrhythmias recognition problems, including detection of heart ventricular fibrillation at early stages of its emergence are given.
Keywords: ECG-signal analysis in frequency domain, Fisher linear discriminant, arrhythmia recognition.

Наиболее важными задачами кардиологического наблюдения по электрокардиосигналу (ЭКС) являются обнаружение опасных аритмий (желудочковая фибрилляция и трепетание желудочков сердца) в момент их внезапного появления, а также распознавание нарушений, являющихся предвестниками тяжелых состояний пациента. К ним относят следующие виды аритмий: политопные желудочковые экстрасистолы, пароксизмальную тахикардию, двунаправленную желудочковую тахикардию (пируэтную форму). В этом случае возникает задача построения решающих функций для многих классов ЭКС. При этом чаще всего используют описание сигналов в частотной области, что связано с его достаточно высокой информативностью для обнаружения опасных аритмий [1, 2].
Распознавание ЭКС в частотной области, как правило, основано на анализе спектральных признаков, получаемых при вычислении функции спектральной плотности мощности (СПМ). Это описание достаточно полно отражает частотные свойства представленных групп сигналов, но приводит к необходимости нахождения дискриминантных функций в пространстве большой размерности, что затрудняет построение алгоритмов классификации. Снизить размерность признакового пространства можно путем группировки спектральных коэффициентов, а также отображением полученного описания в пространство меньшей размерности с применением множественного дискриминантного анализа. Основой для построения решающих функций является анализ линейного дискриминанта Фишера по критерию J, максимизация которого приводит к выбору наилучшего для разделения c классов сигналов набора (c−1) векторов [3]. Однако не всегда его оптимизация обеспечивает надежное распознавание сигналов.
Критерий J, оценивающий степень разделения исходных классов сигналов, можно представить скалярной величиной, задаваемой следом матрицы в виде:

множественный дискриминантный анализ ЛЭТИ CardioQVARK (1)
где S1 – матрица рассеяния между классами; S2 – обобщенная матрица рассеяния внутри классов.
В случае c классов проекции объектов при переходе из L-мерного пространства сформированных спектральных признаков G(L) = (G1, G2,…, GL) в (c−1)-мерное пространство могут быть найдены с помощью матричного преобразования Y = WTG(L), где G(L) представлен вектором-столбцом; W – матрица размера L×(c – 1) , нахождение которой сопряжено с максимизацией J. Недостаток применения выражения (1) связан с тем, что при увеличении числа классов критерий J ориентирован, в основном, на большие межгрупповые расстояния и слабо отражает взаимное рас-положение близко расположенных в частотной области классов. А это, в свою очередь, ограничивает возможности применения метода для классификации трудно разделимых групп объектов.
Цель работы – исследование применимости множественного дискриминантного анализа для распознавания опасных нарушений сердечного ритма.

Преобразование пространства признаков с использованием весовых функций
Оптимизировать процедуру построения решающих правил можно путем сведения ее к набору задач попарной классификации с введением весовых коэффициентов ai,j, усиливающих влияние на критерий J близко расположенных клаcсов [4]. В этом случае обобщенное выражение для критерия J принимает вид

множественный дискриминантный анализ ЛЭТИ CardioQVARK (2)
где ni и nj – частоты появления объектов, образующих классы ωi и ωj.

Весовую функцию ai,j можно связать с ценой ошибки распознавания каждой пары классов ωi и ωj. В работе [4] предлагается использовать веса в виде некоторого представления функции ошибок множественный дискриминантный анализ ЛЭТИ CardioQVARK, где t – граница решающего правила, а η и σ – параметры распределений, вычисляемые для заданных групп объектов исходя из предположений о нормальном законе распределений с равными ковариационными матрицами. Этот подход представляется эффективным, поскольку критерий J может быть приближен к оценке достоверности распознавания объектов путем суммирования вероятностей правильного решения при попарной классификации. В данной работе развивается идея приближения критерия J к оценке точности классификации объектов в пространстве спектральных признаков, представленных нормированными значениями СПМ.
Нахождение элементов матрицы W сводится к задаче определения собственных значений матрицы:

множественный дискриминантный анализ ЛЭТИ CardioQVARK
и взятию столбцов матрицы W размером L×d, (d = c – 1), равным d собственным векторам, которые соответствуют d наибольшим их собственным значениям λi.
Задачу нахождения ai,j в (2) предлагается решить, используя метод, рассмотренный ниже.

Метод вычисления весовых функций
Рассмотрим в двумерном пространстве (x1, x2) два класса объектов ωi и ωj с нормальным законом распределения и единичными матрицами ковариации. Если расстояние между центрами этих классов обозначить как множественный дискриминантный анализ ЛЭТИ CardioQVARK, где mi и mj − векторы средних значений, то, проецируя эти классы на новое направление V, расстояние между ними будет изменяться в зависимости от угла α между направлением, соединяющим центры классов, и вектором V. Эту зависимость можно представить как множественный дискриминантный анализ ЛЭТИ CardioQVARK.При равных априорных вероятностях появления объектов обоих классов вероятность правильного распознавания определится в виде

множественный дискриминантный анализ ЛЭТИ CardioQVARK,
где erf(.) – функция ошибок.
Тогда для случая c классов c одинаковыми распределениями критерий J(γ), оценивающий среднюю точность распознавания, можно представить как

множественный дискриминантный анализ ЛЭТИ CardioQVARK (3)
а критерий J, оценивающий степень расхождения классов, примет вид

множественный дискриминантный анализ ЛЭТИ CardioQVARK (4)
Сравнивая (3) и (4), веса ai,j можно задать следующим образом:

множественный дискриминантный анализ ЛЭТИ CardioQVARK
для случая наилучшего взаимного расположения двух классов (ωi, ωj), что соответствует случаю совпадения направлений векторов V и mi,j = (mi mj). При этом α=0 и множественный дискриминантный анализ ЛЭТИ CardioQVARK. Распознавание объектов в частотной области, как правило, предполагает использование нормированного спектра (СПМ), поэтому множественный дискриминантный анализ ЛЭТИ CardioQVARK, и в этом случае, используя приближение функции ошибок полиномиальной функцией ai,j, можно задать в виде

множественный дискриминантный анализ ЛЭТИ CardioQVARK (5)
Этот способ нахождения весовых функций множественный дискриминантный анализ ЛЭТИ CardioQVARKможно применить и для многоклассовой задачи, исходя из предположения, что каждый из c классов имеет матрицу внутригруппового рассеяния, задаваемую обобщенной матрицей разброса множественный дискриминантный анализ ЛЭТИ CardioQVARK− выборочная ковариационная матрица i-го класса. Тогда для каждой пары классов множественный дискриминантный анализ ЛЭТИ CardioQVARKв исходном L-мерном пространстве спектральных признаков необходимо найти евклидово расстояние между центрами соответствующих классов ∆I,j и определить веса ai,j, используя выражение (5). Максимизация критерия J в (2) приводит к процедуре нахождения собственных векторов Wi,i = 1,…,c – 1 и анализу распределений групп объектов в пространстве признаков пониженной размерности.

Применение метода для распознавания опасных аритмий
Экспериментальные исследования были направлены на создание надежных методов обнаружения желудочковой фибрилляции, но при этом анализировалась возможность распознавания этой аритмии на ранних стадиях ее проявления, а именно в момент срыва пароксизмальной тахикардии на трепетание желудочков сердца, что сопровождается, как правило, появлением короткого периода пируэтной формы тахикардии. В частности, решалась задача распознавания трех классов опасных аритмий: ω1 − желудочковая фибрилляция (ЖФ) и трепетание желудочков (ТЖ), ω2 − желудочковая пароксизмальная тахикардия (ПТ) и фоновый ритм, представленный разными формами экстрасистолии, ω3 − веретенообразная форма ЖТ (пируэтная тахикардия − ПирТ).
Эффективность применения рассмотренных процедур оценивалась по результатам экспериментов, выполненных на реальных данных, включающих записи ЭКС длительностью более 20 мин. Все реализации ЭКГ получены из стандартной компьютерной базы ЭКГ-сигналов MIT-BIH.
Вид ЭКГ для рассматриваемых в данной работе нарушений ритма приведен на рис. 1.

примеры форм ЭКГ при нарушениях ритма ЛЭТИ CardioQVARK
Рис. 1. Примеры форм ЭКГ на интервале времени 5 с при нарушениях ритма: а − трепетание желудочков сердца (ТЖ); б − желудочковая фибрилляция (ЖФ); в − желудочковая пароксизмальная тахикардия (ПТ); г − веретенообразная форма ПТ (ПирТ)

множественный дискриминантный анализ ЛЭТИ CardioQVARK
Рис. 2. Представление объектов трех классов ω1 (ЖФ), ω2 (ЖТ), ω3 (ПирТ) в пространстве векторов W1, W2, полученных с применением весовых функций

В качестве исходного описания объектов, представленных фрагментами ЭКС длительностью 2 с, использован упорядоченный набор 28 спектральных признаков, полученных в частотной области, ограниченной 15 Гц, с применением перекрывающихся сегментов [5]. Некоррелированные оценки СПМ вычислены при ширине спектрального окна ∆f=0,976 Гц, но при этом шаг по частотной оси выбран вдвое меньше этой величины и составлял 0,488 Гц. В этом случае удается сохранить особенности формы спектра анализируемых сигналов при относительной устойчивости получаемых оценок СПМ. Распределение объектов трех классов (c = 3), представленных в пространстве размерности L = 28, оценивалось в двумерном пространстве d = 2, полученном в соответствии с традиционным подходом (1) и с использованием весовых функций (2). Сравнительный анализ двух распределений показал, что использование критерия (2) приводит к более равномерной группировке объектов на плоскости [5].
На рис. 2 в качестве примера приведены результаты отображения объектов на плоскость (y1, y2), т.е. в пространство собственных векторов W1, W2, которые получены при распознавании трех классов сигналов ω1, ω2, ω3. Оптимизация двумерного пространства проведена по критерию J c применением весовых функций.
В ходе экспериментов были построены разделяющие функции, определены границы областей решений и найдены ошибки классификации, являющиеся критерием надежности распознавания аритмий. Как показал результат линейного дискриминантного анализа, при использовании весовых функций средняя ошибка классификации может быть уменьшена с 8,2 до 4,6%, что является показателем эффективности применения этой процедуры оптимизации. В результате анализа объектов, попавших в зону пересечения полученных областей решений, установлено, что они являются спорными в плане классификации, поскольку могут быть отнесены к одному из альтернативных классов. Это касается в основном пересечения областей ω1 и ω2 с промежуточным классом ω3, образованным начальной формой опасной аритмии. Важным является результат безошибочного распознавания классов ω1 и ω2, что гарантирует надежное обнаружение ЖФ в стадии устойчивого ее проявления.
• Рассмотрен метод преобразования пространства спектральных признаков для задач распознавания нескольких классов биомедицинских сигналов. Показано, что введение весовых функций приближает критерий Фишера к точности классификации групп объектов.
На примере распознавания опасных нарушений ритма показаны возможности применения множественного дискриминантного анализа в практических медицинских задачах.

Исследование выполнено при поддержке РФФИ в рамках научных проектов №№ 15-07-01790-а, 16-01-00159-a и медицинского проекта CardioQVARK - кардиограмма с помощью телефона, www.cardioqvark.ru

Литература
1. Clayton R.H., Murray A., Campbell R.W.F. Frequency Analysis of Self-Terminating Ventricular Fibrillation // Computers in Cardiol-ogy. IEEE Computer Society Press. 1995. P. 705–708.
2. Clayton R.H., Campbell R.W.F., Murray A. Time–Frequency Analysis of Human Polymorphic Ventricular Tachycardia // Computers in Cardiology. IEEE Computer Society Press. 1997. V. 24. P. 97–100.
3. Дуда З., Харт П. Распознавание образов и анализ сцен / Пер. с англ. М.: Мир. 1976. 511 с.
4. Loog M., Duin R.P.W., Haeb-Umbach R. Multiclass Linear Dimension Reduction by Weighted Pairwise Fisher Criteria // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2001. V. 23. № 7. P. 762−766.
5. Манило Л.А. Упорядочение спектральных признаков по эмпирическим оценкам межгруппового расстояния в зада-чах классификации биосигналов // Известия вузов России. Радиоэлектроника. 2006. Вып. 3. С. 20–29.


Multiple discriminant analysis for recognition of electrocardiosignals in frequency domain
L.A. Manilo Dr.Sc. (Eng.),
Professor, Department of Biotechnical Systems, Saint Petersburg Electrotechnical University «LETI»
E-mail: lmanilo@yandex.ru

The problem of linear decision functions creation for several classes of biomedical signals recognition is considered. Importance of the solution for the problem of dangerous arrhythmias detection at early stages of their occurrence is shown. The conclusion about the expediency of the electrocardiogram analysis in frequency domain with application of the multiple discriminant analysis is drawn. For the purpose of approach of Fischer’s criterion to the groups of signals classification accuracy it is offered to use weight functions. For the problem of electrocardiogram recognition using the parameters of a normalized spectrum the formula of weight coefficients calculation is received. The special attention is paid to the procedure of spectral feature space transformation which allows to reduce its dimension and to simplify the algorithm of decision functions creation. Results of the experimental research on different types of dangerous arrhythmias recognition are given. In particular the problems of ventricular fibrillation detection, and also the recognition of arrhythmias which are harbingers of dangerous violations by electrocardiogram are solved. It is shown that use of the Fischer’s discriminant taking into account the weight functions allows to reduce classification errors. The conclusion about high reliability of ventricular fibrillation detection according to the electrocardiogram spectral description is drawn.

REFERENCES
1. Clayton R.H., Murray A., Campbell R.W.F. Frequency Analysis of Self-Terminating Ventricular Fibrillation // Computers in Cardiology. IEEE Computer Society Press. 1995. P. 705–708.
2. Clayton R.H., Campbell R.W.F., Murray A. Time–Frequency Analysis of Human Polymorphic Ventricular Tachycardia // Computers in Cardiology. IEEE Computer Society Press. 1997. V. 24. P. 97–100.
3. Duda Z., Hart P. Raspoznavanie obrazov i analiz scen / Per. s angl. M.: Mir. 1976. 511 s.
4. −766. Loog M., Duin R.P.W., Haeb-Umbach R. Multiclass Linear Dimension Reduction by Weighted Pairwise Fisher Criteria // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2001. V. 23. № 7. P. 762
5. Manilo L.A. Uporjadochenie spektral'nyh priznakov po jempiricheskim ocenkam mezhgruppovogo rasstojanija v zadachah klassifikacii biosignalov // Izvestija vuzov Rossii. Radiojelektronika. 2006. Vyp. 3. S. 20–29.