Сокращение размерности признакового пространства на основе критерия разделимости классов

Немирко Анатолий Павлович 
apn-bs@yandex.ru
Россия, Санкт-Петербург, СПбГЭТУ «ЛЭТИ»

Рассматривается линейное преобразование данных в многомерном признаковом пространстве на основе критерия Фишера. Дискриминантный анализ Фишера позволяет сократить размерность исходного пространстве и применять различные методы распознавания в полученном пространстве меньшей размерности. Введение добавочных весовых векторов позволяет более точно представить взаимное положение классов в результирующем пространстве. Предложена процедура для рекуррентного вычисления весовых векторов, которые образуют новые признаки. Для линейной классификации в сокращенном пространстве признаков рассмотрена мера близости классов на основе минимального расстояния между выпуклыми оболочками классов. Предположен алгоритм вычисления такого расстояния для двумерного пространства. На примерах показано, что за счет более точного представления данных с помощью найденных признаков они позволяют обнаружить линейную разделимость классов, которую методами главных компонент и классического линейного дискриминанта Фишера обнаружить не удается [1]. Результаты использованы в задачах автоматического анализа биомедицинских данных.

Работа поддержана грантами РФФИ 15-07-01790 и 16-01-00159 и медицинским проектов CardioQVARK – кардиограмма с помощью телефона (www.cardioqvark.ru).

[1] Nemirko A.P. Transformation of feature space based on Fishers linear discriminant // Pattern Recogn. Image Anal., 2016. Vol. 26. No. 2. P. 257-261.

Reduction of feature space dimension based on separability criterion

Nemirko Anatolii
apn-bs@yandex.ru
Saint Petersburg, Russia, ETU

Linear transformation of data in multidimensional feature space based on Fishers criterion is considered. Fishers discriminant analysis enables to reduce the dimensions of initial space and to apply various methods of recognition in the derived space of smaller dimension. Introduction of addictioal weigh vectors allows to represent the mutual location of classes in the resulting space more precisely. Procedure for recurrent calculation of weight vectors which form new features is suggested. For linear classification in the reduced space of features, the measure of proximity of classes is considered. It is based on the assessment of the minimum distance between convex covers of classes. The algorithm for calculation of such distance for two-dimensional space is proposed. The considered examples show that the newly found features which represent the data more accurately make it possible to achieve linear separability of classes which remains impossible using the technique of principal components and the classic Fishers linear discriminant [1]. The obtained results are used in the tasks of the automatic analysis of biomedical data.

The research is funded by the Russian Foundation for Basic Research, grants Nos. 15-07-01790 and 16-01-00159, and by medical project CardioQVARK – Cardiogram by Phone (www.cardioqvark.ru).

[1] Nemirko, A. 2016. Transformation of feature space based on Fishers linear discriminant. Pattern Recogn. Image Anal. 26(2): 257-261.