О.Г. Берестнева, Л.С. Макарова, Е.Г. Семерякова

Национальный исследовательский Томский политехнический университет, Россия

ПРИМИНЕНИЕ ДИСКРИМИНАНТНОГО АНАЛИЗА В ЗАДАЧАХ МЕДИЦИНСКОЙ ДИАГНОСТИКИ

E-mail: ogb6@yandex.ru

Разработка и внедрение в медицинскую науку математических методов и компьютерных технологий повышают точность, оперативность, информативность клинико-диагностических исследований, снижают количеств о врачебных ошибок, позволяют получить реальные эффекты за счет лучшей организации лечебного процесса [1, 2]. В докладе рассмотрены вопросы приминения дискриминантного анализа в одной из задач медицинской диагностики: дифференциальной диагностики различных форм бронхиальной астмы и психогенной отдышки.

Исходная информация представляет собой данные о пациентах с четырьмя различными диагнозами: бронхиальная астма непсихогенная (BANP); бронхиальная астма сомато-психогенная (BASP); бронхиальная астма психогенно индуцированная (BAPI); психогенная одышка (PD). Данные получены Немеровым Е.В. (подробное описание в [3, 4]). Для каждого человека имеются результаты анализов: физиологические показания дыхания (минутный объем дыхания, жизненная емкость легких, форсированная емкость легких, объем форсированного выдоха за 1 с и т. д.), а также психологические показатели.

Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Дискриминантный анализ — это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий — дискриминации и методы классификации наблюдений по группам [2].

При использовании метода дискриминантного анализа главным показателем является точность классификации, и этот показатель можно легко определить, оценив долю правильно классифицированных при помощи прогностического уравнения наблюдений. Если исследователь работает с достаточно большой выборкой, применяется следующий подход: выполняется анализ по части данных (например, по половине), а затем прогностическое уравнение применяется для классификации наблюдений во второй половине данных. Точность прогноза оценивается, т.е. происходит перекрестная верификация. В дискриминантном анализе существуют методы пошагового отбора переменных, помогающие осуществить выбор предсказывающих переменных [2].  На рис.1 представлены результаты дискриминантного анализа (полученные в пакете Statgraphics) при решении задачи дифференциальной диагностики бронхиальной астмы.

Number of complete cases: 83

Number of groups: 4

Discriminant     Eigenvalue         Relative              Canonical

Function                                             Percentage        Correlation

----------------------------------------------------

1             4,44286                51,72                     0,90348

2             2,6559                  30,92                     0,85233

3             1,49168                17,36                     0,77373

 

Functions           Wilks    Chi-Square         DF          P-Value

Derived                               Lambda

----------------------------------------------------

1             0,0201691           226,4089              132         0,0000

2             0,109778              128,1393              86           0,0022

3             0,401336              52,9515                42           0,1198

----------------------------------------------------

Рис. 1. Сводка дискриминантного анализа

 

        Приведенная таблица содержит характеристики трех выделенных дискриминантных функций (Discriminant Function): собственные значения (Eigenvalue), вклад каждой функции в объяснение дисперсии симптомов (Relative Percentage) в %, канонические корреляции с классифицирующим фактором (Cannonical Correlation) и оценки уровня значимости дискриминантных функций по критериям Лямбда и хи-квадрат. Как следует из приведенных цифр, для решения диагностической задачи достаточно применить две дискриминантные фунции F1 и F2, на которые в сумме приходится 82,64% дисперсии симптомов.

        Вместе с тем, более точные результаты диагностики дает применение линейных дискриминантных функций Фишера, параметры которых также определяются в рамках процедуры дискриминантного анализа StatGraphics. Они имеют название классифицирующих функций. В нашем случае точность диагностики больных первой группы составляет 95,65%, второй группы – 94,74% и третьей группы 93,10%. Это довольно точные результаты, которые могут в какой-то мере содействовать окончательному заключению специалиста. Вместе с тем констатация отсутствия бронхиальной астмы (группа 4) осуществляется со 100% надежностью, что следует считать определенным достижением в применении методов дискриминантного анализа для решения практически важных задач медицинской диагностики.

 

Литература:

1.     Орлов В.А., Клещев А.С. Компьютерные банки знаний. Многоцелевой банк знаний // Информационные технологии. - 2006. – № 2. - С. 28.

2.     Дюк В., Эмануэль В. Информационные технологии в медико-биологических исследованиях. — СПб. : Питер, 2003. — 528 с.

3.     Немеров Е.В., Языков К.Г. К вопросу изучения личностных свойств в психофизиологической реактивности больных бронхиальной астмой на аудиовизуальную стимуляцию // Вестник ТГПУ. – 2011. – Вып. 6 (108). – С. 134–137.

4.     Берестнева О. Г. , Осадчая И. А. , Немеров Е. В. Методы исследования структуры медицинских данных [Электронный ресурс] // Вестник науки Сибири. Серия: Медицинские технологии. - 2012 - Т. 2 - №. 1 - C. 333-338. - Режим доступа: http://sjs.tpu.ru/journal/article/view/245/250.