Современные информационные технологии/3. Программное обеспечение
Краснобаев Алексей Фёдорович
ФБГУН Институт
биомедицинских исследований ВНЦ РАН и Правительства РСО-Алания, г. Владикавказ,
Россия.
Разработка хронобиологической экспертной системы средствами технологий
DATA MINING
Актуальность
темы. Глобальная
информатизация стимулировала разработку в различных проблемных областях
человеческой деятельности автоматизированных диагностических систем. Это, как
правило, интеллектуальные системы, моделирующие процесс рассуждения эксперта
при принятии им решения – экспертные системы (ЭС). Основным элементом ЭС
является база знаний, представленная множеством систематизированных правил,
описывающих закономерности предметной области. Данные правила формулируются
экспертом или формируются на основе анализа больших статистических массивов данных.
В
первом случае эксперт явно или неявно формализует свои знания, опыт и интуицию
в рамках выбранной модели представления знаний. Это сложный процесс, требующий
большой аналитической работы.
Второе
направление связано с разработкой и применением новых математических методов,
способных эффективно анализировать статистические данные и извлекать из них
полезные знания при минимуме работы эксперта. Использование данного подхода
перспективно для формирования баз знаний экспертных систем нового поколения –
мягких экспертных систем – в таких предметных областях как медицина,
промышленность, нефтяная отрасль и др.
Таким
образом, актуальной задачей является разработка адекватных моделей, эффективных
алгоритмов и реализующих их программных комплексов формирования баз знаний
экспертных систем.
Объект
исследования: базы знаний
интеллектуальных человеко-машинных систем поддержки принятия решений –
экспертных систем.
Предмет
исследования: методы,
модели, алгоритмы и стратегии получения знаний для экспертных систем.
Цель
работы: повышение
эффективности построения баз знаний нечётких экспертных систем на основе
моделей и алгоритмов интеллектуального анализа данных, формирующих правила
принятия решений.
Научная
задача: разработка
формальной модели, алгоритма её обучения и программного комплекса формирования
баз знаний экспертных систем.
Методы исследования. Для решения обозначенных вопросов использованы
методы математического моделирования, нечёткой логики, искусственных нейронных
сетей.
Процессы
формирования знаний привлекают разработчиков и исследователей своими
способностями к автоматическому получению знаний, интерпретации баз данных
путём извлечения «скрытых» в них закономерностей.
Существование
«скрытых» знаний обусловлено большими объёмами накопленных данных. Для их
анализа используются специальные методы Data
Mining: статистические пакеты, нейронные сети, эволюционные методы,
алгоритмы поиска логических связей и закономерностей, а также гибридные модели,
сочетающие в себе достоинства различных технологий.
Применение
методов Data Mining является составной частью технологии Knowledge Discovery in Databases – обнаружение знаний в базах данных. Основные этапы данного процесса:
1)
выборка исходного набора данных – понимание и формулировка задачи анализа,
создание наборов данных, получение обучающей выборки;
2)
подготовка (предобработка) данных заключается в получении качественных,
корректных данных с точки зрения методов их анализа;
3)
преобразование (трансформация) данных осуществляется путём их сглаживания,
агрегирования, обобщения, нормализации;
4)
data mining – использование различных инструментальных средств для нахождения
закономерностей в данных;
5)
оценка (постобработка) данных – проверка построенных моделей и интерпретация
полученных результатов.
Эффективность
нечётких систем обусловлена:
1)
возможностью
формализации их средствами нечётких лингвистических категорий, используемых человеком при решении задачи;
2)
хорошей
интерпретируемостью;
3)
отсутствием
необходимости в задании обучающей выборки при условии возможности формализации
решения задачи человеком-экспертом.
Основные
недостатки систем, базирующихся на нечёткой логике:
1)
исходный набор
постулируемых нечётких правил должен формироваться человеком-экспертом и может
оказаться неполным или противоречивым;
2)
формирование
нечёткой модели требует большой предварительной аналитической работы эксперта;
3)
вид и параметры
функций принадлежности (ФП) выбираются субъективно и могут оказаться не вполне
отражающими реальную действительность;
4)
невозможно
автоматическое приобретение знаний.
Эффективность
нейронных сетей обусловлена
возможностью:
1)
аппроксимировать
функциональные зависимости в данных;
2)
выражать
«выход-выход» на основе обучения с минимумом предварительной аналитической работы
человека-эксперта;
3)
автоматически
приобретать знания.
Недостатками
нейронных сетей являются:
1)
требование
наличия объёмной и представительной обучающей выборки;
2)
плохая
интерпретируемость, невозможность объяснить результат.
Представленные
недостатки не могут быть преодолены в рамках рассмотренных направлений в
отдельности, что делает каждое из них пригодным для решения одних классов задач
и менее пригодным для других классов.
В
настоящее время значительную актуальность приобрело создание гибридных
технологий, обладающих достоинствами как нейронных сетей, так и нечётких
систем. Примером являются нечёткие нейронные сети (ННС).
Их
использование позволяет реализовать подход к формированию ФП нечётких множеств:
выбирается параметризованная функция формы, параметры которой настраиваются с
помощью алгоритма обучения нейронной сети с точки зрения обучающей выборки. В
результате осуществляется аппроксимация экспериментальных данных с помощью нечётких
систем.
Результаты. Проведён анализ эффективности методов
интеллектуальной обработки информации и стратегий получения знаний для
экспертных систем. Показана актуальность разработки новых математических
методов и алгоритмов автоматизированного формирования баз знаний экспертных систем.
Каждый из этапов разработки является изолированным логическим процессом с
измерением параметров, их анализом, принятием этапного решения. В процессе
создания базы знаний диагностической системы в медицине важно определить и
стандартизировать основные этапы сбора и анализа информации для обработки её с
помощью нечёткой нейронной сети и построения важных для исследователя правил.
Выполнен ряд исследований с использованием разработанной нейронной сети для
оценки ее эффективности.