Современные информационные технологии/3. Программное обеспечение

 

Краснобаев Алексей Фёдорович

ФБГУН Институт биомедицинских исследований ВНЦ РАН и Правительства РСО-Алания, г. Владикавказ, Россия.

Разработка хронобиологической экспертной системы средствами технологий DATA MINING

Актуальность темы. Глобальная информатизация стимулировала разработку в различных проблемных областях человеческой деятельности автоматизированных диагностических систем. Это, как правило, интеллектуальные системы, моделирующие процесс рассуждения эксперта при принятии им решения – экспертные системы (ЭС). Основным элементом ЭС является база знаний, представленная множеством систематизированных правил, описывающих закономерности предметной области. Данные правила формулируются экспертом или формируются на основе анализа больших статистических массивов данных.

В первом случае эксперт явно или неявно формализует свои знания, опыт и интуицию в рамках выбранной модели представления знаний. Это сложный процесс, требующий большой аналитической работы.

Второе направление связано с разработкой и применением новых математических методов, способных эффективно анализировать статистические данные и извлекать из них полезные знания при минимуме работы эксперта. Использование данного подхода перспективно для формирования баз знаний экспертных систем нового поколения – мягких экспертных систем – в таких предметных областях как медицина, промышленность, нефтяная отрасль и др.

Таким образом, актуальной задачей является разработка адекватных моделей, эффективных алгоритмов и реализующих их программных комплексов формирования баз знаний экспертных систем.

Объект исследования: базы знаний интеллектуальных человеко-машинных систем поддержки принятия решений – экспертных систем.

Предмет исследования: методы, модели, алгоритмы и стратегии получения знаний для экспертных систем.

Цель работы: повышение эффективности построения баз знаний нечётких экспертных систем на основе моделей и алгоритмов интеллектуального анализа данных, формирующих правила принятия решений.

Научная задача: разработка формальной модели, алгоритма её обучения и программного комплекса формирования баз знаний экспертных систем.

Методы исследования. Для решения обозначенных вопросов использованы методы математического моделирования, нечёткой логики, искусственных нейронных сетей.

Процессы формирования знаний привлекают разработчиков и исследователей своими способностями к автоматическому получению знаний, интерпретации баз данных путём извлечения «скрытых» в них закономерностей.

Существование «скрытых» знаний обусловлено большими объёмами накопленных данных. Для их анализа используются специальные методы Data Mining: статистические пакеты, нейронные сети, эволюционные методы, алгоритмы поиска логических связей и закономерностей, а также гибридные модели, сочетающие в себе достоинства различных технологий.

Применение методов Data Mining является составной частью технологии Knowledge Discovery in Databases – обнаружение знаний в базах данных. Основные этапы данного процесса:

1)                    выборка исходного набора данных – понимание и формулировка задачи анализа, создание наборов данных, получение обучающей выборки;

2)                    подготовка (предобработка) данных заключается в получении качественных, корректных данных с точки зрения методов их анализа;

3)                    преобразование (трансформация) данных осуществляется путём их сглаживания, агрегирования, обобщения, нормализации;

4)                    data mining – использование различных инструментальных средств для нахождения закономерностей в данных;

5)                    оценка (постобработка) данных – проверка построенных моделей и интерпретация полученных результатов.

Эффективность нечётких систем обусловлена:

1)                    возможностью формализации их средствами нечётких лингвистических  категорий, используемых человеком при решении задачи;

2)                    хорошей интерпретируемостью;

3)                    отсутствием необходимости в задании обучающей выборки при условии возможности формализации решения задачи человеком-экспертом.

Основные недостатки систем, базирующихся на нечёткой логике:

1)                    исходный набор постулируемых нечётких правил должен формироваться человеком-экспертом и может оказаться неполным или противоречивым;

2)                    формирование нечёткой модели требует большой предварительной аналитической работы эксперта;

3)                    вид и параметры функций принадлежности (ФП) выбираются субъективно и могут оказаться не вполне отражающими реальную действительность;

4)                    невозможно автоматическое приобретение знаний.

Эффективность нейронных сетей обусловлена возможностью:

1)                    аппроксимировать функциональные зависимости в данных;

2)                    выражать «выход-выход» на основе обучения с минимумом предварительной аналитической работы человека-эксперта;

3)                    автоматически приобретать знания.

Недостатками нейронных сетей являются:

1)                    требование наличия объёмной и представительной обучающей выборки;

2)                    плохая интерпретируемость, невозможность объяснить результат.

Представленные недостатки не могут быть преодолены в рамках рассмотренных направлений в отдельности, что делает каждое из них пригодным для решения одних классов задач и менее пригодным для других классов.

В настоящее время значительную актуальность приобрело создание гибридных технологий, обладающих достоинствами как нейронных сетей, так и нечётких систем. Примером являются нечёткие нейронные сети (ННС).

Их использование позволяет реализовать подход к формированию ФП нечётких множеств: выбирается параметризованная функция формы, параметры которой настраиваются с помощью алгоритма обучения нейронной сети с точки зрения обучающей выборки. В результате осуществляется аппроксимация экспериментальных данных с помощью нечётких систем.

Результаты. Проведён анализ эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем. Показана актуальность разработки новых математических методов и алгоритмов автоматизированного формирования баз знаний экспертных систем. Каждый из этапов разработки является изолированным логическим процессом с измерением параметров, их анализом, принятием этапного решения. В процессе создания базы знаний диагностической системы в медицине важно определить и стандартизировать основные этапы сбора и анализа информации для обработки её с помощью нечёткой нейронной сети и построения важных для исследователя правил. Выполнен ряд исследований с использованием разработанной нейронной сети для оценки ее эффективности.