И.Б. Сироджа, И.А. Верещак
Национальный аэрокосмический университет
им. Н.Е. Жуковского «ХАИ»; АО «НИИРИ», г. Харьков
МЕТОДЫ ИНЖЕНЕРИИ КВАНТОВ ЗНАНИЙ ДЛЯ ПРИНЯТИЯ РЕШЕНИЙ В
СИСТЕМАХ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В работе предлагаются новые
математические модели и методы инженерии квантов знаний (ИКЗ) для принятия решений в системах
искусственного интеллекта (СИИ) при
управлении сложными объектами. В создании СИИ
актуальна проблема разработки интеллектуальных
систем поддержки принятия решений (ИСППР)
в условиях неопределённости. Основные трудности её решения обусловлены
неполнотой, нечёткостью и лингвистическим характером данных, а также сложностью
и плохой формализуемостью задач. Существующие искусственные нейронные сети и методы инженерии знаний, основанные на фреймовых, продукционных и других моделях знаний, не достаточно эффективны
из-за несовершенства способов представления знаний и машинного манипулирования
ими [1].
Перспективно знаниеориентированное направление в моделировании интеллектуальных умений человека,
способного успешно принимать решения в различных условиях неопределённости,
опираясь на собственную интуицию и знания. Авторы развивают это
направление на базе применения предложенных квантовой
структуризации разнотипных данных и математических средств ИКЗ с целью разработки эффективных СИИ
для принятия решений в условиях d-неопределённости. В основе ИКЗ лежит созданный метод разноуровневых алгоритмических квантов
знаний (dРАКЗ-метод) [2], обобщённый по параметру условий d-неопределённости (d=t,,v). Если квантовые события достоверны, то используют tk-знания (точные); при не точной
информации – k-знания (приближённые); в вероятных условиях применяют vk-знания (вероятностные).
Обобщённая задача состоит в создания
методологии инженерии
квантов знаний. Она сводится к
формулировке базовых Аd,-Вd,-Сd-задач и разработке общих методик их решения dРАКЗ-методом. Обобщение охватывает частные случаи (dÎ{t,p,v}) применения dРАКЗ-моделей представления и машинного манипулирования
dk-знаниями в условиях t-,p-,v-неопределённости.
Обобщённую базовую Аd--задачу для dk-знаний формально
представим множественной пятёркой:
Аd = (Sd, Kd, Dd, Пd, Qd), (1)
где Sd – символьный язык dk-знаний, состоящий из
конечного множества букв, цифр и символов операций теории алгоритмов;
Kd – конечное множество терминальных
dk-знаний; задаваемое
априори;
Dd – множество значений некоторой функции достоверности квантовых событий (КС),
описываемых разноуровневыми dk-знаниями, т.е. множество
значений показателей достоверности (ПД) dk-знаний из
некоторого интервала;
Пd – правила
конструирования разноуровневых dk-знаний;
Qd– множество семантических
кодов и специальных символов,
описывающих уровень и содержание dk-знаний.
Содержательно, в обобщённой Аd--задаче требуется создать формальные средства
для представления и манипулирования порциями знаний, а также
для построения класса Мd (dÎ{t,p,v}) разноуровневых dk-знаний в языке Sd со значениями ПД из множества Dd на основе
применения правил Пd к терминальным dk-знаниям из Kd. Требуемый уровень структурной
сложности и содержание dk-знаний из класса Мd описывается соответствующими семантическими
кодами из множества Qd.
Под представлением знаний понимается
строгое определение класса Мd={MtMpMv} dk-знаний как dРАКЗ-моделей в
терминах теории алгоритмов [2].
Класс
Мd состоит из подклассов: Мt – точных или t-квантовых моделей (tРАКЗ-моделей); Мp – приближённых или p-квантовых моделей
(pРАКЗ-моделей) и Мv – вероятностных или v-квантовых
моделей (vРАКЗ-моделей).
Под манипулированием знаниями
будем понимать компьютерную реализацию формальных операций
над dk-знаниями, процедур логического рассуждения и вывода dk-знаний при формировании
принимаемых решений.
Обобщённая базовая Вd-задача состоит в
синтезе алгоритмов машинного манипулирования dk-знаниями для индуктивного
построения идентификационной БdkЗ и дедуктивного вывода из неё искомого
значения целевого классификационного признака ОПР по его
наблюдаемым признакам с заданной надёжностью h. Иными словами,
распознать класс данного ОПР
означает принять классификационное решение, опираясь на идентификационную БdkЗ.
Обобщённая базовая Сd-задача заключается в
синтезе процедур машинного построения и манипулирования dk-знаниями для экстраполяции
результатов частичных наблюдений за ОПР. Конкретнее, необходимо синтезировать алгоритмы машинного манипулирования dk-знаниями для индуктивного построения прогнозной БdkЗ и дедуктивного
вывода из неё целевых неизмеренных признаков ОПР на основании измеренных значений других признаков
с заданной надёжностью h. Здесь
возможность прогноза обеспечивается
тем, что прогнозная БdkЗ по определению
должна содержать закономерности,
отражающие связь во времени между измеренными и неизмеренными признаками
ОПР.
Для
решения обобщённых базовых Вd-,Сd-задач средствами ИКЗ
будем использовать как операторную dРАКЗ-модель МОП, так и сетевую dРАКЗ-модель МКС
вывода решений.
Операторная dРАКЗ-модель МОП
предполагает вывод искомого решения
в виде определённого dk-знания путём операторной редукции (преобразования) БdkЗ по входному наблюдаемому dk-знанию. При этом БdkЗ находится индуктивно в режиме обучения по выборочным dk-знаниям.
Сетевая dРАКЗ-модель МКС=d-КСВР представляет
собой многополюсную логическую квантовую сеть. Входные узлы
(d-кванты) d-КСВР отвечают исходным (посылочным) признакам ОПР, внутренние узлы
– промежуточным рассуждениям
как свойствам ОПР, а выходные
узлы – заключительным
следствиям, т.е. целевым признакам ОПР, определяющим искомые решения. Представляя рассуждения во внутренних
и выходных узлах сети dk-знаниями в виде формул алгебры высказываний или булевыми
функциями, получаем функциональный механизм вывода решений
из посылок,
реализуемый в d-КСВР путём движения
от её входов к выходам.
В
практических задачах высказывания
в узлах сети обретают свойства
знаний о фактах, событиях, закономерностях конкретной предметной
области и требуют алгоритмического
доопределения. Например, нужны алгоритмы автоматического квантования
информации и вычисления ПД промежуточных и окончательных решений. Для успешной алгоритмизации всех этих
процессов, включая и организацию обучения
на dk-знаниях, введём начальное формальное представление моделируемых
суждений в виде логической сети вероятных рассуждений (ЛСВР). Формально ЛСВР
отвечает ориентированный граф G, обладающий порядковой
функцией. Основу алгоритмизации ЛСВР
и трансформации её в d-квантовую сеть вывода решений (d-КСВР) составляют алгоритм обучения (АЛОБУЧ) и алгоритм автоматического
квантования (dАЛАКВА) [2]. Первичной формой обучающих dk-знаний всегда служит таблица эмпирических
данных (ТЭД) объёмом (mn). На основе
использования ТЭД и/или опыта экспертов строится последовательность
сценарных примеров обучающих знаний (СПОЗ). Формально СПОЗ представляют собой отдельные
фрагменты сценариев принятия решений
в виде высказываний:
|
(2) |
которые
описываются пропозициональными формулами в базисе {Ù,
Ú,
Ø,
Þ}
с указанием показателей
достоверности ПД(ei) посылок ei и импликаций
ПД(ÞCj).
Отметим, что искомые правила принятия решений (ППР), порождаемые операторной моделью МОП и сетевой моделью МКС
вывода, должны обладать экстраполяционными свойствами.
Это значит, что ППР должны оперировать только с логическими комбинациями признаков ранга не более rmax, адекватного объёму
заданных ТЭД или СПОЗ,
без ухудшения качества
принятия решений относительно ОПР той же
природы, но не используемых при обучении..
В зависимости от конкретных условий d-неопределённости (d=t,p,v) в базовых Аd-,Вd-,Сd-задачах используются точные
tk-знания при t-неопределённости,
приближённые pk-знания при p-неопределённости и вероятностные vk-знания при v-неопределённости [2]. Общая методология решения поставленной обобщённой задачи охватывает неформальный и формальный
аспекты построения операторной
МОП и сетевой
МКС моделей принятия идентификационных и прогнозных
решений.
Неформальный аспект состоит в
формировании человеком принципов и методов инженерии квантов знаний,
исходных ТЭД, СПОЗ и целей знаниеориентированного
принятия решений. Это является прерогативой интеллекта экспертов, разработчиков и пользователей интеллектуальных систем в конкретной
предметной области.
Формальный аспект непосредственно
связан с формализацией
dk-знаний, (dÎ{t,p,v}), обоснованием их корректности, а
также с алгоритмизацией процессов
обучения, автоматического квантования, оптимизации
и управления квантовыми сетями принятия
решений.
В целом общая методология ИКЗ базируется на построении обобщенного класса Мd={MtMpMv} dРАКЗ-моделей. Они
удовлетворяют специфическим ограничениям
для подклассов Mt точных tk-знаний, Mp приближенных pk-знаний и Mv вероятностных vk-знаний. Общность
методологии
обусловлена общим принципом автоматического
квантования информации с доменным
представлением свойств ОПР, единой структурой пространства dРАКЗ-моделей с
общими методами их множественного, векторно-матричного и конечно-предикатного представления [2].
В отличие от
известных методов dРАКЗ-метод обеспечивает индуктивное построение по обучающим
dk-знаниям баз d-квантов знаний (БdkЗ) в виде систем устойчивых
импликативных
и/или функциональных связей
r-го ранга, (т. е. между r признаками
ОПР) как закономерностей
предметной области. На практике такие связи считаются достаточно устойчивыми, если их можно обнаружить при анализе
ограниченной ТЭД То(m,n) [1, 2].
Определение 1. Устойчивая
связь между r признаками ОПР из общего их числа n, (r£n), выражающая недопустимость (запрет)
по смыслу хотя бы одной
комбинации их значений на множестве dk-знаний, (dÎ{t, p, v}), называется импликативной
закономерностью или запретом r-го ранга.
Между
признаками может существовать и функциональная связь как частный случай импликативной. Отличие их состоит в том, что при функциональной
связи значения некоторых признаков, называемых аргументами, всегда
однозначно
определяют значение признака-функции,
в то время, как при импликативной связи – не
всегда, а лишь при некоторых комбинациях значений исходных признаков.
Определение
2. Функциональной закономерностью r-го ранга на множестве dk-знаний, (dÎ{t, p, v}), называется устойчивая связь между r, (r£n) признаками ОПР и некоторым (r+1)-м признаком, позволяющая по значениям признаков-аргументов, однозначно определить
значение признака-функции.
Понятие устойчивости запретных и функциональных связей
базируется на статистических представлениях [1,2]. Благодаря этому, реализуется алгоритмизация квантовых операторов и обучаемых квантовых
сетей вывода решений (d-КСВР) как dРАКЗ-моделей дедуктивного вывода следствий из БdkЗ по наблюдаемым d-квантам-посылкам.
Адекватность dРАКЗ-моделей оценивается
доказанным соотношением между объёмом выборочных обучающих dk-знаний и
наибольшим рангом сложности
построенной БdkЗ, а эффективность–допустимой величиной риска
принятия ошибочного решения на контрольной выборке dk-знаний. Адекватность и эффективность dРАКЗ-моделей подтверждена
результатами успешного решения многочисленных практических задач [2].
Литература.
1.
Люгер Дж.Ф. Искусственный интеллект. Стратегии и методы решения
сложных проблем.– Москва, Санкт-Петербург, Киев: – 2003. – 863 с.
2.
Сироджа И.Б. Квантовые
модели и методы искусственного интеллекта для принятия решений и управления. – Киев:
Наукова думка. – 2002. – 490 с.