И.Б. Сироджа, И.А. Верещак

Национальный аэрокосмический университет

 им. Н.Е. Жуковского «ХАИ»; АО «НИИРИ», г. Харьков

МЕТОДЫ ИНЖЕНЕРИИ КВАНТОВ ЗНАНИЙ ДЛЯ ПРИНЯТИЯ РЕШЕНИЙ В СИСТЕМАХ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

 

В работе предлагаются новые математические модели и методы инженерии квантов знаний (ИКЗ) для принятия решений в системах искусственного интеллекта (СИИ) при управлении сложными объектами. В создании СИИ актуальна проблема разработки интеллектуальных систем поддержки принятия решений (ИСППР) в условиях неопределённости. Основные трудности её решения обусловлены неполнотой, нечёткостью и лингвистическим характером данных, а также сложностью и плохой формализуемостью задач. Существующие искусственные нейронные сети и методы инженерии знаний, основанные на фреймовых, продукционных и других моделях знаний, не достаточно эффективны из-за несовершенства способов представления знаний и машинного манипулирования ими [1].

Перспективно знаниеориентированное направление в моделировании интеллектуальных умений человека, способного успешно принимать решения в различных условиях неопределённости, опираясь на собственную интуицию и знания. Авторы развивают это направление на базе применения предложенных квантовой структуризации разнотипных данных и математических средств ИКЗ с целью разработки эффективных СИИ для принятия решений в условиях d-неопределённости. В основе ИКЗ лежит созданный метод разноуровневых алгоритмических квантов знаний (dРАКЗ-метод) [2], обобщённый по параметру условий d-неопределённости (d=t,,v). Если квантовые события достоверны, то используют tk-знания (точные); при не точной информации – k-знания (приближённые); в вероятных условиях применяют vk-знания (вероятностные).

Обобщённая задача состоит в создания методологии инженерии квантов знаний. Она сводится к формулировке базовых Аd,-Вd,-Сd-задач и разработке общих методик их решения dРАКЗ-методом. Обобщение охватывает частные случаи (dÎ{t,p,v}) применения dРАКЗ-моделей представления и машинного манипулирования dk-знаниями в условиях t-,p-,v-неопределённости.

Обобщённую базовую Аd--задачу для dk-знаний формально представим множественной пятёркой:

Аd = (Sd, Kd, Dd, Пd, Qd),                                                           (1)

где Sd –  символьный язык dk-знаний, состоящий из конечного множества букв, цифр и символов операций теории алгоритмов;

Kdконечное множество терминальных dk-знаний; задаваемое априори;

Dd – множество значений некоторой функции достоверности квантовых событий (КС), описываемых разноуровневыми dk-знаниями, т.е. множество значений показателей достоверности (ПД) dk-знаний из некоторого интервала;

Пd – правила конструирования разноуровневых dk-знаний;

Qd– множество семантических кодов и специальных символов, описывающих уровень и содержание dk-знаний.

Содержательно, в обобщённой Аd--задаче требуется создать формальные средства для представления и манипулирования порциями знаний, а также для построения класса Мd (dÎ{t,p,v}) разноуровневых dk-знаний в языке Sd со значениями ПД из множества Dd на основе применения правил Пd к терминальным dk-знаниям из Kd. Требуемый уровень структурной сложности и содержание dk-знаний из класса Мd описывается соответствующими семантическими кодами из множества Qd.

Под представлением знаний понимается строгое определение класса Мd={MtMpMv} dk-знаний как dРАКЗ-моделей в терминах теории алгоритмов [2]. Класс Мd состоит из подклассов: Мt точных или t-квантовых моделей (tРАКЗ-моделей); Мp приближённых или  p-квантовых моделей  (pРАКЗ-моделей) и Мv вероятностных или v-квантовых моделей (vРАКЗ-моделей).

Под манипулированием знаниями будем понимать компьютерную реализацию формальных операций над dk-знаниями, процедур логического рассуждения и вывода dk-знаний при формировании принимаемых решений.

Обобщённая базовая Вd-задача состоит в синтезе алгоритмов машинного манипулирования dk-знаниями для индуктивного построения идентификационной БdkЗ и дедуктивного вывода из неё искомого значения целевого классификационного признака ОПР по его наблюдаемым признакам с заданной надёжностью h. Иными словами, распознать класс данного ОПР означает принять классификационное решение, опираясь на идентификационную БdkЗ.

Обобщённая базовая Сd-задача заключается в синтезе процедур машинного построения и манипулирования dk-знаниями для экстраполяции результатов частичных наблюдений за ОПР. Конкретнее, необходимо синтезировать алгоритмы машинного манипулирования dk-знаниями для индуктивного построения прогнозной БdkЗ и дедуктивного вывода из неё целевых неизмеренных признаков ОПР на основании измеренных значений других признаков с заданной надёжностью h. Здесь возможность прогноза обеспечивается тем, что прогнозная БdkЗ по определению должна содержать закономерности, отражающие связь во времени между измеренными и неизмеренными признаками ОПР.

Для решения обобщённых базовых Вd-,Сd-задач средствами ИКЗ будем использовать как операторную dРАКЗ-модель МОП, так и сетевую dРАКЗ-модель МКС вывода решений.

Операторная dРАКЗ-модель МОП предполагает вывод искомого решения в виде определённого dk-знания путём операторной редукции (преобразования) БdkЗ по входному наблюдаемому dk-знанию. При этом БdkЗ находится индуктивно в режиме обучения по выборочным dk-знаниям.

Сетевая dРАКЗ-модель МКС=d-КСВР представляет собой многополюсную логическую квантовую сеть. Входные узлы (d-кванты) d-КСВР отвечают исходным (посылочным) признакам ОПР, внутренние узлыпромежуточным рассуждениям как свойствам ОПР, а выходные узлызаключительным следствиям, т.е. целевым признакам ОПР, определяющим искомые решения. Представляя рассуждения во внутренних и выходных узлах сети dk-знаниями в виде формул алгебры высказываний или булевыми функциями, получаем функциональный механизм вывода решений из посылок, реализуемый в d-КСВР путём движения от её входов к выходам.

В практических задачах высказывания в узлах сети обретают свойства знаний о фактах, событиях, закономерностях конкретной предметной области и требуют алгоритмического доопределения. Например, нужны алгоритмы автоматического квантования информации и вычисления ПД промежуточных и окончательных решений. Для успешной алгоритмизации всех этих процессов, включая и организацию обучения на dk-знаниях, введём начальное формальное представление моделируемых суждений в виде логической сети вероятных рассуждений (ЛСВР). Формально ЛСВР отвечает ориентированный граф G, обладающий порядковой функцией. Основу алгоритмизации ЛСВР и трансформации её в d-квантовую сеть вывода решений (d-КСВР) составляют алгоритм обучения (АЛОБУЧ) и алгоритм автоматического квантования (dАЛАКВА) [2]. Первичной формой обучающих dk-знаний всегда служит таблица эмпирических данных (ТЭД) объёмом (mn). На основе использования ТЭД и/или опыта экспертов строится последовательность сценарных примеров обучающих знаний (СПОЗ). Формально СПОЗ представляют собой отдельные фрагменты сценариев принятия решений в виде высказываний:

                (2)

которые описываются пропозициональными формулами в базисе  {Ù, Ú, Ø, Þ}  с указанием показателей достоверности ПД(ei) посылок ei и импликаций ПД(ÞCj). Отметим, что искомые правила принятия решений (ППР), порождаемые операторной моделью МОП и сетевой моделью МКС вывода, должны обладать экстраполяционными свойствами. Это значит, что ППР должны оперировать только с логическими комбинациями признаков ранга не более rmax, адекватного объёму заданных ТЭД или СПОЗ, без ухудшения качества принятия решений относительно ОПР той же природы, но не используемых при обучении..

В зависимости от конкретных условий d-неопределённости (d=t,p,v) в базовых Аd-,Вd-,Сd-задачах используются точные tk-знания при t-неопределённости, приближённые pk-знания при p-неопределённости и вероятностные vk-знания при v-неопределённости [2]. Общая методология решения поставленной обобщённой задачи охватывает неформальный и формальный аспекты построения операторной МОП и сетевой МКС моделей принятия идентификационных и прогнозных решений.

Неформальный аспект состоит в формировании человеком принципов и методов инженерии квантов знаний, исходных ТЭД, СПОЗ и целей знаниеориентированного принятия решений. Это является прерогативой интеллекта экспертов, разработчиков и пользователей интеллектуальных систем в конкретной предметной области.

Формальный аспект непосредственно связан с формализацией dk-знаний, (dÎ{t,p,v}), обоснованием их корректности, а также с алгоритмизацией процессов обучения, автоматического квантования, оптимизации и управления квантовыми сетями принятия решений.

В целом общая методология ИКЗ базируется на построении обобщенного класса Мd={MtMpMv} dРАКЗ-моделей. Они удовлетворяют специфическим ограничениям для подклассов Mt точных tk-знаний, Mp приближенных pk-знаний и Mv вероятностных vk-знаний. Общность методологии обусловлена общим принципом автоматического квантования информации с доменным представлением свойств ОПР, единой структурой пространства dРАКЗ-моделей с общими методами их множественного, векторно-матричного и конечно-предикатного представления [2].

В отличие от известных методов dРАКЗ-метод обеспечивает индуктивное построение по обучающим dk-знаниям баз d-квантов знаний (БdkЗ) в виде систем устойчивых импликативных и/или функциональных связей r-го ранга, (т. е. между r признаками ОПР) как закономерностей предметной области. На практике такие связи считаются достаточно устойчивыми, если их можно обнаружить при анализе ограниченной ТЭД То(m,n) [1, 2].

Определение 1. Устойчивая связь между r признаками ОПР из общего их числа n, (r£n), выражающая недопустимость (запрет) по смыслу хотя бы одной комбинации их значений на множестве dk-знаний, (dÎ{t, p, v}), называется импликативной закономерностью или запретом r-го ранга.

Между признаками может существовать и функциональная связь как частный случай импликативной. Отличие их состоит в том, что при функциональной связи значения некоторых признаков, называемых аргументами, всегда однозначно определяют значение признака-функции, в то время, как при импликативной связи – не всегда, а лишь при некоторых комбинациях значений исходных признаков.

Определение 2. Функциональной закономерностью r-го ранга на множестве dk-знаний, (dÎ{t, p, v}), называется устойчивая связь между r, (r£n) признаками ОПР и некоторым (r+1)-м признаком, позволяющая по значениям признаков-аргументов, однозначно определить значение признака-функции. Понятие устойчивости запретных и функциональных связей базируется на статистических представлениях [1,2]. Благодаря этому, реализуется алгоритмизация квантовых операторов и обучаемых квантовых сетей вывода решений (d-КСВР) как dРАКЗ-моделей дедуктивного вывода следствий из БdkЗ по наблюдаемым d-квантам-посылкам.

Адекватность dРАКЗ-моделей оценивается доказанным соотношением между объёмом выборочных обучающих dk-знаний и наибольшим рангом сложности построенной БdkЗ, а эффективностьдопустимой величиной риска принятия ошибочного решения на контрольной выборке dk-знаний. Адекватность и эффективность dРАКЗ-моделей подтверждена результатами успешного решения многочисленных практических задач [2].

 

Литература.

 

1.              Люгер Дж. Искусственный интеллект. Стратегии и методы решения сложных проблем.– Москва, Санкт-Петербург, Киев: – 2003. – 863 с.

2.              Сироджа И.Б. Квантовые модели и методы искусственного интеллекта для принятия решений и управления. – Киев: Наукова думка. – 2002. – 490 с.