И.А. Верещак, И.Б. Сироджа
АО «НИИРИ», г. Харьков;
Национальный
аэрокосмический университет им. Н.Е. Жуковского «ХАИ»
ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ДОСТОВЕРНОСТИ
ВЫВОДИМЫХ СЛЕДСТВИЙ В v-КВАНТОВОЙ СЕТИ
ВЫВОДА РЕШЕНИЙ (v-КСВР)
В роли оперативной
базы знаний v-КСВР представляет
собой систему логических функциональных
закономерностей в форме разноуровневых
v-квантов знаний (vk-знаний) с заданными и вычисляемыми
показателями достоверности (ПД) [1]. Закономерности описывают выходные целевые заключения v-КСВР булевыми
функциями от переменных, которыми
являются посылочные входные и внутренние промежуточные v-кванты сети. Это и определяет функциональный характер
механизма вывода решений посредством v-КСВР как базы vk-знаний (БvkЗ). Булевы функции представляются формулами , , которые описывают высказывания или суждения во внутренних и
выходных v-квантах как узлах графа , представляющего v-КСВР. Формулы зависят от переменных,
отвечающих входящим в соответствующий узел дугам . Каждому из таких v-квантовых суждений-узлов как
вероятным событиям приписывается
логическая переменная , а исходящей из дуге
– выражение . Здесь выполняет
роль внутренней переменной согласно общей методике алгоритмического решения
базовых - и -задач [1].
Очевидно, что вероятность принимать булевой функцией значение
истинности «1» на произвольном наборе значений её статистически независимых аргументов характеризует вероятность свершения соответствующего события, т.е. принятия
решения, например, об отнесении наблюдаемого объекта принятия
решений (ОПР) к определённой категории. К сожалению, для произвольного узла v-КСВР условие статистической независимости переменных
(событий) на практике не выполняется.
Ставится
задача определения в этих условиях вероятности выводимого
следствия-решения как сложного
суждения, логически связанного с посылочными
и промежуточными суждениями. В связи
с этим и возникает необходимость представления функции эквивалентной формулой в ортогональной дизъюнктивной
нормальной форме (ОДНФ), чтобы уйти от байесовских вычислительных трудностей
с зависимыми v-квантовыми событиями
и обеспечить простое строгое вычисление вероятностей независимых событий. Указанные вероятности мы называем показателями достоверности (ПД) выводимых следствий в силу
использования при вычислениях и так называемых субъективных вероятностей.
Сущность
алгоритмического механизма вывода конкретного
вероятного решения , j=1,2,… посредством
v-КСВР, заключается в активизации
сети относительно целевого v-кванта с именем и в построении
для него формулы ОДНФ путём суперпозиции
от выходных переменных ко входам сети для вычисления ПД по некоторому
алгоритму . При этом должно быть выполнено так называемое -условие,
состоящие в следующем. Внутренние
переменные при суперпозиции логической формулы заменяются выражениями , представленными в виде ОДНФ. Если v-квантовое событие в узле достоверно выполняется, то есть , то логическая формула отождествляется
с соответствующей внутренней
переменной . Если же v-квантовое событие проявляется при , согласно формуле с некоторой вероятностью, то с внутренней переменной отождествляется
выражение также в
виде ОДНФ при суперпозиции от выходов ко входам v-КСВР.
Итак, логика вывода следствий посредством v-КСВР представима в ОДНФ, что позволяет эквивалентно
выразить ПД следствия как вероятность р зависимых v-квантовых событий через р независимых событий,
отвечающих переменным ОДНФ, т.е. именам v-квантов. Действительно, пусть событиям , и ,{0,1} т.е. булевы переменные. Рассмотрим
более сложное событие z1, например, относительно ОПР :
z1:= «ЕСЛИ ОПР обладает признаком ИЛИ , ИЛИ … ИЛИ признаком , ТО принадлежит классу A».
Тогда
в соответствии с доказанной в [1] теоремой при заданных вероятностях появления истинных значений и ПД сложного
события z1 можно определить по формуле:
ПД (z1)
(1)
Теорема. Пусть логика целевого заключения по
имени С выходного v-кванта
в v-КСВР описывается булевой функцией F в ДНФ:
(2)
где –входные
переменные v-КСВР;
–внутренние переменные v-КСВР с известными ПД и . Если функцию F (2) представить в эквивалентной ОДНФ F0:
, (3)
где (4)
то показатель достоверности ПД(С) целевого заключения-решения С в определяется по
формуле:
(5)
полученной
из формулы (3) путём подстановки вместо булевых переменных и , и значений
соответствующих вероятностей и , и с заменой операций логического сложения и умножения соответствующими арифметическими операциями при учёте условия:
Методику точного вычисления ПД выводимых следствий, которая базируется на использовании приведенной теоремы, проиллюстрируем на примере. В нашем примере результатом вывода с помощью v-КСВР являются vk-знания в виде матричного v-кванта 2-го уровня ():
, (6)
v-кванты-строки 1-го уровня которого определены в выражении (7).
, (7)
Эти vk-знания реализуют процесс вывода принимаемых решений С5 (ОПРклассу 1) и С6 (ОПРклассу 2) с вычислением вероятностных оценок и , т.е. ПД принимаемых целевых заключений в v-квантах и . Используем предложенную методику, исходные вероятностные данные, обученную v-КСВР, алгоритмы АЛ с МАВВО и АЛУПР, изложенные в [1].
Пусть v-квант наблюдений за ОПР , характеризуется значениями
вероятностных оценок , где указана логика соответствующих событий
с оценками ПД субъективными вероятностями:
, , ,
, , (8)
,,
, .
Здесь С5 и С6 отвечают именам целевых решений, е1–е6 – логическим аргументам, х1–х6, а введенные булевы переменные – событиям-следствиям.
В машинном представлении, например, вывод заключения («ОПР отнести к классу 1») сводится к активизации этого v-кванта по пути от выхода ко входу v-КСВР и вычислению ПД как вероятности данного суждения путём суперпозиции функций v-квантовой логики, сопоставленных внутренним переменным v-КСВР. Пусть , представлены булевыми функциями с учётом переменных :
, , ,
, , (9)
.
При
вычислении вероятностей и алгоритм МАВВО будет оперировать с
соответствующими ортогональными ДНФ:
(10)
. (11)
На выходе алгоритма АЛ согласно исходным данным (8) по формулам (10) и (11) получаем вероятностные оценки и как ПД целевых v-квантов и :
с уровнем риска 19%;
, (риск 38%).
Символьно-текстовое представление принимаемого идентификационного решения «ОПРклассу 1», т.к. в предположении, что допустимый уровень риска составляет 0,80. Заметим, что лицо, принимающее решение, имеет возможность по своему усмотрению варьировать исходными данными и величиной допустимого риска при одной и той же v-КСВР в интерактивном режиме.
В случае неудовлетворительной базы знаний БvkЗ=v-КСВР (об этом свидетельствовали бы высокие уровни риска при выводе решений) необходимо пересмотреть сценарные примеры обучающих знаний (СПОЗ) и повторить цикл «дообучения» или «переобучения», используя алгоритм АЛУПР [1].
Литература.
1. Сироджа И.Б. Квантовые модели и методы
искусственного интеллекта для принятия решений и управления. – К.: Наукова
думка, 2002. – 420с.