Математика/4.Прикладная математика
Д.ф.-м.н. Тараканов А.Ф.
Борисоглебский государственный
педагогический институт, Россия
Принятие решений в игре
двух коалиций при неопределённости на основе метода штрафных функций
Изучается
статическая игра двух коалиций (в каждой – по два игрока). Отношения между
коалициями носят антагонистический характер. В этой ситуации применяется
концепция угроз и контругроз. Отношения между игроками внутри каждой коалиции
строятся по Парето. Принятие решений членами коалиций происходит в условиях
неопределённости (ошибки в измерениях, неточно известные параметры, погрешности
в передаче информации и т.п.). В качестве “особого” вида неопределённости
выделим информационную неопределённость, связанную с полным или частичным
отсутствием информации о стратегии коалиции-оппонента. Поэтому каждая коалиция
конструирует свою стратегию на основе принципа гарантированного результата.
Игру
четырёх лиц в условиях неопределённости зададим набором , где
– множество номеров
игроков,
– множество ситуаций
игры, каждая из
которых образуется соответствующими стратегиями игроков
,
– выпуклое компактное
множество стратегий
-го игрока,
– выпуклое компактное
множество неопределённых факторов,
– неопределённый
фактор, функция выигрыша
-го игрока задана непрерывной на
скалярной функцией
,
.
Пусть ,
– коалиции игроков,
заданные соответственно указанными номерами игроков. Стратегии коалиций
и
имеют вид
,
.
Члены каждой
коалиции стремятся достичь возможно больших значений своих функций выигрыша . При этом они учитывают возможность реализации любого
значения неопределённого фактора
.
Определение 1. Пусть – некоторая ситуация
в коалиционной игре. Угрозой коалиции
на ситуацию
назовём такую
возможность изменения стратегии
на
, что для всех
совместна система
неравенств
,
,
, из которых
по крайней мере одно строгое.
Контругрозой
коалиции (в ответ на угрозу
коалиции
) назовём возможность изменения членами коалиции
стратегии
на
, что для всех
, во-первых, выполняется система неравенств
,
,
,
из которых по крайней мере одно строгое, во-вторых,
,
.
Угроза коалиции и контругроза
коалиции
определяются
аналогично.
Определение 2. Ситуацию , назовём коалиционным
гарантирующим равновесием угроз-контругроз, если для любых
выполняются следующие
условия:
1а) стратегия коалиции
максимальна по
Парето, то есть для всех
несовместна система неравенств
,
, из которых по крайней мере одно строгое;
1б) стратегия коалиции
максимальна по
Парето, то есть для всех
несовместна система неравенств
,
, из которых по крайней мере одно строгое;
2) в ответ на угрозу любой коалиции у другой
коалиции имеется контругроза.
Пусть ,
,
,
.
Для
функций и
(
) предполагаются
выполненными следующие условия: функции
(
) непрерывно
дифференцируемы по
(
) и непрерывны
по
; функции
(
) непрерывно
дифференцируемы по
и удовлетворяют условию
-регулярности:
такое, что
, где
– метрика,
функция
-ой коалиции удовлетворяет условию Липшица по совокупности
переменных.
Решим задачу
с точки зрения коалиции с номером . Тогда у коалиции-оппонента номер
,
. Введём штрафную
функцию
,
. Коалиция с номером
решает максиминную
задачу нахождения величины
,
.
Введение функционала
,
где – штрафные параметры,
приводит к семейству максиминных задач (без ограничений)
.
Теорема
1. Имеет место равенство
.
Доказательство. Обозначим погрешность метода штрафов величиной
.
Пусть
. Тогда
,
где – константы, не
зависящие от
,
. Максимум функции
достигается в точке
. При
получаем оценку
. Отсюда для сходимости достаточно выполнения условий
,
. Теорема 1 доказана.
Пусть – числа,
– штрафные параметры,
– мера Лебега.
Введём функцию (
)
.
Теорема
2. Имеет место равенство
.
Теорема
3. Пусть зафиксированы номера коалиций ,
,
– оптимальная
стратегия
-ой коалиции. Тогда
существуют функции
,
,
и числа
такие, что
,
,
,
,
,
.