Математика/4.Прикладная математика
Д.ф.-м.н. Тараканов А.Ф.
Борисоглебский государственный
педагогический институт, Россия
Принятие решений в игре
двух коалиций при неопределённости на основе метода штрафных функций
Изучается
статическая игра двух коалиций (в каждой – по два игрока). Отношения между
коалициями носят антагонистический характер. В этой ситуации применяется
концепция угроз и контругроз. Отношения между игроками внутри каждой коалиции
строятся по Парето. Принятие решений членами коалиций происходит в условиях
неопределённости (ошибки в измерениях, неточно известные параметры, погрешности
в передаче информации и т.п.). В качестве “особого” вида неопределённости
выделим информационную неопределённость, связанную с полным или частичным
отсутствием информации о стратегии коалиции-оппонента. Поэтому каждая коалиция
конструирует свою стратегию на основе принципа гарантированного результата.
Игру четырёх лиц в условиях неопределённости зададим набором , где – множество номеров игроков, – множество ситуаций игры, каждая из которых образуется соответствующими стратегиями игроков , – выпуклое компактное множество стратегий -го игрока, – выпуклое компактное множество неопределённых факторов, – неопределённый фактор, функция выигрыша -го игрока задана непрерывной на скалярной функцией , .
Пусть , – коалиции игроков,
заданные соответственно указанными номерами игроков. Стратегии коалиций и имеют вид , .
Члены каждой коалиции стремятся достичь возможно больших значений своих функций выигрыша . При этом они учитывают возможность реализации любого значения неопределённого фактора .
Определение 1. Пусть – некоторая ситуация
в коалиционной игре. Угрозой коалиции на ситуацию назовём такую
возможность изменения стратегии на , что для всех совместна система
неравенств , , , из которых
по крайней мере одно строгое.
Контругрозой
коалиции (в ответ на угрозу
коалиции ) назовём возможность изменения членами коалиции стратегии на , что для всех , во-первых, выполняется система неравенств , , ,
из которых по крайней мере одно строгое, во-вторых, , .
Угроза коалиции и контругроза
коалиции определяются
аналогично.
Определение 2. Ситуацию , назовём коалиционным
гарантирующим равновесием угроз-контругроз, если для любых выполняются следующие
условия:
1а) стратегия коалиции максимальна по
Парето, то есть для всех несовместна система неравенств , , из которых по крайней мере одно строгое;
1б) стратегия коалиции максимальна по
Парето, то есть для всех несовместна система неравенств , , из которых по крайней мере одно строгое;
2) в ответ на угрозу любой коалиции у другой
коалиции имеется контругроза.
Пусть , ,
, .
Для
функций и () предполагаются
выполненными следующие условия: функции
() непрерывно
дифференцируемы по () и непрерывны
по ; функции () непрерывно
дифференцируемы по и удовлетворяют условию -регулярности: такое, что , где – метрика,
функция -ой коалиции удовлетворяет условию Липшица по совокупности
переменных.
Решим задачу
с точки зрения коалиции с номером . Тогда у коалиции-оппонента номер , . Введём штрафную
функцию , . Коалиция с номером решает максиминную
задачу нахождения величины
, .
Введение функционала
,
где – штрафные параметры,
приводит к семейству максиминных задач (без ограничений)
.
Теорема
1. Имеет место равенство
.
Доказательство. Обозначим погрешность метода штрафов величиной
.
Пусть
. Тогда
,
где – константы, не
зависящие от , . Максимум функции достигается в точке . При получаем оценку . Отсюда для сходимости достаточно выполнения условий , . Теорема 1 доказана.
Пусть – числа, – штрафные параметры, – мера Лебега. Введём функцию ()
.
Теорема
2. Имеет место равенство
.
Теорема
3. Пусть зафиксированы номера коалиций , , – оптимальная
стратегия -ой коалиции. Тогда
существуют функции , , и числа такие, что
, ,
, , , .