Принятие решений в игре двух коалиций при неопределённости на основе метода штрафных функций

Математика/4.Прикладная математика

Д.ф.-м.н. Тараканов А.Ф.

Борисоглебский государственный педагогический институт, Россия

Принятие решений в игре двух коалиций при неопределённости на основе метода штрафных функций

Изучается статическая игра двух коалиций (в каждой – по два игрока). Отношения между коалициями носят антагонистический характер. В этой ситуации применяется концепция угроз и контругроз. Отношения между игроками внутри каждой коалиции строятся по Парето. Принятие решений членами коалиций происходит в условиях неопределённости (ошибки в измерениях, неточно известные параметры, погрешности в передаче информации и т.п.). В качестве “особого” вида неопределённости выделим информационную неопределённость, связанную с полным или частичным отсутствием информации о стратегии коалиции-оппонента. Поэтому каждая коалиция конструирует свою стратегию на основе принципа гарантированного результата.

Игру четырёх лиц в условиях неопределённости зададим набором , где – множество номеров игроков, – множество ситуаций игры, каждая из которых образуется соответствующими стратегиями игроков , – выпуклое компактное множество стратегий -го игрока, – выпуклое компактное множество неопределённых факторов, – неопределённый фактор, функция выигрыша -го игрока задана непрерывной на скалярной функцией , .

Пусть , – коалиции игроков, заданные соответственно указанными номерами игроков. Стратегии коалиций и имеют вид , .

Члены каждой коалиции стремятся достичь возможно больших значений своих функций выигрыша . При этом они учитывают возможность реализации любого значения неопределённого фактора .

Определение 1. Пусть – некоторая ситуация в коалиционной игре. Угрозой коалиции на ситуацию назовём такую возможность изменения стратегии на , что для всех совместна система неравенств , , , из которых по крайней мере одно строгое.

Контругрозой коалиции (в ответ на угрозу коалиции ) назовём возможность изменения членами коалиции стратегии на , что для всех , во-первых, выполняется система неравенств , , , из которых по крайней мере одно строгое, во-вторых, , .

Угроза коалиции и контругроза коалиции определяются аналогично.

Определение 2. Ситуацию , назовём коалиционным гарантирующим равновесием угроз-контругроз, если для любых выполняются следующие условия:

1а) стратегия коалиции максимальна по Парето, то есть для всех несовместна система неравенств , , из которых по крайней мере одно строгое;

1б) стратегия коалиции максимальна по Парето, то есть для всех несовместна система неравенств , , из которых по крайней мере одно строгое;

2) в ответ на угрозу любой коалиции у другой коалиции имеется контругроза.

Пусть , ,

, .

Для функций и () предполагаются выполненными следующие условия: функции () непрерывно дифференцируемы по () и непрерывны по ; функции () непрерывно дифференцируемы по и удовлетворяют условию -регулярности: такое, что , где – метрика, функция -ой коалиции удовлетворяет условию Липшица по совокупности переменных.

Решим задачу с точки зрения коалиции с номером . Тогда у коалиции-оппонента номер , . Введём штрафную функцию , . Коалиция с номером решает максиминную задачу нахождения величины

, .

Введение функционала

где – штрафные параметры, приводит к семейству максиминных задач (без ограничений)

Теорема 1. Имеет место равенство

Доказательство. Обозначим погрешность метода штрафов величиной

Пусть . Тогда

где – константы, не зависящие от , . Максимум функции достигается в точке . При получаем оценку . Отсюда для сходимости достаточно выполнения условий , . Теорема 1 доказана.