Математика/4.Прикладная математика

 

Д.ф.-м.н. Тараканов А.Ф.

 

Борисоглебский государственный педагогический институт, Россия

 

Принятие решений в игре двух коалиций при неопределённости на основе метода штрафных функций

 

Изучается статическая игра двух коалиций (в каждой – по два игрока). Отношения между коалициями носят антагонистический характер. В этой ситуации применяется концепция угроз и контругроз. Отношения между игроками внутри каждой коалиции строятся по Парето. Принятие решений членами коалиций происходит в условиях неопределённости (ошибки в измерениях, неточно известные параметры, погрешности в передаче информации и т.п.). В качестве “особого” вида неопределённости выделим информационную неопределённость, связанную с полным или частичным отсутствием информации о стратегии коалиции-оппонента. Поэтому каждая коалиция конструирует свою стратегию на основе принципа гарантированного результата.

Игру четырёх лиц в условиях неопределённости зададим набором , где  – множество номеров игроков,   – множество ситуаций  игры, каждая из которых образуется соответствующими стратегиями игроков ,  – выпуклое компактное множество стратегий -го игрока,  – выпуклое компактное множество неопределённых факторов,  – неопределённый фактор, функция выигрыша -го игрока задана непрерывной на  скалярной функцией , .

Пусть ,  – коалиции игроков, заданные соответственно указанными номерами игроков. Стратегии коалиций  и  имеют вид , .

Члены каждой коалиции стремятся достичь возможно больших значений своих функций выигрыша . При этом они учитывают возможность реализации любого значения неопределённого фактора .

Определение 1. Пусть  – некоторая ситуация в коалиционной игре. Угрозой коалиции  на ситуацию  назовём такую возможность изменения стратегии  на , что для всех  совместна система неравенств , , , из которых по крайней мере одно строгое.

Контругрозой коалиции  (в ответ на угрозу коалиции ) назовём возможность изменения членами коалиции  стратегии  на , что для всех , во-первых, выполняется система неравенств , , , из которых по крайней мере одно строгое, во-вторых, , .

Угроза коалиции  и контругроза коалиции  определяются аналогично.

Определение 2. Ситуацию , назовём коалиционным гарантирующим равновесием угроз-контругроз, если для любых  выполняются следующие условия:

1а) стратегия  коалиции  максимальна по Парето, то есть для всех  несовместна система неравенств , , из которых по крайней мере одно строгое;

1б) стратегия  коалиции  максимальна по Парето, то есть для всех  несовместна система неравенств , , из которых по крайней мере одно строгое;

2) в ответ на угрозу любой коалиции у другой коалиции имеется контругроза.

Пусть , ,

, .

Для функций  и  () предполагаются выполненными следующие условия: функции  () непрерывно дифференцируемы по  () и непрерывны по ; функции  () непрерывно дифференцируемы по  и удовлетворяют условию -регулярности:   такое, что , где  – метрика, функция  -ой коалиции удовлетворяет условию Липшица по совокупности переменных.

Решим задачу с точки зрения коалиции с номером . Тогда у коалиции-оппонента номер , . Введём штрафную функцию , . Коалиция с номером  решает максиминную задачу нахождения величины

, .

Введение функционала

,

где  – штрафные параметры, приводит к семейству максиминных задач (без ограничений)

.

Теорема 1. Имеет место равенство

.

Доказательство. Обозначим погрешность метода штрафов величиной

.

Пусть . Тогда

,

где  – константы, не зависящие от , . Максимум функции  достигается в точке . При  получаем оценку . Отсюда для сходимости достаточно выполнения условий , . Теорема 1 доказана.

Пусть  – числа,  штрафные параметры,  – мера Лебега. Введём функцию ()

.

Теорема 2. Имеет место равенство

.

Теорема 3. Пусть зафиксированы номера коалиций , ,  – оптимальная стратегия -ой коалиции. Тогда существуют функции , ,  и числа   такие, что

, ,

, , , .