Цена стабильности
Цена стабильности (англ. price of stability, PoS) для игры — отношение значения целевой функции в одном из равновесных состояний игры к её оптимальному значению. Понятие имеет смысл для игр, в которых существует некая центральная сила или правила, способные повлиять на действия игроков и помочь им достичь равновесия Нэша. При оценке эффективности равновесия Нэша в игре наряду с ценой стабильности часто рассматривают также цену анархии (англ. Price of Anarchy, PoA).
Примеры
PoS можно выразить следующим образом:
Здесь — значение лучшего равновесия Нэша, — значение оптимального решения.
В приведённой ниже игре «Дилемма заключённого» игроки не всегда будут взаимодействовать друг с другом, даже если это в их интересах, поскольку имеется единственное равновесие (, ), мы имеем .
| (2,2) | (0,3) | |
| (3,0) | (1,1) |
Этот пример является версией игры «битва полов». В нём имеются две точки равновесия, (, ) и (, ) со значениями 3 и 15 соответственно. Оптимальным значением является 15. Тогда , в то время как .
| (2,1) | (0,0) | |
| (0,0) | (5,10) |
Предпосылки и вехи
Понятие цены стабильности было впервые исследовано А. Шульцаном и Н. Мозесом, а сам термин ввёл Э. Аншелевич. В их работах было показано, что равновесие Нэша в чистых стратегиях всегда существует, и для ориентированных графов цена стабильности не превышает n-го гармонического числа в ориентированных графах. Для неориентированных графов Аншелевич и его соавторы установили строгую верхнюю границу цены стабильности, равную 4/3, для случая с одним источником и двумя игроками. Й. Ли доказал, что для таких графов с различными стоками (пунктами назначения), с которыми должны быть связаны все игроки, цена стабильности в игре Шепли по построению сети (Shapley network design game) где — число игроков. С другой стороны, цена анархии для игры равна примерно .
Игры на построение сети
Для сетевых игр понятие цены стабильности имеет принципиальную важность. Их ключевая особенность заключается в том, что цена стабильности в них может быть значительно ниже, чем цена анархии.
Пример следующей игры:
- игроков;
- целью каждого -го игрока является соединение вершин и в ориентированном графе ;
- стратегиями для игрока являются все пути из в в графе ;
- каждая дуга имеет цену ;
- «справедливое распределение цен»: Если игроков выбирают дугу , то цена распределяется равно между ними;
- цена для игрока составляет ;
- социальная цена равна сумме цен для игроков: .
Цена анархии может составлять . Пример следующей игры на построение сети.
В этой игре есть 2 различных равновесия. Если все разделяют дугу , то социальная цена равна . Более того, это равновесие оптимально. Однако, разделение всеми дуги является также равновесием Нэша. Любой агент имеет цену в равновесной стратегии, и переключение его на другую дугу повышает его цену до .
Здесь приведена патологическая игра с таким же поведением, но уже для цены стабильности. Присутствует игроков, каждый из которых начинает с вершины и пытается соединить её с вершиной . Допустим, цены непомеченных дуг равны 0.
Оптимальной стратегией для всех игроков является общее использование дуги , что даёт социальную цену . Однако имеется единственная стратегия с равновесием Нэша для этой игры. В случае оптимальности, каждый игрок платит и игрок 1 может уменьшить свою цену путём переключения на дугу . Если это происходит, то игроку 2 становится выгодным переключиться на дугу и так далее. В конце концов, агенты достигнут равновесия Нэша, оплачивая свою собственную отдельную дугу. Такое распределение имеет социальную цену , где является -ым гармоническим числом, что равно . Хотя это значение не ограничено, цена стабильности экспоненциально лучше цены анархии в этой игре.
По определению игры на построение сети являются играми на переполнение, поэтому они допускают потенциальную функцию .
Теорема. [Теорема 19.13 из книги 1] Предположим, что существует константы и , такие, что для любой стратегии
Тогда цена стабильности меньше .
Доказательство. Глобальный минимум функции является равновесием Нэша, так что
Социальная цена была определена как сумма цен по дугам, так что
Тривиально получаем и вычисления выше дают , так что можно привлечь теорему для верхней границы цены стабильности.
См. также
- Распределение объектов (конкурентная игра) — игра без цены стабильности.
Примечания
Литература
- Vijay V. Vazirani, Noam Nisan, Tim Roughgarden, Éva Tardos. Algorithmic Game Theory. — Cambridge, UK: Cambridge University Press, 2007. — ISBN 0-521-87282-0.
- L. Agussurja, H. C. Lau. The Price of Stability in Selfish Scheduling Games // Web Intelligence and Agent Systems: An International Journal. — 2009. — Т. 9, вып. 4.
- Jian Li. An upper bound on the price of stability for undirected Shapely network design games // Information Processing Letters. — 2009. — Т. 109, вып. 15. — С. 876—878.