Стратегия Зойтена
Стратегия Зойтена — переговорная стратегия, используемая в мультиагентных системах. Её ключевая идея состоит в оценке «готовности рисковать конфликтом»: агент будет более склонен идти на риск конфликта, если разница между выгодой его текущего предложения и результатом конфликта малы. При использовании стратегии Зойтена обоими агентами в протоколе монотонных уступок агенты достигают соглашения по решению внутри множества переговорных соглашений, включающего все неконфликтные результаты, которые одновременно индивидуально рациональны и парето-оптимальны. Итогом становится равновесие Нэша[1]. При одностороннем использовании стратегии Зойтена другой агент не сможет достичь лучших результатов, кроме как тоже использовать её[2]. Стратегия применима во всех ситуациях, когда в мультиагентной среде целью является максимизация социального выигрыша.
Принцип
Стратегия Зойтена используется в переговорах в рамках протокола монотонных уступок, при котором участники по очереди делают предложения, и каждое последующее предложение должно быть выгоднее предыдущего. Если агент получает предложение, которое приносит ему бóльшую выгоду, чем его собственное, переговоры считаются успешными. В противном случае, если ни один из агентов не сделает нового предложения, переговоры завершаются неудачей[3].
Стратегия предполагает, что агенты знают свои собственные функции полезности.
В ходе анализа стратегии обычно рассматриваются три вопроса[2]:
- Какое первое предложение должен сделать агент?
- Кто должен уступить в данном раунде?
- На какую величину должен уступить агент в случае необходимости уступки?
Ответ на первый вопрос прост: первым предложением должно быть наиболее предпочтительное для агента решение с точки зрения его полезности. Агент i выбирает такое предложение , которое максимизирует его функцию полезности U:
Второй вопрос раскрывается в стратегии Зойтена через оценку «готовности агента рисковать конфликтом». Интуитивно, агент будет более готов рисковать конфликтом, если разница между полезностью его текущего предложения и конфликтным решением мала. Если же эта разница велика — агент ожидает большие потери и склонен уступить[2].
Готовность агента i рисковать конфликтом в раунде t вычисляется как
Числитель определён как разность полезности текущего предложения агента i и предложения агента j, знаменатель — как полезность текущего предложения i. До достижения соглашения значение риска изменяется от 0 до 1. Чем выше риск (ближе к 1), тем меньше потери от конфликта, агент менее склонен уступать. Чем ниже риск (ближе к 0), тем выше потери, агент меньше хочет рисковать[2].
Формула:
Присвоение риска равным 1, если полезность хода агента i равна нулю, означает, что выгода агента от собственного и конфликтного решений совпадают, и он полностью готов пойти на конфликт.
В ходе переговоров склонность к риску уменьшается. Тот, чей риск меньше, должен уступить так, чтобы баланс риска сместился на второго агента.
Стратегия утверждает: в раунде t должен уступить тот агент, чья оценка риска ниже[2]. Остаётся вопрос — насколько должен уступить агент.
Если оба используют стратегию Зойтена, будет достигнуто равновесие Нэша, причём в следующей точке:[1]
Достаточная уступка
Если агент уступает недостаточно, в следующем раунде соотношение риска по-прежнему будет показывать высокую потенциальную потерю от конфликта. Поэтому необходим минимальная уступка, при которой меняется баланс риска, после чего другой агент вынужден уступить[2].
Если агент A делает достаточный уступок, а агент B действует рационально, тот также уступит либо в этом, либо в следующем ходе. Множество всех достаточных уступков агента A на шаге t обозначается как [1]. Минимальным уступком будет тот, который принадлежит этому множеству и приносит максимальную полезность.
Доказательство
Пусть δA = δ(A,t), δB = δ(B,t).
Согласно стратегии Зойтена, агент A уступает на шаге t при условии[1]:
Агент A уступит (или согласится на предложение), если его собственное предложение () не принесёт большего выигрыша, чем предложение B.
Таким образом, стратегия гарантирует достижение соглашения и максимизацию продукта Нэша.
Ход протокола
Стратегия Зойтена, реализованная в протоколе монотонных уступок, может быть описана следующим псевдокодом[4] (ход переговоров описан со стороны агента A):
Пример
На иллюстрации показан графический ход переговоров между агентами i и j[4]. По оси x — полезность U, по оси y — множество предложений . Начальные предложения (шаг 0): для i, для j.
Видно, что агент j имеет меньший риск и должен сделать уступку. Новое предложение выбирается так, чтобы в следующем раунде j не пришлось снова уступать
То есть .
Соответственно, агент j выбирает .
Проблемы
Предположим, что в последнем раунде у обоих агентов одинаковые значения риска[2]:
В этом случае по алгоритму оба должны уступить, однако возникает потенциальная проблема: если один из агентов нарушит стратегию, не уступив, он получит большую выгоду за счёт другого. Если оба будут упрямы, возникнет конфликт — типичная игра в цыплят, анализируемая теорией игр. Предложения делаются одновременно, договорённости невозможны; выгоду приносит противодействие уступке, но если оба не уступают — конфликт невыгоден всем. Это некооперативная и антикоординационная ситуация.
| A (уступить) | A (не уступать) | |
| B (уступить) | желаемый исход | выигрывает агент A |
| B (не уступать) | выигрывает агент B | конфликт |
Например, при следующих полезностях:
| A (уступить) | A (не уступать) | |
| B (уступить) | 1, 1 | -3, 3 |
| B (не уступать) | 3, -3 | -10, -10 |
На практике решением может быть добавление элементарной рандомизации — «подбрасывание монеты» или иной механизм, который случайным образом распределяет, кто уступает; только при этом стратегия становится устойчивой и удовлетворяет требованию равновесия Нэша[2].
Второй существенный недостаток — сложность применения для большого числа задач: множество решений растёт экспоненциально, что сильно ограничивает возможность применения стратегии Зойтена в реальных задачах[2].
Примечания
- ↑ 1 2 3 4 Rosenschein, Jeffrey S.; Zlotkin, Gilad. Rules of Encounter: Designing Conventions for Automated Negotiation Among Computers : [англ.]. — MIT Press, 1994. — ISBN 0-262-18159-2.
- ↑ 1 2 3 4 5 6 7 8 9 Wooldridge, Michael J. An Introduction to MultiAgent Systems : [англ.]. — John Wiley and Sons, 2009. — ISBN 9780470519462.
- ↑ Кубик, Алеш. Интеллектуальные агенты. Разработка прикладного ПО на базе мультиагентных систем : [чеш.]. — Computer Press, 2004. — ISBN 80-251-0323-4.
- ↑ 1 2 Vidal, José M. Fundamentals of Multiagent Systems with NetLogo examples (англ.). Дата обращения: 15 июня 2024. Архивировано 20 сентября 2024 года.