Стратегия Зойтена

Стратегия Зойтена — переговорная стратегия, используемая в мультиагентных системах. Её ключевая идея состоит в оценке «готовности рисковать конфликтом»: агент будет более склонен идти на риск конфликта, если разница между выгодой его текущего предложения и результатом конфликта малы. При использовании стратегии Зойтена обоими агентами в протоколе монотонных уступок агенты достигают соглашения по решению внутри множества переговорных соглашений, включающего все неконфликтные результаты, которые одновременно индивидуально рациональны и парето-оптимальны. Итогом становится равновесие Нэша[1]. При одностороннем использовании стратегии Зойтена другой агент не сможет достичь лучших результатов, кроме как тоже использовать её[2]. Стратегия применима во всех ситуациях, когда в мультиагентной среде целью является максимизация социального выигрыша.

Принцип

Стратегия Зойтена используется в переговорах в рамках протокола монотонных уступок, при котором участники по очереди делают предложения, и каждое последующее предложение должно быть выгоднее предыдущего. Если агент получает предложение, которое приносит ему бóльшую выгоду, чем его собственное, переговоры считаются успешными. В противном случае, если ни один из агентов не сделает нового предложения, переговоры завершаются неудачей[3].

Стратегия предполагает, что агенты знают свои собственные функции полезности.

В ходе анализа стратегии обычно рассматриваются три вопроса[2]:

  1. Какое первое предложение должен сделать агент?
  2. Кто должен уступить в данном раунде?
  3. На какую величину должен уступить агент в случае необходимости уступки?

Ответ на первый вопрос прост: первым предложением должно быть наиболее предпочтительное для агента решение с точки зрения его полезности. Агент i выбирает такое предложение , которое максимизирует его функцию полезности U:

Второй вопрос раскрывается в стратегии Зойтена через оценку «готовности агента рисковать конфликтом». Интуитивно, агент будет более готов рисковать конфликтом, если разница между полезностью его текущего предложения и конфликтным решением мала. Если же эта разница велика — агент ожидает большие потери и склонен уступить[2].

Готовность агента i рисковать конфликтом в раунде t вычисляется как

Числитель определён как разность полезности текущего предложения агента i и предложения агента j, знаменатель — как полезность текущего предложения i. До достижения соглашения значение риска изменяется от 0 до 1. Чем выше риск (ближе к 1), тем меньше потери от конфликта, агент менее склонен уступать. Чем ниже риск (ближе к 0), тем выше потери, агент меньше хочет рисковать[2].

Формула:

Присвоение риска равным 1, если полезность хода агента i равна нулю, означает, что выгода агента от собственного и конфликтного решений совпадают, и он полностью готов пойти на конфликт.

В ходе переговоров склонность к риску уменьшается. Тот, чей риск меньше, должен уступить так, чтобы баланс риска сместился на второго агента.

Стратегия утверждает: в раунде t должен уступить тот агент, чья оценка риска ниже[2]. Остаётся вопрос — насколько должен уступить агент.

Если оба используют стратегию Зойтена, будет достигнуто равновесие Нэша, причём в следующей точке:[1]

Достаточная уступка

Если агент уступает недостаточно, в следующем раунде соотношение риска по-прежнему будет показывать высокую потенциальную потерю от конфликта. Поэтому необходим минимальная уступка, при которой меняется баланс риска, после чего другой агент вынужден уступить[2].

Если агент A делает достаточный уступок, а агент B действует рационально, тот также уступит либо в этом, либо в следующем ходе. Множество всех достаточных уступков агента A на шаге t обозначается как [1]. Минимальным уступком будет тот, который принадлежит этому множеству и приносит максимальную полезность.

Доказательство

Пусть δA = δ(A,t), δB = δ(B,t).

Согласно стратегии Зойтена, агент A уступает на шаге t при условии[1]:

Агент A уступит (или согласится на предложение), если его собственное предложение () не принесёт большего выигрыша, чем предложение B.

Таким образом, стратегия гарантирует достижение соглашения и максимизацию продукта Нэша.

Ход протокола

Стратегия Зойтена, реализованная в протоколе монотонных уступок, может быть описана следующим псевдокодом[4] (ход переговоров описан со стороны агента A):

Пример

undefined

На иллюстрации показан графический ход переговоров между агентами i и j[4]. По оси x — полезность U, по оси y — множество предложений . Начальные предложения (шаг 0): для i, для j.

Видно, что агент j имеет меньший риск и должен сделать уступку. Новое предложение выбирается так, чтобы в следующем раунде j не пришлось снова уступать

То есть .

Соответственно, агент j выбирает .

Проблемы

Предположим, что в последнем раунде у обоих агентов одинаковые значения риска[2]:

В этом случае по алгоритму оба должны уступить, однако возникает потенциальная проблема: если один из агентов нарушит стратегию, не уступив, он получит большую выгоду за счёт другого. Если оба будут упрямы, возникнет конфликт — типичная игра в цыплят, анализируемая теорией игр. Предложения делаются одновременно, договорённости невозможны; выгоду приносит противодействие уступке, но если оба не уступают — конфликт невыгоден всем. Это некооперативная и антикоординационная ситуация.

A (уступить) A (не уступать)
B (уступить) желаемый исход выигрывает агент A
B (не уступать) выигрывает агент B конфликт

Например, при следующих полезностях:

A (уступить) A (не уступать)
B (уступить) 1, 1 -3, 3
B (не уступать) 3, -3 -10, -10

На практике решением может быть добавление элементарной рандомизации — «подбрасывание монеты» или иной механизм, который случайным образом распределяет, кто уступает; только при этом стратегия становится устойчивой и удовлетворяет требованию равновесия Нэша[2].

Второй существенный недостаток — сложность применения для большого числа задач: множество решений растёт экспоненциально, что сильно ограничивает возможность применения стратегии Зойтена в реальных задачах[2].

Вычислительная сложность =

Примечания

  1. 1 2 3 4 Rosenschein, Jeffrey S.; Zlotkin, Gilad. Rules of Encounter: Designing Conventions for Automated Negotiation Among Computers : [англ.]. — MIT Press, 1994. — ISBN 0-262-18159-2.
  2. 1 2 3 4 5 6 7 8 9 Wooldridge, Michael J. An Introduction to MultiAgent Systems : [англ.]. — John Wiley and Sons, 2009. — ISBN 9780470519462.
  3. Кубик, Алеш. Интеллектуальные агенты. Разработка прикладного ПО на базе мультиагентных систем : [чеш.]. — Computer Press, 2004. — ISBN 80-251-0323-4.
  4. 1 2 Vidal, José M. Fundamentals of Multiagent Systems with NetLogo examples (англ.). Дата обращения: 15 июня 2024. Архивировано 20 сентября 2024 года.