Тест Тьюринга для игровых ботов

Тест Тьюринга для игровых ботов (англ. computer game bot Turing test) — разновидность теста Тьюринга, в которой человеческий судья, наблюдающий и взаимодействующий с виртуальным миром, должен отличить других людей от ботов, также взаимодействующих с тем же виртуальным пространством. Данный вариант теста был впервые предложен в 2008 году ассоциированным профессором Филипом Хингстоном^[1]^[2] из Университета Эдит Коуан, и реализован в виде турнира, получившего название 2K BotPrize^[3].

Тест Тьюринга для игровых ботов был предложен с целью продвижения областей искусственного интеллекта и вычислительного интеллекта применительно к видеоиграм. Считалось, что плохо реализованный бот негативно влияет на качество игры, а бот, способный пройти этот тест и стать неотличимым от человека, может значительно повысить её качество. Кроме того, такой подход помогает опровергнуть ошибочное мнение о том, что «игровой ИИ — это уже решённая задача»^[2].

Особое внимание уделялось боту, взаимодействующему с другими игроками в многопользовательской среде. В отличие от бота, которому достаточно принимать рациональные решения, схожие с человеческими, чтобы успешно играть или побеждать в игре, данный бот должен совершать эти же действия и параллельно убеждать других внутриигровых участников в своей «человечности».

Тест был предназначен для проверки способности игрового бота взаимодействовать с игровым миром наравне с человеком; просто выиграть у людей было недостаточно. Из этого вырос конкурс, имевший ряд целей^[2]:

В испытании участвуют три стороны: человек-игрок, игровой бот и судья.
Бот должен казаться более человеком, чем сам игрок-человек. Оценки судей не бинарные — как человеку, так и боту можно выставить баллы по шкале от 1 до 5 (1 — не похож на человека; 5 — человек).
Все три участника должны быть неотличимы друг от друга с точки зрения внешнего вида на арене, за исключением случайно сгенерированного имени, чтобы минимизировать влияние случайных факторов.
Во время матча возможность общения через чат отключена.
У ботов отсутствуют «всевидящие» способности, которыми они могли бы обладать в других играх; они могут оперировать только теми данными, которые доступны обычному игроку.
Человеческие участники обладали средним уровнем мастерства — среди них не было ни абсолютных новичков, ни профессионалов.

В 2008 году состоялся первый турнир 2K BotPrize^[4], в котором в качестве платформы использовалась игра «Unreal Tournament 2004». Участники заранее создавали своих ботов с помощью интерфейса GameBots. В систему GameBots были внесены специфические изменения, чтобы соответствовать условиям конкурса — например, были удалены данные о стратегических точках карты или уроне оружия, так как эти сведения давали бы ботам нечестное преимущество.

Первый турнир BotPrize прошёл 17 декабря 2008 года как часть симпозиума IEEE по вычислительному интеллекту и играм в Австралии^[4]^[5]. Каждой команде предоставлялось время для настройки и адаптации своих ботов под модифицированный игровой клиент, однако изменять программный код на этом этапе было запрещено. Состязание проводилось в формате раундов, каждый из которых представлял собой 10-минутную битву на выживание. Судьи подключались к серверу последними и поочерёдно наблюдали за каждым участником (и человеком, и ботом) хотя бы один раз, при этом состав пар «человек–бот» варьировался. По итогам первого турнира ни один из ботов не был оценён как более человечный, чем реальный игрок^[6].

В последующих турнирах (2009–2011 годы)^[7]^[8]^[9] боты набирали всё более высокие «человечные» оценки, однако ни один из участников не стал победителем BotPrize.

В 2012 году турнир 2K BotPrize прошёл вновь, и две команды смогли создать ботов, получивших более высокие оценки «человечности», чем реальные игроки^[3].

На сегодняшний день известно о двух игровых ботах, успешно прошедших тест Тьюринга для игровых ботов:

UT^2 — команда из Техасского университета в Остине сконцентрировала внимание на боте, который подстраивал своё поведение, основываясь на ранее наблюдавшихся человеческих действиях, используя нейроэволюцию. Команда опубликовала своего бота в открытом доступе^[10], для его работы требуется лицензия на игру «Unreal Tournament 2004».
Михай Полчеану, аспирант из Румынии, разработал бота, который имитировал реакции соперника, фактически «заимствуя» элементы человеческого поведения у противника^[3]. Оба победителя добились успеха в 2012 году — к столетию рождения Алана Тьюринга.

Результаты, при которых бот кажется более человечным, чем человек, в определённой степени могут быть переоценены: в турнире 2012 года средний показатель «человечности» среди игроков составлял лишь 41,4 %^[11]. Это указывает на ограничения данного теста, ведь поведение человека оказывается более сложным и многогранным, чем предполагали разработчики^[12]. В связи с этим организаторы BotPrize планируют повысить сложность задач для участников в последующих соревнованиях^[13].

Считается также, что методы и техники, разработанные для теста Тьюринга для игровых ботов, найдут применение за пределами видеоигр — например, для виртуальных тренажёров и улучшения взаимодействия человека и робота^[14].

Тест Тьюринга для игровых ботов во многом отличается от традиционного варианта теста Тьюринга^[2]:

В классических соревнованиях (например, Премия Лёбнера) люди, противостоящие чат-ботам, стремятся убедить судей, что являются людьми; в игровом же варианте основная цель игроков — победить в матче (например, набрать большее количество очков убийств).
Судьи не обязаны выбирать только одного участника как «человека», а другого — как «нечеловека»; оценки допускают большую вариативность и сложность.
«Человечность» игрового бота не эквивалентна интеллекту: бот, прошедший данный тест, не обязательно считается интеллектуальным, в отличие от ситуации с чат-ботами.
Для теста выбран «Unreal Tournament 2004» благодаря коммерческой доступности и специальному интерфейсу для создания ботов GameBots; эта специфика резко отличает игровой тест от классических вариантов, где важна свободная беседа и огромный простор для вопросов.
Информация, доступная ботам и людям, различается: люди ориентируются на зрение и слух, боты — на оперирование данными и событиями.
Судьи не могут напрямую создавать новые игровые ситуации (например, добавить яму с лавой), как это возможно при испытаниях чат-ботов.
Тест строится как трёхстороннее взаимодействие (два участника и судья), в отличие от классического диалога между парой «человек—машина».

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Тест Тьюринга для игровых ботов

История

Техническая реализация

Турнир

Успешные боты

Итоги и влияние

Отличия от классического теста Тьюринга

Примечания