Тест Тьюринга для игровых ботов
Тест Тьюринга для игровых ботов (англ. computer game bot Turing test) — разновидность теста Тьюринга, в которой человеческий судья, наблюдающий и взаимодействующий с виртуальным миром, должен отличить других людей от ботов, также взаимодействующих с тем же виртуальным пространством. Данный вариант теста был впервые предложен в 2008 году ассоциированным профессором Филипом Хингстоном[1][2] из Университета Эдит Коуан, и реализован в виде турнира, получившего название 2K BotPrize[3].
История
Тест Тьюринга для игровых ботов был предложен с целью продвижения областей искусственного интеллекта и вычислительного интеллекта применительно к видеоиграм. Считалось, что плохо реализованный бот негативно влияет на качество игры, а бот, способный пройти этот тест и стать неотличимым от человека, может значительно повысить её качество. Кроме того, такой подход помогает опровергнуть ошибочное мнение о том, что «игровой ИИ — это уже решённая задача»[2].
Особое внимание уделялось боту, взаимодействующему с другими игроками в многопользовательской среде. В отличие от бота, которому достаточно принимать рациональные решения, схожие с человеческими, чтобы успешно играть или побеждать в игре, данный бот должен совершать эти же действия и параллельно убеждать других внутриигровых участников в своей «человечности».
Техническая реализация
Тест был предназначен для проверки способности игрового бота взаимодействовать с игровым миром наравне с человеком; просто выиграть у людей было недостаточно. Из этого вырос конкурс, имевший ряд целей[2]:
- В испытании участвуют три стороны: человек-игрок, игровой бот и судья.
- Бот должен казаться более человеком, чем сам игрок-человек. Оценки судей не бинарные — как человеку, так и боту можно выставить баллы по шкале от 1 до 5 (1 — не похож на человека; 5 — человек).
- Все три участника должны быть неотличимы друг от друга с точки зрения внешнего вида на арене, за исключением случайно сгенерированного имени, чтобы минимизировать влияние случайных факторов.
- Во время матча возможность общения через чат отключена.
- У ботов отсутствуют «всевидящие» способности, которыми они могли бы обладать в других играх; они могут оперировать только теми данными, которые доступны обычному игроку.
- Человеческие участники обладали средним уровнем мастерства — среди них не было ни абсолютных новичков, ни профессионалов.
В 2008 году состоялся первый турнир 2K BotPrize[4], в котором в качестве платформы использовалась игра «Unreal Tournament 2004». Участники заранее создавали своих ботов с помощью интерфейса GameBots. В систему GameBots были внесены специфические изменения, чтобы соответствовать условиям конкурса — например, были удалены данные о стратегических точках карты или уроне оружия, так как эти сведения давали бы ботам нечестное преимущество.
Турнир
Первый турнир BotPrize прошёл 17 декабря 2008 года как часть симпозиума IEEE по вычислительному интеллекту и играм в Австралии[4][5]. Каждой команде предоставлялось время для настройки и адаптации своих ботов под модифицированный игровой клиент, однако изменять программный код на этом этапе было запрещено. Состязание проводилось в формате раундов, каждый из которых представлял собой 10-минутную битву на выживание. Судьи подключались к серверу последними и поочерёдно наблюдали за каждым участником (и человеком, и ботом) хотя бы один раз, при этом состав пар «человек–бот» варьировался. По итогам первого турнира ни один из ботов не был оценён как более человечный, чем реальный игрок[6].
В последующих турнирах (2009–2011 годы)[7][8][9] боты набирали всё более высокие «человечные» оценки, однако ни один из участников не стал победителем BotPrize.
В 2012 году турнир 2K BotPrize прошёл вновь, и две команды смогли создать ботов, получивших более высокие оценки «человечности», чем реальные игроки[3].
Успешные боты
На сегодняшний день известно о двух игровых ботах, успешно прошедших тест Тьюринга для игровых ботов:
- UT^2 — команда из Техасского университета в Остине сконцентрировала внимание на боте, который подстраивал своё поведение, основываясь на ранее наблюдавшихся человеческих действиях, используя нейроэволюцию. Команда опубликовала своего бота в открытом доступе[10], для его работы требуется лицензия на игру «Unreal Tournament 2004».
- Михай Полчеану, аспирант из Румынии, разработал бота, который имитировал реакции соперника, фактически «заимствуя» элементы человеческого поведения у противника[3]. Оба победителя добились успеха в 2012 году — к столетию рождения Алана Тьюринга.
Итоги и влияние
Результаты, при которых бот кажется более человечным, чем человек, в определённой степени могут быть переоценены: в турнире 2012 года средний показатель «человечности» среди игроков составлял лишь 41,4 %[11]. Это указывает на ограничения данного теста, ведь поведение человека оказывается более сложным и многогранным, чем предполагали разработчики[12]. В связи с этим организаторы BotPrize планируют повысить сложность задач для участников в последующих соревнованиях[13].
Считается также, что методы и техники, разработанные для теста Тьюринга для игровых ботов, найдут применение за пределами видеоигр — например, для виртуальных тренажёров и улучшения взаимодействия человека и робота[14].
Отличия от классического теста Тьюринга
Тест Тьюринга для игровых ботов во многом отличается от традиционного варианта теста Тьюринга[2]:
- В классических соревнованиях (например, Премия Лёбнера) люди, противостоящие чат-ботам, стремятся убедить судей, что являются людьми; в игровом же варианте основная цель игроков — победить в матче (например, набрать большее количество очков убийств).
- Судьи не обязаны выбирать только одного участника как «человека», а другого — как «нечеловека»; оценки допускают большую вариативность и сложность.
- «Человечность» игрового бота не эквивалентна интеллекту: бот, прошедший данный тест, не обязательно считается интеллектуальным, в отличие от ситуации с чат-ботами.
- Для теста выбран «Unreal Tournament 2004» благодаря коммерческой доступности и специальному интерфейсу для создания ботов GameBots; эта специфика резко отличает игровой тест от классических вариантов, где важна свободная беседа и огромный простор для вопросов.
- Информация, доступная ботам и людям, различается: люди ориентируются на зрение и слух, боты — на оперирование данными и событиями.
- Судьи не могут напрямую создавать новые игровые ситуации (например, добавить яму с лавой), как это возможно при испытаниях чат-ботов.
- Тест строится как трёхстороннее взаимодействие (два участника и судья), в отличие от классического диалога между парой «человек—машина».