Прогресс в области искусственного интеллекта

Прогресс в области искусственного интеллекта — это накопление достижений, вех и открытий в сфере искусственного интеллекта, охватывающее развитие технологий, алгоритмов и прикладных решений. Искусственный интеллект — междисциплинарная область информатики, нацеленная на создание машин и систем, способных выполнять задачи, требующие интеллектуальных способностей, присущих человеку. Применения искусственного интеллекта охватывают медицинскую диагностику, торговлю акциями, управление роботами, юриспруденцию, научные открытия, видеоигры и игрушки. Многие внедрения ИИ перестают восприниматься как нечто особое: «Многие современные применения ИИ органично входят в повседневную жизнь и теряют ярлык „ИИ“ по мере своей массовости и пользы»^[1]^[2]. Отмечается также, что «тысячи приложений ИИ глубоко интегрированы в инфраструктуру каждой отрасли»^[3]. К концу 1990-х и началу XXI века технологии ИИ широко использовались в составе крупных систем^[3]^[4], однако – редко связывались в обществе с самой областью искусственного интеллекта.

Каплан и Хэнлайн подразделяют ИИ на три эволюционных уровня: 1) узконаправленный искусственный интеллект, решающий специфические задачи; 2) общий искусственный интеллект, способный автономно решать задачи из различных областей, порой не относящихся к исходной специализации; 3) сверхинтеллект — то есть уровень, обладающий научной креативностью, социальными навыками и всеобщей мудростью^[2].

Для сопоставления с человеческим уровнем интеллекта ИИ может оцениваться на формализованных и ограниченных задачах, известных как тесты Тьюринга для экспертов. Кроме того, использование менее масштабных задач облегчает достижение прогресса, фиксируя всё большее число положительных результатов.

Игра	Год победы ИИ^[5]	Число легальных позиций (log₁₀)^[6]	Сложность дерева игры (log₁₀)^[6]	Информация полная?	Примечания
Шашки	1994	21	31	Полная	^[7]
Отелло	1997	28	58	Полная	^[8]
Шахматы	1997	46	123	Полная
Скрэббл	2006				^[9]
Сёги	2017	71	226	Полная	^[10]
Го	2016	172	360	Полная
Техасский холдем безлимитный, дуэль	2017			Неполная
StarCraft	-	270+		Неполная	^[11]
StarCraft II	2019			Неполная	^[12]

Существует множество интеллектуальных умений, каждая из которых раскрывает определённые аспекты эффективности ИИ в разных областях.

ИИ, подобно электричеству или паровой машине, — технология общего назначения. Единого взгляда на то, какие типы задач наиболее подходят для ИИ, нет^[13]. Согласно парадоксу Моравека, люди с наибольшей вероятностью превосходят машины там, где роль эволюции сильнее всего: в двигательных и сенсорных способностях^[14]. Хотя проекты вроде AlphaZero способны самостоятельно формировать знания, большинство современных систем обучения ИИ нуждаются в больших обучающих наборах^[15]^[16]. Исследователь Эндрю Ын предложил ориентир: «Почти всё, что человек делает менее чем за секунду размышлений, технически может быть автоматизировано с помощью ИИ уже сейчас или в ближайшем будущем»^[17].

Тем не менее, несмотря на достижения ИИ, есть области, где человек по‑прежнему лидирует: здравый смысл, креативность, эмпатия, гибкость и контекстность решений^[13]. Оперирование сложными и меняющимися ситуациями остаётся преимущественно человеческим навыком.

Цель развития ИИ заключается не в обязательном превосходстве над человеком во всём, а в том, чтобы увеличить эффективность и возможности там, где машина способна дополнить и усилить человеческий труд.

Игры служат заметным ориентиром для оценки темпов прогресса, так как имеют массовую базу и систему рейтингов. Программа ИИ AlphaGo завершила эпоху классических бенчмарков настольных игр, одержав в 2016 году победу над сильнейшим игроком в го Ли Седолем, доказав превосходство искусственного интеллекта^[18]. Игры с неполной информацией (например, покер) — новая сложная область для ИИ, где прецедентом стала победа системы Libratus в 2017 году^[19]^[20]. Киберспортные дисциплины вроде StarCraft стали новыми бенчмарками, здесь ведущие команды (в том числе ИИ‑подразделения Facebook и DeepMind) участвуют в соревнованиях^[21]^[22].

Для оценки прогресса по ИИ условно выделяют такие категории исходов:

оптимальный: достижение наилучшего возможного результата (этого также могли добиться люди);
сверхчеловеческий: превосходит все человеческие достижения;
высокочеловеческий: результат выше среднего уровня человека;
сравнимый с человеком: примерно на уровне большинства людей;
ниже человеческого: уступает большинству людей.

Оптимальный уровень

Крестики-нолики
Четыре в ряд: 1988
Шашки (англ. International 8×8 draughts): слабо решена (2007)^[23]
Кубик Рубика: в основном решён (2010)^[24]
Лимитный хедс-ап покер: практически оптимален — жизни обычного игрока не хватит на доказательство неидеальности решения (2015)^[25]

Сверхчеловеческий уровень

Отелло: около 1997^[8]
Скрэббл:^[26]^[27] 2006^[9]
Нарды: около 1995–2002^[28]
Шахматы: суперкомпьютер — около 1997; персональный компьютер — около 2006^[29]; мобильный телефон — около 2009^[30]; компьютер побеждает объединённую команду человек+компьютер — около 2017^[31]
Jeopardy!: отвечание на вопросы (без распознавания речи машиной) — 2011^[32]^[33]
Arimaa: 2015^[34]^[35]
Сёги: около 2017^[10]
Го: 2017^[36]
Безлимитный покер хедс-ап: 2017
Безлимитный покер на шестеро: 2019^[37]
Gran Turismo Sport: 2022^[38]

Высокочеловеческий уровень

Кроссворды: ок. 2012^[39]^[40]
Freeciv: 2016^[41]
Dota 2: 2018^[42]
Бридж: по обзору 2009 года, лучшие программы достигают мастерского уровня без учёта торгов^[43].
StarCraft II: 2019^[44]
Маджонг: 2019^[45]
Stratego: 2022^[46]
Дипломатия без коммуникации (Diplomacy): 2022^[47]
Hanabi: 2022^[48]
Обработка естественного языка

Сравнимо с человеком

Оптическое распознавание символов для ISO 1073-1:1976 и похожих спецшрифтов
Классификация изображений^[49]
Распознавание рукописного текста^[50]
Распознавание лиц^[51]
Ответы на визуальные вопросы
Тест английского чтения и понимания SQuAD 2.0 (2019)^[52]
Тест на понимание английского языка SuperGLUE (2020)^[52]
Отдельные экзамены школьных наук (2019)^[53]
Некоторые задания из Прогрессивные матрицы Равена^[54]
Большинство игр Atari 2600 (2015)^[55]

Ниже человеческого уровня

Оптическое распознавание символов для обычного текста (близко к человеческому уровню для латиницы)
Распознавание объектов
Несколько задач, требующих прогресса в робототехнике и аппаратном обеспечении:
- Устойчивая двуногая ходьба: современные роботы ходят менее стабильно, чем человек (по состоянию на 2017 год)^[56]
- Робофутбол^[57]
Распознавание речи: «близко к человеческому уровню» (2017)^[58]
Объяснимость. Современные медицинские системы могут ставить диагноз, но не объясняют его пользователю^[59]
Многие тесты нефигурального интеллекта (2020)^[54]
Задачи визуального вывода по тесту Бонгарда, например, Bongard-LOGO (2020)^[54]^[60]
Тесты на здравый смысл (VCR) до 2020^[52]
Прогнозирование биржевых рынков: обработка финансовых данных средствами ИИ
Видеоигра Angry Birds, до 2020^[61]
Задачи, требующие глубокого контекстного понимания:
- Машинный перевод
- Семантическая неоднозначность слов

Тест Тьюринга (предложен Аланом Тьюрингом), опираясь на язык как суть человечности^[62], ныне считается слишком эксплуатируемым, чтобы реально измерять интеллект ИИ^[63].

Тест Фейгенбаума, введённый основателем экспертных систем, измеряет знания и опыт по теме^[64]. Джим Грей из Microsoft (2003) предлагал расширить тест Тьюринга на задачи речи, синтеза речи, обнаружения объектов и поведения^[65].

Различные тесты «универсального интеллекта» предлагают сравнивать ИИ, людей и животных на максимальном наборе задач. Полный набор включает все возможные задачи, взвешенные по сложности Колмогорова, однако такие тесты склонны к примитивному сопоставлению и позволяют ИИ превосходить человека на экспериментах со слабым паттерном^[66]^[67]^[68]^[69]^[70].

По информации OpenAI, в 2023 году ChatGPT (GPT-4) занял 90-й процентиль на едином юридическом экзамене, 89-й процентиль по математике и 93-й по чтению/письму на SAT; на тесте GRE — 54-я позиция по письму, 88-я по количественному анализу и 99-я по вербальному. В Олимпиаде по биологии США за 2020 год GPT-4 вошёл в топ-1 %. Он получил высший балл на ряде экзаменов продвинутого уровня (AP)^[71].

По данным независимых исследований (2023), ChatGPT (GPT-3.5) достигал и превышал порог прохождения всех частей медицинского экзамена США. На четырёх юридических курсах Университета Миннесоты GPT-3.5 также набрал проходные баллы, хотя и невысокие^[71]. GPT-4 прошёл текстовый экзамен по радиологии^[72]^[73].

Большие состязания — например, конкурс ImageNet — стимулируют прогресс в области ИИ. Типичные спортивные задачи: машинный интеллект общего назначения, ведение диалога, интеллектуальный анализ данных, автономные автомобили, робофутбол и классические игры^[74].

По опросу экспертов 2016 года под руководством Катии Грейс (Институт будущего человечества), медиа-оценки были таковы: для победы в Angry Birds — 3 года, Мировая серия по покеру — 4 года, отличный искусственный интеллект в StarCraft — 6 лет. По более субъективным задачам — 6 лет до машин, складывающих бельё как рабочий, 7–10 лет до экспертных ответов на «гуглимые» вопросы, через 8 лет — столь же качественная расшифровка речи, 9 лет — ИИ-консультант в банкинге и 11 лет — сочинение экспертных песен. Стать автором бестселлера или победить в Олимпиаде по математике, по мнению экспертов, ИИ сможет не ранее чем через 30 лет^[75]^[76]^[77].

Шахматы

ИИ обыграл гроссмейстера на официальном турнире впервые в 1988 году; позднее машина под именем Deep Blue в 1997 году победила действующего чемпиона мира, что стало рубежом в истории (см. Deep Blue — Каспаров)^[78].

Прогнозы преодоления человеком компьютеров в шахматах
Год прогноза	Год исполнения	Интервал (лет)	Прогнозист	Примечания
1957	1967 или ранее	10 или меньше	Герберт А. Саймон, экономист^[79]
1990	До 2000	10 или меньше	Рэй Курцвейл, футурист	Age of Intelligent Machines^[80]

Го

AlphaGo победил лучшего европейского игрока в октябре 2015 года, а затем и мирового лидера Ли Седоля в марте 2016 года (см. AlphaGo — Ли Седоль). По оценкам Scientific American и ряда других изданий, большинство экспертов ожидало такого прорыва не ранее чем через десятилетие^[81]^[82]^[83].

Прогнозы преодоления человеком компьютеров в го
Год прогноза	Год исполнения	Интервал (лет)	Прогнозист	Организация	Примечания
1997	2100 или позже	103 или больше	Пит Хутт, физик, любитель го	Институт перспективных исследований	The New York Times^[84]
2007	2017 или раньше	10 или меньше	Фэн-Сюнь Сюй, ведущий проекта Deep Blue	Microsoft Research Asia	IEEE Spectrum^[85]
2014	2024	10	Реми Кулом, разработчик CrazyStone	CrazyStone	WIRED^[86]

Общий искусственный интеллект (ОИИ)

Пионер ИИ и экономист Герберт А. Саймон ошибочно утверждал в 1965 году: «Через двадцать лет машины смогут сделать любую работу, которую может делать человек». В 1970 году Марвин Минский писал: «В течение одного поколения… задача создания искусственного интеллекта будет в целом решена»^[87].

Четыре экспертных опроса (2012–2013) выводили медиану ожиданий появления ОИИ в интервале 2040–2050^[88]^[89].

Опрос 2016 года под руководством Грейс показал, что сроки сильно варьируются в зависимости от формулировки. В случае вопроса «когда машины будут лучше и дешевле людей в выполнении каждой задачи» медиана составляла 45 лет. Если спрашивали, когда можно будет полностью автоматизировать каждую профессию, средний ответ — 122 года. Для автоматизации деятельности исследователя ИИ медиана — 90 лет. Опыт не влиял на оптимизм, но исследователи из Азии были в среднем вдвое оптимистичнее коллег из США: они называли 30 лет против 74 лет^[75]^[76]^[77].

Прогнозы появления общего искусственного интеллекта (ОИИ)
Год прогноза	Год исполнения	Интервал (лет)	Прогнозист	Примечания
1965	1985 или ранее	20 или меньше	Герберт А. Саймон	The shape of automation for men and management^[87]^[90]
1993	2023 или ранее	30 или меньше	Вернор Виндже, писатель-фантаст	"The Coming Technological Singularity"^[91]
1995	2040 или ранее	45 или меньше	Ханс Моравек, робототехник	WIRED^[92]
2008	Никогда / отдалённое будущее		Гордон Э. Мур, автор закона Мура	IEEE Spectrum^[93]
2017	2029	12	Рэй Курцвейл	Интервью^[94]

ИИ формирует заметный углеродный след вследствие роста энергопотребления — особенно на этапе обучения и эксплуатации^[95]^[96]. Учёные подчёркивают, что при расчёте последствий важно учитывать энергозатраты моделей ИИ на обучение^[97]. По прогнозам, к 2027 году энергопотребление ИИ может достичь 85–134 ТВт·ч, что эквивалентно 0,5 % всего текущего потребления электроэнергии^[98]^[99]. Только одно обучение глубокой нейросети даёт тот же след по выбросам, как жизненный цикл пяти автомобилей^[95].

Охлаждение серверов ИИ требует больших объёмов пресной воды, которая испаряется в градирнях^[100]^[101]. К 2027 году ИИ может использовать до 6,6 млрд кубометров воды^[102].

Только тренировка GPT-3 потребовала около 700 тыс. литров воды — это водный след производства 320 автомобилей Tesla^[103].

ЦОД Microsoft в Финиксе при ориентации на ИИ способен тратить 212 млн литров пресной воды в год — столько же требует около 670 семей^[102].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[83]

[84]

[85]

[86]

[87]

[88]

[89]

[90]

[91]

[92]

[93]

[94]

[95]

[96]

[97]

[98]

[99]

[100]

Прогресс в области искусственного интеллекта

Уровни

Современное состояние

Оптимальный уровень

Сверхчеловеческий уровень

Высокочеловеческий уровень

Сравнимо с человеком

Ниже человеческого уровня

Предлагаемые тесты искусственного интеллекта

Экзамены

Соревнования

Ранние и современные прогнозы

Шахматы

Го

Общий искусственный интеллект (ОИИ)

Углеродный след ИИ

Примечания