Прогресс в области искусственного интеллекта
Прогресс в области искусственного интеллекта — это накопление достижений, вех и открытий в сфере искусственного интеллекта, охватывающее развитие технологий, алгоритмов и прикладных решений. Искусственный интеллект — междисциплинарная область информатики, нацеленная на создание машин и систем, способных выполнять задачи, требующие интеллектуальных способностей, присущих человеку. Применения искусственного интеллекта охватывают медицинскую диагностику, торговлю акциями, управление роботами, юриспруденцию, научные открытия, видеоигры и игрушки. Многие внедрения ИИ перестают восприниматься как нечто особое: «Многие современные применения ИИ органично входят в повседневную жизнь и теряют ярлык „ИИ“ по мере своей массовости и пользы»[1][2]. Отмечается также, что «тысячи приложений ИИ глубоко интегрированы в инфраструктуру каждой отрасли»[3]. К концу 1990-х и началу XXI века технологии ИИ широко использовались в составе крупных систем[3][4], однако – редко связывались в обществе с самой областью искусственного интеллекта.
Уровни
Каплан и Хэнлайн подразделяют ИИ на три эволюционных уровня: 1) узконаправленный искусственный интеллект, решающий специфические задачи; 2) общий искусственный интеллект, способный автономно решать задачи из различных областей, порой не относящихся к исходной специализации; 3) сверхинтеллект — то есть уровень, обладающий научной креативностью, социальными навыками и всеобщей мудростью[2].
Для сопоставления с человеческим уровнем интеллекта ИИ может оцениваться на формализованных и ограниченных задачах, известных как тесты Тьюринга для экспертов. Кроме того, использование менее масштабных задач облегчает достижение прогресса, фиксируя всё большее число положительных результатов.
Современное состояние
| Игра | Год победы ИИ[5] | Число легальных позиций (log10)[6] | Сложность дерева игры (log10)[6] | Информация полная? | Примечания |
|---|---|---|---|---|---|
| Шашки | 1994 | 21 | 31 | Полная | [7] |
| Отелло | 1997 | 28 | 58 | Полная | [8] |
| Шахматы | 1997 | 46 | 123 | Полная | |
| Скрэббл | 2006 | [9] | |||
| Сёги | 2017 | 71 | 226 | Полная | [10] |
| Го | 2016 | 172 | 360 | Полная | |
| Техасский холдем безлимитный, дуэль | 2017 | Неполная | |||
| StarCraft | - | 270+ | Неполная | [11] | |
| StarCraft II | 2019 | Неполная | [12] |
Существует множество интеллектуальных умений, каждая из которых раскрывает определённые аспекты эффективности ИИ в разных областях.
ИИ, подобно электричеству или паровой машине, — технология общего назначения. Единого взгляда на то, какие типы задач наиболее подходят для ИИ, нет[13]. Согласно парадоксу Моравека, люди с наибольшей вероятностью превосходят машины там, где роль эволюции сильнее всего: в двигательных и сенсорных способностях[14]. Хотя проекты вроде AlphaZero способны самостоятельно формировать знания, большинство современных систем обучения ИИ нуждаются в больших обучающих наборах[15][16]. Исследователь Эндрю Ын предложил ориентир: «Почти всё, что человек делает менее чем за секунду размышлений, технически может быть автоматизировано с помощью ИИ уже сейчас или в ближайшем будущем»[17].
Тем не менее, несмотря на достижения ИИ, есть области, где человек по‑прежнему лидирует: здравый смысл, креативность, эмпатия, гибкость и контекстность решений[13]. Оперирование сложными и меняющимися ситуациями остаётся преимущественно человеческим навыком.
Цель развития ИИ заключается не в обязательном превосходстве над человеком во всём, а в том, чтобы увеличить эффективность и возможности там, где машина способна дополнить и усилить человеческий труд.
Игры служат заметным ориентиром для оценки темпов прогресса, так как имеют массовую базу и систему рейтингов. Программа ИИ AlphaGo завершила эпоху классических бенчмарков настольных игр, одержав в 2016 году победу над сильнейшим игроком в го Ли Седолем, доказав превосходство искусственного интеллекта[18]. Игры с неполной информацией (например, покер) — новая сложная область для ИИ, где прецедентом стала победа системы Libratus в 2017 году[19][20]. Киберспортные дисциплины вроде StarCraft стали новыми бенчмарками, здесь ведущие команды (в том числе ИИ‑подразделения Facebook и DeepMind) участвуют в соревнованиях[21][22].
Для оценки прогресса по ИИ условно выделяют такие категории исходов:
- оптимальный: достижение наилучшего возможного результата (этого также могли добиться люди);
- сверхчеловеческий: превосходит все человеческие достижения;
- высокочеловеческий: результат выше среднего уровня человека;
- сравнимый с человеком: примерно на уровне большинства людей;
- ниже человеческого: уступает большинству людей.
- Крестики-нолики
- Четыре в ряд: 1988
- Шашки (англ. International 8×8 draughts): слабо решена (2007)[23]
- Кубик Рубика: в основном решён (2010)[24]
- Лимитный хедс-ап покер: практически оптимален — жизни обычного игрока не хватит на доказательство неидеальности решения (2015)[25]
- Отелло: около 1997[8]
- Скрэббл:[26][27] 2006[9]
- Нарды: около 1995–2002[28]
- Шахматы: суперкомпьютер — около 1997; персональный компьютер — около 2006[29]; мобильный телефон — около 2009[30]; компьютер побеждает объединённую команду человек+компьютер — около 2017[31]
- Jeopardy!: отвечание на вопросы (без распознавания речи машиной) — 2011[32][33]
- Arimaa: 2015[34][35]
- Сёги: около 2017[10]
- Го: 2017[36]
- Безлимитный покер хедс-ап: 2017
- Безлимитный покер на шестеро: 2019[37]
- Gran Turismo Sport: 2022[38]
- Кроссворды: ок. 2012[39][40]
- Freeciv: 2016[41]
- Dota 2: 2018[42]
- Бридж: по обзору 2009 года, лучшие программы достигают мастерского уровня без учёта торгов[43].
- StarCraft II: 2019[44]
- Маджонг: 2019[45]
- Stratego: 2022[46]
- Дипломатия без коммуникации (Diplomacy): 2022[47]
- Hanabi: 2022[48]
- Обработка естественного языка
- Оптическое распознавание символов для ISO 1073-1:1976 и похожих спецшрифтов
- Классификация изображений[49]
- Распознавание рукописного текста[50]
- Распознавание лиц[51]
- Ответы на визуальные вопросы
- Тест английского чтения и понимания SQuAD 2.0 (2019)[52]
- Тест на понимание английского языка SuperGLUE (2020)[52]
- Отдельные экзамены школьных наук (2019)[53]
- Некоторые задания из Прогрессивные матрицы Равена[54]
- Большинство игр Atari 2600 (2015)[55]
- Оптическое распознавание символов для обычного текста (близко к человеческому уровню для латиницы)
- Распознавание объектов
- Несколько задач, требующих прогресса в робототехнике и аппаратном обеспечении:
- Устойчивая двуногая ходьба: современные роботы ходят менее стабильно, чем человек (по состоянию на 2017 год)[56]
- Робофутбол[57]
- Распознавание речи: «близко к человеческому уровню» (2017)[58]
- Объяснимость. Современные медицинские системы могут ставить диагноз, но не объясняют его пользователю[59]
- Многие тесты нефигурального интеллекта (2020)[54]
- Задачи визуального вывода по тесту Бонгарда, например, Bongard-LOGO (2020)[54][60]
- Тесты на здравый смысл (VCR) до 2020[52]
- Прогнозирование биржевых рынков: обработка финансовых данных средствами ИИ
- Видеоигра Angry Birds, до 2020[61]
- Задачи, требующие глубокого контекстного понимания:
Предлагаемые тесты искусственного интеллекта
Тест Тьюринга (предложен Аланом Тьюрингом), опираясь на язык как суть человечности[62], ныне считается слишком эксплуатируемым, чтобы реально измерять интеллект ИИ[63].
Тест Фейгенбаума, введённый основателем экспертных систем, измеряет знания и опыт по теме[64]. Джим Грей из Microsoft (2003) предлагал расширить тест Тьюринга на задачи речи, синтеза речи, обнаружения объектов и поведения[65].
Различные тесты «универсального интеллекта» предлагают сравнивать ИИ, людей и животных на максимальном наборе задач. Полный набор включает все возможные задачи, взвешенные по сложности Колмогорова, однако такие тесты склонны к примитивному сопоставлению и позволяют ИИ превосходить человека на экспериментах со слабым паттерном[66][67][68][69][70].
Экзамены
По информации OpenAI, в 2023 году ChatGPT (GPT-4) занял 90-й процентиль на едином юридическом экзамене, 89-й процентиль по математике и 93-й по чтению/письму на SAT; на тесте GRE — 54-я позиция по письму, 88-я по количественному анализу и 99-я по вербальному. В Олимпиаде по биологии США за 2020 год GPT-4 вошёл в топ-1 %. Он получил высший балл на ряде экзаменов продвинутого уровня (AP)[71].
По данным независимых исследований (2023), ChatGPT (GPT-3.5) достигал и превышал порог прохождения всех частей медицинского экзамена США. На четырёх юридических курсах Университета Миннесоты GPT-3.5 также набрал проходные баллы, хотя и невысокие[71]. GPT-4 прошёл текстовый экзамен по радиологии[72][73].
Соревнования
Большие состязания — например, конкурс ImageNet — стимулируют прогресс в области ИИ. Типичные спортивные задачи: машинный интеллект общего назначения, ведение диалога, интеллектуальный анализ данных, автономные автомобили, робофутбол и классические игры[74].
Ранние и современные прогнозы
По опросу экспертов 2016 года под руководством Катии Грейс (Институт будущего человечества), медиа-оценки были таковы: для победы в Angry Birds — 3 года, Мировая серия по покеру — 4 года, отличный искусственный интеллект в StarCraft — 6 лет. По более субъективным задачам — 6 лет до машин, складывающих бельё как рабочий, 7–10 лет до экспертных ответов на «гуглимые» вопросы, через 8 лет — столь же качественная расшифровка речи, 9 лет — ИИ-консультант в банкинге и 11 лет — сочинение экспертных песен. Стать автором бестселлера или победить в Олимпиаде по математике, по мнению экспертов, ИИ сможет не ранее чем через 30 лет[75][76][77].
ИИ обыграл гроссмейстера на официальном турнире впервые в 1988 году; позднее машина под именем Deep Blue в 1997 году победила действующего чемпиона мира, что стало рубежом в истории (см. Deep Blue — Каспаров)[78].
| Год прогноза | Год исполнения | Интервал (лет) | Прогнозист | Примечания |
|---|---|---|---|---|
| 1957 | 1967 или ранее | 10 или меньше | Герберт А. Саймон, экономист[79] | |
| 1990 | До 2000 | 10 или меньше | Рэй Курцвейл, футурист | Age of Intelligent Machines[80] |
AlphaGo победил лучшего европейского игрока в октябре 2015 года, а затем и мирового лидера Ли Седоля в марте 2016 года (см. AlphaGo — Ли Седоль). По оценкам Scientific American и ряда других изданий, большинство экспертов ожидало такого прорыва не ранее чем через десятилетие[81][82][83].
| Год прогноза | Год исполнения | Интервал (лет) | Прогнозист | Организация | Примечания |
|---|---|---|---|---|---|
| 1997 | 2100 или позже | 103 или больше | Пит Хутт, физик, любитель го | Институт перспективных исследований | The New York Times[84] |
| 2007 | 2017 или раньше | 10 или меньше | Фэн-Сюнь Сюй, ведущий проекта Deep Blue | Microsoft Research Asia | IEEE Spectrum[85] |
| 2014 | 2024 | 10 | Реми Кулом, разработчик CrazyStone | CrazyStone | WIRED[86] |
Пионер ИИ и экономист Герберт А. Саймон ошибочно утверждал в 1965 году: «Через двадцать лет машины смогут сделать любую работу, которую может делать человек». В 1970 году Марвин Минский писал: «В течение одного поколения… задача создания искусственного интеллекта будет в целом решена»[87].
Четыре экспертных опроса (2012–2013) выводили медиану ожиданий появления ОИИ в интервале 2040–2050[88][89].
Опрос 2016 года под руководством Грейс показал, что сроки сильно варьируются в зависимости от формулировки. В случае вопроса «когда машины будут лучше и дешевле людей в выполнении каждой задачи» медиана составляла 45 лет. Если спрашивали, когда можно будет полностью автоматизировать каждую профессию, средний ответ — 122 года. Для автоматизации деятельности исследователя ИИ медиана — 90 лет. Опыт не влиял на оптимизм, но исследователи из Азии были в среднем вдвое оптимистичнее коллег из США: они называли 30 лет против 74 лет[75][76][77].
| Год прогноза | Год исполнения | Интервал (лет) | Прогнозист | Примечания |
|---|---|---|---|---|
| 1965 | 1985 или ранее | 20 или меньше | Герберт А. Саймон | The shape of automation for men and management[87][90] |
| 1993 | 2023 или ранее | 30 или меньше | Вернор Виндже, писатель-фантаст | "The Coming Technological Singularity"[91] |
| 1995 | 2040 или ранее | 45 или меньше | Ханс Моравек, робототехник | WIRED[92] |
| 2008 | Никогда / отдалённое будущее | Гордон Э. Мур, автор закона Мура | IEEE Spectrum[93] | |
| 2017 | 2029 | 12 | Рэй Курцвейл | Интервью[94] |
Углеродный след ИИ
ИИ формирует заметный углеродный след вследствие роста энергопотребления — особенно на этапе обучения и эксплуатации[95][96]. Учёные подчёркивают, что при расчёте последствий важно учитывать энергозатраты моделей ИИ на обучение[97]. По прогнозам, к 2027 году энергопотребление ИИ может достичь 85–134 ТВт·ч, что эквивалентно 0,5 % всего текущего потребления электроэнергии[98][99]. Только одно обучение глубокой нейросети даёт тот же след по выбросам, как жизненный цикл пяти автомобилей[95].
Охлаждение серверов ИИ требует больших объёмов пресной воды, которая испаряется в градирнях[100][101]. К 2027 году ИИ может использовать до 6,6 млрд кубометров воды[102].
Только тренировка GPT-3 потребовала около 700 тыс. литров воды — это водный след производства 320 автомобилей Tesla[103].
ЦОД Microsoft в Финиксе при ориентации на ИИ способен тратить 212 млн литров пресной воды в год — столько же требует около 670 семей[102].