Прогресс в области искусственного интеллекта


undefined

Прогресс в области искусственного интеллекта — это накопление достижений, вех и открытий в сфере искусственного интеллекта, охватывающее развитие технологий, алгоритмов и прикладных решений. Искусственный интеллект — междисциплинарная область информатики, нацеленная на создание машин и систем, способных выполнять задачи, требующие интеллектуальных способностей, присущих человеку. Применения искусственного интеллекта охватывают медицинскую диагностику, торговлю акциями, управление роботами, юриспруденцию, научные открытия, видеоигры и игрушки. Многие внедрения ИИ перестают восприниматься как нечто особое: «Многие современные применения ИИ органично входят в повседневную жизнь и теряют ярлык „ИИ“ по мере своей массовости и пользы»[1][2]. Отмечается также, что «тысячи приложений ИИ глубоко интегрированы в инфраструктуру каждой отрасли»[3]. К концу 1990-х и началу XXI века технологии ИИ широко использовались в составе крупных систем[3][4], однако – редко связывались в обществе с самой областью искусственного интеллекта.

Уровни

Каплан и Хэнлайн подразделяют ИИ на три эволюционных уровня: 1) узконаправленный искусственный интеллект, решающий специфические задачи; 2) общий искусственный интеллект, способный автономно решать задачи из различных областей, порой не относящихся к исходной специализации; 3) сверхинтеллект — то есть уровень, обладающий научной креативностью, социальными навыками и всеобщей мудростью[2].

Для сопоставления с человеческим уровнем интеллекта ИИ может оцениваться на формализованных и ограниченных задачах, известных как тесты Тьюринга для экспертов. Кроме того, использование менее масштабных задач облегчает достижение прогресса, фиксируя всё большее число положительных результатов.

Современное состояние

Игра Год победы ИИ[5] Число легальных позиций (log10)[6] Сложность дерева игры (log10)[6] Информация полная? Примечания
Шашки 1994 21 31 Полная [7]
Отелло 1997 28 58 Полная [8]
Шахматы 1997 46 123 Полная
Скрэббл 2006 [9]
Сёги 2017 71 226 Полная [10]
Го 2016 172 360 Полная
Техасский холдем безлимитный, дуэль 2017 Неполная
StarCraft - 270+ Неполная [11]
StarCraft II 2019 Неполная [12]

Существует множество интеллектуальных умений, каждая из которых раскрывает определённые аспекты эффективности ИИ в разных областях.

ИИ, подобно электричеству или паровой машине, — технология общего назначения. Единого взгляда на то, какие типы задач наиболее подходят для ИИ, нет[13]. Согласно парадоксу Моравека, люди с наибольшей вероятностью превосходят машины там, где роль эволюции сильнее всего: в двигательных и сенсорных способностях[14]. Хотя проекты вроде AlphaZero способны самостоятельно формировать знания, большинство современных систем обучения ИИ нуждаются в больших обучающих наборах[15][16]. Исследователь Эндрю Ын предложил ориентир: «Почти всё, что человек делает менее чем за секунду размышлений, технически может быть автоматизировано с помощью ИИ уже сейчас или в ближайшем будущем»[17].

Тем не менее, несмотря на достижения ИИ, есть области, где человек по‑прежнему лидирует: здравый смысл, креативность, эмпатия, гибкость и контекстность решений[13]. Оперирование сложными и меняющимися ситуациями остаётся преимущественно человеческим навыком.

Цель развития ИИ заключается не в обязательном превосходстве над человеком во всём, а в том, чтобы увеличить эффективность и возможности там, где машина способна дополнить и усилить человеческий труд.

Игры служат заметным ориентиром для оценки темпов прогресса, так как имеют массовую базу и систему рейтингов. Программа ИИ AlphaGo завершила эпоху классических бенчмарков настольных игр, одержав в 2016 году победу над сильнейшим игроком в го Ли Седолем, доказав превосходство искусственного интеллекта[18]. Игры с неполной информацией (например, покер) — новая сложная область для ИИ, где прецедентом стала победа системы Libratus в 2017 году[19][20]. Киберспортные дисциплины вроде StarCraft стали новыми бенчмарками, здесь ведущие команды (в том числе ИИ‑подразделения Facebook и DeepMind) участвуют в соревнованиях[21][22].

Для оценки прогресса по ИИ условно выделяют такие категории исходов:

  • оптимальный: достижение наилучшего возможного результата (этого также могли добиться люди);
  • сверхчеловеческий: превосходит все человеческие достижения;
  • высокочеловеческий: результат выше среднего уровня человека;
  • сравнимый с человеком: примерно на уровне большинства людей;
  • ниже человеческого: уступает большинству людей.

Оптимальный уровень

  • Крестики-нолики
  • Четыре в ряд: 1988
  • Шашки (англ. International 8×8 draughts): слабо решена (2007)[23]
  • Кубик Рубика: в основном решён (2010)[24]
  • Лимитный хедс-ап покер: практически оптимален — жизни обычного игрока не хватит на доказательство неидеальности решения (2015)[25]

Сверхчеловеческий уровень

  • Отелло: около 1997[8]
  • Скрэббл:[26][27] 2006[9]
  • Нарды: около 1995–2002[28]
  • Шахматы: суперкомпьютер — около 1997; персональный компьютер — около 2006[29]; мобильный телефон — около 2009[30]; компьютер побеждает объединённую команду человек+компьютер — около 2017[31]
  • Jeopardy!: отвечание на вопросы (без распознавания речи машиной) — 2011[32][33]
  • Arimaa: 2015[34][35]
  • Сёги: около 2017[10]
  • Го: 2017[36]
  • Безлимитный покер хедс-ап: 2017
  • Безлимитный покер на шестеро: 2019[37]
  • Gran Turismo Sport: 2022[38]

Высокочеловеческий уровень

Сравнимо с человеком

Ниже человеческого уровня

  • Оптическое распознавание символов для обычного текста (близко к человеческому уровню для латиницы)
  • Распознавание объектов
  • Несколько задач, требующих прогресса в робототехнике и аппаратном обеспечении:
    • Устойчивая двуногая ходьба: современные роботы ходят менее стабильно, чем человек (по состоянию на 2017 год)[56]
    • Робофутбол[57]
  • Распознавание речи: «близко к человеческому уровню» (2017)[58]
  • Объяснимость. Современные медицинские системы могут ставить диагноз, но не объясняют его пользователю[59]
  • Многие тесты нефигурального интеллекта (2020)[54]
  • Задачи визуального вывода по тесту Бонгарда, например, Bongard-LOGO (2020)[54][60]
  • Тесты на здравый смысл (VCR) до 2020[52]
  • Прогнозирование биржевых рынков: обработка финансовых данных средствами ИИ
  • Видеоигра Angry Birds, до 2020[61]
  • Задачи, требующие глубокого контекстного понимания:

Предлагаемые тесты искусственного интеллекта

Тест Тьюринга (предложен Аланом Тьюрингом), опираясь на язык как суть человечности[62], ныне считается слишком эксплуатируемым, чтобы реально измерять интеллект ИИ[63].

Тест Фейгенбаума, введённый основателем экспертных систем, измеряет знания и опыт по теме[64]. Джим Грей из Microsoft (2003) предлагал расширить тест Тьюринга на задачи речи, синтеза речи, обнаружения объектов и поведения[65].

Различные тесты «универсального интеллекта» предлагают сравнивать ИИ, людей и животных на максимальном наборе задач. Полный набор включает все возможные задачи, взвешенные по сложности Колмогорова, однако такие тесты склонны к примитивному сопоставлению и позволяют ИИ превосходить человека на экспериментах со слабым паттерном[66][67][68][69][70].

Экзамены

По информации OpenAI, в 2023 году ChatGPT (GPT-4) занял 90-й процентиль на едином юридическом экзамене, 89-й процентиль по математике и 93-й по чтению/письму на SAT; на тесте GRE — 54-я позиция по письму, 88-я по количественному анализу и 99-я по вербальному. В Олимпиаде по биологии США за 2020 год GPT-4 вошёл в топ-1 %. Он получил высший балл на ряде экзаменов продвинутого уровня (AP)[71].

По данным независимых исследований (2023), ChatGPT (GPT-3.5) достигал и превышал порог прохождения всех частей медицинского экзамена США. На четырёх юридических курсах Университета Миннесоты GPT-3.5 также набрал проходные баллы, хотя и невысокие[71]. GPT-4 прошёл текстовый экзамен по радиологии[72][73].

Соревнования

Большие состязания — например, конкурс ImageNet — стимулируют прогресс в области ИИ. Типичные спортивные задачи: машинный интеллект общего назначения, ведение диалога, интеллектуальный анализ данных, автономные автомобили, робофутбол и классические игры[74].

Ранние и современные прогнозы

По опросу экспертов 2016 года под руководством Катии Грейс (Институт будущего человечества), медиа-оценки были таковы: для победы в Angry Birds — 3 года, Мировая серия по покеру — 4 года, отличный искусственный интеллект в StarCraft — 6 лет. По более субъективным задачам — 6 лет до машин, складывающих бельё как рабочий, 7–10 лет до экспертных ответов на «гуглимые» вопросы, через 8 лет — столь же качественная расшифровка речи, 9 лет — ИИ-консультант в банкинге и 11 лет — сочинение экспертных песен. Стать автором бестселлера или победить в Олимпиаде по математике, по мнению экспертов, ИИ сможет не ранее чем через 30 лет[75][76][77].

Шахматы

undefined

ИИ обыграл гроссмейстера на официальном турнире впервые в 1988 году; позднее машина под именем Deep Blue в 1997 году победила действующего чемпиона мира, что стало рубежом в истории (см. Deep Blue — Каспаров)[78].

Прогнозы преодоления человеком компьютеров в шахматах
Год прогноза Год исполнения Интервал (лет) Прогнозист Примечания
1957 1967 или ранее 10 или меньше Герберт А. Саймон, экономист[79]
1990 До 2000 10 или меньше Рэй Курцвейл, футурист Age of Intelligent Machines[80]

Го

AlphaGo победил лучшего европейского игрока в октябре 2015 года, а затем и мирового лидера Ли Седоля в марте 2016 года (см. AlphaGo — Ли Седоль). По оценкам Scientific American и ряда других изданий, большинство экспертов ожидало такого прорыва не ранее чем через десятилетие[81][82][83].

Прогнозы преодоления человеком компьютеров в го
Год прогноза Год исполнения Интервал (лет) Прогнозист Организация Примечания
1997 2100 или позже 103 или больше Пит Хутт, физик, любитель го Институт перспективных исследований The New York Times[84]
2007 2017 или раньше 10 или меньше Фэн-Сюнь Сюй, ведущий проекта Deep Blue Microsoft Research Asia IEEE Spectrum[85]
2014 2024 10 Реми Кулом, разработчик CrazyStone CrazyStone WIRED[86]

Общий искусственный интеллект (ОИИ)

Пионер ИИ и экономист Герберт А. Саймон ошибочно утверждал в 1965 году: «Через двадцать лет машины смогут сделать любую работу, которую может делать человек». В 1970 году Марвин Минский писал: «В течение одного поколения… задача создания искусственного интеллекта будет в целом решена»[87].

Четыре экспертных опроса (2012–2013) выводили медиану ожиданий появления ОИИ в интервале 2040–2050[88][89].

Опрос 2016 года под руководством Грейс показал, что сроки сильно варьируются в зависимости от формулировки. В случае вопроса «когда машины будут лучше и дешевле людей в выполнении каждой задачи» медиана составляла 45 лет. Если спрашивали, когда можно будет полностью автоматизировать каждую профессию, средний ответ — 122 года. Для автоматизации деятельности исследователя ИИ медиана — 90 лет. Опыт не влиял на оптимизм, но исследователи из Азии были в среднем вдвое оптимистичнее коллег из США: они называли 30 лет против 74 лет[75][76][77].

Прогнозы появления общего искусственного интеллекта (ОИИ)
Год прогноза Год исполнения Интервал (лет) Прогнозист Примечания
1965 1985 или ранее 20 или меньше Герберт А. Саймон The shape of automation for men and management[87][90]
1993 2023 или ранее 30 или меньше Вернор Виндже, писатель-фантаст "The Coming Technological Singularity"[91]
1995 2040 или ранее 45 или меньше Ханс Моравек, робототехник WIRED[92]
2008 Никогда / отдалённое будущее Гордон Э. Мур, автор закона Мура IEEE Spectrum[93]
2017 2029 12 Рэй Курцвейл Интервью[94]

Углеродный след ИИ

ИИ формирует заметный углеродный след вследствие роста энергопотребления — особенно на этапе обучения и эксплуатации[95][96]. Учёные подчёркивают, что при расчёте последствий важно учитывать энергозатраты моделей ИИ на обучение[97]. По прогнозам, к 2027 году энергопотребление ИИ может достичь 85–134 ТВт·ч, что эквивалентно 0,5 % всего текущего потребления электроэнергии[98][99]. Только одно обучение глубокой нейросети даёт тот же след по выбросам, как жизненный цикл пяти автомобилей[95].

Охлаждение серверов ИИ требует больших объёмов пресной воды, которая испаряется в градирнях[100][101]. К 2027 году ИИ может использовать до 6,6 млрд кубометров воды[102].

Только тренировка GPT-3 потребовала около 700 тыс. литров воды — это водный след производства 320 автомобилей Tesla[103].

ЦОД Microsoft в Финиксе при ориентации на ИИ способен тратить 212 млн литров пресной воды в год — столько же требует около 670 семей[102].

Примечания