Бум искусственного интеллекта

Бум искусственного интеллекта (англ. AI boom) — продолжающийся период стремительного технологического прогресса в области искусственного интеллекта (ИИ), начавшийся в конце 2010-х годов и получивший всемирную известность в 2020-х[1][2]. Среди примеров — генеративные ИИ-технологии, такие как большие языковые модели и генераторы изображений ИИ от компаний вроде OpenAI, а также научные достижения, например, предсказание структуры белков под руководством Google DeepMind. Этот период иногда называют весной искусственного интеллекта (англ. AI spring), противопоставляя его предыдущим «зимам ИИ»[3][4]. По состоянию на 2025 год, ChatGPT занимает 5-е место среди самых посещаемых сайтов в мире[5][6].

История

undefined

В 2012 году исследовательская группа Торонтоского университета использовала искусственные нейронные сети и методы глубинного обучения, чтобы впервые снизить уровень ошибки ниже 25 % на соревновании ImageNet по распознаванию объектов в компьютерном зрении. Это событие стало катализатором бума ИИ в последующие годы, когда многие выпускники ImageNet стали лидерами индустрии[7][8] В марте 2016 года программа AlphaGo одержала победу над Ли Седолем в матче из пяти игр, впервые победив 9-данного профессионального игрока в го без форы. Этот матч привёл к росту интереса общественности к ИИ. Гонка генеративного ИИ началась в 2016—2017 годах с появлением OpenAI и достижениями в области графических процессоров (GPU), использования масштабных обучающих данных, генеративных состязательных сетей (GAN), моделей диффузии и архитектур трансформеров[9].

В 2018 году инициативой AI Index под эгидой Стэнфордского университета было отмечено ускорение исследований и коммерческих сервисов на основе ИИ. Лидером по количеству опубликованных работ стала Европа, за ней следовали Китай и Северная Америка[10]. Технологии, такие как AlphaFold, позволили точнее предсказывать структуру белков, что может ускорить разработку медикаментов[11]. Экономисты и законодатели стали обсуждать возможное влияние ИИ всё чаще[12].

В ноябре 2022 года компания OpenAI выпустила чат-бот ChatGPT, основанный на большой языковой модели[13]. ChatGPT набрал более 100 млн пользователей за два месяца и, по оценке инвестиционного банка UBS, стал самым быстрорастущим потребительским приложением в истории[14][15]. В то же время получили популярность модели преобразования текста в изображение, такие как DALL-E и Midjourney[16]. Программное обеспечение для синтеза речи также стало способно воспроизводить голоса и манеру речи конкретных людей[17].

Достижения

Биомедицина

В 2020 году программа AlphaFold от DeepMind, предназначенная для предсказания структуры белков, набрала более 90 баллов по глобальному тесту расстояния (GDT)[18]. Структурный биолог и лауреат Нобелевской премии, Венкатраман Рамакришнан, назвал результат «поразительным прорывом» в области белкового свёртывания. Возможность точно предсказывать структуру белков по последовательности аминокислот может ускорить открытие лекарств и обеспечить лучшее понимание болезней[19][20].

Изображения и видео

undefined

Изменённые с помощью ИИ изображения стали широко распространяться после выхода Google DeepDream в 2015 году[21].

Компания OpenAI выпустила DALL-E — модель, способную генерировать изображения по текстовым описаниям, в январе 2021 года[22]. В 2022 году вышла версия DALL-E 2, способная создавать более сложные и реалистичные изображения[23]. Среди других заметных моделей преобразования текста в изображение — NovelAI (2021), Midjourney и Stable Diffusion (обе — 2022)[24][25].

К примеру, платформы текст-видео включают Gen-1 от Runway (февраль 2023) и Sora от OpenAI (декабрь 2024)[26].

Язык

GPT-3 — большая языковая модель, выпущенная OpenAI в 2020 году и способная генерировать текст, близкий по стилю к человеческому[27][28]. Новая версия GPT-4 вышла 14 марта 2023 года и используется в поисковой системе Microsoft Bing[29]. Также появились другие языковые модели — PaLM и Gemini от Google[30] и LLaMA от Meta.

Музыка и голос

В 2016 году Google DeepMind представил модель WaveNet, использующую глубинное обучение для генерации английской, китайской речи и фортепианной музыки[31]. WaveNet показал, что модели глубокого обучения способны синтезировать речь на основе спектральных признаков. За этим последовала Tacotron 2 (2018), доказавшая, что нейросети могут создавать естественную речь, но требуют больших объёмов обучающих данных[32].

В 2020 году был запущен сайт 15.ai — бесплатное веб-приложение для синтеза голоса с помощью ИИ, способное воспроизводить голоса персонажей по коротким аудиозаписям[33]. Его популярность в 2021 году объяснялась способностью синтезировать выразительную речь персонажей из известных видеоигр и мультфильмов[34][35]. 15.ai способствовал популяризации имитации голосов с помощью ИИ в мемах и видеоконтенте[36].

Технология ElevenLabs позволяет загружать образцы голосов и создавать аудио, имитирующее манеру говорящих. После создания спорных материалов с подражанием голосам знаменитостей компания подверглась критике[37].

Влияние

Энергетика

Рост электроэнергии для аппаратных средств ИИ увеличивает нагрузку на электросети, угрожая процессу отказа от ископаемого топлива[38]. Крупные компании, такие как Microsoft, Google и Amazon, инвестируют в атомные электростанции для покрытия этих потребностей.

Культура

Во время бума искусственного интеллекта выделились группы, выступающие как за ускорение развития, так и за приоритет безопасности (AI safety). По данным опроса Pew Research Center (апрель 2025), 43 % американцев считали, что ИИ скорее навредит им в будущем, а 24 % — что принесёт пользу. Женщины опасаются ИИ сильнее мужчин[39].

Бизнес и экономика

undefined

Некоторые экономисты (например, Эрик Бриньолфссон) считают, что текущий бум ИИ может вызвать рост производительности[41]. Другие аналитики, например, Роберт Гордон, настроены скептически[42].

Ведущие ИТ-компании рассматривают бум ИИ и как возможность, и как угрозу; например, Google объединила DeepMind и Google Brain для ускорения исследований в ответ на рост популярности ChatGPT[43]. Капитализация Nvidia — ведущего производителя GPU для обучения моделей ИИ — превысила $3,3 трлн, а 9 июля 2025 года компания преодолела отметку $4 трлн[44][45].

Ресурсы машинного обучения (аппаратные и программные) становятся предметом купли-продажи и доступны как сервисы через облачные платформы[46]. В 2021 году инвестиции в ИИ достигли $119 млрд (по сравнению с $18 млрд в 2014-м), на долю генеративного ИИ пришлось около 30 % инвестиций в 2023 году[47].

Проблемы и ограничения

Основные риски, связанные с бумом ИИ: ошибки, нарушения безопасности, проблемы интеллектуальной собственности[48]. Большие языковые модели критикуют за воспроизведение дискриминационных искажений тренирующих данных[49]. Как технология двойного назначения, ИИ может быть использован злоумышленниками[50]. Усиление ИИ может привести к технологической безработице и волнениям на рынке труда[51].

Доминантность технологических гигантов

Коммерческий рынок ИИ контролируется американскими корпорациями Alphabet Inc., Amazon, Apple Inc., Meta Platforms и Microsoft, инвестиции которых в ИИ превышают объёмы венчурного финансирования в США[52].

Интеллектуальная собственность

Разработчики крупнейших ИТ-компаний, таких как Meta, OpenAI и Nvidia, подверглись искам со стороны правообладателей за использование их работ при обучении моделей[53].

Лик и подражание

ИИ позволяет создавать правдоподобные персональные сообщения, изображения и аудио, что облегчает распространение дезинформации, манипуляций и пропаганды[54].

Окружающая среда

Потребление электроэнергии генеративным ИИ затрудняет достижение компаниями целей по снижению выбросов парниковых газов. С 2019 по 2024 год выбросы Google выросли на 50 %[55].

Биобезопасность и кибербезопасность

ИИ может повышать возможности кибератак, облегчая доступ и масштабирование атак[50][56]. Отдельные эксперты опасаются, что будущие ИИ смогут создавать опасные патогены[57].

Осознанность и риски исчезновения человечества

Некоторые лидеры индустрии подписали Заявление о рисках ИИ, высказывая опасения, что прогрессирующий общий искусственный интеллект может выйти из-под контроля[58][59].

Финансовые риски и угрозы пузыря

Несмотря на крупные инвестиции в ИИ, по оценке MIT, 95 % бизнес-проектов на базе ИИ остаются убыточными[60]. Это порождает опасения по поводу возможного технологического пузыря на рынке[61].

Примечания

Литература

Ссылки