GPT-5

GPT-5 — мульти­модальная большая языковая модель, разработанная компанией OpenAI и являющаяся пятой в серии генеративных предварительно обученных трансформеров (GPT). Модель пришла на смену GPT-4 и была официально представлена 7 августа 2025 года, объединив в себе функции для выполнения как задач, требующих рассуждений, так и более простых запросов в едином интерфейсе. На момент выпуска GPT-5 продемонстрировала передовые результаты на различных бенчмарках, ориентированных на большие языковые модели. Модель стала публично доступна для пользователей ChatGPT и Microsoft Copilot, а также для разработчиков через API OpenAI.

Общие сведения
GPT-5
Тип Мультимодальная модель, Большая языковая модель, Генеративный предварительно обученный трансформер, Базовая модель
Разработчик OpenAI
Написана на Python, C++, Java
Интерфейс Чат-бот, API
Движок Трансформер
Операционная система Независимо от ОС (облачный сервис)
Языки интерфейса Многоязычный (более 50 языков)
Первый выпуск 7 августа 2025
Аппаратные платформы Microsoft Azure и Oracle Cloud
Последняя версия GPT-5.1 (12 ноября 2025)
Состояние активное
Лицензия Проприетарное
Сайт openai.com/gpt-5

Предпосылки

В 2018 году OpenAI представила первую модель GPT (GPT-1), опубликовав статью «Улучшение понимания языка посредством генеративного предобучения»[1]. Она была основана на архитектуре трансформеров и обучалась на крупном корпусе книг[2]. В 2019 году вышел GPT-2, более крупная модель, способная к генерации последовательных текстов[3].

В 2020 году OpenAI анонсировала GPT-3, содержащую в 100 раз больше параметров, чем GPT-2, и способную выполнять различные задачи на основе нескольких примеров[4]. GPT-3 была улучшена до InstructGPT, на базе которого в 2022 году появился ChatGPT — основной чат-бот компании. Изначально ChatGPT использовал GPT-3.5, но позднее был переведён на GPT-4, представленный 14 марта 2023 года.

14 апреля 2023 года Сэм Алтман, генеральный директор OpenAI, выступая на мероприятии в MIT, заявил, что компания в тот момент не занимается обучением GPT-5 и «сейчас сосредоточена на доработке GPT-4»[5].

18 июля OpenAI подала заявку на регистрацию товарного знака «GPT-5» в США[6]. 13 ноября Сэм Алтман подтвердил Financial Times, что компания уже приступила к разработке GPT-5[7][8]. В этот период в СМИ появлялись различные спекуляции о будущей модели, в том числе аналитический прогноз Morgan Stanley от марта 2023 года о возможном использовании 25 000 GPU для обучения, который, однако, не являлся официальным заявлением OpenAI и представлял собой стороннюю оценку[9].

По данным The Information, большую часть второй половины 2024 года OpenAI работала над проектом «Orion», который предполагался как GPT-5, но в итоге продукт стал основой GPT-4.5, представленного в феврале 2025 года[10].

В конце июля 2025 года ожидания относительно скорого выпуска GPT-5 усилились[11][12][13]. Стало известно, что до официального релиза не было публичных альфа- или бета-версий, а проводилось закрытое тестирование с участием корпоративных клиентов и партнёров[14][15]. В рамках этой подготовки были обнаружены следы внутренней альфа-версии «gpt-5-reasoning-alpha-2025-07-13»[16], а 30 июля издание The Verge сообщило, что Microsoft уже тестирует новый «умный режим» для Copilot на базе будущей модели[17]. 5 августа, накануне релиза GPT-5, OpenAI анонсировала открытый набор моделей GPT-OSS с функциями рассуждения[18].

6 августа OpenAI анонсировала прямую трансляцию, намекая на презентацию GPT-5, заменив букву «s» в слове «transmissão» на «5»[19][20].

Разработка

Разработка GPT-5, как и других крупных языковых моделей, является результатом работы больших команд исследователей и инженеров OpenAI. Ключевую роль в руководстве проектом играют генеральный директор Сэм Альтман[21], сооснователь Грег Брокман, главный научный сотрудник Марк Чэн и руководитель подразделения «Post Training» Макс Шварцер[22]. В официальной видеопрезентации модели также участвовали Макс Шварцер и один из ключевых исследователей Якуб Пачоки[22]. В сентябре 2025 года OpenAI провела реорганизацию, в ходе которой команда «Model Behavior», отвечавшая за поведенческие характеристики ИИ, была интегрирована в более крупное подразделение «Post Training» под руководством Шварцера для лучшей координации с основными техническими разработками[22].

Исходный код модели GPT-5 является закрытым, так как она представляет собой проприетарный продукт. Доступ к ней предоставляется через API и интегрированные платформы, такие как Microsoft Azure и GitHub Models[23][24]. Для демонстрации возможностей модели в области программирования OpenAI создала публичный репозиторий на GitHub под названием `gpt-5-coding-examples`, который содержит коллекцию приложений, полностью сгенерированных с помощью GPT-5, но не исходный код самой модели[25]. Эта инициатива отличается от других проектов компании, в рамках которых были выпущены модели с открытыми весами, например, `gpt-oss-120b`, не связанные напрямую с GPT-5[26]. Модель также интегрирована в инструменты для разработчиков, в частности в GitHub Copilot[27].

История версий

GPT-5

Первый официальный выпуск GPT-5 состоялся 7 августа 2025 года[28][29]. Модель стала доступна для всех пользователей ChatGPT, включая бесплатные тарифы, а также для подписчиков планов Plus, Pro и Team[30]. Ключевой особенностью стал унифицированный интерфейс с интеллектуальным маршрутизатором, который автоматически определяет сложность запроса и выбирает между быстрым ответом и более глубоким режимом «размышлений»[31][32].

На момент запуска GPT-5 была представлена как семейство моделей[33]. Для разработчиков через API стали доступны варианты gpt-5, gpt-5-mini и gpt-5-nano[28], а для платных подписчиков была предложена версия GPT-5 Pro для решения особо сложных задач[31].

GPT-5.1

12 ноября 2025 года OpenAI выпустила обновление под названием GPT-5.1, направленное на улучшение интеллекта и стиля общения модели[34][35]. Развёртывание началось с платных пользователей (Pro, Plus, Go, Business), после чего доступ был постепенно открыт для всех[36].

В рамках обновления были представлены две основные улучшенные версии[37]:

  • GPT-5.1 Instant — оптимизирована для быстрых ответов и повседневных задач. Модель описывается как более «тёплая» в общении, игривая и лучше следующая инструкциям[34][38].
  • GPT-5.1 Thinking — предназначена для сложных аналитических задач. Она более эффективно распределяет ресурсы, затрачивая больше времени на сложные запросы, а её ответы стали менее жаргонными и более «человечными»[34].

После выхода обновления предыдущие версии GPT-5 остались доступны для платных подписчиков в течение трёх месяцев для сравнения и адаптации[34][37].

Возможности

На момент выпуска GPT-5 показал ведущие результаты в бенчмарках по математике, программированию и мультимодальному восприятию[39]. Среди ключевых улучшений — более быстрые ответы, улучшенные возможности по кодингу и письму, более точные ответы на медицинские вопросы и меньшая склонность к галлюцинациям[40][41][42]. В сравнении с предыдущими моделями, GPT-5 рассчитан на предоставление более «безопасных выводов» по потенциально чувствительным запросам, а не на их абсолютное отклонение[43], что позволяет моделью отвечать на безопасные вопросы и отклонять лишь по-настоящему рискованные запросы[44]. Также были отмечены более критические и менее «вежливо-податливые» ответы модели по сравнению с предыдущими версиями[45][46].

Некоторые ранние тестировщики отметили значительный прогресс в программировании и решении задач по сравнению с GPT-4, хотя изменения не были столь революционны, как при переходе от GPT-3 к GPT-4[47]. Накануне релиза Сэм Алтман описал GPT-5 как «существенный шаг на пути к ИИ общего назначения (AGI)»[48], подразумевая способность выполнять любую экономически полезную задачу на уровне человека[49]. По его словам, GPT-5 обладает «докторским уровнем» решений в широком диапазоне задач[50].

GPT-5 является нативной мультимодальной системой, способной одновременно обрабатывать различные типы данных: текст, изображения, аудио и видео[51][52]. Модель поддерживает контекстное окно размером до 400 000 токенов при использовании через API, из которых 272 000 токенов могут быть использованы для входных данных, а 128 000 — для выходных[53][54].

На вход модель может принимать[55][56]:

  • Текстовые документы (например, .txt, .pdf, .docx);
  • Изображения (например, .jpeg, .png);
  • Табличные данные (например, .csv, .xlsx);
  • Аудио- и видеофайлы.

На выходе GPT-5 может генерировать:

  • Текст, включая форматирование Markdown;
  • Структурированные данные в формате JSON[57];
  • Исходный код на различных языках программирования.

При этом генерация файлов в форматах, отличных от простого текста (например, .csv или .xlsx), происходит не напрямую, а с помощью внешних инструментов, таких как интерпретатор кода, который выполняет инструкции модели[58].

Потребление энергии GPT-5 официально не раскрывается; по данным исследователей Университета Род-Айленда, один средний ответ требует чуть более 18 ватт-часов энергии, что эквивалентно работе лампы накаливания около 18 минут[59].

Архитектура

GPT-5 представляет собой не единую монолитную модель, а семейство взаимосвязанных моделей, основанных на архитектуре Трансформер. Система сочетает в себе быстрый базовый модуль, расширенные модули для рассуждений и интеллектуальный маршрутизатор, который автоматически определяет, какой компонент задействовать в зависимости от задачи пользователя[60][61]. Такой подход к унификации был реализован после того, как Сэм Альтман ранее критиковал необходимость ручного переключения между моделями[62].

Семейство моделей включает варианты, оптимизированные для разных целей. Для разработчиков через API доступны gpt-5, gpt-5-mini и gpt-5-nano для быстрых и высокопроизводительных операций. Для сложных задач, требующих глубокого анализа, предназначены «размышляющие» модели (англ. thinking models)[63], а платным подписчикам была предложена версия GPT-5 Pro. Модель также реализует «агентную» функциональность, позволяя создавать собственную рабочую среду и использовать инструменты для выполнения задач[63].

12 ноября 2025 года OpenAI выпустила обновление GPT-5.1, в рамках которого были представлены две основные улучшенные версии:

  • GPT-5.1 Instant — оптимизирована для быстрых ответов и повседневных задач. Модель описывается как более «тёплая» в общении, игривая и лучше следующая инструкциям.
  • GPT-5.1 Thinking — предназначена для сложных аналитических задач. Она более эффективно распределяет ресурсы, затрачивая больше времени на сложные запросы, а её ответы стали менее жаргонными и более «человечными».
undefined

Ограничения

Безопасность

Компания Neuraltrust (обеспечение безопасности) заявила, что смогла скомпрометировать GPT-5 в первый же день тестирования[64][65]. По их отчёту, это позволило получить от GPT-5 инструкции по изготовлению взрывных устройств[64][65]. Похожие выводы по вопросу безопасности модели сделал и независимый исследователь SPLX[64][65]; ряд оценок свидетельствуют о значительных пробелах в обеспечении безопасности, особенно для корпоративного использования[64][65].

В обновлении GPT-5.1, выпущенном в ноябре 2025 года, особое внимание было уделено ментальному здоровью пользователей. Модель была обучена распознавать и осторожно реагировать на ситуации, в которых пользователь может развить эмоциональную зависимость от чат-бота[66].

Обучение

Согласно Research AIMultiple[67], опубликованная статья отмечает: «Нативное мультимодальное обучение с самого начала…». В работе, размещённой на arXiv[68], нативное мультимодальное обучение определяется как тренировка моделей с нуля сразу по всем модальностям — без использования заранее обученных языковых и визуальных компонентов.

Далее, по данным AIMultiple[67], в разделе о процессе обучения указано: «GPT-5 обучался комбинацией не­контролируемого предварительного обучения, супервизорного дообучения и RLHF…». На этапе предварительного обучения использовался обширный многоязычный корпус книг, статей, кода, страниц web, научных работ и лицензированных наборов данных. В отличие от GPT-4, визуальные способности GPT-5 прорабатывались параллельно с текстовыми с самого начала[69].

GPT-5 характеризуется как нативно мультимодальная система: она обучалась сразу по нескольким модальностям (текст, изображения и т. д.) без дообучения от других моделей. Процесс включал три этапа: предварительное несупер­визорное обучение, супервизорное дообучение и RLHF. Предобучение проводилось на огромном многоязычном массиве данных — книги, статьи, лицензированные источники и др. В отличие от GPT-4, визуальные и текстовые возможности в GPT-5 создавались в рамках единой архитектуры.

Для обучения модели использовалась специализированная высокопроизводительная инфраструктура. Исторически основным партнёром OpenAI является Microsoft, и GPT-5 обучалась на суперкомпьютерных кластерах Microsoft Azure[70]. Для удовлетворения растущих потребностей в вычислительных мощностях OpenAI расширила сотрудничество, задействовав также Oracle Cloud для масштабирования операций[71]. Основу вычислительной мощности составляют графические процессоры от Nvidia, включая такие модели, как H200 и B200[72].

Использование

GPT-5 применяется в ChatGPT. Хотя базовая версия доступна всем пользователям ChatGPT бесплатно[73], подписчики Plus получают повышенные лимиты, а Pro — неограниченный доступ и доступ к версии GPT-5 Pro. Для пользователей базового уровня без подписки действуют ограничения по числу ответов в час. C запуском GPT-5 в ChatGPT был введён «Voice», заменяющий старый «Режим расширенного голоса»[74], который с 9 сентября 2025 года станет основным для всех пользователей ChatGPT.

С обновлениями в интерфейс ChatGPT были добавлены новые функции для управления взаимодействием с моделью. Появился режим «Deep Research», позволяющий ИИ проводить углублённый анализ информации из множества интернет-источников для ответа на сложные вопросы. Пользователи также получили возможность настраивать тональность ответов, выбирая из предустановленных стилей, таких как «дружелюбный», «профессиональный» или «откровенный», а также регулировать краткость и использование эмодзи[35][75]. Кроме того, была реализована интеграция с сервисами Gmail и Google Календарь для лучшего понимания контекста задач пользователя[76].

GPT-5 реализован и в Microsoft Copilot, где для его использования необходимо выбрать режим «Интеллектуальный» (англ. Smart GPT-5)[77], а Microsoft подтверждала его интеграцию в широкий спектр своих сервисов[78]. Компания Apple также планирует использовать GPT-5 в Apple Intelligence в iOS 26, iPadOS 26 и macOS Tahoe[79][80]. Доступ к GPT-5 реализован и через API OpenAI[81].

Некоторые крупные компании США получили ранний доступ к GPT-5 до официального релиза: частная медицинская страховая компания Oscar Health тестировала модель для проверки заявок[82]. Uber использовал модель для автоматизации поддержки клиентов, GitLab, Windsurf и Cursor — для софтверной разработки, а испанский банк BBVA — для финансовой аналитики[82]. Также OpenAI указывала среди ранних пользователей Amgen, Lowe's и Notion[82].

Интерфейс ChatGPT официально поддерживает более 50 языков[83]. По состоянию на ноябрь 2025 года в их число входят[84]:

  • албанский
  • амхарский
  • арабский
  • армянский
  • бенгальский
  • бирманский
  • боснийский
  • болгарский
  • венгерский
  • вьетнамский
  • голландский
  • греческий
  • грузинский
  • гуджарати
  • датский
  • индонезийский
  • исландский
  • испанский
  • итальянский
  • каннада
  • казахский
  • каталанский
  • китайский
  • корейский
  • латышский
  • литовский
  • македонский
  • малайский
  • малаялам
  • маратхи
  • монгольский
  • немецкий
  • норвежский
  • панджаби
  • персидский
  • польский
  • португальский
  • румынский
  • русский
  • сербский
  • словацкий
  • словенский
  • сомалийский
  • суахили
  • тагальский
  • тайский
  • тамильский
  • телугу
  • турецкий
  • украинский
  • урду
  • финский
  • французский
  • хинди
  • хорватский
  • чешский
  • шведский
  • эстонский
  • японский

При этом сама модель способна понимать и отвечать на более чем 95 языках, даже если для них нет официальной локализации интерфейса[83].

Смягчение контентной политики

14 октября Сэм Альтман сообщил, что в декабре пользователи, прошедшие проверку на возраст, получат доступ к менее цензурированной версии чат-бота, включая эротические материалы. Ранее OpenAI запрещала подобный контент, аргументируя это заботой о психическом здоровье пользователей[85].

«Теперь, когда нам удалось смягчить серьезные проблемы с психическим здоровьем и получить новые инструменты, мы сможем безопасно ослабить ограничения в большинстве случаев. Мы уделяем большое внимание тому, чтобы обращаться со взрослыми людьми как со взрослыми», — Сэм Альтман в X[85][86][87].

Восприятие

Критика и оценки

Грейс Хаккинс в MIT Technology Review отмечала, что «если о1 был настоящим технологическим скачком, то GPT-5 — в первую очередь доработанный продукт». По её словам, он делает пользовательский опыт более плавным и приятным, однако пока далёк от революционных ожиданий в сфере искусственного интеллекта[88].

В The Information Стефани Палаззоло особо выделила возможности GPT-5 в программировании[13].

Маттео Вонг на портале The Atlantic отмечал интуитивность, быстродействие, эффективность, лёгкость пользовательской настройки и гибкость GPT-5[89].

Джон Херрман из New York писал, что для обычных пользователей самой ChatGPT изменения покажутся минимальными, тогда как профессионалы почувствуют заметную разницу[90].

Кристиан де Лупер (Mashable) выделил главным нововведением GPT-5 создание интерактивных приложений на основе простых текстовых запросов[91].

Кайл Орланд (Ars Technica) отмечал, что по сравнению с GPT-4o у GPT-5 ответы стали короче и менее детализированными[92].

Реакция пользователей

Новый маршрутизатор GPT-5, автоматически переключающий режимы в зависимости от задач, был раскритикован за непредсказуемость качества: многие жаловались, что GPT-5 иногда уступает GPT-4o[93][94][95][96]. Cэм Алтман заявил, что причиной этого был сбой автоматического переключателя моделей в день запуска, пообещав скорое устранение проблемы[93].

Некоторые критиковали исчезновение старых моделей GPT в ChatGPT для обычных пользователей[49][62] и снижение контроля: теперь система выбирает режим за пользователя, снижая гибкость[97]. В ответ в сервисе X (бывш. Twitter) Алтман пообещал вернуть выбор и следить за активностью, чтобы определить, как долго поддерживать старые модели[97][98].

Часть пользователей отмечала более «сухой» и «безэмоциональный» стиль GPT-5 по сравнению с GPT-4o и ассоциировали его с «перегруженной секретаршей»[99]. Алтман признал эту обратную связь и пообещал улучшить «личность» GPT-5; соответствующее обновление было выпущено 15 августа 2025 года[100][101].

Алтмана также критиковали за завышенные ожидания относительно возможностей GPT-5[102][103][104], а также за излишне высокие ожидания на фоне сравнений с «проектом Манхэттен» и эмоциональных высказываний[89][105][106][107].

Примечания