GPT-5
GPT-5 — мультимодальная большая языковая модель, разработанная компанией OpenAI и являющаяся пятой в серии генеративных предварительно обученных трансформеров (GPT). Модель пришла на смену GPT-4 и была официально представлена 7 августа 2025 года, объединив в себе функции для выполнения как задач, требующих рассуждений, так и более простых запросов в едином интерфейсе. На момент выпуска GPT-5 продемонстрировала передовые результаты на различных бенчмарках, ориентированных на большие языковые модели. Модель стала публично доступна для пользователей ChatGPT и Microsoft Copilot, а также для разработчиков через API OpenAI.
Общие сведения
| GPT-5 | |||
|---|---|---|---|
| Тип | Мультимодальная модель, Большая языковая модель, Генеративный предварительно обученный трансформер, Базовая модель | ||
| Разработчик | OpenAI | ||
| Написана на | Python, C++, Java | ||
| Интерфейс | Чат-бот, API | ||
| Движок | Трансформер | ||
| Операционная система | Независимо от ОС (облачный сервис) | ||
| Языки интерфейса | Многоязычный (более 50 языков) | ||
| Первый выпуск | 7 августа 2025 | ||
| Аппаратные платформы | Microsoft Azure и Oracle Cloud | ||
| Последняя версия | GPT-5.1 (12 ноября 2025) | ||
| |||
| |||
| Состояние | активное | ||
| Лицензия | Проприетарное | ||
| Сайт | openai.com/gpt-5 | ||
Предпосылки
В 2018 году OpenAI представила первую модель GPT (GPT-1), опубликовав статью «Улучшение понимания языка посредством генеративного предобучения»[1]. Она была основана на архитектуре трансформеров и обучалась на крупном корпусе книг[2]. В 2019 году вышел GPT-2, более крупная модель, способная к генерации последовательных текстов[3].
В 2020 году OpenAI анонсировала GPT-3, содержащую в 100 раз больше параметров, чем GPT-2, и способную выполнять различные задачи на основе нескольких примеров[4]. GPT-3 была улучшена до InstructGPT, на базе которого в 2022 году появился ChatGPT — основной чат-бот компании. Изначально ChatGPT использовал GPT-3.5, но позднее был переведён на GPT-4, представленный 14 марта 2023 года.
14 апреля 2023 года Сэм Алтман, генеральный директор OpenAI, выступая на мероприятии в MIT, заявил, что компания в тот момент не занимается обучением GPT-5 и «сейчас сосредоточена на доработке GPT-4»[5].
18 июля OpenAI подала заявку на регистрацию товарного знака «GPT-5» в США[6]. 13 ноября Сэм Алтман подтвердил Financial Times, что компания уже приступила к разработке GPT-5[7][8]. В этот период в СМИ появлялись различные спекуляции о будущей модели, в том числе аналитический прогноз Morgan Stanley от марта 2023 года о возможном использовании 25 000 GPU для обучения, который, однако, не являлся официальным заявлением OpenAI и представлял собой стороннюю оценку[9].
По данным The Information, большую часть второй половины 2024 года OpenAI работала над проектом «Orion», который предполагался как GPT-5, но в итоге продукт стал основой GPT-4.5, представленного в феврале 2025 года[10].
В конце июля 2025 года ожидания относительно скорого выпуска GPT-5 усилились[11][12][13]. Стало известно, что до официального релиза не было публичных альфа- или бета-версий, а проводилось закрытое тестирование с участием корпоративных клиентов и партнёров[14][15]. В рамках этой подготовки были обнаружены следы внутренней альфа-версии «gpt-5-reasoning-alpha-2025-07-13»[16], а 30 июля издание The Verge сообщило, что Microsoft уже тестирует новый «умный режим» для Copilot на базе будущей модели[17]. 5 августа, накануне релиза GPT-5, OpenAI анонсировала открытый набор моделей GPT-OSS с функциями рассуждения[18].
6 августа OpenAI анонсировала прямую трансляцию, намекая на презентацию GPT-5, заменив букву «s» в слове «transmissão» на «5»[19][20].
Разработка
Разработка GPT-5, как и других крупных языковых моделей, является результатом работы больших команд исследователей и инженеров OpenAI. Ключевую роль в руководстве проектом играют генеральный директор Сэм Альтман[21], сооснователь Грег Брокман, главный научный сотрудник Марк Чэн и руководитель подразделения «Post Training» Макс Шварцер[22]. В официальной видеопрезентации модели также участвовали Макс Шварцер и один из ключевых исследователей Якуб Пачоки[22]. В сентябре 2025 года OpenAI провела реорганизацию, в ходе которой команда «Model Behavior», отвечавшая за поведенческие характеристики ИИ, была интегрирована в более крупное подразделение «Post Training» под руководством Шварцера для лучшей координации с основными техническими разработками[22].
Исходный код модели GPT-5 является закрытым, так как она представляет собой проприетарный продукт. Доступ к ней предоставляется через API и интегрированные платформы, такие как Microsoft Azure и GitHub Models[23][24]. Для демонстрации возможностей модели в области программирования OpenAI создала публичный репозиторий на GitHub под названием `gpt-5-coding-examples`, который содержит коллекцию приложений, полностью сгенерированных с помощью GPT-5, но не исходный код самой модели[25]. Эта инициатива отличается от других проектов компании, в рамках которых были выпущены модели с открытыми весами, например, `gpt-oss-120b`, не связанные напрямую с GPT-5[26]. Модель также интегрирована в инструменты для разработчиков, в частности в GitHub Copilot[27].
История версий
Первый официальный выпуск GPT-5 состоялся 7 августа 2025 года[28][29]. Модель стала доступна для всех пользователей ChatGPT, включая бесплатные тарифы, а также для подписчиков планов Plus, Pro и Team[30]. Ключевой особенностью стал унифицированный интерфейс с интеллектуальным маршрутизатором, который автоматически определяет сложность запроса и выбирает между быстрым ответом и более глубоким режимом «размышлений»[31][32].
На момент запуска GPT-5 была представлена как семейство моделей[33]. Для разработчиков через API стали доступны варианты gpt-5, gpt-5-mini и gpt-5-nano[28], а для платных подписчиков была предложена версия GPT-5 Pro для решения особо сложных задач[31].
12 ноября 2025 года OpenAI выпустила обновление под названием GPT-5.1, направленное на улучшение интеллекта и стиля общения модели[34][35]. Развёртывание началось с платных пользователей (Pro, Plus, Go, Business), после чего доступ был постепенно открыт для всех[36].
В рамках обновления были представлены две основные улучшенные версии[37]:
- GPT-5.1 Instant — оптимизирована для быстрых ответов и повседневных задач. Модель описывается как более «тёплая» в общении, игривая и лучше следующая инструкциям[34][38].
- GPT-5.1 Thinking — предназначена для сложных аналитических задач. Она более эффективно распределяет ресурсы, затрачивая больше времени на сложные запросы, а её ответы стали менее жаргонными и более «человечными»[34].
После выхода обновления предыдущие версии GPT-5 остались доступны для платных подписчиков в течение трёх месяцев для сравнения и адаптации[34][37].
Возможности
На момент выпуска GPT-5 показал ведущие результаты в бенчмарках по математике, программированию и мультимодальному восприятию[39]. Среди ключевых улучшений — более быстрые ответы, улучшенные возможности по кодингу и письму, более точные ответы на медицинские вопросы и меньшая склонность к галлюцинациям[40][41][42]. В сравнении с предыдущими моделями, GPT-5 рассчитан на предоставление более «безопасных выводов» по потенциально чувствительным запросам, а не на их абсолютное отклонение[43], что позволяет моделью отвечать на безопасные вопросы и отклонять лишь по-настоящему рискованные запросы[44]. Также были отмечены более критические и менее «вежливо-податливые» ответы модели по сравнению с предыдущими версиями[45][46].
Некоторые ранние тестировщики отметили значительный прогресс в программировании и решении задач по сравнению с GPT-4, хотя изменения не были столь революционны, как при переходе от GPT-3 к GPT-4[47]. Накануне релиза Сэм Алтман описал GPT-5 как «существенный шаг на пути к ИИ общего назначения (AGI)»[48], подразумевая способность выполнять любую экономически полезную задачу на уровне человека[49]. По его словам, GPT-5 обладает «докторским уровнем» решений в широком диапазоне задач[50].
GPT-5 является нативной мультимодальной системой, способной одновременно обрабатывать различные типы данных: текст, изображения, аудио и видео[51][52]. Модель поддерживает контекстное окно размером до 400 000 токенов при использовании через API, из которых 272 000 токенов могут быть использованы для входных данных, а 128 000 — для выходных[53][54].
На вход модель может принимать[55][56]:
- Текстовые документы (например, .txt, .pdf, .docx);
- Изображения (например, .jpeg, .png);
- Табличные данные (например, .csv, .xlsx);
- Аудио- и видеофайлы.
На выходе GPT-5 может генерировать:
- Текст, включая форматирование Markdown;
- Структурированные данные в формате JSON[57];
- Исходный код на различных языках программирования.
При этом генерация файлов в форматах, отличных от простого текста (например, .csv или .xlsx), происходит не напрямую, а с помощью внешних инструментов, таких как интерпретатор кода, который выполняет инструкции модели[58].
Потребление энергии GPT-5 официально не раскрывается; по данным исследователей Университета Род-Айленда, один средний ответ требует чуть более 18 ватт-часов энергии, что эквивалентно работе лампы накаливания около 18 минут[59].
GPT-5 представляет собой не единую монолитную модель, а семейство взаимосвязанных моделей, основанных на архитектуре Трансформер. Система сочетает в себе быстрый базовый модуль, расширенные модули для рассуждений и интеллектуальный маршрутизатор, который автоматически определяет, какой компонент задействовать в зависимости от задачи пользователя[60][61]. Такой подход к унификации был реализован после того, как Сэм Альтман ранее критиковал необходимость ручного переключения между моделями[62].
Семейство моделей включает варианты, оптимизированные для разных целей. Для разработчиков через API доступны gpt-5, gpt-5-mini и gpt-5-nano для быстрых и высокопроизводительных операций. Для сложных задач, требующих глубокого анализа, предназначены «размышляющие» модели (англ. thinking models)[63], а платным подписчикам была предложена версия GPT-5 Pro. Модель также реализует «агентную» функциональность, позволяя создавать собственную рабочую среду и использовать инструменты для выполнения задач[63].
12 ноября 2025 года OpenAI выпустила обновление GPT-5.1, в рамках которого были представлены две основные улучшенные версии:
- GPT-5.1 Instant — оптимизирована для быстрых ответов и повседневных задач. Модель описывается как более «тёплая» в общении, игривая и лучше следующая инструкциям.
- GPT-5.1 Thinking — предназначена для сложных аналитических задач. Она более эффективно распределяет ресурсы, затрачивая больше времени на сложные запросы, а её ответы стали менее жаргонными и более «человечными».
Ограничения
Компания Neuraltrust (обеспечение безопасности) заявила, что смогла скомпрометировать GPT-5 в первый же день тестирования[64][65]. По их отчёту, это позволило получить от GPT-5 инструкции по изготовлению взрывных устройств[64][65]. Похожие выводы по вопросу безопасности модели сделал и независимый исследователь SPLX[64][65]; ряд оценок свидетельствуют о значительных пробелах в обеспечении безопасности, особенно для корпоративного использования[64][65].
В обновлении GPT-5.1, выпущенном в ноябре 2025 года, особое внимание было уделено ментальному здоровью пользователей. Модель была обучена распознавать и осторожно реагировать на ситуации, в которых пользователь может развить эмоциональную зависимость от чат-бота[66].
Обучение
Согласно Research AIMultiple[67], опубликованная статья отмечает: «Нативное мультимодальное обучение с самого начала…». В работе, размещённой на arXiv[68], нативное мультимодальное обучение определяется как тренировка моделей с нуля сразу по всем модальностям — без использования заранее обученных языковых и визуальных компонентов.
Далее, по данным AIMultiple[67], в разделе о процессе обучения указано: «GPT-5 обучался комбинацией неконтролируемого предварительного обучения, супервизорного дообучения и RLHF…». На этапе предварительного обучения использовался обширный многоязычный корпус книг, статей, кода, страниц web, научных работ и лицензированных наборов данных. В отличие от GPT-4, визуальные способности GPT-5 прорабатывались параллельно с текстовыми с самого начала[69].
GPT-5 характеризуется как нативно мультимодальная система: она обучалась сразу по нескольким модальностям (текст, изображения и т. д.) без дообучения от других моделей. Процесс включал три этапа: предварительное несупервизорное обучение, супервизорное дообучение и RLHF. Предобучение проводилось на огромном многоязычном массиве данных — книги, статьи, лицензированные источники и др. В отличие от GPT-4, визуальные и текстовые возможности в GPT-5 создавались в рамках единой архитектуры.
Для обучения модели использовалась специализированная высокопроизводительная инфраструктура. Исторически основным партнёром OpenAI является Microsoft, и GPT-5 обучалась на суперкомпьютерных кластерах Microsoft Azure[70]. Для удовлетворения растущих потребностей в вычислительных мощностях OpenAI расширила сотрудничество, задействовав также Oracle Cloud для масштабирования операций[71]. Основу вычислительной мощности составляют графические процессоры от Nvidia, включая такие модели, как H200 и B200[72].
Использование
GPT-5 применяется в ChatGPT. Хотя базовая версия доступна всем пользователям ChatGPT бесплатно[73], подписчики Plus получают повышенные лимиты, а Pro — неограниченный доступ и доступ к версии GPT-5 Pro. Для пользователей базового уровня без подписки действуют ограничения по числу ответов в час. C запуском GPT-5 в ChatGPT был введён «Voice», заменяющий старый «Режим расширенного голоса»[74], который с 9 сентября 2025 года станет основным для всех пользователей ChatGPT.
С обновлениями в интерфейс ChatGPT были добавлены новые функции для управления взаимодействием с моделью. Появился режим «Deep Research», позволяющий ИИ проводить углублённый анализ информации из множества интернет-источников для ответа на сложные вопросы. Пользователи также получили возможность настраивать тональность ответов, выбирая из предустановленных стилей, таких как «дружелюбный», «профессиональный» или «откровенный», а также регулировать краткость и использование эмодзи[35][75]. Кроме того, была реализована интеграция с сервисами Gmail и Google Календарь для лучшего понимания контекста задач пользователя[76].
GPT-5 реализован и в Microsoft Copilot, где для его использования необходимо выбрать режим «Интеллектуальный» (англ. Smart GPT-5)[77], а Microsoft подтверждала его интеграцию в широкий спектр своих сервисов[78]. Компания Apple также планирует использовать GPT-5 в Apple Intelligence в iOS 26, iPadOS 26 и macOS Tahoe[79][80]. Доступ к GPT-5 реализован и через API OpenAI[81].
Некоторые крупные компании США получили ранний доступ к GPT-5 до официального релиза: частная медицинская страховая компания Oscar Health тестировала модель для проверки заявок[82]. Uber использовал модель для автоматизации поддержки клиентов, GitLab, Windsurf и Cursor — для софтверной разработки, а испанский банк BBVA — для финансовой аналитики[82]. Также OpenAI указывала среди ранних пользователей Amgen, Lowe's и Notion[82].
Интерфейс ChatGPT официально поддерживает более 50 языков[83]. По состоянию на ноябрь 2025 года в их число входят[84]:
- албанский
- амхарский
- арабский
- армянский
- бенгальский
- бирманский
- боснийский
- болгарский
- венгерский
- вьетнамский
- голландский
- греческий
- грузинский
- гуджарати
- датский
- индонезийский
- исландский
- испанский
- итальянский
- каннада
- казахский
- каталанский
- китайский
- корейский
- латышский
- литовский
- македонский
- малайский
- малаялам
- маратхи
- монгольский
- немецкий
- норвежский
- панджаби
- персидский
- польский
- португальский
- румынский
- русский
- сербский
- словацкий
- словенский
- сомалийский
- суахили
- тагальский
- тайский
- тамильский
- телугу
- турецкий
- украинский
- урду
- финский
- французский
- хинди
- хорватский
- чешский
- шведский
- эстонский
- японский
При этом сама модель способна понимать и отвечать на более чем 95 языках, даже если для них нет официальной локализации интерфейса[83].
14 октября Сэм Альтман сообщил, что в декабре пользователи, прошедшие проверку на возраст, получат доступ к менее цензурированной версии чат-бота, включая эротические материалы. Ранее OpenAI запрещала подобный контент, аргументируя это заботой о психическом здоровье пользователей[85].
«Теперь, когда нам удалось смягчить серьезные проблемы с психическим здоровьем и получить новые инструменты, мы сможем безопасно ослабить ограничения в большинстве случаев. Мы уделяем большое внимание тому, чтобы обращаться со взрослыми людьми как со взрослыми», — Сэм Альтман в X[85][86][87].
Восприятие
Грейс Хаккинс в MIT Technology Review отмечала, что «если о1 был настоящим технологическим скачком, то GPT-5 — в первую очередь доработанный продукт». По её словам, он делает пользовательский опыт более плавным и приятным, однако пока далёк от революционных ожиданий в сфере искусственного интеллекта[88].
В The Information Стефани Палаззоло особо выделила возможности GPT-5 в программировании[13].
Маттео Вонг на портале The Atlantic отмечал интуитивность, быстродействие, эффективность, лёгкость пользовательской настройки и гибкость GPT-5[89].
Джон Херрман из New York писал, что для обычных пользователей самой ChatGPT изменения покажутся минимальными, тогда как профессионалы почувствуют заметную разницу[90].
Кристиан де Лупер (Mashable) выделил главным нововведением GPT-5 создание интерактивных приложений на основе простых текстовых запросов[91].
Кайл Орланд (Ars Technica) отмечал, что по сравнению с GPT-4o у GPT-5 ответы стали короче и менее детализированными[92].
Новый маршрутизатор GPT-5, автоматически переключающий режимы в зависимости от задач, был раскритикован за непредсказуемость качества: многие жаловались, что GPT-5 иногда уступает GPT-4o[93][94][95][96]. Cэм Алтман заявил, что причиной этого был сбой автоматического переключателя моделей в день запуска, пообещав скорое устранение проблемы[93].
Некоторые критиковали исчезновение старых моделей GPT в ChatGPT для обычных пользователей[49][62] и снижение контроля: теперь система выбирает режим за пользователя, снижая гибкость[97]. В ответ в сервисе X (бывш. Twitter) Алтман пообещал вернуть выбор и следить за активностью, чтобы определить, как долго поддерживать старые модели[97][98].
Часть пользователей отмечала более «сухой» и «безэмоциональный» стиль GPT-5 по сравнению с GPT-4o и ассоциировали его с «перегруженной секретаршей»[99]. Алтман признал эту обратную связь и пообещал улучшить «личность» GPT-5; соответствующее обновление было выпущено 15 августа 2025 года[100][101].
Алтмана также критиковали за завышенные ожидания относительно возможностей GPT-5[102][103][104], а также за излишне высокие ожидания на фоне сравнений с «проектом Манхэттен» и эмоциональных высказываний[89][105][106][107].