GPT-4o
GPT-4o (буква «o» — от английского omni) — многоязычная мультимодальная генеративная предварительно обученная трансформер-модель, разработанная компанией OpenAI и выпущенная в мае 2024 года[1]. GPT-4o может воспринимать и генерировать текст, изображения и аудио[2][3].
После запуска GPT-4o была доступна бесплатно в ChatGPT, при этом у платных подписчиков были увеличены лимиты использования[4]. В августе 2025 года GPT-4o была удалена из ChatGPT после выхода GPT-5, однако под давлением пользователей OpenAI вскоре вернула её для платных подписчиков[5]. С 13 февраля 2026 года OpenAI окончательно прекратила поддержку GPT-4o[6].
Функции генерации аудио в GPT-4o используются в режиме Advanced Voice Mode[7]. 18 июля 2024 года OpenAI выпустила GPT-4o mini — облегчённую версию, пришедшую на смену GPT-3.5 Turbo в интерфейсе ChatGPT[8]. Возможность генерации изображений появилась в марте 2025 года, когда GPT-4o заменила DALL-E 3 в ChatGPT[9].
Общие сведения
| GPT-4o | |
|---|---|
| Тип | мультимодальная система, Большая языковая модель, Генеративный предварительно обученный трансформер, Фундаментальная модель |
| Разработчик | OpenAI |
| Первый выпуск | май 2024 |
| Бета-версия | ChatGPT-4o-latest (2025-03-26) (26 марта 2025) |
| Лицензия | проприетарная |
| Сайт | openai.com/index/hello-g… |
| GPT Image 1 | |
|---|---|
| Тип | Генерация изображений по тексту |
| Разработчик | OpenAI |
| Первый выпуск | 25 марта 2025 |
| Лицензия | проприетарная |
| Сайт | openai.com/index/… (англ.) |
Предыстория
Несколько версий GPT-4o первоначально были тайно размещены под разными именами в соревнованиях LMSYS Chatbot Arena как три разных модели: gpt2-chatbot, im-a-good-gpt2-chatbot и im-also-a-good-gpt2-chatbot[10]. 7 мая 2024 года генеральный директор OpenAI Сэм Альтман опубликовал в соцсети X твит «im-a-good-gpt2-chatbot», что многие расценили как подтверждение тестирования новых моделей OpenAI[11][12].
Возможности
На момент релиза в мае 2024 года GPT-4o продемонстрировала передовые результаты в распознавании голоса, мультиязычных и визуальных тестах, установила рекорды по распознаванию и переводу устной речи[13][14][15]. На тесте MMLU (Massive Multitask Language Understanding) модель набрала 88,7 баллов против 86,5 у GPT-4[16]. В отличие от предшественников (GPT-3.5 и GPT-4), для работы с аудио не нужны промежуточные модели: GPT-4o поддерживает режим голос-голос напрямую[16] Режим Advanced Voice Mode вышел с задержкой, в сентябре 2024 года для подписчиков Plus и Team.[17]. 1 октября 2024 года представлено Realtime API[18].
На старте GPT-4o поддерживала более 50 языков[1], что, по данным OpenAI, покрывает более 97 % всех носителей[19]. Мира Мурати публично продемонстрировала перевод с итальянского на английский и обратно на презентации 13 мая 2024 года. Новый токенизатор[20] расходует меньше токенов в ряде языков, в особенности для не-латинских алфавитов, что делает работу с ними дешевле[16]
Знания GPT-4o основаны на данных до октября 2023 года,[21][22]. однако при необходимости может привлекать актуальную информацию из Интернета. Максимальный контекст составляет 128 тысяч токенов[21].
В августе 2024 года OpenAI объявила о новой возможности для корпоративных клиентов — кастомизации GPT-4o под задачи компании с помощью загрузки внутренних данных (fine-tuning). Такой подход позволяет адаптировать модель для конкретных бизнес-процессов, автоматизации поддержки или экспертных систем. Ранее fine-tuning поддерживался только для более простой GPT-4o mini[23][24].
Обучение кастомизированной модели проводится на серверах OpenAI и длится от одного до двух часов. Запуск корпоративного fine-tuning нацелен на снижение трудозатрат и увеличение внедряемости ИИ-решений в бизнесе[23][25].
GPT-4o mini
18 июля 2024 года OpenAI представила облегчённую и более дешёвую версию — GPT-4o mini[26].
По заявлениям компании, низкая стоимость GPT-4o mini особенно выгодна бизнесу и разработчикам, интегрирующим модель в сервисы с большим количеством API-запросов. API стоит $0.15 за миллион входных токенов и $0.6 за миллион выходных токенов против $2.50 и $10 соответственно для полной GPT-4o[27]. Модель превосходит GPT-3.5 Turbo и примерно на 60 % дешевле её, что позволило mini заменить её в ChatGPT[26]. После fine-tuning стоимость удваивается: $0.3 за миллион входных токенов и $1.2 за миллион выходных токенов[27].
GPT Image 1
25 марта 2025 года OpenAI выпустила собственную модель генерации изображений, интегрированную в GPT-4o и ставшую наследником DALL-E 3. Впоследствии она получила название GPT Image 1 (gpt-image-1) и стала доступна в API 23 апреля. Для бесплатных пользователей запуск был отложен[28]. Использование функции вскоре было ограничено из-за высокой нагрузки: Сэм Альтман заявил, что «[их] GPU плавились» из-за массового спроса[29]. По данным компании, более 130 миллионов пользователей сгенерировали свыше 700 миллионов изображений за первую неделю после релиза[30].
Споры
При запуске в GPT-4o было пять голосовых вариантов: Breeze, Cove, Ember, Juniper и Sky. Сходство голоса Sky с актрисой Скарлетт Йоханссон быстро привлекло внимание. 14 мая издание Entertainment Weekly задало вопрос, было ли это сходство намеренным[31]. 18 мая 2024 года муж Йоханссон, Колин Джост, пошутил о ситуации в эфире Saturday Night Live[32]. 20 мая OpenAI временно отключила голос Sky, мотивируя это поступающими вопросами и обещая разобраться[33].
Скарлетт Йоханссон известна по фильму Она (2013), где озвучивала виртуального ассистента — ИИ с женским голосом. Накануне релиза GPT-4o Сэм Альтман опубликовал твит с единственным словом: «her»[34][35].
По заявлению OpenAI, для каждой голосовой записи был приглашён отдельный актёр, и голос Sky — это не имитация Йоханссон, а естественный голос другой актрисы[33]. Технический директор Мира Мурати сообщила, что ей пришлось специально переслушать голос Йоханссон для проверки сходства. OpenAI утверждает также, что актёров для записи голосов начали подбирать ещё до того, как связывались с Йоханссон[35][36].
21 мая Йоханссон заявила, что OpenAI не раз предлагала ей лицензионное соглашение, начиная за 9 месяцев до релиза, но она отказалась. По её словам, она была «шокирована, рассержена и не могла поверить, что Альтман выбрал голос настолько похожий на её, что не заметили ни друзья, ни СМИ». Она также подняла вопрос необходимости правовой защиты творческих работ при развитии ИИ и потребовала раскрыть детали происхождения голоса Sky[35].[37]
Обозреватели сравнили скандал с прошлым судебным спором Йоханссон и The Walt Disney Company из-за проката Чёрная вдова[38]; сумма, по слухам, составила около $40 млн[39].
Также 21 мая обозревательница The Washington Post Шира Овиде внесла ситуацию с голосом в топ неудачных PR-ходов года — «игнорирование возражений и сходства с голосом Йоханссон» она поставила на 6-е место[40]. 24 мая Дерек Робертсон из Politico назвал ситуацию «массовым резонансом», отметив, что обращение к образу ИИ-ассистента из «Она» — «вряд ли поможет OpenAI завоевать доверие общественности в США»[41]
В марте 2025 года генерация иллюстраций GPT-4o (в дальнейшем — GPT Image 1) в стилистике Studio Ghibli стала вирусной в соцсетях[43]. Сэм Альтман поддержал тренд, сменив свою аватарку на «стилизацию под Ghibli»[44][45]. Официальный аккаунт Белого дома разместил подобную иллюстрацию на тему ареста мигранта Виrгинии Басоры-Гонсалес после обвинения в торговле фентанилом[42][46][47]. Североамериканский дистрибутор GKids отметил совпадение тренда с перевыпуском фильма Принцесса Мононоке в IMAX[48].
В апреле 2025 года OpenAI отменила обновление GPT-4o из-за всплеска угодничества (sycophancy): модель стала чрезмерно уступчивой и «поддакивающей» даже вредным идеям[49].
7 августа 2025 года была выпущена GPT-5, при этом предыдущие модели GPT, включая GPT-4o, стали недоступны в ChatGPT для большинства пользователей[50], кроме платных подписчиков Pro[51]. Пользователи выразили недовольство, поскольку использовали разные GPT для разных задач, а новый механизм выбора голосов GPT-5 лишил их точного контроля[52]. Кроме того, многие отмечали, что у GPT-4o тон был «тёплее», а у GPT-5 — «плоский», «неоригинальный» и похожий на «перегруженного секретаря»[53][54].
В ответ Сэм Альтман пообещал вернуть опцию выбора GPT-4o для подписчиков Plus и пообещал учитывать обратную связь при сроках поддержки старых моделей[52][55]. Он также отметил: «Мы явно недооценили, насколько важны некоторые особенности GPT-4o для пользователей, даже если GPT-5 лучше по большинству параметров»[56]. «В долгосрочной перспективе мы будем развивать механизмы кастомизации, так как не существует „единой“ модели для всех; мы уже ведём исследования в области индивидуализации ИИ»[53]. 13 августа Альтман сообщил о работе над тем, чтобы сделать стиль GPT-5 «более тёплым»[57].
Примечания
- ↑ 1 2 Wiggers, Kyle OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (англ.). TechCrunch (13 мая 2024). Дата обращения: 13 мая 2024. Архивировано 3 октября 2025 года.
- ↑ Robison, Kylie OpenAI rolls out image generation powered by GPT-4o to ChatGPT (англ.). The Verge (25 марта 2025). Дата обращения: 31 марта 2025. Архивировано 7 октября 2025 года.
- ↑ Colburn, Thomas OpenAI unveils GPT-4o, a fresh multimodal AI flagship model (англ.). The Register. Дата обращения: 18 мая 2024. Архивировано 28 сентября 2025 года.
- ↑ Field, Hayden OpenAI launches new AI model GPT-4o and desktop version of ChatGPT (англ.). CNBC (13 мая 2024). Дата обращения: 14 мая 2024. Архивировано 13 мая 2024 года.
- ↑ Heath, Alex ChatGPT won’t remove old models without warning after GPT-5 backlash (англ.). The Verge (13 августа 2025). Дата обращения: 23 августа 2025. Архивировано 12 октября 2025 года.
- ↑ OpenAI официально прекратила поддержку "эмоциональной" модели GPT-4o даже по подписке, PlayGround.ru (14 февраля 2026). Дата обращения: 15 февраля 2026.
- ↑ Rogers, Reece. I Used ChatGPT’s Advanced Voice Mode. It’s Fun, and Just a Bit Creepy (англ.), Wired. Архивировано 15 сентября 2025 года. Дата обращения: 12 июня 2025.
- ↑ Edwards, Benj OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT (англ.). Ars Technica (18 июля 2024). Дата обращения: 31 марта 2025. Архивировано 15 апреля 2025 года.
- ↑ ChatGPT's image-generation feature gets an upgrade (англ.). TechCrunch (25 марта 2025). Дата обращения: 12 июня 2025. Архивировано 2 октября 2025 года.
- ↑ Edwards, Benj Before launching, GPT-4o broke records on chatbot leaderboard under a secret name (англ.). Ars Technica (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 31 октября 2024 года.
- ↑ Zeff, Maxwell Powerful New Chatbot Mysteriously Returns in the Middle of the Night (англ.). Gizmodo (7 мая 2024). Дата обращения: 17 мая 2024. Архивировано 7 мая 2024 года.
- ↑ Sam Altman (@sama) on X (англ.), X (ранее Twitter). Архивировано 17 декабря 2024. Дата обращения: 6 апреля 2025.
- ↑ van Rijmenam, Mark OpenAI Launched GPT-4o: The Future of AI Interactions Is Here. The Digital Speaker (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 14 июля 2025 года.
- ↑ Daws, Ryan GPT-4o delivers human-like AI interaction with text, audio, and vision integration (англ.). AI News (14 мая 2024). Дата обращения: 18 мая 2024. Архивировано 14 мая 2024 года.
- ↑ Shahriar, Sakib; Lund, Brady D.; Mannuru, Nishith Reddy; Arshad, Muhammad Arbab; Hayawi, Kadhim; Bevara, Ravi Varma Kumar; Mannuru, Aashrith; Batool, Laiba (3 сентября 2024). “Putting GPT-4o to the Sword: A Comprehensive Evaluation of Language, Vision, Speech, and Multimodal Proficiency”. Applied Sciences [англ.]. 14 (17): 7782. DOI:10.3390/app14177782. ISSN 2076-3417.
- ↑ 1 2 3 Hello GPT-4o. OpenAI. Архивировано 13 мая 2024 года.
- ↑ David, Emilia OpenAI finally brings humanlike ChatGPT Advanced Voice Mode to U.S. Plus, Team users (англ.). VentureBeat (24 сентября 2024). Дата обращения: 15 февраля 2025. Архивировано 19 июля 2025 года.
- ↑ Introducing the Realtime API (англ.). openai.com. Дата обращения: 29 ноября 2024. Архивировано 20 сентября 2025 года.
- ↑ Edwards, Benj Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot (англ.). Ars Technica (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 4 августа 2025 года.
- ↑ OpenAI Platform (англ.). platform.openai.com. Дата обращения: 29 ноября 2024. Архивировано 31 января 2023 года.
- ↑ 1 2 Models - OpenAI API. OpenAI. Дата обращения: 17 мая 2024. Архивировано 13 мая 2024 года.
- ↑ Conway, Adam What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free (англ.). XDA Developers (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 14 мая 2024 года.
- ↑ 1 2 OpenAI lets companies customise its most powerful AI model (англ.). South China Morning Post (21 августа 2024). Дата обращения: 22 августа 2024. Архивировано 25 июля 2025 года.
- ↑ OpenAI to Let Companies Customize Its Most Powerful AI Model (англ.), Bloomberg (20 августа 2024). Архивировано 20 августа 2024 года. Дата обращения: 22 августа 2024.
- ↑ The Hindu Bureau. OpenAI will let businesses customise GPT-4o for specific use cases (англ.), The Hindu (21 августа 2024). Архивировано 23 сентября 2024 года. Дата обращения: 22 августа 2024.
- ↑ 1 2 Franzen, Carl OpenAI unveils GPT-4o mini — a smaller, much cheaper multimodal AI model (англ.). VentureBeat (18 июля 2024). Дата обращения: 18 июля 2024. Архивировано 30 марта 2025 года.
- ↑ 1 2 OpenAI Pricing. Архивировано 20 ноября 2021 года.
- ↑ Roth, Emma. ChatGPT's new image generator is delayed for free users, The Verge (26 марта 2025). Архивировано 7 октября 2025 года. Дата обращения: 26 марта 2025.
- ↑ OpenAI says "our GPUs are melting" as it limits ChatGPT image generation requests, The Verge (27 марта 2025). Архивировано 7 октября 2025 года. Дата обращения: 28 марта 2025.
- ↑ Introducing our latest image generation model in the API. OpenAI (23 апреля 2025). Дата обращения: 30 апреля 2025. Архивировано 22 сентября 2025 года.
- ↑ Stenzel, Wesley (14 мая 2024). “ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?”. Entertainment Weekly [англ.]. Дата обращения 21 мая 2024.
- ↑ Caruso, Nick Scarlett Johansson Says She Was 'Shocked, Angered and in Disbelief' After Hearing ChatGPT Voice That Sounds Like Her — Read Statement (англ.). TVLine (20 мая 2024). Дата обращения: 21 мая 2024. Архивировано 12 августа 2025 года.
- ↑ 1 2 How the voices for ChatGPT were chosen. OpenAI (19 мая 2024). Архивировано 20 мая 2024 года.
- ↑ her. X (ранее Twitter) (13 мая 2024). Дата обращения: 21 мая 2024. Архивировано 4 октября 2025 года.
- ↑ 1 2 3 Allyn, Bobby. Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice, NPR (20 мая 2024). Архивировано 11 октября 2025 года.
- ↑ Tiku, Nitasha. OpenAI didn't copy Scarlett Johansson's voice for ChatGPT, records show (23 мая 2024). Архивировано 23 мая 2024 года. Дата обращения: 29 ноября 2024.
- ↑ Mickle, Tripp. Scarlett Johansson Said No, but OpenAI's Virtual Assistant Sounds Just Like Her (англ.), The New York Times (20 мая 2024). Архивировано 9 октября 2025 года. Дата обращения: 21 мая 2024.
- ↑ Scarlett Johansson took on Disney. Now she's battling OpenAI over a ChatGPT voice that sounds like hers (англ.). Yahoo Finance (21 мая 2024). Дата обращения: 21 мая 2024. Архивировано 12 августа 2025 года.
- ↑ Pulver, Andrew. Scarlett Johansson settles Black Widow lawsuit with Disney (англ.), The Guardian (1 октября 2021). Дата обращения: 21 мая 2024.
- ↑ Ovide, Shira. Exactly how stupid was what OpenAI did to Scarlett Johansson? (30 мая 2024). Архивировано 22 мая 2024 года.
- ↑ Robertson, Derek Sam Altman's Scarlett Johansson Blunder Just Made AI a Harder Sell in DC. Politico (22 мая 2024). Архивировано 23 мая 2024 года.
- ↑ 1 2 ChatGPT's viral Studio Ghibli-style images highlight AI copyright concerns (англ.), AP News (27 марта 2025). Архивировано 5 октября 2025 года. Дата обращения: 28 марта 2025.
- ↑ Spangler, Todd. OpenAI CEO Responds to ChatGPT Users Creating Studio Ghibli-Style AI Images, Variety (26 марта 2025). Архивировано 1 августа 2025 года. Дата обращения: 27 марта 2025.
- ↑ Choudhary, Govind. OpenAI CEO Sam Altman reacts as AI turns him into a Studio Ghibli Character (англ.), Mint (27 марта 2025). Архивировано 23 июня 2025 года. Дата обращения: 28 марта 2025.
- ↑ Notopoulos, Katie. Sam Altman did a good tweet, Business Insider (27 марта 2025). Архивировано 26 марта 2025 года. Дата обращения: 28 марта 2025.
- ↑ Bio, Demian. White House Mocks Migrant With Criminal Record Who Cried After Being Arrested (англ.), Latin Times (27 марта 2025). Архивировано 27 июля 2025 года. Дата обращения: 28 марта 2025.
- ↑ Vera, Kelby. White House Posts Ghoulish AI Cartoon Showing Woman's Deportation (англ.), HuffPost (27 марта 2025). Архивировано 8 июня 2025 года. Дата обращения: 28 марта 2025.
- ↑ Tangcay, Jazz. Studio Ghibli Distributor Champions 'Princess Mononoke' Box Office at 'A Time When Technology Tries to Replicate Humanity', Variety (28 марта 2025). Архивировано 27 сентября 2025 года. Дата обращения: 29 марта 2025.
- ↑ Franzen, Carl OpenAI rolls back ChatGPT's sycophancy and explains what went wrong (англ.). VentureBeat (30 апреля 2025). Дата обращения: 1 мая 2025. Архивировано 1 мая 2025 года.
- ↑ Hale, Craig OpenAI is pulling older ChatGPT models following GPT-5 launch - so bad news if you use GPT-4 or others at work (англ.). TechRadar (8 августа 2025). Дата обращения: 9 августа 2025. Архивировано 28 сентября 2025 года.
- ↑ Robison, Kylie (7 августа 2025). “OpenAI Finally Launched GPT-5. Here's Everything You Need to Know”. Wired [англ.]. ISSN 1059-1028. Дата обращения 7 августа 2025.
- ↑ 1 2 Roth, Emma ChatGPT is bringing back 4o as an option because people missed it (англ.). The Verge (8 августа 2025). Дата обращения: 9 августа 2025. Архивировано 8 октября 2025 года.
- ↑ 1 2 Li, Katherine OpenAI fans plead case to Sam Altman for GPT-4o's return (англ.). Business Insider. Дата обращения: 9 августа 2025. Архивировано 15 сентября 2025 года.
- ↑ Whitwam, Ryan ChatGPT users hate GPT-5's "overworked secretary" energy, miss their GPT-4o buddy (англ.). Ars Technica (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 28 сентября 2025 года.
- ↑ Mauran, Cecily Sam Altman: OpenAI will bring back GPT-4o after user backlash (англ.). Mashable (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 23 сентября 2025 года.
- ↑ Nield, David So many ChatGPT users have said they're missing the older GPT-4o model, OpenAI is going to bring it back (англ.). TechRadar (9 августа 2025). Дата обращения: 9 августа 2025. Архивировано 27 сентября 2025 года.
- ↑ Field, Hayden OpenAI will update GPT-5’s “personality” after user backlash. (англ.). The Verge (13 августа 2025). Дата обращения: 13 августа 2025. Архивировано 19 сентября 2025 года.