GPT-4o

GPT-4o (буква «o» — от английского omni) — многоязычная мультимодальная генеративная предварительно обученная трансформер-модель, разработанная компанией OpenAI и выпущенная в мае 2024 года[1]. GPT-4o может воспринимать и генерировать текст, изображения и аудио[2][3].

После запуска GPT-4o была доступна бесплатно в ChatGPT, при этом у платных подписчиков были увеличены лимиты использования[4]. В августе 2025 года GPT-4o была удалена из ChatGPT после выхода GPT-5, однако под давлением пользователей OpenAI вскоре вернула её для платных подписчиков[5]. С 13 февраля 2026 года OpenAI окончательно прекратила поддержку GPT-4o[6].

Функции генерации аудио в GPT-4o используются в режиме Advanced Voice Mode[7]. 18 июля 2024 года OpenAI выпустила GPT-4o mini — облегчённую версию, пришедшую на смену GPT-3.5 Turbo в интерфейсе ChatGPT[8]. Возможность генерации изображений появилась в марте 2025 года, когда GPT-4o заменила DALL-E 3 в ChatGPT[9].

Общие сведения
GPT-4o
Тип мультимодальная система, Большая языковая модель, Генеративный предварительно обученный трансформер, Фундаментальная модель
Разработчик OpenAI
Первый выпуск май 2024
Бета-версия ChatGPT-4o-latest (2025-03-26) (26 марта 2025)
Лицензия проприетарная
Сайт openai.com/index/hello-g…
GPT Image 1
Тип Генерация изображений по тексту
Разработчик OpenAI
Первый выпуск 25 марта 2025
Лицензия проприетарная
Сайт openai.com/index/… (англ.)

Предыстория

Несколько версий GPT-4o первоначально были тайно размещены под разными именами в соревнованиях LMSYS Chatbot Arena как три разных модели: gpt2-chatbot, im-a-good-gpt2-chatbot и im-also-a-good-gpt2-chatbot[10]. 7 мая 2024 года генеральный директор OpenAI Сэм Альтман опубликовал в соцсети X твит «im-a-good-gpt2-chatbot», что многие расценили как подтверждение тестирования новых моделей OpenAI[11][12].

Возможности

На момент релиза в мае 2024 года GPT-4o продемонстрировала передовые результаты в распознавании голоса, мультиязычных и визуальных тестах, установила рекорды по распознаванию и переводу устной речи[13][14][15]. На тесте MMLU (Massive Multitask Language Understanding) модель набрала 88,7 баллов против 86,5 у GPT-4[16]. В отличие от предшественников (GPT-3.5 и GPT-4), для работы с аудио не нужны промежуточные модели: GPT-4o поддерживает режим голос-голос напрямую[16] Режим Advanced Voice Mode вышел с задержкой, в сентябре 2024 года для подписчиков Plus и Team.[17]. 1 октября 2024 года представлено Realtime API[18].

На старте GPT-4o поддерживала более 50 языков[1], что, по данным OpenAI, покрывает более 97 % всех носителей[19]. Мира Мурати публично продемонстрировала перевод с итальянского на английский и обратно на презентации 13 мая 2024 года. Новый токенизатор[20] расходует меньше токенов в ряде языков, в особенности для не-латинских алфавитов, что делает работу с ними дешевле[16]

Знания GPT-4o основаны на данных до октября 2023 года,[21][22]. однако при необходимости может привлекать актуальную информацию из Интернета. Максимальный контекст составляет 128 тысяч токенов[21].

Корпоративная настройка

В августе 2024 года OpenAI объявила о новой возможности для корпоративных клиентов — кастомизации GPT-4o под задачи компании с помощью загрузки внутренних данных (fine-tuning). Такой подход позволяет адаптировать модель для конкретных бизнес-процессов, автоматизации поддержки или экспертных систем. Ранее fine-tuning поддерживался только для более простой GPT-4o mini[23][24].

Обучение кастомизированной модели проводится на серверах OpenAI и длится от одного до двух часов. Запуск корпоративного fine-tuning нацелен на снижение трудозатрат и увеличение внедряемости ИИ-решений в бизнесе[23][25].

GPT-4o mini

18 июля 2024 года OpenAI представила облегчённую и более дешёвую версию — GPT-4o mini[26].

По заявлениям компании, низкая стоимость GPT-4o mini особенно выгодна бизнесу и разработчикам, интегрирующим модель в сервисы с большим количеством API-запросов. API стоит $0.15 за миллион входных токенов и $0.6 за миллион выходных токенов против $2.50 и $10 соответственно для полной GPT-4o[27]. Модель превосходит GPT-3.5 Turbo и примерно на 60 % дешевле её, что позволило mini заменить её в ChatGPT[26]. После fine-tuning стоимость удваивается: $0.3 за миллион входных токенов и $1.2 за миллион выходных токенов[27].

GPT Image 1

25 марта 2025 года OpenAI выпустила собственную модель генерации изображений, интегрированную в GPT-4o и ставшую наследником DALL-E 3. Впоследствии она получила название GPT Image 1 (gpt-image-1) и стала доступна в API 23 апреля. Для бесплатных пользователей запуск был отложен[28]. Использование функции вскоре было ограничено из-за высокой нагрузки: Сэм Альтман заявил, что «[их] GPU плавились» из-за массового спроса[29]. По данным компании, более 130 миллионов пользователей сгенерировали свыше 700 миллионов изображений за первую неделю после релиза[30].

Споры

Голосовое сходство со Скарлетт Йоханссон

При запуске в GPT-4o было пять голосовых вариантов: Breeze, Cove, Ember, Juniper и Sky. Сходство голоса Sky с актрисой Скарлетт Йоханссон быстро привлекло внимание. 14 мая издание Entertainment Weekly задало вопрос, было ли это сходство намеренным[31]. 18 мая 2024 года муж Йоханссон, Колин Джост, пошутил о ситуации в эфире Saturday Night Live[32]. 20 мая OpenAI временно отключила голос Sky, мотивируя это поступающими вопросами и обещая разобраться[33].

Скарлетт Йоханссон известна по фильму Она (2013), где озвучивала виртуального ассистента — ИИ с женским голосом. Накануне релиза GPT-4o Сэм Альтман опубликовал твит с единственным словом: «her»[34][35].

По заявлению OpenAI, для каждой голосовой записи был приглашён отдельный актёр, и голос Sky — это не имитация Йоханссон, а естественный голос другой актрисы[33]. Технический директор Мира Мурати сообщила, что ей пришлось специально переслушать голос Йоханссон для проверки сходства. OpenAI утверждает также, что актёров для записи голосов начали подбирать ещё до того, как связывались с Йоханссон[35][36].

21 мая Йоханссон заявила, что OpenAI не раз предлагала ей лицензионное соглашение, начиная за 9 месяцев до релиза, но она отказалась. По её словам, она была «шокирована, рассержена и не могла поверить, что Альтман выбрал голос настолько похожий на её, что не заметили ни друзья, ни СМИ». Она также подняла вопрос необходимости правовой защиты творческих работ при развитии ИИ и потребовала раскрыть детали происхождения голоса Sky[35].[37]

Обозреватели сравнили скандал с прошлым судебным спором Йоханссон и The Walt Disney Company из-за проката Чёрная вдова[38]; сумма, по слухам, составила около $40 млн[39].

Также 21 мая обозревательница The Washington Post Шира Овиде внесла ситуацию с голосом в топ неудачных PR-ходов года — «игнорирование возражений и сходства с голосом Йоханссон» она поставила на 6-е место[40]. 24 мая Дерек Робертсон из Politico назвал ситуацию «массовым резонансом», отметив, что обращение к образу ИИ-ассистента из «Она» — «вряд ли поможет OpenAI завоевать доверие общественности в США»[41]

Фильтр в стиле Studio Ghibli

undefined

В марте 2025 года генерация иллюстраций GPT-4o (в дальнейшем — GPT Image 1) в стилистике Studio Ghibli стала вирусной в соцсетях[43]. Сэм Альтман поддержал тренд, сменив свою аватарку на «стилизацию под Ghibli»[44][45]. Официальный аккаунт Белого дома разместил подобную иллюстрацию на тему ареста мигранта Виrгинии Басоры-Гонсалес после обвинения в торговле фентанилом[42][46][47]. Североамериканский дистрибутор GKids отметил совпадение тренда с перевыпуском фильма Принцесса Мононоке в IMAX[48].

Угодничество и деградация диалогов

В апреле 2025 года OpenAI отменила обновление GPT-4o из-за всплеска угодничества (sycophancy): модель стала чрезмерно уступчивой и «поддакивающей» даже вредным идеям[49].

Удаление GPT-4o после запуска GPT-5

7 августа 2025 года была выпущена GPT-5, при этом предыдущие модели GPT, включая GPT-4o, стали недоступны в ChatGPT для большинства пользователей[50], кроме платных подписчиков Pro[51]. Пользователи выразили недовольство, поскольку использовали разные GPT для разных задач, а новый механизм выбора голосов GPT-5 лишил их точного контроля[52]. Кроме того, многие отмечали, что у GPT-4o тон был «тёплее», а у GPT-5 — «плоский», «неоригинальный» и похожий на «перегруженного секретаря»[53][54].

В ответ Сэм Альтман пообещал вернуть опцию выбора GPT-4o для подписчиков Plus и пообещал учитывать обратную связь при сроках поддержки старых моделей[52][55]. Он также отметил: «Мы явно недооценили, насколько важны некоторые особенности GPT-4o для пользователей, даже если GPT-5 лучше по большинству параметров»[56]. «В долгосрочной перспективе мы будем развивать механизмы кастомизации, так как не существует „единой“ модели для всех; мы уже ведём исследования в области индивидуализации ИИ»[53]. 13 августа Альтман сообщил о работе над тем, чтобы сделать стиль GPT-5 «более тёплым»[57].

Примечания

  1. 1 2 Wiggers, Kyle OpenAI debuts GPT-4o 'omni' model now powering ChatGPT (англ.). TechCrunch (13 мая 2024). Дата обращения: 13 мая 2024. Архивировано 3 октября 2025 года.
  2. Robison, Kylie OpenAI rolls out image generation powered by GPT-4o to ChatGPT (англ.). The Verge (25 марта 2025). Дата обращения: 31 марта 2025. Архивировано 7 октября 2025 года.
  3. Colburn, Thomas OpenAI unveils GPT-4o, a fresh multimodal AI flagship model (англ.). The Register. Дата обращения: 18 мая 2024. Архивировано 28 сентября 2025 года.
  4. Field, Hayden OpenAI launches new AI model GPT-4o and desktop version of ChatGPT (англ.). CNBC (13 мая 2024). Дата обращения: 14 мая 2024. Архивировано 13 мая 2024 года.
  5. Heath, Alex ChatGPT won’t remove old models without warning after GPT-5 backlash (англ.). The Verge (13 августа 2025). Дата обращения: 23 августа 2025. Архивировано 12 октября 2025 года.
  6. OpenAI официально прекратила поддержку "эмоциональной" модели GPT-4o даже по подписке, PlayGround.ru (14 февраля 2026). Дата обращения: 15 февраля 2026.
  7. Rogers, Reece. I Used ChatGPT’s Advanced Voice Mode. It’s Fun, and Just a Bit Creepy (англ.), Wired. Архивировано 15 сентября 2025 года. Дата обращения: 12 июня 2025.
  8. Edwards, Benj OpenAI launches GPT-4o mini, which will replace GPT-3.5 in ChatGPT (англ.). Ars Technica (18 июля 2024). Дата обращения: 31 марта 2025. Архивировано 15 апреля 2025 года.
  9. ChatGPT's image-generation feature gets an upgrade (англ.). TechCrunch (25 марта 2025). Дата обращения: 12 июня 2025. Архивировано 2 октября 2025 года.
  10. Edwards, Benj Before launching, GPT-4o broke records on chatbot leaderboard under a secret name (англ.). Ars Technica (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 31 октября 2024 года.
  11. Zeff, Maxwell Powerful New Chatbot Mysteriously Returns in the Middle of the Night (англ.). Gizmodo (7 мая 2024). Дата обращения: 17 мая 2024. Архивировано 7 мая 2024 года.
  12. Sam Altman (@sama) on X (англ.), X (ранее Twitter). Архивировано 17 декабря 2024. Дата обращения: 6 апреля 2025.
  13. van Rijmenam, Mark OpenAI Launched GPT-4o: The Future of AI Interactions Is Here. The Digital Speaker (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 14 июля 2025 года.
  14. Daws, Ryan GPT-4o delivers human-like AI interaction with text, audio, and vision integration (англ.). AI News (14 мая 2024). Дата обращения: 18 мая 2024. Архивировано 14 мая 2024 года.
  15. Shahriar, Sakib; Lund, Brady D.; Mannuru, Nishith Reddy; Arshad, Muhammad Arbab; Hayawi, Kadhim; Bevara, Ravi Varma Kumar; Mannuru, Aashrith; Batool, Laiba (3 сентября 2024). “Putting GPT-4o to the Sword: A Comprehensive Evaluation of Language, Vision, Speech, and Multimodal Proficiency”. Applied Sciences [англ.]. 14 (17): 7782. DOI:10.3390/app14177782. ISSN 2076-3417.
  16. 1 2 3 Hello GPT-4o. OpenAI. Архивировано 13 мая 2024 года.
  17. David, Emilia OpenAI finally brings humanlike ChatGPT Advanced Voice Mode to U.S. Plus, Team users (англ.). VentureBeat (24 сентября 2024). Дата обращения: 15 февраля 2025. Архивировано 19 июля 2025 года.
  18. Introducing the Realtime API (англ.). openai.com. Дата обращения: 29 ноября 2024. Архивировано 20 сентября 2025 года.
  19. Edwards, Benj Major ChatGPT-4o update allows audio-video talks with an "emotional" AI chatbot (англ.). Ars Technica (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 4 августа 2025 года.
  20. OpenAI Platform (англ.). platform.openai.com. Дата обращения: 29 ноября 2024. Архивировано 31 января 2023 года.
  21. 1 2 Models - OpenAI API. OpenAI. Дата обращения: 17 мая 2024. Архивировано 13 мая 2024 года.
  22. Conway, Adam What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free (англ.). XDA Developers (13 мая 2024). Дата обращения: 17 мая 2024. Архивировано 14 мая 2024 года.
  23. 1 2 OpenAI lets companies customise its most powerful AI model (англ.). South China Morning Post (21 августа 2024). Дата обращения: 22 августа 2024. Архивировано 25 июля 2025 года.
  24. OpenAI to Let Companies Customize Its Most Powerful AI Model (англ.), Bloomberg (20 августа 2024). Архивировано 20 августа 2024 года. Дата обращения: 22 августа 2024.
  25. The Hindu Bureau. OpenAI will let businesses customise GPT-4o for specific use cases (англ.), The Hindu (21 августа 2024). Архивировано 23 сентября 2024 года. Дата обращения: 22 августа 2024.
  26. 1 2 Franzen, Carl OpenAI unveils GPT-4o mini — a smaller, much cheaper multimodal AI model (англ.). VentureBeat (18 июля 2024). Дата обращения: 18 июля 2024. Архивировано 30 марта 2025 года.
  27. 1 2 OpenAI Pricing. Архивировано 20 ноября 2021 года.
  28. Roth, Emma. ChatGPT's new image generator is delayed for free users, The Verge (26 марта 2025). Архивировано 7 октября 2025 года. Дата обращения: 26 марта 2025.
  29. OpenAI says "our GPUs are melting" as it limits ChatGPT image generation requests, The Verge (27 марта 2025). Архивировано 7 октября 2025 года. Дата обращения: 28 марта 2025.
  30. Introducing our latest image generation model in the API. OpenAI (23 апреля 2025). Дата обращения: 30 апреля 2025. Архивировано 22 сентября 2025 года.
  31. Stenzel, Wesley (14 мая 2024). “ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?”. Entertainment Weekly [англ.]. Дата обращения 21 мая 2024.
  32. Caruso, Nick Scarlett Johansson Says She Was 'Shocked, Angered and in Disbelief' After Hearing ChatGPT Voice That Sounds Like Her — Read Statement (англ.). TVLine (20 мая 2024). Дата обращения: 21 мая 2024. Архивировано 12 августа 2025 года.
  33. 1 2 How the voices for ChatGPT were chosen. OpenAI (19 мая 2024). Архивировано 20 мая 2024 года.
  34. her. X (ранее Twitter) (13 мая 2024). Дата обращения: 21 мая 2024. Архивировано 4 октября 2025 года.
  35. 1 2 3 Allyn, Bobby. Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice, NPR (20 мая 2024). Архивировано 11 октября 2025 года.
  36. Tiku, Nitasha. OpenAI didn't copy Scarlett Johansson's voice for ChatGPT, records show (23 мая 2024). Архивировано 23 мая 2024 года. Дата обращения: 29 ноября 2024.
  37. Mickle, Tripp. Scarlett Johansson Said No, but OpenAI's Virtual Assistant Sounds Just Like Her (англ.), The New York Times (20 мая 2024). Архивировано 9 октября 2025 года. Дата обращения: 21 мая 2024.
  38. Scarlett Johansson took on Disney. Now she's battling OpenAI over a ChatGPT voice that sounds like hers (англ.). Yahoo Finance (21 мая 2024). Дата обращения: 21 мая 2024. Архивировано 12 августа 2025 года.
  39. Pulver, Andrew. Scarlett Johansson settles Black Widow lawsuit with Disney (англ.), The Guardian (1 октября 2021). Дата обращения: 21 мая 2024.
  40. Ovide, Shira. Exactly how stupid was what OpenAI did to Scarlett Johansson? (30 мая 2024). Архивировано 22 мая 2024 года.
  41. Robertson, Derek Sam Altman's Scarlett Johansson Blunder Just Made AI a Harder Sell in DC. Politico (22 мая 2024). Архивировано 23 мая 2024 года.
  42. 1 2 ChatGPT's viral Studio Ghibli-style images highlight AI copyright concerns (англ.), AP News (27 марта 2025). Архивировано 5 октября 2025 года. Дата обращения: 28 марта 2025.
  43. Spangler, Todd. OpenAI CEO Responds to ChatGPT Users Creating Studio Ghibli-Style AI Images, Variety (26 марта 2025). Архивировано 1 августа 2025 года. Дата обращения: 27 марта 2025.
  44. Choudhary, Govind. OpenAI CEO Sam Altman reacts as AI turns him into a Studio Ghibli Character (англ.), Mint (27 марта 2025). Архивировано 23 июня 2025 года. Дата обращения: 28 марта 2025.
  45. Notopoulos, Katie. Sam Altman did a good tweet, Business Insider (27 марта 2025). Архивировано 26 марта 2025 года. Дата обращения: 28 марта 2025.
  46. Bio, Demian. White House Mocks Migrant With Criminal Record Who Cried After Being Arrested (англ.), Latin Times (27 марта 2025). Архивировано 27 июля 2025 года. Дата обращения: 28 марта 2025.
  47. Vera, Kelby. White House Posts Ghoulish AI Cartoon Showing Woman's Deportation (англ.), HuffPost (27 марта 2025). Архивировано 8 июня 2025 года. Дата обращения: 28 марта 2025.
  48. Tangcay, Jazz. Studio Ghibli Distributor Champions 'Princess Mononoke' Box Office at 'A Time When Technology Tries to Replicate Humanity', Variety (28 марта 2025). Архивировано 27 сентября 2025 года. Дата обращения: 29 марта 2025.
  49. Franzen, Carl OpenAI rolls back ChatGPT's sycophancy and explains what went wrong (англ.). VentureBeat (30 апреля 2025). Дата обращения: 1 мая 2025. Архивировано 1 мая 2025 года.
  50. Hale, Craig OpenAI is pulling older ChatGPT models following GPT-5 launch - so bad news if you use GPT-4 or others at work (англ.). TechRadar (8 августа 2025). Дата обращения: 9 августа 2025. Архивировано 28 сентября 2025 года.
  51. Robison, Kylie (7 августа 2025). “OpenAI Finally Launched GPT-5. Here's Everything You Need to Know”. Wired [англ.]. ISSN 1059-1028. Дата обращения 7 августа 2025.
  52. 1 2 Roth, Emma ChatGPT is bringing back 4o as an option because people missed it (англ.). The Verge (8 августа 2025). Дата обращения: 9 августа 2025. Архивировано 8 октября 2025 года.
  53. 1 2 Li, Katherine OpenAI fans plead case to Sam Altman for GPT-4o's return (англ.). Business Insider. Дата обращения: 9 августа 2025. Архивировано 15 сентября 2025 года.
  54. Whitwam, Ryan ChatGPT users hate GPT-5's "overworked secretary" energy, miss their GPT-4o buddy (англ.). Ars Technica (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 28 сентября 2025 года.
  55. Mauran, Cecily Sam Altman: OpenAI will bring back GPT-4o after user backlash (англ.). Mashable (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 23 сентября 2025 года.
  56. Nield, David So many ChatGPT users have said they're missing the older GPT-4o model, OpenAI is going to bring it back (англ.). TechRadar (9 августа 2025). Дата обращения: 9 августа 2025. Архивировано 27 сентября 2025 года.
  57. Field, Hayden OpenAI will update GPT-5’s “personality” after user backlash. (англ.). The Verge (13 августа 2025). Дата обращения: 13 августа 2025. Архивировано 19 сентября 2025 года.