OpenAI o3

OpenAI o3 — рефлексирующая генеративная предварительно обученная трансформерная модель (GPT), разработанная компанией OpenAI как преемник OpenAI o1 для использования в ChatGPT. Модель спроектирована для выделения дополнительного времени на рассуждение при ответах на вопросы, требующие пошагового логического мышления[1][2].

31 января 2025 года OpenAI представила уменьшенную версию модели — o3-mini[3], за которой 16 апреля последовали o3 и o4-mini[4]. 10 июня был выпущен o3-pro — расширенная и наиболее продуктивная версия серии[5].

Общие сведения
OpenAI o3
Тип Генеративные предварительно обученные трансформеры, языковая модель для логического рассуждения
Разработчик OpenAI
Первый выпуск 31 января 2025 (o3-mini), 16 апреля 2025 (o3), 10 июня 2025 (o3-pro)

История

Модель OpenAI o3 была анонсирована 20 декабря 2024 года. Вместо ожидаемого имени «o2» было выбрано название «o3», чтобы избежать конфликта с товарным знаком телекоммуникационного бренда O2[1]. OpenAI пригласила исследователей в области безопасности и защиты примениться на ранний доступ к новым моделям до 10 января 2025 года[6]. Как и в случае с o1, пользователям доступны две версии модели: o3 и o3-mini[3].

31 января 2025 года o3-mini была выпущена для всех пользователей ChatGPT, включая бесплатный тариф, и для части пользователей API. OpenAI описывает o3-mini как «специализированную альтернативу» o1 для технических областей, требующих «точности и быстродействия»[7]. В o3-mini реализованы три уровня интеллектуального усилия: низкий, средний и высокий; в бесплатной версии доступен средний уровень. Использующая больше вычислительных ресурсов версия o3-mini-high предоставляется платным подписчикам[3][8]. Пользователи тарифа ChatGPT Pro имеют неограниченный доступ как к o3-mini, так и o3-mini-high[7].

2 февраля 2025 года OpenAI запустила сервис OpenAI Deep Research — услугу ChatGPT, в которой используется версия o3 для составления расширенных отчётов (от 5 до 30 минут) на основе веб-поиска[9].

6 февраля, реагируя на конкуренцию со стороны DeepSeek, OpenAI анонсировала обновление, увеличивающее прозрачность «хода мысли» при решениях в o3-mini[10].

12 февраля было увеличено ограничение количества запросов для o3-mini-high до 50 в сутки (ранее — 50 в неделю) для подписчиков ChatGPT Plus, а также реализована поддержка загрузки файлов и изображений[11].

16 апреля 2025 года OpenAI выпустила o3 и o4-mini — преемника o3-mini[4].

10 июня вышла версия o3-pro, которую компания назвала самой способной моделью на тот момент[5]. OpenAI рекомендовала использовать её для сложных задач, где надёжность важнее скорости и допустимо подождать несколько минут ради более качественного ответа[12].

Возможности

Для обучения OpenAI o3 использовать обучение с подкреплением, что позволило формировать у модели способность «обдумывать» ответ перед генерацией, используя так называемую «закрытую цепочку размышлений» (private chain of thought)[13]. Такой подход даёт модели возможность заранее планировать ходы и рассуждать поэтапно, решая задачи с помощью промежуточных логических операций, что повышает качество ответов ценой дополнительных вычислений и увеличенной задержки откликов[14].

O3 значительно превосходит o1 по ряду задач, в том числе программирование, математика, естественные науки[1]. Сообщается, что o3 набрала 87,7 % на специализированном научном бенчмарке GPQA Diamond, который включает вопросы экспертного уровня, не выкладывавшиеся ранее в открытом доступе[15].

В SWE-bench Verified (бенчмарк по инженерии ПО, где оценивается решение реальных задач из GitHub), o3 достигла 71,7 % (для сравнения, у o1 — 48,9 %). В тестах на Codeforces рейтинг o3 по системе Elo составил 2727 против 1891 у o1[15].

В бенчмарке Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), оценивающем общую способность к новым типам логических и учебных задач, o3 показала втрое более высокую точность, чем o1[1][16].

Примечания