YandexGPT

YandexGPT — нейросеть семейства генеративных предварительно обученных трансформеров от компании Яндекс, способная создавать и обрабатывать тексты, предлагать новые идеи и учитывать контекст диалога с пользователем.

Для обучения YandexGPT используется набор данных, включающий информацию из книг, журналов, газет и других открытых источников в интернете[1]. По словам разработчиков, нейросеть может ошибаться в фактах и «фантазировать», однако по мере обучения выдаёт всё более точные ответы.

Что важно знать
YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023
Последняя версия 5.1 (28 августа 2025)
Состояние функционирует
Сайт ya.ru/ai/gpt

Использование YandexGPT

YandexGPT применяется в различных продуктах Яндекса для решения широкого спектра задач. Модель интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», умных колонках «Яндекс Станция», а также в телевизорах с «Алисой».

YandexGPT доступен на главной странице Яндекса, в Поиске[2], «Яндекс Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании.

Яндекс предоставляет бизнесу доступ к API модели через Yandex Cloud и разрабатывает собственные B2B-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ-разработчики, банки, ритейлеры и компании других отраслей могут использовать технологию в двух режимах: через API и Playground (консольный интерфейс Yandex Cloud для тестирования модели и проверки гипотез)[5]. С 21 ноября 2024 года доступен инструмент AI Assistant API для быстрой разработки ИИ-ассистентов для бизнеса на базе YandexGPT[6].

Бизнес-клиентам доступны две версии модели: асинхронная — для сложных задач, и версия для быстрых ответов в реальном времени. На основе YandexGPT реализованы десятки сценариев — от создания контента и техподдержки до создания чат-ботов и виртуальных ассистентов.

В июне 2024 года с помощью YandexGPT был улучшен машинный перевод в «Яндекс Переводчике», «Поиске» и при переводе видео в «Яндекс Браузере»[7].

История

В феврале 2023 года Яндекс сообщил о разработке собственной генеративной нейросети по аналогии с ChatGPT, в рамках линии языковых моделей YaLM (Yet another Language Model)[8]. Первоначальное название проекта — YaLM 2.0, позднее изменено на YandexGPT.

17 мая 2023 года была официально представлена модель YandexGPT (YaGPT), в «Алису» добавлен специальный навык для взаимодействия с новой языковой моделью[9].

5 июня 2023 года пресс-служба Яндекса объявила, что нейросеть научилась запоминать контекст диалога и задавать уточняющие вопросы[10].

15 июня 2023 года поддержку YandexGPT добавили в приложение для генерации изображений Шедеврум[11]. Пользователи получили возможность создавать посты с текстом, заголовком и подходящей иллюстрацией[12].

27 июня Яндекс объявил о появлении функции тезисного пересказа статей из интернета, работающей с текстами объёмом до 30 тыс. знаков на русском языке[13].

С июля 2023 года модель стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также для генерации и структурирования текстовой информации.

7 сентября 2023 года на Practical ML Conf Яндекс представил YandexGPT 2[14]. Качество ответов улучшилось по сравнению с первой версией[15]; по заявлениям Яндекса, во втором поколении ответы лучше в 67 % случаев[16].

14 сентября 2023 года началось тестирование быстрых ответов на запросы пользователей в Поиске на базе YandexGPT[17]. Модель находит лучшие источники по запросу пользователя, извлекает главное и формирует итоговый ответ с ссылкой.

С 6 октября 2023 года YandexGPT начала создавать краткие пересказы русскоязычных видеороликов в интернете[18], обобщая видео продолжительностью от двух минут до четырёх часов, если присутствует речь[19].

В декабре 2023 года Яндекс Казахстан предоставил доступ к YandexGPT API компаниям Казахстана[20].

28 марта 2024 года Яндекс запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro — предназначена для бизнеса и работает в Yandex Cloud[21]. На тестах YandexGPT 3 Pro показала лучшие результаты в 67 % задач, в простых пользовательских запросах показатель достиг 69 %[22].

28 мая 2024 года вышло третье поколение облегчённой версии YandexGPT Lite[23].

24 октября 2024 года вышло четвёртое поколение моделей — YandexGPT 4 Lite и Pro[24]. В декабре 2024 года YandexGPT 4 Pro внедрили в массовый сервис — Алиса Про[25].

25 февраля 2025 года Яндекс представил пятое поколение — YandexGPT 5 Pro, сразу интегрировав его в чат с «Алисой Про»[26]. Облегчённая версия YandexGPT 5 Lite Pretrain выложена в открытый доступ на HuggingFace[27]. 31 марта 2025 года представлена версия YandexGPT 5 Lite Instruct, прошедшая дополнительную настройку для решения пользовательских задач по промтам[28].

28 августа 2025 года для корпоративных клиентов стала доступна YandexGPT 5.1 Pro, а остальные пользователи получили её только в чате с «Алисой»[29].

Поиск с Алисой

16 апреля 2024 года Яндекс представил сервис «Нейро», объединяющий классический поиск и генеративные языковые модели. Пользователь может задать системе вопрос простыми словами, YandexGPT 3 анализирует поисковую выдачу, объединяет информацию и предоставляет ответ с источниками. Диалоговый формат позволяет уточнять и развивать тему, добавлять изображения[30][31].

С 22 мая 2025 года сервис получил новое имя — «Поиск с Алисой».

Обучение YandexGPT

Обучение модели проходит в несколько этапов:

  1. Pretraining. Модель осваивает структуру языка и общие факты о мире на огромных терабайтных сборках текстов из интернета, книг и других открытых источников, отобранных с помощью поисковых моделей Яндекса и разбитых на фрагменты (токены)[32].
  2. Fine-tuning. Эксперты оптимизируют миллиарды параметров на большом датасете разнообразных задач и хороших ответов. Качество обучающих примеров обеспечивает команда AI-тренеров Яндекса[33]. В обучении участвуют журналисты, педагоги, редакторы, социологи, психологи, филологи[34]. Яндекс стал первой российской компанией, начавшей обучение подобных специалистов.
  3. Продуктовые доработки. Модели придают «человеческий» характер для естественного диалога и ответов на вопросы о себе[32].

Обучение YandexGPT проводится на суперкомпьютерах Яндекса[35].

Версии моделей

В таблице представлены ключевые версии YandexGPT:

Версия Дата выпуска
YandexGPT 17 мая 2023[9]
YandexGPT 2 7 сентября 2023[14]
YandexGPT 3 Lite 28 мая 2024[23]
YandexGPT 3 Pro 28 марта 2024[23]
YandexGPT 4 Lite 24 октября 2024[24]
YandexGPT 4 Pro 24 октября 2024[24]
YandexGPT 5 Lite Pretrain 25 февраля 2025[27]
YandexGPT 5 Lite Instruct 31 марта 2025[28]
YandexGPT 5 Pro 25 февраля 2025[26]
YandexGPT 5.1 Pro 28 августа 2025

Возможности

В октябре 2023 года YandexGPT 2 сдала ЕГЭ по литературе на 55 баллов[36]. Минимальный проходной балл для поступления в вуз составляет 40 баллов. Это был первый случай в России, когда искусственный интеллект не только справился с тестовой частью, но и выполнил творческие задания ЕГЭ[37].

Примечания

Ссылки