Veo 3

Veo 3 — генератор видео со звуком, который компания Google презентовала 20 мая 2025 года на конференции I/O 2025 вместе с ИИ-редактором Flow. С помощью искусственного интеллекта пользователи могут создавать кинематографичные видеоролики в 4K с естественной озвучкой, включая диалоги, фоновую музыку и эффекты[1].

Общие сведения
Veo 3
англ. Veo 3
Дата появления 2025
Место появления  США
Автор понятия Google

Технология

Veo 3 создаёт видеоролики по данным промптов, состоящих из текста или набора изображений. Пользователь может полностью контролировать процесс генерации сцен. Например, доступна регулировка положения камеры и возможность упорядочивания кадров. Максимальное разрешение видео — 4K. Модель генерирует речь персонажей с точным движением губ и добавляет окружающие звуки, например шум волн, пение птиц или городской гул[2]. В отличие от аналогов вроде Runway или Sora — ролики генерируются сразу с подходящим аудио[3].

ИИ-генератор поддерживает сложные сценарные описания и стилистические запросы.

9 сентября 2025 года Veo 3 получила поддержку вертикального формата 9:16 и разрешение 1080 пикселей, больше подходящий для TikTok и YouTube Shorts[4].

Пример промта для мультипликации

«На следующем снимке старая мудрая сова, парящая высоко в воздухе и выглядывающая из-за облаков в залитом лунным светом небе над лесом. Старая мудрая сова осторожно кружит по поляне, осматривая лесную подстилку. Через несколько мгновений она опускается на залитую лунным светом дорожку и садится рядом с барсуком. Звук: хлопанье крыльев, пение птиц, громкий и приятный шелест ветра и прерывистое жужжание, хруст веток под ногами, кваканье. Лёгкая оркестровая партитура с деревянными духовыми, с весёлым, оптимистичным ритмом, полным невинного любопытства. Мудрая старая сова и нервный барсук сидят на залитой лунным светом лесной тропинке: „Сегодня они оставили после себя мяч. Он отскочил выше, чем я могу прыгнуть“ — барсук запнулся, пытаясь осознать это. „Что это за магия такая?“ — задумчиво ухнула сова. Звук: уханье совы, нервное чириканье барсука, шелест листьев, стрекотание сверчков. Старая мудрая сова улетает за пределы кадра, а молодой нервный барсук убегает в другую сторону. На заднем плане мимо пробегает белка, издавая при этом шум, похожий на шелест сухих осенних листьев. Аудио: громкое пение птиц и шелест листьев, а также звуки прерывистого приятного жужжания, хруст веток под ногами и звуки бегающих белок по сухим осенним листьям. Вдалеке ухает сова, нервно щебечет барсук, шуршат листья, стрекочут сверчки — звуки, полные невинного любопытства»[5].

Социальные сети

В США набирают популярность видео с ведущими новостей, которые созданы при помощи нового инструмента Veo 3. Технология, по словам экспертов, может использоваться для создания фейкового контента[6]. В Google утверждают, что все видео, созданные Veo 3, помечаются невидимым водяным знаком SynthID[7].

Редакция издания «Мослента» сгенерировала с помощью Veo 3 сюжет про пенсионерку, которая держит в квартире бегемота[8].

Доступ

Google открыла доступ к Veo 3 для пользователей из 71 страны. Сервис был доступен через подписку в приложении Gemini. По состоянию на 30 мая 2025 года жители Европейского союза и России не могли воспользоваться ИИ-генератором. Для пользователей из США была доступна подписка Google AI Pro за 20 долларов, которая включала 100 генераций в месяц и подписка Google AI Ultra за 249.99 долларов в месяц с возможностью генерировать больше сотни роликов ежемесячно[9].

Модель Veo 3 доступна в редакторе Flow. Он объединяет ИИ-генератор с текстовой нейросетью Google Gemini и моделью для создания изображений Imagen 4. По инструментарию Flow похож на Sora от OpenAI[10].

Сферы применения

Киноиндустрия

Компания Google с режиссёром Дарреном Аронофски и кинематографистом Элизой Макнитт использовали Veo 3 при создании фильмов «Primordial Soup» и «Ancestra»[11].

Маркетинг

Создание рекламного ролика в 2025 году с помощью ИИ-генератора стоило 500 долларов. Традиционный съёмочный процесс обошёлся бы в 50 тысяч долларов[12].

Образование

С помощью Veo 3 можно создавать визуализацию исторических событий или научных концепций с озвучкой[13].

Примечания

Категории