OmniHuman

OmniHuman-1 AI
OmniHuman-1 AI
Тип	частная компания
Основание	4 февраля 2025
Основатели	ByteDance
Отрасль	Искусственный интеллект
Сайт	omnihuman.cc

OmniHuman-1 AI
OmniHuman-1 AI
Тип	частная компания
Основание	4 февраля 2025
Основатели	ByteDance
Отрасль	Искусственный интеллект
Сайт	omnihuman.cc

OmniHuman-1 — система искусственного интеллекта от китайской компании ByteDance, представленная 4 февраля 2025 года. Сквозная мультимодальная структура предназначена для генерации персонализированных реалистичных видеороликов на основе одной фотографии и аудиофрагмента (например, речи или вокала). Возможно создание видео любой длительности с настраиваемым аспектным соотношением и пропорциями тела^[1].

Технологии анимации человека (генерации говорящего на основе аудиодорожки) были распространены и до выхода OmniHuman-1, однако подобные дипфейки выглядели неестественно и содержали артефакты цифрового изображения, несовпадение мимики и другие факторы, позволяющие понять, что видео сгенерировано ИИ^[2].

Инженеры ByteDance использовали для обучения OmniHuman-1 более 18 700 часов видеоматериалов с участием людей и воспользовались новым методом под названием «всеобщие условия». Он включает в учебный процесс разнообразные входные данные: текст, аудиосигналы и двигательные паттерны^[3].

При этом команда ByteDance сообщает о продолжении работы над системой, которая сейчас ограничена, например, исходными данными. Так, низкое качество загружаемой фотографии скажется на реалистичности готового видео. Также ИИ испытывает трудности с генерацией определённых поз и жестов^[4].

Отличительной особенностью является то, что OmniHuman-1 способен генерировать видеоролики в полный рост. Жестикуляция и мимика соответствует произнесённой речи (предыдущие версии ИИ могли анимировать лишь лица или верхнюю часть тела). Поддерживает несколько форм ввода движения:

Управление звуком — генерирует синхронизированные движения губ и жесты на основе речевого ввода;
На основе существующего видео — воспроизводит движение из эталонного видео;
Мультимодальное слияние — объединяет аудио- и видеосигналы для точного управления различными частями тела^[5].

Оценка OmniHuman-1 по сравнению с ведущими моделями анимации (включая Loopy, CyberHost и DiffTED):

Точность синхронизации губ (чем выше, тем лучше):
- OmniHuman-1: 5.255
- Loopy: 4.814
- CyberHost: 6.627
Расстояние Фреше (FVD) (чем меньше, тем лучше):
- OmniHuman-1: 15.906
- Loopy: 16.134
- DiffTED: 58.871
Выразительность жестов (HKV metric) :
- OmniHuman-1: 47.561
- CyberHost: 24.733
- DiffGest: 23.409
Точность жеста руки (HKC) (чем выше, тем лучше):
- OmniHuman-1: 0,898
- CyberHost: 0.884
- DiffTED: 0.769^[5]

↑ Omnihuman-lab (англ.). omnihuman-lab.github.io (5 февраля 2025). Дата обращения: 5 февраля 2025.
↑ OmniHuman-1 от ByteDance: новая эпоха дипфейков или угроза безопасности?, NEURO-AI (4 февраля 2025). Дата обращения: 5 февраля 2025.
↑ Китай действительно удивляет: представлена нейросеть OmniHuman-1, создающая реалистичные видео из фотографий, Se7en.ws (5 февраля 2025). Дата обращения: 5 февраля 2025.
↑ Wiggers, Kyle. Deepfake videos are getting shockingly good, TechCrunch (4 февраля 2025). Дата обращения: 5 февраля 2025.
↑ ¹ ² ByteDance Proposes OmniHuman-1: An End-to-End Multimodality Framework Generating Human Videos based on a Single Human Image and Motion Signals (неопр.). MarkTechPost (4 февраля 2025). Дата обращения: 5 февраля 2025.

Правообладателем данного материала является АНО «Интернет-энциклопедия «РУВИКИ».
Использование данного материала на других сайтах возможно только с согласия АНО «Интернет-энциклопедия «РУВИКИ».

[1] Omnihuman-lab (англ.). omnihuman-lab.github.io (5 февраля 2025). Дата обращения: 5 февраля 2025.

[2] OmniHuman-1 от ByteDance: новая эпоха дипфейков или угроза безопасности?, NEURO-AI (4 февраля 2025). Дата обращения: 5 февраля 2025.

[3] Китай действительно удивляет: представлена нейросеть OmniHuman-1, создающая реалистичные видео из фотографий, Se7en.ws (5 февраля 2025). Дата обращения: 5 февраля 2025.

[4] Wiggers, Kyle. Deepfake videos are getting shockingly good, TechCrunch (4 февраля 2025). Дата обращения: 5 февраля 2025.

[:0-5] ¹ ² ByteDance Proposes OmniHuman-1: An End-to-End Multimodality Framework Generating Human Videos based on a Single Human Image and Motion Signals (неопр.). MarkTechPost (4 февраля 2025). Дата обращения: 5 февраля 2025.

[1]

[2]

[3]

[4]

[5]

Искусственный интеллект
История	История искусственного интеллекта Зима искусственного интеллекта Дартмутский семинар
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля Эффективный акселерационизм
Направления	Агентный подход Адаптивное управление Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Видеоманипуляция Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ Применение ИИ в армии США Применение ИИ в армии Великобритании Применение ИИ в армии Китая
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Денис Димитров Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Александер Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский
Компании	OpenAI Microsoft Stargate Project Apple Nvidia Meta Platforms Tesla IBM Palantir Mobileye SentinelOne DeepSeek OmniHuman Zhipu AI BuilderAI io Cacoon
Программы	YandexGPT YandexART Яндекс.Рефераты
Конкурсы	Miss AI
Другое	Временные меры по управлению сервисами генеративного ИИ Agentic AI Разметка данных

OmniHuman

История

Технические особенности

Примечания

Категории