Udio

Udio
Udio
Тип	Генеративный искусственный интеллект; Генерация музыки
Разработчик	Udio
Первый выпуск	10 апреля 2024
Последняя версия	v1.5 (23 июля 2024)
Сайт	udio.com

Udio
Udio
Тип	Генеративный искусственный интеллект; Генерация музыки
Разработчик	Udio
Первый выпуск	10 апреля 2024
Последняя версия	v1.5 (23 июля 2024)
Сайт	udio.com

Udio — генеративная модель искусственного интеллекта, предназначенная для создания музыки на основе простых текстовых запросов. Система способна генерировать вокал и инструментальные партии. Бесплатная бета-версия была публично представлена 10 апреля 2024 года. Для расширения функциональности, включая аудио-инпейтинг, пользователи могут оформить платную подписку (ежемесячно или ежегодно).

Компания была основана в декабре 2023 года командой бывших исследователей Google DeepMind во главе с генеральным директором Udio Дэвидом Дингом. Финансирование обеспечили венчурная компания Andreessen Horowitz и музыканты will.i.am и Common, а также ряд других инвесторов. Рецензенты отметили реалистичность создаваемого вокала, однако некоторые критики выразили опасения по поводу наличия защищённой авторским правом музыки в обучающих данных Udio.

Udio была создана в декабре 2023 года командой из четырёх бывших исследователей Google DeepMind, в которую вошли генеральный директор Udio Дэвид Динг, Конор Дуркан, Чарли Нэш, Ярослав Ганин и Эндрю Санчес^[1]^[2] под именем Uncharted Labs^[3]. Венчурная компания Andreessen Horowitz, музыкальный дистрибьютор UnitedMasters, музыканты will.i.am, Tay Keith и Common, инвестор Кевин Уолл, сооснователь Instagram Майк Кригер, а также исследователь DeepMind Oriol Vinyals выступили спонсорами, оценив стоимость Udio в 10 миллионов долларов на стадии посевного финансирования (вдобавок к ранее привлечённым 8,5 миллионам долларов)^[3]^[4]. Несколько месяцев проект проходил стадию закрытого тестирования, после чего 10 апреля 2024 года бесплатная бета-версия стала доступна на официальном сайте^[5]. По состоянию на апрель 2024 года, сервис позволяет бесплатно сгенерировать до 600 песен в месяц^[6]. По словам Санчеса, сервис «позволяет музыкантам создавать отличную музыку и… зарабатывать на ней в будущем»^[1]. Запуск Udio последовал за выходом других сервисов генерации музыки по тексту, таких как Suno AI и Stability Audio^[7].

В Udio была создана песня-пародия «BBL Drizzy» музыканта Willonius Hatcher, ставшая вирусной во время конфликта между Дрейком и Кендриком Ламаром — за первую неделю она собрала более 23 миллионов просмотров в Twitter и 3,3 миллиона прослушиваний на SoundCloud^[8].

В августе 2024 года песня австрийского продюсера Butterbro «Verknallt in einen Talahon», сгенерированная в Udio, стала первой композицией, созданной искусственным интеллектом, которая попала в немецкий чарт Top 50^[9].

Udio создаёт музыку на основе текстового запроса, который может содержать указание жанра (например, барбершоп-квартет, кантри, классика, хип-хоп, немецкий поп, хард-рок и другие), текста, сценарной идеи или примеров других артистов. Тексты песен создаются с помощью большой языковой модели, при этом детали процесса генерации музыки, по состоянию на апрель 2024 года, не раскрываются^[10]. После генерации Udio предлагает пользователю два варианта песни, которые можно далее «ремиксировать» новыми текстовыми подсказками^[11]. Изначально песня создаётся длиной около 30 секунд, после чего доступно поэтапное продление на дополнительные 30 секунд^[6]. Подписчики могут воспользоваться расширенными возможностями, включая аудио-инпейтинг^[12]^[13].

Редактор PC World Марк Хачман сравнил Udio с генераторами изображений на основе ИИ и похвалил способность сервиса превращать «несколько довольно слабых текстов» в «запоминающуюся» песню, а также отметил, что сгенерированный вокал звучит «очень реалистично и даже эмоционально»^[6]. Сабрина Ортис из ZDNET назвала создаваемые песни «впечатляющими» и заявила, что они «звучат профессионально». По её словам, треки получаются «наполненнее и богаче», чем у конкурентов, а сам сервис предлагает больше настроек^[5]. Райан Моррисон из Tom's Guide отметил у Udio «необычайную способность выражать эмоции в синтетическом вокале», и назвал сервис единственным генератором музыки на ИИ, который «передаёт страсть, боль и дух вокального исполнения»^[14]. Он также добавил, что программа рассчитана на «людей без или с минимальными музыкальными навыками»^[2]. Брайан Хайатт из Rolling Stone написал, что Udio «более настраиваем, но, возможно, менее интуитивен» по сравнению с Suno AI, и отметил, что, по мнению многих ранних пользователей, «Udio в среднем звучит чище, чем Suno»^[1].

Бендж Эдвардс (Ars Technica) охарактеризовал качество генерации Udio как неидеальное и «менее впечатляющее», чем у Suno AI, подчеркнув, что длина треков у Udio заметно меньше. Он также назвал сгенерированные сервисом песни «незавершёнными и почти кошмарными»^[10]. В ответ на анонс бета-версии Udio в Twitter участник дуэта Telefon Tel Aviv Джошуа Юстис написал, что Udio — это «приложение для замены музыкантов», и усомнился в происхождении обучающих данных. Онлайн-критики также упрекали сервис в отсутствии «души» и потенциальной возможности создания аудио-дипфейков^[11]^[7]. Лукас Ропек из Gizmodo охарактеризовал Udio как «полный акустической ерунды», а его мелодии — как «исключительно плохие»^[15].

Вопросы авторского права

Критики Udio поднимают вопрос о том, какие данные использовались для обучения и содержали ли они защищённую авторским правом музыку. Rolling Stone отмечал, что есть «серьёзные основания полагать», что как Udio, так и Suno AI обучались на защищённых материалах, а Бендж Эдвардс (Ars Technica) предположил, что обучающая выборка, вероятно, была «наполнена защищёнными авторским правом произведениями»^[10]^[11]. При этом Udio не воспроизводит существующие произведения по запросу^[6]. Дэвид Динг утверждает, что компания использует «широкую систему автоматических фильтров по авторскому праву» и постоянно совершенствует механизмы защиты.^[7]. Для сравнения, Stability AI в Stable Audio 2.0 использует специально лицензированный датасет AudioSparx^[16].

В июне 2024 года Ассоциация звукозаписывающей индустрии Америки подала иск против Udio и Suno, обвинив сервисы в массовом нарушении авторских прав на звуковые записи. Истцы требуют запретить обучение на защищённых произведениях и взыскать компенсацию до 150 000 долларов за каждое нарушение^[17]^[18].

Официальный сайт

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Udio

История

Возможности

Оценки и критика

Вопросы авторского права

Примечания

Ссылки

Категории

Udio
Тип	Генеративный искусственный интеллект Генерация музыки
Разработчик	Udio
Первый выпуск	10 апреля 2024
Последняя версия	v1.5 (23 июля 2024)
Сайт	udio.com