Udio

Udio — генеративная модель искусственного интеллекта, предназначенная для создания музыки на основе простых текстовых запросов. Система способна генерировать вокал и инструментальные партии. Бесплатная бета-версия была публично представлена 10 апреля 2024 года. Для расширения функциональности, включая аудио-инпейтинг, пользователи могут оформить платную подписку (ежемесячно или ежегодно).

Компания была основана в декабре 2023 года командой бывших исследователей Google DeepMind во главе с генеральным директором Udio Дэвидом Дингом. Финансирование обеспечили венчурная компания Andreessen Horowitz и музыканты will.i.am и Common, а также ряд других инвесторов. Рецензенты отметили реалистичность создаваемого вокала, однако некоторые критики выразили опасения по поводу наличия защищённой авторским правом музыки в обучающих данных Udio.

Что важно знать
Udio
Тип Генеративный искусственный интеллект
Генерация музыки
Разработчик Udio
Первый выпуск 10 апреля 2024
Последняя версия v1.5 (23 июля 2024)
Сайт udio.com

История

Udio была создана в декабре 2023 года командой из четырёх бывших исследователей Google DeepMind, в которую вошли генеральный директор Udio Дэвид Динг, Конор Дуркан, Чарли Нэш, Ярослав Ганин и Эндрю Санчес[1][2] под именем Uncharted Labs[3]. Венчурная компания Andreessen Horowitz, музыкальный дистрибьютор UnitedMasters, музыканты will.i.am, Tay Keith и Common, инвестор Кевин Уолл, сооснователь Instagram Майк Кригер, а также исследователь DeepMind Oriol Vinyals выступили спонсорами, оценив стоимость Udio в 10 миллионов долларов на стадии посевного финансирования (вдобавок к ранее привлечённым 8,5 миллионам долларов)[3].[4] Несколько месяцев проект проходил стадию закрытого тестирования, после чего 10 апреля 2024 года бесплатная бета-версия стала доступна на официальном сайте[5]. По состоянию на апрель 2024 года, сервис позволяет бесплатно сгенерировать до 600 песен в месяц[6]. По словам Санчеса, сервис «позволяет музыкантам создавать отличную музыку и… зарабатывать на ней в будущем»[1]. Запуск Udio последовал за выходом других сервисов генерации музыки по тексту, таких как Suno AI и Stability Audio[7].

В Udio была создана песня-пародия «BBL Drizzy» музыканта Willonius Hatcher, ставшая вирусной во время конфликта между Дрейком и Кендриком Ламаром — за первую неделю она собрала более 23 миллионов просмотров в Twitter и 3,3 миллиона прослушиваний на SoundCloud[8].

В августе 2024 года песня австрийского продюсера Butterbro «Verknallt in einen Talahon», сгенерированная в Udio, стала первой композицией, созданной искусственным интеллектом, которая попала в немецкий чарт Top 50[9].

Возможности

Udio создаёт музыку на основе текстового запроса, который может содержать указание жанра (например, барбершоп-квартет, кантри, классика, хип-хоп, немецкий поп, хард-рок и другие), текста, сценарной идеи или примеров других артистов. Тексты песен создаются с помощью большой языковой модели, при этом детали процесса генерации музыки, по состоянию на апрель 2024 года, не раскрываются[10]. После генерации Udio предлагает пользователю два варианта песни, которые можно далее «ремиксировать» новыми текстовыми подсказками[11]. Изначально песня создаётся длиной около 30 секунд, после чего доступно поэтапное продление на дополнительные 30 секунд[6]. Подписчики могут воспользоваться расширенными возможностями, включая аудио-инпейтинг[12].[13]

Оценки и критика

Редактор PC World Марк Хачман сравнил Udio с генераторами изображений на основе ИИ и похвалил способность сервиса превращать «несколько довольно слабых текстов» в «запоминающуюся» песню, а также отметил, что сгенерированный вокал звучит «очень реалистично и даже эмоционально»[6]. Сабрина Ортис из ZDNET назвала создаваемые песни «впечатляющими» и заявила, что они «звучат профессионально». По её словам, треки получаются «наполненнее и богаче», чем у конкурентов, а сам сервис предлагает больше настроек[5]. Райан Моррисон из Tom's Guide отметил у Udio «необычайную способность выражать эмоции в синтетическом вокале», и назвал сервис единственным генератором музыки на ИИ, который «передаёт страсть, боль и дух вокального исполнения»[14]. Он также добавил, что программа рассчитана на «людей без или с минимальными музыкальными навыками»[2]. Брайан Хайатт из Rolling Stone написал, что Udio «более настраиваем, но, возможно, менее интуитивен» по сравнению с Suno AI, и отметил, что, по мнению многих ранних пользователей, «Udio в среднем звучит чище, чем Suno»[1].

Бендж Эдвардс (Ars Technica) охарактеризовал качество генерации Udio как неидеальное и «менее впечатляющее», чем у Suno AI, подчеркнув, что длина треков у Udio заметно меньше. Он также назвал сгенерированные сервисом песни «незавершёнными и почти кошмарными»[10]. В ответ на анонс бета-версии Udio в Twitter участник дуэта Telefon Tel Aviv Джошуа Юстис написал, что Udio — это «приложение для замены музыкантов», и усомнился в происхождении обучающих данных. Онлайн-критики также упрекали сервис в отсутствии «души» и потенциальной возможности создания аудио-дипфейков[11].[7] Лукас Ропек из Gizmodo охарактеризовал Udio как «полный акустической ерунды», а его мелодии — как «исключительно плохие»[15].

Вопросы авторского права

Критики Udio поднимают вопрос о том, какие данные использовались для обучения и содержали ли они защищённую авторским правом музыку. Rolling Stone отмечал, что есть «серьёзные основания полагать», что как Udio, так и Suno AI обучались на защищённых материалах, а Бендж Эдвардс (Ars Technica) предположил, что обучающая выборка, вероятно, была «наполнена защищёнными авторским правом произведениями»[10].[11] При этом Udio не воспроизводит существующие произведения по запросу[6] Дэвид Динг утверждает, что компания использует «широкую систему автоматических фильтров по авторскому праву» и постоянно совершенствует механизмы защиты.[7]. Для сравнения, Stability AI в Stable Audio 2.0 использует специально лицензированный датасет AudioSparx[16].

В июне 2024 года Ассоциация звукозаписывающей индустрии Америки подала иск против Udio и Suno, обвинив сервисы в массовом нарушении авторских прав на звуковые записи. Истцы требуют запретить обучение на защищённых произведениях и взыскать компенсацию до 150 000 долларов за каждое нарушение[17].[18]

Примечания

Ссылки