Udio
Udio — генеративная модель искусственного интеллекта, предназначенная для создания музыки на основе простых текстовых запросов. Система способна генерировать вокал и инструментальные партии. Бесплатная бета-версия была публично представлена 10 апреля 2024 года. Для расширения функциональности, включая аудио-инпейтинг, пользователи могут оформить платную подписку (ежемесячно или ежегодно).
Компания была основана в декабре 2023 года командой бывших исследователей Google DeepMind во главе с генеральным директором Udio Дэвидом Дингом. Финансирование обеспечили венчурная компания Andreessen Horowitz и музыканты will.i.am и Common, а также ряд других инвесторов. Рецензенты отметили реалистичность создаваемого вокала, однако некоторые критики выразили опасения по поводу наличия защищённой авторским правом музыки в обучающих данных Udio.
Что важно знать
| Udio | |
|---|---|
| Тип |
Генеративный искусственный интеллект Генерация музыки |
| Разработчик | Udio |
| Первый выпуск | 10 апреля 2024 |
| Последняя версия | v1.5 (23 июля 2024) |
| Сайт | udio.com |
История
Udio была создана в декабре 2023 года командой из четырёх бывших исследователей Google DeepMind, в которую вошли генеральный директор Udio Дэвид Динг, Конор Дуркан, Чарли Нэш, Ярослав Ганин и Эндрю Санчес[1][2] под именем Uncharted Labs[3]. Венчурная компания Andreessen Horowitz, музыкальный дистрибьютор UnitedMasters, музыканты will.i.am, Tay Keith и Common, инвестор Кевин Уолл, сооснователь Instagram Майк Кригер, а также исследователь DeepMind Oriol Vinyals выступили спонсорами, оценив стоимость Udio в 10 миллионов долларов на стадии посевного финансирования (вдобавок к ранее привлечённым 8,5 миллионам долларов)[3].[4] Несколько месяцев проект проходил стадию закрытого тестирования, после чего 10 апреля 2024 года бесплатная бета-версия стала доступна на официальном сайте[5]. По состоянию на апрель 2024 года, сервис позволяет бесплатно сгенерировать до 600 песен в месяц[6]. По словам Санчеса, сервис «позволяет музыкантам создавать отличную музыку и… зарабатывать на ней в будущем»[1]. Запуск Udio последовал за выходом других сервисов генерации музыки по тексту, таких как Suno AI и Stability Audio[7].
В Udio была создана песня-пародия «BBL Drizzy» музыканта Willonius Hatcher, ставшая вирусной во время конфликта между Дрейком и Кендриком Ламаром — за первую неделю она собрала более 23 миллионов просмотров в Twitter и 3,3 миллиона прослушиваний на SoundCloud[8].
В августе 2024 года песня австрийского продюсера Butterbro «Verknallt in einen Talahon», сгенерированная в Udio, стала первой композицией, созданной искусственным интеллектом, которая попала в немецкий чарт Top 50[9].
Возможности
Udio создаёт музыку на основе текстового запроса, который может содержать указание жанра (например, барбершоп-квартет, кантри, классика, хип-хоп, немецкий поп, хард-рок и другие), текста, сценарной идеи или примеров других артистов. Тексты песен создаются с помощью большой языковой модели, при этом детали процесса генерации музыки, по состоянию на апрель 2024 года, не раскрываются[10]. После генерации Udio предлагает пользователю два варианта песни, которые можно далее «ремиксировать» новыми текстовыми подсказками[11]. Изначально песня создаётся длиной около 30 секунд, после чего доступно поэтапное продление на дополнительные 30 секунд[6]. Подписчики могут воспользоваться расширенными возможностями, включая аудио-инпейтинг[12].[13]
Оценки и критика
Редактор PC World Марк Хачман сравнил Udio с генераторами изображений на основе ИИ и похвалил способность сервиса превращать «несколько довольно слабых текстов» в «запоминающуюся» песню, а также отметил, что сгенерированный вокал звучит «очень реалистично и даже эмоционально»[6]. Сабрина Ортис из ZDNET назвала создаваемые песни «впечатляющими» и заявила, что они «звучат профессионально». По её словам, треки получаются «наполненнее и богаче», чем у конкурентов, а сам сервис предлагает больше настроек[5]. Райан Моррисон из Tom's Guide отметил у Udio «необычайную способность выражать эмоции в синтетическом вокале», и назвал сервис единственным генератором музыки на ИИ, который «передаёт страсть, боль и дух вокального исполнения»[14]. Он также добавил, что программа рассчитана на «людей без или с минимальными музыкальными навыками»[2]. Брайан Хайатт из Rolling Stone написал, что Udio «более настраиваем, но, возможно, менее интуитивен» по сравнению с Suno AI, и отметил, что, по мнению многих ранних пользователей, «Udio в среднем звучит чище, чем Suno»[1].
Бендж Эдвардс (Ars Technica) охарактеризовал качество генерации Udio как неидеальное и «менее впечатляющее», чем у Suno AI, подчеркнув, что длина треков у Udio заметно меньше. Он также назвал сгенерированные сервисом песни «незавершёнными и почти кошмарными»[10]. В ответ на анонс бета-версии Udio в Twitter участник дуэта Telefon Tel Aviv Джошуа Юстис написал, что Udio — это «приложение для замены музыкантов», и усомнился в происхождении обучающих данных. Онлайн-критики также упрекали сервис в отсутствии «души» и потенциальной возможности создания аудио-дипфейков[11].[7] Лукас Ропек из Gizmodo охарактеризовал Udio как «полный акустической ерунды», а его мелодии — как «исключительно плохие»[15].
Критики Udio поднимают вопрос о том, какие данные использовались для обучения и содержали ли они защищённую авторским правом музыку. Rolling Stone отмечал, что есть «серьёзные основания полагать», что как Udio, так и Suno AI обучались на защищённых материалах, а Бендж Эдвардс (Ars Technica) предположил, что обучающая выборка, вероятно, была «наполнена защищёнными авторским правом произведениями»[10].[11] При этом Udio не воспроизводит существующие произведения по запросу[6] Дэвид Динг утверждает, что компания использует «широкую систему автоматических фильтров по авторскому праву» и постоянно совершенствует механизмы защиты.[7]. Для сравнения, Stability AI в Stable Audio 2.0 использует специально лицензированный датасет AudioSparx[16].
В июне 2024 года Ассоциация звукозаписывающей индустрии Америки подала иск против Udio и Suno, обвинив сервисы в массовом нарушении авторских прав на звуковые записи. Истцы требуют запретить обучение на защищённых произведениях и взыскать компенсацию до 150 000 долларов за каждое нарушение[17].[18]


