Midjourney

Midjourney — генеративный искусственный интеллект, представляющий собой программу и сервис, созданный и поддерживаемый независимой исследовательской лабораторией Midjourney, Inc., базирующейся в Сан-Франциско. Midjourney генерирует изображения по текстовым описаниям на естественном языке (так называемые «промпты»), аналогично таким системам, как DALL-E от OpenAI и Stable Diffusion от Stability AI[1][2]. Является одной из ключевых технологий современной волны ИИ.

В августе 2024 года инструмент находился в состоянии открытой беты, которую запустили 12 июля 2022 года[3]. Команду Midjourney возглавляет Дэвид Хольц, сооснователь Leap Motion[4]. По словам Хольца, сказанным изданию The Register в августе 2022 года, компания уже была прибыльной[5]. Пользователи могут создавать изображения с помощью команд бота Discord или через официальный сайт[6][7].

Что важно знать
Midjourney
Тип Модель преобразования текста в изображение
Разработчики Midjourney, Inc.
Языки интерфейса английский
Первый выпуск 12 июля 2022
Последняя версия V7 (4 апреля 2025)
Сайт midjourney.com

История

Midjourney, Inc. была основана в Сан-Франциско, Калифорния Дэвидом Хольцем[8], ранее сооснователем Leap Motion[9]. Платформа генерации изображений Midjourney перешла в стадию открытой беты 12 июля 2022 года[3]. 14 марта 2022 года был запущен сервер Discord Midjourney с просьбой публиковать качественные фотографии в Twitter и Reddit для обучения системы.

Версии моделей

Компания регулярно обновляет свои алгоритмы, выпускает новые версии моделей каждые несколько месяцев. Версия 2 была запущена в апреле 2022 года[10], а версия 3 — 25 июля[11]. 5 ноября 2022 года была выложена альфа-версия четвёртого поколения[12][13]. С четвёртой версии основные модели обучаются на тензорных процессорах Google[14].

15 марта 2023 года вышла альфа-версия пятой серии[15]. Модель 5.1 стала более стилизованной, а 5.1 RAW лучше подходит для буквальных (дословных) промптов. Версия 5.2 включила новую «систему эстетики» и возможность «отдалять» сцену, дорисовывая окружение к уже сгенерированному изображению[16]. 21 декабря 2023 года появилась альфа-версия шестой модели, обученная с нуля за девять месяцев и получившая заметные улучшения в генерации текста и записи буквальных промптов.

Основные версии моделей
Версия Дата выпуска
V1 февраль 2022[17]
V2 12 апреля 2022[10]
V3 25 июля 2022[11]
V4 5 ноября 2022 (альфа)[12]
V5 15 марта 2023 (альфа)[15]
V5.1 3 мая 2023[18]
V5.2 22 июня 2023[19]
V6 21 декабря 2023 (альфа)[20]
V6.1 31 июля 2024[21]
V7 4 апреля 2025 (альфа)[22][23]
Другие модели
Версия Дата выпуска Примечания
--beta 22 августа 2022
test/testp 28 августа 2022
Niji 20 декабря 2022 Модель, специализирующаяся на аниме
Niji 5 2 апреля 2023
Niji 6 29 января 2024

Возможности

Midjourney доступна через бота в Discord или через официальный сайт. В Discord можно использовать официальный сервер, писать боту в личных сообщениях или приглашать его на сторонние серверы. Для генерации изображений применяется команда /imagine и текстовый промпт[24]. Далее бот возвращает четыре варианта, которые пользователь может увеличить по разрешению. На сайте первоначально требовалось наличие 1000 сгенерированных изображений через бота, позже это ограничение сняли.

Vary (Region) и функция Remix

5 сентября 2023 года в версии 5.2 появилась функция Vary (Region), позволяющая выделять зону изображения для изменения только на этом участке, оставляя остальную часть без изменений[25].

Веб-интерфейс Midjourney

В августе 2024 года был запущен веб-интерфейс Midjourney (совместно с версией 6.1), упростивший доступ к сервису вне Discord. В редакторе объединены инструменты для редактирования, панорамирования, масштабирования, вариаций по участкам и дорисовки («inpainting») в единый интерфейс[26][27]. Веб-интерфейс синхронизирует чаты между Discord и веб-комнатами, облегчая коллаборацию. Переходу способствовала конкуренция с такими платформами, как Adobe Firefly и Google Imagen, уже имеющими собственные веб-приложения для создания изображений[28].

Image Weight

Параметр «image weight» позволяет регулировать влияние загруженного изображения на итоговый результат. При увеличении веса итог сильнее повторяет структуру и детали изображения, а при низком весе — больше ориентируется на текстовый промпт[29].

Style Reference

Функция Style Reference позволяет загрузить пример изображения, чтобы сервис учёл стиль (цветовую палитру, фактуру, атмосферу) при генерации. Это даёт пользователю больше контроля над эстетикой итогового изображения[30].

Character Reference

С помощью Character Reference можно загружать изображения персонажей и генерировать новые изображения с сохранением их внешнего вида — для консистентности персонажей в разных сценах[31].

Использование

По словам Дэвида Хольца, художники используют Midjourney для быстрого прототипирования идей и демонстрации заказчикам концепций[5].

Реклама активно внедряет такие ИИ-инструменты, как Midjourney, DALL-E и Stable Diffusion: они ускоряют генерацию уникального контента и позволяют тестировать креативы, что открывает возможности для персонализированной рекламы и новых эффектов[32].

Архитекторы описывают опыт использования Midjourney для генерации мудбордов на ранних этапах проектов, как альтернативу поиску изображений в Google Images[33].

Известные применения и споры

В июне 2022 года британский журнал The Economist использовал Midjourney для создания обложки[35]. В августе 2022 года итальянская газета Corriere della Sera опубликовала комикс, созданный с помощью Midjourney[36]. Использование генерируемой обложки для The Atlantic вызвало споры среди иллюстраторов, отчасти их опасения касались конкуренции со стороны ИИ[37]. В августе 2022 года Last Week Tonight with John Oliver посвятил Midjourney отдельный 10-минутный сюжет[38].

Изображение Midjourney «Théâtre D’opéra Spatial» заняло первое место в конкурсе цифрового искусства на ярмарке штата Колорадо в 2022 году. Художник Джейсон Ален использовал промпт, распечатал результат на холсте и отправил на конкурс как «Jason M. Allen via Midjourney», что вызвало волну обсуждений среди цифровых художников[39].

В декабре 2022 года Midjourney применялась для иллюстрирования ИИ-сгенерированной детской книги Alice and Sparkle[40]. Проект вызвал споры из-за этики использования генеративных моделей, обучавшихся на чужих работах[34].

В 2023 году уровень реалистичности ИИ-генераторов заметно вырос: вирусное распространение получили фото Папы Франциска в пуховике[41], инсценировка ареста Дональда Трампа[42] и ложные снимки нападения на Пентагон[43]. Система используется и в профессиональном искусстве[44].

Исследования выявили, что изображения, генерируемые Midjourney, могут отражать предвзятость: даже с нейтральными промптами встречается неравномерное распределение по полу, цвету кожи и географии. Отдельное исследование некоммерческой организации Center for Countering Digital Hate показало, что сервис легко создаёт расистские и конспирологические изображения[45]. В октябре 2023 года Rest of World сообщал о генерации национальных стереотипов[46].

В 2024 году журнал Frontiers опубликовал статью[47], содержащую заведомо неверные иллюстрации, созданные Midjourney: рисунок крысы с огромными яичками и пенисом стал вирусным мемом и поводом для молниеносной отозвания публикации[48].

Модерация и цензура контента в Midjourney

До мая 2023 года Midjourney блокировала нежелательные запросы по чёрному списку конкретных слов, касающихся NSFW, насилия, а также политических и религиозных фигур (например, Allah, Си Цзиньпин). Такой подход не раз вызывал споры о цензуре[49][50].

С мая 2023 года (после релизов v5) Midjourney перешла на ИИ-модерируемую фильтрацию контента: теперь анализируется не отдельное «запрещённое слово», а контекст всего промпта. Например, допускается портрет Си Цзиньпина, но не разрешается генерировать его арест[51].

Судебные разбирательства

13 января 2023 года три художника — Сара Андерсен, Келли МакКернан и Карла Ортис — подали иск против Stability AI, Midjourney и DeviantArt о нарушении авторских прав: утверждалось, что эти компании обучали свои ИИ на 5 миллиардах изображений, собранных из интернета без согласия авторов[52]. Иск был подан юристом Мэттью Баттериком (совместно с Joseph Saveri Law Firm) в Сан-Франциско; эта команда также оспаривает действия Microsoft, GitHub и OpenAI. В июле 2023 года судья Уильям Оррик III заявил о готовности отклонить основную часть иска, но разрешил истцам уточнить требования[53]. В ноябре 2023 года ещё один коллективный иск был подан против Midjourney и других компаний за использование работ более 4700 художников[54].

11 июня 2025 года Universal Pictures (принадлежит Comcast) и The Walt Disney Company подали на Midjourney в суд за нарушение авторских прав[55], назвав сервис «бездонной пропастью плагиата»[55].

4 сентября 2025 года Warner Bros. Discovery подала аналогичный иск, обвинив Midjourney в «краже» интеллектуальной собственности компании, включая образы Супермен, Бэтмен, Чудо-женщина, Твити и Скуби-Ду[56]. В иске говорится, что компания сознательно не защищает права владельцев авторских прав ради прибыли.

Примечания

Ссылки