Midjourney

Midjourney
Midjourney
Тип	Модель преобразования текста в изображение
Разработчики	Midjourney, Inc.
Языки интерфейса	английский
Первый выпуск	12 июля 2022
Последняя версия	V7 (4 апреля 2025)
Сайт	midjourney.com

Midjourney
Midjourney
Тип	Модель преобразования текста в изображение
Разработчики	Midjourney, Inc.
Языки интерфейса	английский
Первый выпуск	12 июля 2022
Последняя версия	V7 (4 апреля 2025)
Сайт	midjourney.com

Midjourney — генеративный искусственный интеллект, представляющий собой программу и сервис, созданный и поддерживаемый независимой исследовательской лабораторией Midjourney, Inc., базирующейся в Сан-Франциско. Midjourney генерирует изображения по текстовым описаниям на естественном языке (так называемые «промпты»), аналогично таким системам, как DALL-E от OpenAI и Stable Diffusion от Stability AI^[1]^[2]. Является одной из ключевых технологий современной волны ИИ.

В августе 2024 года инструмент находился в состоянии открытой беты, которую запустили 12 июля 2022 года^[3]. Команду Midjourney возглавляет Дэвид Хольц, сооснователь Leap Motion^[4]. По словам Хольца, сказанным изданию The Register в августе 2022 года, компания уже была прибыльной^[5]. Пользователи могут создавать изображения с помощью команд бота Discord или через официальный сайт^[6]^[7].

Midjourney, Inc. была основана в Сан-Франциско, Калифорния Дэвидом Хольцем^[8], ранее сооснователем Leap Motion^[9]. Платформа генерации изображений Midjourney перешла в стадию открытой беты 12 июля 2022 года^[3]. 14 марта 2022 года был запущен сервер Discord Midjourney с просьбой публиковать качественные фотографии в Twitter и Reddit для обучения системы.

Версии моделей

Компания регулярно обновляет свои алгоритмы, выпускает новые версии моделей каждые несколько месяцев. Версия 2 была запущена в апреле 2022 года^[10], а версия 3 — 25 июля^[11]. 5 ноября 2022 года была выложена альфа-версия четвёртого поколения^[12]^[13]. С четвёртой версии основные модели обучаются на тензорных процессорах Google^[14].

15 марта 2023 года вышла альфа-версия пятой серии^[15]. Модель 5.1 стала более стилизованной, а 5.1 RAW лучше подходит для буквальных (дословных) промптов. Версия 5.2 включила новую «систему эстетики» и возможность «отдалять» сцену, дорисовывая окружение к уже сгенерированному изображению^[16]. 21 декабря 2023 года появилась альфа-версия шестой модели, обученная с нуля за девять месяцев и получившая заметные улучшения в генерации текста и записи буквальных промптов.

Основные версии моделей
Версия	Дата выпуска
V1	февраль 2022^[17]
V2	12 апреля 2022^[10]
V3	25 июля 2022^[11]
V4	5 ноября 2022 (альфа)^[12]
V5	15 марта 2023 (альфа)^[15]
V5.1	3 мая 2023^[18]
V5.2	22 июня 2023^[19]
V6	21 декабря 2023 (альфа)^[20]
V6.1	31 июля 2024^[21]
V7	4 апреля 2025 (альфа)^[22]^[23]

Другие модели
Версия	Дата выпуска	Примечания
--beta	22 августа 2022
test/testp	28 августа 2022
Niji	20 декабря 2022	Модель, специализирующаяся на аниме
Niji 5	2 апреля 2023
Niji 6	29 января 2024

Midjourney доступна через бота в Discord или через официальный сайт. В Discord можно использовать официальный сервер, писать боту в личных сообщениях или приглашать его на сторонние серверы. Для генерации изображений применяется команда /imagine и текстовый промпт^[24]. Далее бот возвращает четыре варианта, которые пользователь может увеличить по разрешению. На сайте первоначально требовалось наличие 1000 сгенерированных изображений через бота, позже это ограничение сняли.

Vary (Region) и функция Remix

5 сентября 2023 года в версии 5.2 появилась функция Vary (Region), позволяющая выделять зону изображения для изменения только на этом участке, оставляя остальную часть без изменений^[25].

Веб-интерфейс Midjourney

В августе 2024 года был запущен веб-интерфейс Midjourney (совместно с версией 6.1), упростивший доступ к сервису вне Discord. В редакторе объединены инструменты для редактирования, панорамирования, масштабирования, вариаций по участкам и дорисовки («inpainting») в единый интерфейс^[26]^[27]. Веб-интерфейс синхронизирует чаты между Discord и веб-комнатами, облегчая коллаборацию. Переходу способствовала конкуренция с такими платформами, как Adobe Firefly и Google Imagen, уже имеющими собственные веб-приложения для создания изображений^[28].

Image Weight

Параметр «image weight» позволяет регулировать влияние загруженного изображения на итоговый результат. При увеличении веса итог сильнее повторяет структуру и детали изображения, а при низком весе — больше ориентируется на текстовый промпт^[29].

Style Reference

Функция Style Reference позволяет загрузить пример изображения, чтобы сервис учёл стиль (цветовую палитру, фактуру, атмосферу) при генерации. Это даёт пользователю больше контроля над эстетикой итогового изображения^[30].

Character Reference

С помощью Character Reference можно загружать изображения персонажей и генерировать новые изображения с сохранением их внешнего вида — для консистентности персонажей в разных сценах^[31].

По словам Дэвида Хольца, художники используют Midjourney для быстрого прототипирования идей и демонстрации заказчикам концепций^[5].

Реклама активно внедряет такие ИИ-инструменты, как Midjourney, DALL-E и Stable Diffusion: они ускоряют генерацию уникального контента и позволяют тестировать креативы, что открывает возможности для персонализированной рекламы и новых эффектов^[32].

Архитекторы описывают опыт использования Midjourney для генерации мудбордов на ранних этапах проектов, как альтернативу поиску изображений в Google Images^[33].

Известные применения и споры

В июне 2022 года британский журнал The Economist использовал Midjourney для создания обложки^[35]. В августе 2022 года итальянская газета Corriere della Sera опубликовала комикс, созданный с помощью Midjourney^[36]. Использование генерируемой обложки для The Atlantic вызвало споры среди иллюстраторов, отчасти их опасения касались конкуренции со стороны ИИ^[37]. В августе 2022 года Last Week Tonight with John Oliver посвятил Midjourney отдельный 10-минутный сюжет^[38].

Изображение Midjourney «Théâtre D’opéra Spatial» заняло первое место в конкурсе цифрового искусства на ярмарке штата Колорадо в 2022 году. Художник Джейсон Ален использовал промпт, распечатал результат на холсте и отправил на конкурс как «Jason M. Allen via Midjourney», что вызвало волну обсуждений среди цифровых художников^[39].

В декабре 2022 года Midjourney применялась для иллюстрирования ИИ-сгенерированной детской книги Alice and Sparkle^[40]. Проект вызвал споры из-за этики использования генеративных моделей, обучавшихся на чужих работах^[34].

В 2023 году уровень реалистичности ИИ-генераторов заметно вырос: вирусное распространение получили фото Папы Франциска в пуховике^[41], инсценировка ареста Дональда Трампа^[42] и ложные снимки нападения на Пентагон^[43]. Система используется и в профессиональном искусстве^[44].

Исследования выявили, что изображения, генерируемые Midjourney, могут отражать предвзятость: даже с нейтральными промптами встречается неравномерное распределение по полу, цвету кожи и географии. Отдельное исследование некоммерческой организации Center for Countering Digital Hate показало, что сервис легко создаёт расистские и конспирологические изображения^[45]. В октябре 2023 года Rest of World сообщал о генерации национальных стереотипов^[46].

В 2024 году журнал Frontiers опубликовал статью^[47], содержащую заведомо неверные иллюстрации, созданные Midjourney: рисунок крысы с огромными яичками и пенисом стал вирусным мемом и поводом для молниеносной отозвания публикации^[48].

Модерация и цензура контента в Midjourney

До мая 2023 года Midjourney блокировала нежелательные запросы по чёрному списку конкретных слов, касающихся NSFW, насилия, а также политических и религиозных фигур (например, Allah, Си Цзиньпин). Такой подход не раз вызывал споры о цензуре^[49]^[50].

С мая 2023 года (после релизов v5) Midjourney перешла на ИИ-модерируемую фильтрацию контента: теперь анализируется не отдельное «запрещённое слово», а контекст всего промпта. Например, допускается портрет Си Цзиньпина, но не разрешается генерировать его арест^[51].

13 января 2023 года три художника — Сара Андерсен, Келли МакКернан и Карла Ортис — подали иск против Stability AI, Midjourney и DeviantArt о нарушении авторских прав: утверждалось, что эти компании обучали свои ИИ на 5 миллиардах изображений, собранных из интернета без согласия авторов^[52]. Иск был подан юристом Мэттью Баттериком (совместно с Joseph Saveri Law Firm) в Сан-Франциско; эта команда также оспаривает действия Microsoft, GitHub и OpenAI. В июле 2023 года судья Уильям Оррик III заявил о готовности отклонить основную часть иска, но разрешил истцам уточнить требования^[53]. В ноябре 2023 года ещё один коллективный иск был подан против Midjourney и других компаний за использование работ более 4700 художников^[54].

11 июня 2025 года Universal Pictures (принадлежит Comcast) и The Walt Disney Company подали на Midjourney в суд за нарушение авторских прав^[55], назвав сервис «бездонной пропастью плагиата»^[55].

4 сентября 2025 года Warner Bros. Discovery подала аналогичный иск, обвинив Midjourney в «краже» интеллектуальной собственности компании, включая образы Супермен, Бэтмен, Чудо-женщина, Твити и Скуби-Ду^[56]. В иске говорится, что компания сознательно не защищает права владельцев авторских прав ради прибыли.

Официальный сайт

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[35]

[36]

[37]

[38]

[39]

[40]

[34]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

Midjourney

История

Версии моделей

Возможности

Vary (Region) и функция Remix

Веб-интерфейс Midjourney

Image Weight

Style Reference

Character Reference

Использование

Известные применения и споры

Модерация и цензура контента в Midjourney

Судебные разбирательства

Примечания

Ссылки

Категории