Midjourney
Midjourney — генеративный искусственный интеллект, представляющий собой программу и сервис, созданный и поддерживаемый независимой исследовательской лабораторией Midjourney, Inc., базирующейся в Сан-Франциско. Midjourney генерирует изображения по текстовым описаниям на естественном языке (так называемые «промпты»), аналогично таким системам, как DALL-E от OpenAI и Stable Diffusion от Stability AI[1][2]. Является одной из ключевых технологий современной волны ИИ.
В августе 2024 года инструмент находился в состоянии открытой беты, которую запустили 12 июля 2022 года[3]. Команду Midjourney возглавляет Дэвид Хольц, сооснователь Leap Motion[4]. По словам Хольца, сказанным изданию The Register в августе 2022 года, компания уже была прибыльной[5]. Пользователи могут создавать изображения с помощью команд бота Discord или через официальный сайт[6][7].
Что важно знать
| Midjourney | |
|---|---|
| Тип | Модель преобразования текста в изображение |
| Разработчики | Midjourney, Inc. |
| Языки интерфейса | английский |
| Первый выпуск | 12 июля 2022 |
| Последняя версия | V7 (4 апреля 2025) |
| Сайт | midjourney.com |
История
Midjourney, Inc. была основана в Сан-Франциско, Калифорния Дэвидом Хольцем[8], ранее сооснователем Leap Motion[9]. Платформа генерации изображений Midjourney перешла в стадию открытой беты 12 июля 2022 года[3]. 14 марта 2022 года был запущен сервер Discord Midjourney с просьбой публиковать качественные фотографии в Twitter и Reddit для обучения системы.
Компания регулярно обновляет свои алгоритмы, выпускает новые версии моделей каждые несколько месяцев. Версия 2 была запущена в апреле 2022 года[10], а версия 3 — 25 июля[11]. 5 ноября 2022 года была выложена альфа-версия четвёртого поколения[12][13]. С четвёртой версии основные модели обучаются на тензорных процессорах Google[14].
15 марта 2023 года вышла альфа-версия пятой серии[15]. Модель 5.1 стала более стилизованной, а 5.1 RAW лучше подходит для буквальных (дословных) промптов. Версия 5.2 включила новую «систему эстетики» и возможность «отдалять» сцену, дорисовывая окружение к уже сгенерированному изображению[16]. 21 декабря 2023 года появилась альфа-версия шестой модели, обученная с нуля за девять месяцев и получившая заметные улучшения в генерации текста и записи буквальных промптов.
| Версия | Дата выпуска |
|---|---|
| V1 | февраль 2022[17] |
| V2 | 12 апреля 2022[10] |
| V3 | 25 июля 2022[11] |
| V4 | 5 ноября 2022 (альфа)[12] |
| V5 | 15 марта 2023 (альфа)[15] |
| V5.1 | 3 мая 2023[18] |
| V5.2 | 22 июня 2023[19] |
| V6 | 21 декабря 2023 (альфа)[20] |
| V6.1 | 31 июля 2024[21] |
| V7 | 4 апреля 2025 (альфа)[22][23] |
| Версия | Дата выпуска | Примечания |
|---|---|---|
| --beta | 22 августа 2022 | |
| test/testp | 28 августа 2022 | |
| Niji | 20 декабря 2022 | Модель, специализирующаяся на аниме |
| Niji 5 | 2 апреля 2023 | |
| Niji 6 | 29 января 2024 |
Возможности
Midjourney доступна через бота в Discord или через официальный сайт. В Discord можно использовать официальный сервер, писать боту в личных сообщениях или приглашать его на сторонние серверы. Для генерации изображений применяется команда /imagine и текстовый промпт[24]. Далее бот возвращает четыре варианта, которые пользователь может увеличить по разрешению. На сайте первоначально требовалось наличие 1000 сгенерированных изображений через бота, позже это ограничение сняли.
5 сентября 2023 года в версии 5.2 появилась функция Vary (Region), позволяющая выделять зону изображения для изменения только на этом участке, оставляя остальную часть без изменений[25].
В августе 2024 года был запущен веб-интерфейс Midjourney (совместно с версией 6.1), упростивший доступ к сервису вне Discord. В редакторе объединены инструменты для редактирования, панорамирования, масштабирования, вариаций по участкам и дорисовки («inpainting») в единый интерфейс[26][27]. Веб-интерфейс синхронизирует чаты между Discord и веб-комнатами, облегчая коллаборацию. Переходу способствовала конкуренция с такими платформами, как Adobe Firefly и Google Imagen, уже имеющими собственные веб-приложения для создания изображений[28].
Параметр «image weight» позволяет регулировать влияние загруженного изображения на итоговый результат. При увеличении веса итог сильнее повторяет структуру и детали изображения, а при низком весе — больше ориентируется на текстовый промпт[29].
Функция Style Reference позволяет загрузить пример изображения, чтобы сервис учёл стиль (цветовую палитру, фактуру, атмосферу) при генерации. Это даёт пользователю больше контроля над эстетикой итогового изображения[30].
С помощью Character Reference можно загружать изображения персонажей и генерировать новые изображения с сохранением их внешнего вида — для консистентности персонажей в разных сценах[31].
Использование
По словам Дэвида Хольца, художники используют Midjourney для быстрого прототипирования идей и демонстрации заказчикам концепций[5].
Реклама активно внедряет такие ИИ-инструменты, как Midjourney, DALL-E и Stable Diffusion: они ускоряют генерацию уникального контента и позволяют тестировать креативы, что открывает возможности для персонализированной рекламы и новых эффектов[32].
Архитекторы описывают опыт использования Midjourney для генерации мудбордов на ранних этапах проектов, как альтернативу поиску изображений в Google Images[33].
В июне 2022 года британский журнал The Economist использовал Midjourney для создания обложки[35]. В августе 2022 года итальянская газета Corriere della Sera опубликовала комикс, созданный с помощью Midjourney[36]. Использование генерируемой обложки для The Atlantic вызвало споры среди иллюстраторов, отчасти их опасения касались конкуренции со стороны ИИ[37]. В августе 2022 года Last Week Tonight with John Oliver посвятил Midjourney отдельный 10-минутный сюжет[38].
Изображение Midjourney «Théâtre D’opéra Spatial» заняло первое место в конкурсе цифрового искусства на ярмарке штата Колорадо в 2022 году. Художник Джейсон Ален использовал промпт, распечатал результат на холсте и отправил на конкурс как «Jason M. Allen via Midjourney», что вызвало волну обсуждений среди цифровых художников[39].
В декабре 2022 года Midjourney применялась для иллюстрирования ИИ-сгенерированной детской книги Alice and Sparkle[40]. Проект вызвал споры из-за этики использования генеративных моделей, обучавшихся на чужих работах[34].
В 2023 году уровень реалистичности ИИ-генераторов заметно вырос: вирусное распространение получили фото Папы Франциска в пуховике[41], инсценировка ареста Дональда Трампа[42] и ложные снимки нападения на Пентагон[43]. Система используется и в профессиональном искусстве[44].
Исследования выявили, что изображения, генерируемые Midjourney, могут отражать предвзятость: даже с нейтральными промптами встречается неравномерное распределение по полу, цвету кожи и географии. Отдельное исследование некоммерческой организации Center for Countering Digital Hate показало, что сервис легко создаёт расистские и конспирологические изображения[45]. В октябре 2023 года Rest of World сообщал о генерации национальных стереотипов[46].
В 2024 году журнал Frontiers опубликовал статью[47], содержащую заведомо неверные иллюстрации, созданные Midjourney: рисунок крысы с огромными яичками и пенисом стал вирусным мемом и поводом для молниеносной отозвания публикации[48].
До мая 2023 года Midjourney блокировала нежелательные запросы по чёрному списку конкретных слов, касающихся NSFW, насилия, а также политических и религиозных фигур (например, Allah, Си Цзиньпин). Такой подход не раз вызывал споры о цензуре[49][50].
С мая 2023 года (после релизов v5) Midjourney перешла на ИИ-модерируемую фильтрацию контента: теперь анализируется не отдельное «запрещённое слово», а контекст всего промпта. Например, допускается портрет Си Цзиньпина, но не разрешается генерировать его арест[51].
Судебные разбирательства
13 января 2023 года три художника — Сара Андерсен, Келли МакКернан и Карла Ортис — подали иск против Stability AI, Midjourney и DeviantArt о нарушении авторских прав: утверждалось, что эти компании обучали свои ИИ на 5 миллиардах изображений, собранных из интернета без согласия авторов[52]. Иск был подан юристом Мэттью Баттериком (совместно с Joseph Saveri Law Firm) в Сан-Франциско; эта команда также оспаривает действия Microsoft, GitHub и OpenAI. В июле 2023 года судья Уильям Оррик III заявил о готовности отклонить основную часть иска, но разрешил истцам уточнить требования[53]. В ноябре 2023 года ещё один коллективный иск был подан против Midjourney и других компаний за использование работ более 4700 художников[54].
11 июня 2025 года Universal Pictures (принадлежит Comcast) и The Walt Disney Company подали на Midjourney в суд за нарушение авторских прав[55], назвав сервис «бездонной пропастью плагиата»[55].
4 сентября 2025 года Warner Bros. Discovery подала аналогичный иск, обвинив Midjourney в «краже» интеллектуальной собственности компании, включая образы Супермен, Бэтмен, Чудо-женщина, Твити и Скуби-Ду[56]. В иске говорится, что компания сознательно не защищает права владельцев авторских прав ради прибыли.


