Материал из РУВИКИ — свободной энциклопедии

Искусственный интеллект в искусстве

Искусственный интеллект в искусстве — направление визуального искусства, в котором произведения создаются или дорабатываются с помощью программ искусственного интеллекта (ИИ). Автоматизированное искусство известно с древних времён, однако становление современной области искусственного интеллекта приходится на 1950-е годы, и уже вскоре после этого художники начали использовать ИИ для творчества. На протяжении истории развития искусственного интеллекта поднимался ряд философских вопросов, связанных с познанием человеческого разума, созданием искусственных существ, а также с пределами определения понятия «искусство» в ситуации взаимодействия человека и ИИ. С XX века ИИ стал активно использоваться для генерации художественных работ, некоторые из которых выставлялись в музеях и получали награды[1].

В период бума искусственного интеллекта 2020-х годов широкой публике стали доступны текстово-графические модели, такие как Midjourney, DALL-E, Stable Diffusion, Runway и FLUX.1, что позволило пользователям легко и быстро создавать изображения[2][3]. Обсуждения ИИ-искусства 2020-х часто фокусируются на вопросах авторского права, подмены и манипуляций, диффамации, а также на воздействии на профессиональных художников, включая проблемы технологической безработицы.

Предыстория[править | править код]

Автомат Маярде рисует картину

Первые упоминания об автоматизированном искусстве относятся к автоматонам Древней Греции, где изобретатели, такие как Дедал и Герон Александрийский, проектировали устройства, способные писать тексты, издавать звуки и исполнять музыку[4][5]. Творческие автоматы рассматривались на протяжении веков, к примеру, «автомат Маярде», созданный около 1800 года, умел производить стихотворения и рисунки[6].

В XIX веке Ада Лавлейс писала о возможности использования «вычислительных операций» для генерации музыки и поэзии[7][8]. В 1950 году Алан Тьюринг в работе «Вычислительная техника и интеллект» ставил задачу имитации машиной человеческого поведения[9]. В 1956 году на исследовательской конференции в Дартмуте была основана научная дисциплина искусственного интеллекта[10].

С момента своего появления исследователи ИИ поднимали философские вопросы о природе человеческого разума и о последствиях создания искусственных существ с интеллектом, подобным человеческому; эти темы отражены и в мифах, и в философии, и в художественной литературе[11].

Художественная история[править | править код]

Инсталляция Galápagos Карла Симса позволяла зрителям «эволюционировать» 3D-формы.

С 1950-х годов художники начали применять ИИ для создания художественных объектов. Работы такого рода называли алгоритмическим искусством[12], компьютерным искусством, цифровым искусством или «новыми медиа»[13].

Одной из первых значимых систем ИИ-искусства является AARON, разработанная Харольдом Коэном в Университете Калифорнии в Сан-Диего во второй половине 1960-х[14]. Система реализует правилоориентированный подход — создание «технических изображений» с целью формализации самого процесса рисования[15]. В 1972 году AARON была представлена в Музее округа Лос-Анджелес[16], а затем до 1975 года дорабатывалась в Лаборатории искусственного интеллекта Стэнфорда[17]. В 2024 году Музей американского искусства Уитни представил ретроспективную выставку с использованием ранних роботов Коэна[17].

С 1980-х искусственный интеллект в художественных целях использует Карл Симс, пионер в области искусственной жизни, лауреат премий Prix Ars Electronica 1991 и 1992 за видео, созданные средствами искусственной эволюции[18]. В 1997 году Симс создал установку Galápagos для NTT InterCommunication Center в Токио. В 2019 году он получил премию Эмми за инженерные достижения[19].

Пример из Electric Sheep Скотта Дрэйвса

В 1999 году Скотт Дрэйвс и команда разработали Electric Sheep — бесплатный скринсейвер, распределённую вычислительную среду для анимации и эволюции фрактальных изображений, где ИИ создавал «бесконечную» анимацию, обучаясь на реакции пользователей. Проект получил премию Fundación Telefónica Life 4.0.

В 2014 году Стефани Динкинс начала проект диалогов с социальным роботом BINA48[20], а в 2015 году Соугуэн Чжунг приступила к перформансам — совместным рисованиям с помощью роботизированной руки на ИИ[21]. В 2018 году на аукционе Кристис в Нью-Йорке работа Edmond de Belamy (созданная генеративно-состязательной сетью) была продана почти в 45 раз дороже оценки[22].

В 2024 году вышел японский фильм generAIdoscope, в котором видео, звук и музыка полностью созданы средствами искусственного интеллекта[23].

В 2025 году впервые вышел аниме-сериал Twins Hinahima, который частично был создан при помощи ИИ (конвертация фото в стиль аниме, ретушь и др.)[24].

Технологическая история[править | править код]

Глубокое обучение с многоуровневой структурой, призванной имитировать работу человеческого мозга, стало переломным моментом в искусстве на ИИ в 2010-х годах[25]. В этот период для генеративного искусства применялись: авторегрессионные модели, диффузионные модели, генеративно-состязательные сети (ГСС/ГАН), нормализующие потоки.

В 2014 году Иэн Гудфеллоу и соавторы разработали генеративно-состязательную сеть (ГАН), способную генерировать изображения на основе анализа статистических свойств данных. ГАНы не только следуют заданным правилам, но и способны учиться на избранном наборе примеров[12].

В 2015 году команда Google разработала DeepDream, программу для поиска и усиления паттернов в изображениях с помощью свёрточной нейросети, что приводит к «сновидческим» эффектам[26].

В 2020-х распространение получили текстово-графические модели, такие как DALL-E, Midjourney, Stable Diffusion и прочие.

Инструменты и процессы

[править | править код]

Подходы[править | править код]

Существует множество подходов к созданию ИИ-искусства. При модели преобразования текста в изображение пользователь задаёт текстовое описание (промт), а ИИ генерирует изображение — чаще всего с помощью диффузионных или трансформерных архитектур[27]. Модели преобразования изображения в другое изображение позволяют преобразовывать исходное изображение в новый стиль, а преобразования изображения в видео — анимировать изображения[28]. При преобразовании текста в видео модель генерирует видеоролики по описанию[29].

Изобразительные инструменты[править | править код]

Пример использования ComfyUI для Stable Diffusion XL. Пользователи могут настраивать параметры генерации.

Художники, работающие с диффузионными моделями, используют как базовые, так и расширенные функции: выбор положительных и отрицательных промтов, использование или игнорирование VAE, LoRA, гиперсетей, эмбеддинга/текстовой инверсии. Ключевые настройки — «guidance scale», seed, выбор апскейлеров и др. Возможна генерация новых моделей для индивидуального творчества.

Широко развиты процедурные (правилоориентированные) методы генерации изображений — на основе математических паттернов, имитации мазков и использования глубокого обучения (ГАН, трансформеры). Существуют приложения и сайты для широкой аудитории с упрощёнными настройками[30].

Существуют как простые мобильные приложения, так и специализированные сервисы на GPU и в ноутбуках Jupyter. Также применяются методы текстовой инверсии — пользователь обучает модель распознавать абстрактное понятие или стиль и затем генерирует изображения на основе нового слова[31].

Влияние и применения[править | править код]

ИИ способствует социальной трансформации — позволяет любителям создавать новые жанры визуальной культуры (например, соларпанк), ускоряет прототипирование[32], уменьшает порог вхождения в искусство[32], повышает продуктивность художника. Генерация изображений нередко используется как этап предварительных эскизов, быстрых экспериментов или для иллюстрации концепций[33].

Промт-инжиниринг и обмен[править | править код]

Промты для преобразования текста в изображение могут включать изображения, ключевые слова, стилистические параметры. Доступны платформы для обмена промтами, создания галерей, совместной доработки и обсуждения[34]. Промт — не единственный входной параметр генерации: результат зависят также от разрешения вывода, число-зерна, алгоритма семплирования[35].

Терминология[править | править код]

Синтетические медиа, куда входит и ИИ-искусство, в 2020-х признаны важным технологическим трендом[32]. Термин «синтография» предлагается для обозначения фотографически правдоподобных изображений, генерируемых ИИ[36].

Проблемы и ограничения

[править | править код]

Смещение и предвзятость[править | править код]

Серьёзную озабоченность вызывает алгоритмическая предвзятость: тренировочные данные часто воспроизводят дискриминацию. В 2023 году учёные Вашингтонского университета выявили расовые смещения в Stable Diffusion, где образ «человека» чаще ассоциировался с мужчинами европейского происхождения[37].

Подобные искажения выявлены и в более ранних исследованиях: алгоритмы связывали европейские имена с «положительными» признаками, а женские — с искусством и гуманитарными науками[38].

Примером гендерной предвзятости стал случай с приложением Lensa (2023), где генерируемые образы женщин часто были представлены в искажённом свете[39].

В 2024 году генератор изображений Gemini от Google подвергся критике за «корректировку» в сторону представления исторических фигур неевропейской внешности[40]. Это привело к дискуссии об этических последствиях и возможном искажении исторического контекста[41].

Авторское право[править | править код]

Юридические и этические вопросы ИИ-искусства обсуждаются с конца XX века. Центральная проблема — возможность использования материалов других авторов без их согласия при обучении моделей[42].

В 1985 году профессор Памела Самуэльсон рассматривала вопрос о присвоении авторских прав пользователю программы[43]. Новые юридические проблемы возникли с массовой доступностью ИИ: художники протестуют против использования своих работ в обучающих датасетах, растёт популярность сервисов по обнаружению залитых работ (например, «Have I Been Trained?»)[44].

По данным Бюро авторского права США, программы ИИ не могут быть субъектом авторского права[45], а авторские права на сгенерированные изображения с помощью, например, DALL-E, в ряде случаев переходят к пользователю, создавшему промт[46].

В США и других странах в 2020—2025 годах инициированы судебные иски против компаний, разрабатывающих генераторы изображений, за нарушение авторских прав[47].

Манипуляции и подделки[править | править код]

Появление ИИ-генераторов повысило риск манипуляций и подложных изображений: дипфейков, фейк-портретов и видео, контента, вредящего репутации или вводящего в заблуждение[48]. Известны случаи победы ИИ-работ на престижных конкурсах с последующим отказом авторов признавать награду.

В 2023 году вирусными стали изображения, ошибочно принимаемые за реальные (например, Папа Римский в пуховике, дипфейковые арты с Дональдом Трампом), что породило новые вопросы об ответственности и маркировке сгенерированных материалов[49].

Основные платформы и разработчики внедряют средства распознавания сгенерированных изображений[50].

Экономика и занятость[править | править код]

Распространение генеративного ИИ вызывает опасения среди профессиональных художников касательно утраты источников заработка. Автоматизация рутинных задач приводит к сокращению рабочих мест для начинающих авторов, а ИИ освещает вопросы честного копирования индивидуального стиля для коммерческой выгоды[51].

ИИ-арт понижает ценность традиционного стокового изображения, а крупные фотобанки интегрируют собственные инструменты генерации на базе безопасных датасетов[52].

Потребление электроэнергии[править | править код]

По расчётам исследователей университета Карнеги — Меллона и Hugging Face (2023), генерация тысячи изображений размером 1024×1024 на основе Stable Diffusion XL требует 11,49 кВт⋅ч электроэнергии, что эквивалентно выбросу 1594 г CO₂[53].

Анализ искусствоведческих коллекций с помощью ИИ

[править | править код]

ИИ применяется не только для создания, но и анализа больших цифровых коллекций произведений искусства. Современные исследовательские методы (медленное чтение, удалённое видение) позволяют количественно сравнивать стилевые особенности и атрибуцию картин[54].

Другие формы ИИ-искусства

[править | править код]

Генеративный ИИ применяется в смежных областях: композиторская и исполнительская музыка, видеоигры (генерация уровней, сюжетов, квестов), литература (автоматизированная помощь писателям при блоке идей, вдохновение), роботизированная кухня (в динамическом анализе вкусовых качеств блюда)[55][56].

Примечания

[править | править код]
  1. Тодорович, Милош (2024). “ИИ и наследие: размышления о переосмыслении культурного наследия в цифровом мире”. International Journal of Cultural and Social Studies. 10 (1): 1—11. DOI:10.46442/intjcss.1397403. Дата обращения 4 июля 2024.
  2. Edwards, Benj FLUX: новый генератор изображений ИИ впечатляет созданием реалистичных человеческих рук (амер. англ.). Ars Technica (2 августа 2024). Дата обращения: 17 ноября 2024.
  3. Все эти изображения созданы новейшим текстово-графическим ИИ Google, The Verge, Vox Media (24 мая 2022). Архивировано 15 февраля 2023. Дата обращения: 28 мая 2022.
  4. Ноэль Шарки. Программируемый робот 60 года н.э. New Scientist (4 июля 2007). Дата обращения: 22 октября 2019. Архивировано 13 января 2018 года.
  5. Бретт, Жерар (июль 1954). “Автоматы в византийском "Троне Соломона"”. Speculum. 29 (3): 477—487. DOI:10.2307/2846790. Проверьте дату в |date= (справка на английском)
  6. kelinich Автомат Маярде (англ.). The Franklin Institute (8 марта 2014). Дата обращения: 24 августа 2023. Архивировано 24 августа 2023 года.
  7. Natale, S., & Henrickson, L. (2022). The Lovelace Effect: Perceptions of Creativity in Machines. White Rose Research Online. Получено 24 сентября 2024, с https://eprints.whiterose.ac.uk/182906/6/NMS-20-1531.R2_Proof_hi%20%282%29.pdf
  8. Лавлейс А. (1843). Notes by the translator. Taylor’s Scientific Memoirs, 3, 666—731.
  9. Тьюринг, Алан Computing Machinery and Intelligence (октябрь 1950). Дата обращения: 16 сентября 2024.
  10. Кревье, Даниэль. Искусственный интеллект: бурный поиск. — Нью-Йорк : BasicBooks, 1993. — P. 109. — ISBN 0-465-02997-3.
  11. Ньюквист, Х.П. Создатели мозга: гениальность, эго и жадность в погоне за мыслящими машинами. — Нью-Йорк : Macmillan/SAMS, 1994. — P. 45–53. — ISBN 978-0-672-30412-5.
  12. 1 2 Эльгаммал, Ахмед (2019). “ИИ размывает понятие художника”. American Scientist. 107 (1): 18. DOI:10.1511/2019.107.1.18.
  13. Гринфилд, Гэри (2015-04-03). “When the machine made art: история компьютерного искусства”. Journal of Mathematics and the Arts [англ.]. 9 (1—2): 44—47. DOI:10.1080/17513472.2015.1009865.
  14. МакКордак, Памела. Код ААРОН: Мета-искусство, искусственный интеллект и творчество Харольда Коэна. — Нью-Йорк : W. H. Freeman and Company, 1991. — P. 210. — ISBN 0-7167-2173-2.
  15. Poltronieri, Fabrizio Augusto. Technical Images and Visual Art in the Era of Artificial Intelligence // Proceedings of the 9th International Conference on Digital and Interactive Arts / Fabrizio Augusto Poltronieri, Max Hänska. — Braga Portugal : ACM, 2019-10-23. — P. 1–8. — ISBN 978-1-4503-7250-3. — doi:10.1145/3359852.3359865.
  16. HAROLD COHEN (1928–2016). Art Forum (9 мая 2016). Дата обращения: 19 сентября 2023.
  17. 1 2 Diehl, Travis. A.I. Art That's More Than a Gimmick? Meet AARON, The New York Times (15 февраля 2024). Дата обращения: 1 июня 2024.
  18. Golden Nicas. Ars Electronica Center. Дата обращения: 26 февраля 2023.
  19. - Winners. Television Academy. Дата обращения: 26 июня 2022. Архивировано 1 июля 2020 года.
  20. Robots, Race, and Algorithms: Stephanie Dinkins at Recess Assembly. Art21 Magazine (7 ноября 2017). Дата обращения: 25 февраля 2020.
  21. Drawing Operations (2015) – Sougwen Chung (愫君). Дата обращения: 25 февраля 2025.
  22. Грядёт ли искусственный интеллект как новое медиа в искусстве? Christie's (12 декабря 2018). Дата обращения: 21 мая 2019.
  23. Cayanan, Joanna Писатель Отсуичи срежиссировал generAIdoscope — фильм, полностью созданный ИИ. Anime News Network (13 июля 2024). Дата обращения: 4 марта 2025.
  24. Hodgkins, Crystalyn Аниме Twins Hinahima с применением ИИ состоится на ТВ 29 марта. Anime News Network (28 февраля 2025). Дата обращения: 4 марта 2025.
  25. Что такое глубокое обучение? (англ.). IBM (17 июня 2024). Дата обращения: 13 ноября 2024.
  26. Mordvintsev, Alexander DeepDream — пример кода визуализации нейросетей. Google Research (2015). Архивировано 8 июля 2015 года.
  27. Wu, Yue Визуальный гид по работе диффузионных моделей. Towards Data Science (6 февраля 2025). Дата обращения: 12 июня 2025.
  28. Image-to-Image Translation. dataforest.ai. Дата обращения: 12 июня 2025.
  29. AI Video Generation: What Is It and How Does It Work? Colossyan. Дата обращения: 12 июня 2025.
  30. AI-фильтры делают фото похожими на работы Пикассо, Digital Trends (18 ноября 2019). Дата обращения: 9 ноября 2022.
  31. Textual Inversion в AUTOMATIC1111. GitHub. Дата обращения: 9 ноября 2022.
  32. 1 2 3 Синтетические медиа навсегда трансформируют бизнес, Computerworld (1 ноября 2022). Дата обращения: 9 ноября 2022.
  33. ИИ-искусство уже меняет креативные профессии, The New York Times (21 октября 2022). Дата обращения: 16 ноября 2022.
  34. Эта галерея ИИ-арт ещё лучше генераторов, How-To Geek. Дата обращения: 9 ноября 2022.
  35. Stable Diffusion Prompt Book (28 октября 2022). Дата обращения: 7 августа 2023.
  36. Reinhuber, Elke Synthography–An Invitation to Reconsider... (2 декабря 2021).
  37. Milne, Stefan. Искусственный интеллект Stable Diffusion воспроизводит расовые и гендерные стереотипы, UW News (29 ноября 2023).
  38. Hadhazy, Adam Biased bots: Искусственный интеллект отражает предубеждения людей. Princeton University (18 апреля 2017). Дата обращения: 13 ноября 2024.
  39. Heikkilä, Melissa Lensa undressed me — без моего согласия. MIT Technology Review. Дата обращения: 26 ноября 2024.
  40. Robertson, Adi Google приносит извинения за «упущения» Gemini. The Verge (21 февраля 2024). Дата обращения: 20 апреля 2024.
  41. Rendering misrepresentation: Diversity failures in AI image generation. Brookings. Дата обращения: 26 октября 2024.
  42. Старк, Люк; Кроуфорд, Кейт (2019-09-07). “Work of Art in the Age of Artificial Intelligence...”. Surveillance & Society [англ.].
  43. Самуэльсон, Памела (1985). “Allocating Ownership Rights in Computer-Generated Works”. U. Pitt. L. Rev. 47: 1185.
  44. Художники ArtStation протестуют против ИИ-генерации. Ars Technica (15 декабря 2022). Дата обращения: 21 декабря 2022.
  45. Офис авторского права США: ИИ-арт не подлежит регистрации. Smithsonian Magazine. Дата обращения: 11 января 2023.
  46. Can I sell images I create with DALL·E? (n.d.). OpenAI Help Center. Получено 11 ноября 2024, с https://help.openai.com/en/articles/6425277-can-i-sell-images-i-create-with-dall-e
  47. Chmielewski, Dawn. Disney и Universal подают в суд на Midjourney, Reuters (11 июня 2025). Дата обращения: 11 июня 2025.
  48. Дипфейки: неэтичные сценарии применения ИИ-генераторов, TechCrunch (24 августа 2022). Дата обращения: 15 сентября 2022.
  49. Novak, Matt Изображение Папы в пуховике оказалось подделкой. Дата обращения: 16 июня 2023.
  50. Whitwam, Ryan OpenAI создало инструмент для отличия изображений DALL-E 3 (8 мая 2024). Дата обращения: 26 мая 2024.
  51. Roose, Kevin Хуан ИИ выиграл приз: художники недовольны. The New York Times (2022). Дата обращения: 1 октября 2022.
  52. Tolliver-Walker, Heidi Могут ли ИИ-изображения заменить сток? (11 октября 2023). Дата обращения: 26 мая 2024.
  53. Luccioni, Alexandra Sasha. Power Hungry Processing: Watts Driving the Cost of AI Deployment?. — 2024.
  54. Cetinic, Eva; She, James (2022). “Understanding and Creating Art with AI: Review and Outlook”. ACM Transactions on Multimedia Computing, Communications, and Applications [англ.].
  55. Yannakakis, Георгиос Н. Computing Frontiers // Game AI revisited. — 2012. — P. 285–292.
  56. Katsnelson, Алла (2022). “Новые ИИ помогают с английским авторам статей”. Nature.