Искусственный интеллект и авторское право
Искусственный интеллект и авторское право — область права, изучающая вопросы, связанные с авторским правом при использовании методов искусственного интеллекта, в частности генеративных моделей, основанных на глубоких нейронных сетях. В 2020-х годах стремительное развитие таких генеративных моделей, как, например, Stable Diffusion (текст-в-изображение) и ChatGPT (крупная языковая модель), привело к появлению новых дискуссий относительно статуса авторских прав на произведения, созданные искусственным интеллектом, а также вопросов о возможности нарушения авторских прав при обучении и использовании таких моделей[1].
Популярные модели глубокого обучения обучаются на огромных объёмах данных, собранных из интернета, что часто включает защищённые авторским правом материалы[2]. Использование защищённых произведений для формирования обучающих выборок может рассматриваться как нарушение исключительного права правообладателя на воспроизведение, если только это не подпадает под исключения, предусмотренные законом об авторском праве. Кроме того, результаты работы ИИ могут также привести к нарушению авторских прав, а создатели моделей могут быть привлечены к ответственности по принципу косвенной ответственности.
Авторское право на произведения, созданные искусственным интеллектом
В большинстве правовых систем авторское право предоставляется только оригинальным произведениям, созданным человеком. Таким образом, определение «оригинальности» является ключевым для статуса авторских прав на произведения, созданные искусственным интеллектом[3].
В США закон об авторском праве защищает только «оригинальные произведения авторства». Управление по авторским правам США трактует это как ограничение только произведениями, созданными человеком, и отказывает в регистрации прав на работы, созданные без участия человека. Некоторые юристы отмечают, что прецедентом можно считать дело англ. Naruto v. Slater (2018), в котором Апелляционный суд девятого округа США постановил, что не-человеческие существа не могут считаться авторами художественных произведений[4]. Согласно другой позиции, определённые работы, сгенерированные ИИ, могут быть защищены авторским правом, если можно доказать, что человек внёс в них творческий вклад при выборе исходных данных или редактировании результата.
Сторонники этого подхода рассматривают ИИ как инструмент, подобный кисти или фотоаппарату, в руках автора для воплощения его творческих замыслов. Например, если стандарт оригинальности удовлетворяется нажатием кнопки затвора камеры, пользователи генеративного ИИ также могут претендовать на авторские права, особенно при многократной доработке запросов к системе[5]. Некоторые эксперты замечают, что Управление по авторскому праву не придерживается технологически нейтрального подхода к ИИ и автоматизированным инструментам[6].
Различие в подходах проявилось в деле о регистрации работы Théâtre D'opéra Spatial Джейсона Мэттью Аллена, сгенерированной с помощью Midjourney и инструмента масштабирования. Управление по авторскому праву заявило:
Коллегия считает, что Работа содержит более чем минимальное количество материала, сгенерированного искусственным интеллектом («ИИ»), и этот материал должен быть исключён из заявки на регистрацию. Поскольку г-н Аллен отказался сделать это, Работа не может быть зарегистрирована в заявленном виде[7].
В связи с активным использованием ИИ для создания литературы, музыки и искусства, Управление по авторскому праву США выпустило дополнительные разъяснения по вопросам регистрации подобных работ, отмечая различие между произведениями как «механическим воспроизведением», так и как «проявлением собственного творческого замысла автора»[8]. В марте 2023 года опубликован специальный регламент по вопросам использования ИИ при создании произведений, в котором отмечено:
...поскольку Управление ежегодно получает около полумиллиона заявок, возникает необходимость адаптировать или расширять перечень обязательной информации в заявке.
Одно из новых явлений — это применение сложных технологий искусственного интеллекта, способных создавать выразительный контент. Эти технологии «обучаются» на огромных объёмах уже имеющихся работ, созданных человеком, и используют выводы из этого обучения для генерации новых материалов. Некоторые из них работают в ответ на текстовые инструкции пользователя (prompt).
Полученный результат может быть текстовым, визуальным или аудио, и определяется ИИ на основе своего устройства и обучающего материала. Эти технологии, часто называемые «генеративным ИИ», вызывают вопросы: защищён ли получаемый материал авторским правом, могут ли быть зарегистрированы работы, сочетающие элементы, созданные человеком и сгенерированные ИИ, и какую информацию должны предоставлять заявители[9].
В январе 2025 года Управление по авторскому праву уточнило, что работы, в которых творческое выражение человека остаётся очевидным — в том числе при тщательном формулировании запроса к ИИ или использовании ИИ как вспомогательного инструмента (например, в кинопроизводстве), — подлежат авторскому праву[10]. Работы, где выражение полностью определяется машиной, защищаться не будут[11]. Руководствуясь этими критериями, в январе 2025 года первая полностью сгенерированная ИИ визуальная работа («A Single Piece of American Cheese») была зарегистрирована как составное произведение[12]. Основанием для авторского права стало участие человека в выборе, компоновке и координации, признаваемое достаточным для признания авторства.
Суды федерального и окружного уровней в округе Колумбия поддержали отказ Управления по авторскому праву в регистрации произведений, полностью созданных машиной, указав на противоречие такой регистрации природе наследуемого права собственности по закону 1975 года[13].
Патентное ведомство США (USPTO) также ввело ограничения на патентоспособность изобретений, созданных исключительно ИИ, после решения по делу англ. Thaler v. Perlmutter (август 2023). Здесь профессору Стивену Талеру было отказано в патенте на результат работы его программы DABUS из-за отсутствия «естественного лица» в качестве автора. Данное решение поддержал Федеральный апелляционный суд[14][15]. Позднее USPTO разъяснило, что патенты могут быть зарегистрированы только при документально подтверждённом участии человека в изобретательной деятельности[16]. Однако это становится практически невозможным, когда участие и функционал ИИ остаются неясными[15].
В апреле 2024 года конгрессмен Адам Шифф внёс в палату представителей законопроект о раскрытии использования защищённых работ для обучения генеративных ИИ. Если он будет принят, компании будут обязаны предоставлять подобные сведения за 30 дней до выпуска новых ИИ-систем[17].
В ряде стран предусмотрены специальные положения о компьютерных произведениях, как, например, в законе Великобритании:
В случае литературного, драматического, музыкального или художественного произведения, созданного компьютером, автором считается лицо, обеспечившее необходимые организационные меры для создания произведения.
Однако эти правила применяются к случаям автономного создания произведений программой. Если человек использует ИИ-инструменты как помощника и сам обеспечивает минимальную степень творчества, он признаётся автором. При создании полностью автономных произведений авторами могут быть разработчики программ[18].
Правительство Великобритании обсуждает внедрение специального Кодекса практики для поддержки ИИ-компаний, обеспечивающего баланс между использованием защищённых данных для обучения и защитой правообладателей[19][20]. В октябре 2023 года Управление по авторскому праву США также инициировало консультации по данным вопросам[21].
27 ноября 2023 года интернет-суд Пекина принял решение, признающее авторское право на изображения, сгенерированные искусственным интеллектом[22].
По мнению специалистов, основная трудность для регуляторов и судов заключается в выработке технологически нейтрального подхода к охране человеческого творчества с учётом рисков так называемых автоматизированных ИИ-фабрик[6].
Обучение ИИ на защищённых авторским правом данных
Модели глубокого обучения собирают большие датасеты из интернета (публичные изображения, тексты сайтов), переводя их в числовой формат для анализа. Модель распознаёт взаимосвязи между текстами и изображениями, а затем при многократном тестировании совершенствует способность генерировать новые данные только на основе текстовых подсказок пользователя[23]. Если обучение требует копирования защищённых произведений, возникает вопрос: является ли это нарушением исключительного права автора на воспроизведение, или подпадает под разрешённые законом исключения («добросовестное использование»)[24][25].
Разработчики машинного обучения в США полагают, что обучение моделей в таких условиях подпадает под категорию добросовестного использования из-за трансформативности и ограниченного применения произведений[26]. Ситуация сравнивается с делом сканирования книг Google, по результатам которого такое использование было признано добросовестным благодаря отсутствию распространения полного содержимого[27].
По мнению аналитиков, если суды встанут на сторону правообладателей, это создаст преимущества крупным корпорациям (Google, Microsoft, Meta), обладающим ресурсами для приобретения лицензий[27]. Исследователи Брайан Кейси и Марк Лемли отмечают, что объёмы данных столь велики, что лицензионное покрытие всей выборки малореально — и любое требование оплаты фактически ограничит использование таких данных полностью[28]. Другие эксперты предсказывают развитие аналогичных механизмов музыкального лицензирования[26].
Одним из первых прецедентов стало дело Thomson Reuters против Ross Intelligence (2020): компания утверждала, что её юридическая ИИ-система была обучена на защищённых сводках решений Westlaw. После череды разбирательств суд признал сводки объектом авторского права, а действия Ross Intelligence — нарушением[29].
В деле против Meta и OpenAI, федеральный судья заявил, что применение несанкционированных произведений для обучения инновационных моделей подрывает коммерческий потенциал оригинальных работ и ставит под вопрос применение доктрины fair use[30].
В случае с компанией Anthropic, суд отдельно признал добросовестным обучение на легально купленных книгах, но не на нелицензированных произведениях, часть из которых входила в датасет The Pile[31]. Последующее предложение о мировом соглашении было судом отклонено[32].
Также Управление по авторскому праву США отметило, что появление новых моделей авторского права на контент, созданный ИИ, требует повторного взвешивания факторов fair use, включая трансформативность и влияние на рынок[33].
В ЕС исключения для обучения ИИ (text and data mining, TDM) закреплены Директивой 2019 года о цифровом едином рынке[34]. В Акте об ИИ (2024) признано, что такие исключения распространяются и на коммерческое обучение ИИ, если правообладатель прямо не выразил отказ[35]. В 2024 году немецкий суд подтвердил это толкование. С августа 2025 года провайдеры ИИ обязаны публиковать подробные сведения о датасетах и соблюдать политику отказа от TDM-исключения[36].
В отличие от ЕС, Великобритания запрещает майнинг данных в коммерческих целях, однако планирует смягчить эти ограничения во имя развития ИИ[37].
Индийский закон допускает применение принципа fair use для научных исследований, но не содержит специальных положений относительно коммерческого обучения ИИ. В 2024 году информационное агентство Asian News International подало иск против OpenAI за использование своих материалов в обучающих датасетах без разрешения. Этот кейс также поднял вопросы юрисдикции и эффективности процедур оптаута[38].[39]
Нарушения авторских прав в результатах работы ИИ
В ряде случаев модели глубокого обучения повторяют отдельные элементы обучающих выборок при генерации результата. Разработчики ИИ считают такое поведение (оверфиттинг) нежелательным и ранее полагали его решаемой проблемой[40]. В современных языковых моделях феномен «запоминания» (memorization) приводит к повторению длинных фрагментов обучающих данных, и связан уже не столько с оверфиттингом[41]. Величина запоминания оценивается, например, как превышающая 1 % (для точных дубликатов)[42] или до 7 %[43]. Это представляет риски как для пользователей, так и для разработчиков[44]. К августу 2023 года ведущие разработчики пытались снизить риск утечек, но исследователи всё равно фиксировали возможность получения защищённого материала на специальный запрос[45].
В американском праве для признания результата работы ИИ нарушающим авторское право истец должен доказать, что генерация осуществлена на основе защищённого произведения, а результат «существенно схож» с ним, и что у ИИ был доступ к оригиналу.
Генеративные модели могут также подражать стилю конкретных художников. Хотя общий стиль не подлежит охране, по американскому законодательству, художественный образ вымышленного персонажа может быть защищён, а ИИ способен создавать работы с такими персонажами.
В марте 2025 года вопросы охраноспособности стиля и произведений, генерируемых ИИ, были вновь подняты из-за того, что обновлённая версия ChatGPT позволяла генерировать изображения в стиле художников студии Ghibli. После критики пользователей, модель ограничила возможность генерации изображений в стиле живых авторов[46][47].
Судебные разбирательства
- В ноябре 2022 года коллективный иск против Microsoft, GitHub и OpenAI обвинил сервис GitHub Copilot в массовом нарушении авторских прав разработчиков открытого ПО: система генерировала исходный код, идентичный данным из обучающей выборки, без указания авторства.
- В январе 2023 года американские художницы Сара Андерсен, Келли МакКернан и Карла Ортис объединились и подали иск о нарушении авторских прав к Stability AI, Midjourney и DeviantArt, заявив, что обучающие выборки ИИ содержат миллиарды изображений без согласия авторов. Впоследствии суд оставил в силе только один пункт обвинения — против Stability AI[48]. В августе 2024 года отдельные претензии были возвращены к рассмотрению[49].
- В январе 2023 года Stability AI была подана в суд в Лондоне за использование изображений Getty Images в обучающем датасете без лицензии.
- В феврале 2023 года аналогичный иск был подан в делавэрский окружной суд США с обвинениями в нарушении не только авторского права на изображения Getty Images, но и товарного знака (ИИ генерировал изображения с водяными знаками Getty).
- В июле 2023 года писатели Пол Трембле и Мона Авад подали иск против OpenAI за обучение ChatGPT на их книгах. Точные пересказы работ были признаны судом вероятным доказательством использования защищённого материала[50].[51]
- Авторы Сара Сильверман, Кристофер Голден и Ричард Кадри подали отдельные иски против Meta и OpenAI, утверждая, что не только обучение на их книгах, но и генерация новых текстов ИИ в их стиле нарушает авторские права[52]. После объединения исков большинство претензий было отклонено[53].
- В сентябре 2023 года Гильдия авторов (Authors Guild) подала иск против OpenAI от имени 17 писателей (включая Джорджа Р. Р. Мартина), утверждая, что произведения незаконно использовались для обучения ChatGPT[54].
- В декабре 2023 года газета New York Times подала иск против Microsoft и OpenAI, считая несанкционированное обучение моделей ИИ на своих статьях нарушением авторских прав[55].
- В апреле 2024 года восемь национальных американских газет подали коллективный иск против Microsoft и OpenAI о нарушении авторских прав (использование их статей для обучения ИИ и генерация ложных высказываний с непрошенным упоминанием газет как источника)[56].
- В июне 2024 года Ассоциация звукозаписывающей индустрии США (RIAA) и крупные лейблы подали иски к компаниям Suno AI и Udio — генеративные ИИ-системы, преобразующие текстовые запросы в музыку, обвиняются в обучении на защищённых композициях без согласия правообладателей[57].
- В сентябре 2024 года Земельный суд Гамбурга отклонил иск немецкого фотографа к некоммерческой организации LAION за копирование и использование его изображений при формировании корпуса для обучения ИИ[34]. Истец подал апелляцию на это решение.
- Индийское агентство ANI подало иск против OpenAI в Дели, утверждая, что ChatGPT воспроизводит новости, защищённые авторским правом ANI[58].
- В ноябре 2024 года ряд канадских медиа-компаний подали коллективный иск против OpenAI с требованием компенсации до 20 000 канадских долларов за каждую использованную статью[59].
- В ноябре 2024 года германское общество коллективного управления авторскими правами GEMA подало иск против OpenAI за незаконное воспроизведение текстов песен[60]. В январе 2025 года аналогичный иск подан против Suno Inc[61].
- В июне 2025 года к Midjourney предъявили иски Disney и NBCUniversal, заявив, что ИИ обучался на изображениях с их персонажами без лицензии[62].
- В сентябре 2025 аналогичный иск против Midjourney подала Warner Bros[63].
- В сентябре 2025 Disney, NBCUniversal и Warner Bros. подали коллективный иск к китайскому сервису генерации изображений и видео Hailuo AI по обвинению в заработке на «иконических» персонажах, защищённых авторским правом[64].
- В сентябре 2025 года авторы Грейди Хендрикс и Дженнифер Роберсон подали иск против Apple Inc. с обвинением в несанкционированном использовании их книг для обучения модели Apple Intelligence[65].
- В сентябре 2025 Encyclopædia Britannica, Inc. подала иск к Perplexity AI за копирование результатов из энциклопедии Britannica и словаря Merriam-Webster без разрешения и компенсации[66].
Примечания
Литература
- Guadamuz, Andres Artificial intelligence and copyright (англ.). WIPO Magazine (октябрь 2017). Дата обращения: 3 апреля 2023. Архивировано 24 мая 2022 года.
- Vincent, James The scary truth about AI copyright is nobody knows what will happen next (англ.). The Verge (15 ноября 2022). Дата обращения: 3 апреля 2023. Архивировано 19 июня 2023 года.
- Zirpoli, Christopher T. Generative Artificial Intelligence and Copyright Law. Congressional Research Service (24 февраля 2023). Дата обращения: 3 апреля 2023. Архивировано 22 марта 2024 года.
- Lee, Timothy B. Stable Diffusion copyright lawsuits could be a legal earthquake for AI. Ars Technica (3 апреля 2023). Дата обращения: 3 апреля 2023. Архивировано 3 апреля 2023 года.