Искусственный интеллект в проектах Wikimedia

Искусственный интеллект в проектах Wikimedia (англ. Artificial intelligence in Wikimedia projects) — использование искусственного интеллекта для развития и поддержки проектов Wikimedia[1].

Описание

Ряд статей в Википедии были созданы полностью или частично с помощью искусственного интеллекта. Контент, сгенерированный ИИ, может быть вреден для Википедии, если он является недостоверным или содержит поддельные ссылки на источники.

Для борьбы с низким качеством автоматически сгенерированных материалов в 2023 году сообществом Википедии был создан проект Очистка от ИИ-контента. В августе 2025 года была принята политика, позволившая редакторам выставлять подозрительные на автогенерацию статьи на быстрое удаление.

Использование искусственного интеллекта для Википедии

ORES

Проект Objective Revision Evaluation Service (ORES) — сервис искусственного интеллекта для оценки качества правок в Википедии[2][3]. Фонд Викимедиа представил проект ORES в ноябре 2015 года[4].

Снижение предвзятости

В августе 2018 года компания Primer сообщила о попытке использовать искусственный интеллект для создания статей о женщинах с целью борьбы с гендерной предвзятостью в Википедии[5][6].

Появление генеративного ИИ

После публичного запуска ChatGPT в 2022 году начались эксперименты по написанию статей в Википедии с помощью ИИ. Это вызвало споры о допустимости использования большие языковые модели (Large language models, LLM) из-за их склонности генерировать правдоподобно звучащую дезинформацию, включая несуществующие ссылки; несоответствие энциклопедическому стилю и воспроизведение предвзятостей[7][8]. С 2023 года шла работа по подготовке политики Википедии по отношению к ChatGPT и аналогичным LLM, в том числе рекомендовалось пользователям, не знакомым с такими инструментами, воздерживаться от их применения из-за вышеописанных рисков, а также отмечались риски клеветы и нарушения авторских прав[8].

6 декабря 2022 года участник Pharos создал статью «Artwork title» в своём черновике, указав, что использовал ChatGPT для экспериментов и будет дорабатывать её вручную. Другой редактор пометил статью как «оригинальное исследование», указав, что первоначально это был автосгенерированный текст без источников, а ссылки добавлены затем, а не использованы с самого начала. Другой участник, также тестировавший ранний ChatGPT, отметил, что его обзор темы был приемлем, но ссылки были вымышленными[9]. Фонд Wiki Education отмечал, что опытные редакторы считают ИИ полезным для черновиков и новых статей, но предупреждал о склонности ChatGPT использовать рекламные формулировки и другие проблемы[10]. Мигель Гарсия, бывший член Wikimedia из Испании, утверждает, что с запуском ChatGPT число автосгенерированных статей резко выросло, но затем стабилизировалось благодаря усилиям сообщества: большинство статей без источников удаляются быстро или номинируются на удаление[11].

В 2023 году сообщество Википедии создало проект AI Cleanup, помогающий удалять низкокачественный ИИ-контент. В октябре 2024 года исследование Принстонского университета показало, что около 5 % из 3000 новых статей англоязычной Википедии, созданных в августе 2024 года, были написаны с помощью искусственного интеллекта. Было установлено, что иногда ИИ использовался просто как вспомогательное средство, но часть публикаций носила рекламный или политический характер[12][13].

В августе 2025 года политика Википедии официально разрешила номинировать статьи, подозреваемые в автосгенерации, на быстрое удаление. Такие статьи обычно узнают по не относящимся к теме или вымышленным сноскам, а также характерной формулировке. Например, если статья написана в стиле ответа LLM («Вот ваша статья по теме…», «На момент моего последнего обучения…»), она обычно помечается на удаление[12][14]. Другие признаки использования ИИ: чрезмерное употребление длинных тире, слова «более того», рекламных выражений («захватывающий»), а также некорректные кавычки. В процессе обсуждения политики быстрых удалений один рецензент отмечал «поток ужасных автосгенерированных черновиков», другие пользователи жаловались на «ложь и поддельные ссылки» в подобных статьях и большие затраты времени на исправление последствий[15][16].

Основатель WikiProject AI Cleanup Ильяс Леблю и другие редакторы отмечают, что по ряду особенностей — неестественному языку, массовому производству правдоподобного, но лживого контента — возможно выявлять поддельные статьи-обманы, которые приходится оперативно удалять[17][18]. Википедия создала руководство по распознаванию признаков ИИ-текста — Signs of AI writing[19].

Фальсификации и вредоносное применение ИИ

В 2023 году учёные выявили частые случаи фабрикации данных и ссылок в ChatGPT. В тот период полный запрет на ИИ в Википедии сочли слишком жёстким решением[20][21]. ИИ использовался для создания различных мистификаций: например, статья объёмом 2000 слов про несуществующую османскую крепость была разоблачена Ильясом Леблю и его командой[22][23]. В другом случае в статью о Estola albosignata (жук) был вставлен сфабрикованный абзац, который ссылался на нерелевантный источник[24].

ИИ применялся для продвижения политической повестки в контентных разделах Википедии.

Простые сводки статей

В 2025 году Фонд Викимедиа начал тестировать функцию «Simple Article Summaries», автоматически генерируемую ИИ-сводку содержания статей, аналогично AI Overviews в Google Search. Решение вызвало быструю и жёсткую критику редакторов Википедии, отметивших снижение доверия к ресурсу из-за склонности ИИ к галлюцинациям и отсутствие очевидной необходимости такой функции[25]. В результате Фонд Викимедиа приостановил внедрение функции, но сохранил интерес к дальнейшей интеграции генеративного ИИ[26].

Использование Википедии для искусственного интеллекта

undefined

При создании Google Perspective API — инструмента для оценки токсичности комментариев на форумах, был использован датасет из сотен тысяч обсуждений на страницах Википедии, где люди вручную разметили токсичность сообщений[28]. Подкорпуса Википедии считаются одними из крупнейших и наиболее тщательно обработанных выборок для обучения ИИ[29].

По данным работы 2012 года, более 1000 научных публикаций (включая ИИ-исследования) анализировали Википедию, повторно использовали её тексты, применяли технические расширения или исследовали коммуникацию на её платформе[30]. Работа 2017 года характеризует Википедию как «золотую жилу» для любого машинного обучения на человеческих текстах[31].

В проекте-обзоре «Столетнее исследование искусственного интеллекта» (2016) Википедия названа важной платформой для изучения взаимодействия ИИ и человеческого участия[32].

Существует опасение по поводу отсутствия атрибуции Википедии при обучении языковых моделей типа ChatGPT[29][33]. Хотя лицензия Википедии позволяет использовать её тексты даже в переработанном виде, она требует обязательного указания авторства, поэтому интеграция Википедии как источника для ИИ без раскрытия происхождения может идти вразрез с условиями использования[29].

Использование искусственного интеллекта для других проектов Wikimedia

Detox — исследовательский проект Google и Фонда Викимедиа по методикам борьбы с грубостью и токсичными высказываниями в обсуждениях сообществ Wikimedia[34]. В числе прочего Wikimedia Foundation и Jigsaw экспериментировали с искусственным интеллектом для поиска и разработки технических решений данной проблемы. В октябре 2016 года эти организации опубликовали исследование «Ex Machina: Personal Attacks Seen at Scale»[35][36]. Мирные СМИ освещали эти исследования и их социальный контекст[37][38][39]. Для перевода статей используются системы машинного перевода, такие как DeepL[40][29][41].

Реакция

В ноябре 2023 года сооснователь Википедии Джимми Уэйлс отметил, что искусственный интеллект не является достоверным источником и что он не будет использовать ChatGPT для написания статей. В июле 2025 года он предложил использовать LLM для предоставления индивидуальных подсказок участникам при отклонении черновиков[42].

Директор по продукту фонда Викимедиа Маршалл Миллер заявил, что проект AI Cleanup поддерживает нейтральность и надёжность сайта, а ИИ способствует созданию низкокачественного контента. В интервью 404 Media Ильяс Леблю назвал быструю политику удаления лишь «пластерем» для наиболее серьёзных проблем, подчеркнув, что фундаментальная проблема остаётся. Некоторые ИИ-статьи, по его словам, обсуждаются до недели перед удалением[43].

Примечания

  1. Gertner, Jon. Wikipedia's Moment of Truth - Can the online encyclopedia help teach A.I. chatbots to get their facts right — without destroying itself in the process?, The New York Times (18 июля 2023). Архивировано 18 июля 2023. Дата обращения: 19 июля 2023.
  2. Simonite, Tom Software That Can Spot Rookie Mistakes Could Make Wikipedia More Welcoming (англ.). MIT Technology Review (1 декабря 2015). Дата обращения: 15 июня 2024. Архивировано 4 марта 2016 года.
  3. Wikipedia Deploys AI to Expand Its Ranks of Human Editors, Wired (1 декабря 2015). Архивировано 2 апреля 2024. Дата обращения: 15 июня 2024.
  4. Halfaker, Aaron; Taraborelli, Dario Artificial intelligence service "ORES" gives Wikipedians X-ray specs to see through bad edits. Wikimedia Foundation (30 ноября 2015). Дата обращения: 15 июня 2024. Архивировано 11 сентября 2018 года.
  5. Using Artificial Intelligence to Fix Wikipedia's Gender Problem, Wired (3 августа 2018). Архивировано 19 октября 2025 года. Дата обращения: 15 июня 2024.
  6. Verger, Rob Artificial intelligence can now help write Wikipedia pages for overlooked scientists (англ.). Popular Science (7 августа 2018). Дата обращения: 15 июня 2024. Архивировано 21 октября 2025 года.
  7. Harrison, Stephen Should ChatGPT Be Used to Write Wikipedia Articles? (англ.). Slate Magazine (12 января 2023). Дата обращения: 13 января 2023. Архивировано 4 августа 2025 года.
  8. 1 2 AI Is Tearing Wikipedia Apart (англ.), Vice (2 мая 2023). Архивировано 1 октября 2025 года. Дата обращения: 15 июня 2024.
  9. Harrison, Stephen Should ChatGPT Be Used to Write Wikipedia Articles? Slate Magazine (12 января 2023). Дата обращения: 13 января 2023. Архивировано 4 августа 2025 года.
  10. Ross, Sage ChatGPT, Wikipedia, and student writing assignments. Wiki Education Foundation (21 февраля 2023). Дата обращения: 15 июня 2024. Архивировано 24 февраля 2023 года.
  11. Bejerano, Pablo G. How Wikipedia is surviving in the age of ChatGPT (амер. англ.). El País (10 августа 2024). Дата обращения: 12 августа 2024. Архивировано 9 сентября 2025 года.
  12. 1 2 Wu, Daniel. Volunteers fight to keep 'AI slop' off Wikipedia (англ.) (8 августа 2025). Дата обращения: 10 августа 2025.
  13. Stokel-Walker, Chris One in 20 new Wikipedia pages seem to be written with the help of AI (амер. англ.). New Scientist (1 ноября 2024). Дата обращения: 4 ноября 2024. Архивировано 8 августа 2025 года.
  14. Maiberg, Emanuel Wikipedia Editors Adopt 'Speedy Deletion' Policy for AI Slop Articles (англ.). 404 Media (5 августа 2025). Дата обращения: 7 августа 2025. Архивировано 28 сентября 2025 года.
  15. Roth, Emma How Wikipedia is fighting AI slop content (амер. англ.). The Verge (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 10 августа 2025 года.
  16. Gills, Drew Read this: How Wikipedia identifies and removes AI slop (амер. англ.). AV Club (8 августа 2025). Дата обращения: 10 августа 2025. Архивировано 19 октября 2025 года.
  17. Maiberg, Emanuel The Editors Protecting Wikipedia from AI Hoaxes (англ.). 404 Media (9 октября 2024). Дата обращения: 11 октября 2024. Архивировано 7 сентября 2025 года.
  18. Lomas, Natasha How AI-generated content is upping the workload for Wikipedia editors (амер. англ.). TechCrunch (11 октября 2024). Дата обращения: 12 октября 2024. Архивировано 18 октября 2025 года.
  19. Clair, Grant Wikipedia publishes list of AI writing tells (амер. англ.). Boing Boing (20 августа 2025). Дата обращения: 21 августа 2025. Архивировано 20 октября 2025 года.
  20. Woodrock, Claire AI Is Tearing Wikipedia Apart. Vice Magazine (2 мая 2023). Дата обращения: 6 ноября 2024. Архивировано 4 октября 2024 года.
  21. Harrison, Stephen Wikipedia Will Survive A.I. Slate Magazine (24 августа 2023). Дата обращения: 6 ноября 2024. Архивировано 18 октября 2025 года.
  22. Durpe, Maggie Wikipedia Declares War on AI Slop. Futurism (10 октября 2024). Дата обращения: 15 октября 2024. Архивировано 4 ноября 2024 года.
  23. Funaki, Kaiyo Wikipedia editors form urgent task force to combat rampant issues with recent wave of content: 'The entire thing was ... [a] hoax'. TCD (25 октября 2024). Дата обращения: 26 октября 2024. Архивировано 9 августа 2025 года.
  24. Nine, Adrianna People Are Stuffing Wikipedia with AI-Generated Garbage (англ.). ExtremeTech (9 октября 2024). Дата обращения: 10 октября 2024. Архивировано 18 октября 2025 года.
  25. Whitwam, Ryan "Yuck": Wikipedia pauses AI summaries after editor revolt. Ars Technica (11 июня 2025). Дата обращения: 12 июня 2025. Архивировано 12 сентября 2025 года.
  26. Wiggers, Kyle Wikipedia pauses AI-generated summaries pilot after editors protest. TechCrunch (11 июня 2025). Дата обращения: 12 июня 2025. Архивировано 22 октября 2025 года.
  27. Villalobos, Pablo; Ho, Anson; Sevilla, Jaime; Besiroglu, Tamay; Heim, Lennart & Hobbhahn, Marius (2022), Will we run out of data? Limits of LLM scaling based on human-generated data, arΧiv:2211.04325 [cs.LG]. 
  28. Google's comment-ranking system will be a hit with the alt-right, Engadget (1 сентября 2017). Архивировано 1 сентября 2017 года. Дата обращения: 15 июня 2024.
  29. 1 2 3 4 Wikipedia's Moment of Truth, New York Times (18 июля 2023). Дата обращения: 29 ноября 2024.
  30. Nielsen, Finn Årup (2012). “Wikipedia Research and Tools: Review and Comments”. SSRN Working Paper Series [англ.]. DOI:10.2139/ssrn.2129874. ISSN 1556-5068.
  31. Mehdi, Mohamad; Okoli, Chitu; Mesgari, Mostafa; Nielsen, Finn Årup; Lanamäki, Arto (март 2017). “Excavating the mother lode of human-generated text: A systematic review of research that uses the wikipedia corpus”. Information Processing & Management. 53 (2): 505—529. DOI:10.1016/j.ipm.2016.07.003. S2CID 217265814. Проверьте дату в |date= (справка на английском)
  32. AI Research Trends - One Hundred Year Study on Artificial Intelligence (AI100) (англ.). ai100.stanford.edu. Дата обращения: 15 июня 2024. Архивировано 22 октября 2025 года.
  33. Wikipedia Built the Internet's Brain. Now Its Leaders Want Credit., Observer (28 марта 2025). Архивировано 20 октября 2025 года. Дата обращения: 2 апреля 2025. «Attributions, however, remain a sticking point. Citations not only give credit but also help Wikipedia attract new editors and donors. " If our content is getting sucked into an LLM without attribution or links, that's a real problem for us in the short term,”».
  34. Research:Detox - Meta : [англ.].
  35. Wulczyn, Ellery. Ex Machina: Personal Attacks Seen at Scale // Proceedings of the 26th International Conference on World Wide Web / Ellery Wulczyn, Nithum Thain, Lucas Dixon. — 2017. — P. 1391–1399. — ISBN 9781450349130. — doi:10.1145/3038912.3052591.
  36. Algorithms And Insults: Scaling Up Our Understanding Of Harassment On Wikipedia. Medium (7 февраля 2017). Дата обращения: 15 июня 2024. Архивировано 24 сентября 2025 года.
  37. Google Cousin Develops Technology to Flag Toxic Online Comments (англ.) (23 февраля 2017). Архивировано 18 октября 2025 года. Дата обращения: 15 июня 2024.
  38. Smellie, Sarah Inside Wikipedia's Attempt to Use Artificial Intelligence to Combat Harassment (амер. англ.). Motherboard. Vice Media (17 февраля 2017). Дата обращения: 15 июня 2024. Архивировано 21 октября 2025 года.
  39. Gershgorn, Dave Alphabet's hate-fighting AI doesn't understand hate yet. Quartz (27 февраля 2017). Дата обращения: 15 июня 2024. Архивировано 27 февраля 2017 года.
  40. Costa-jussà, Marta R.; Cross, James; Çelebi, Onur; Elbayad, Maha; Heafield, Kenneth; Heffernan, Kevin; Kalbassi, Elahe; Lam, Janice; Licht, Daniel; Maillard, Jean; Sun, Anna; Wang, Skyler; Wenzek, Guillaume; Youngblood, Al; Akula, Bapi; Barrault, Loic; Gonzalez, Gabriel Mejia; Hansanti, Prangthip; Hoffman, John; Jarrett, Semarley; Sadagopan, Kaushik Ram; Rowe, Dirk; Spruit, Shannon; Tran, Chau; Andrews, Pierre; Ayan, Necip Fazil; Bhosale, Shruti; Edunov, Sergey; Fan, Angela; Gao, Cynthia; Goswami, Vedanuj; Guzmán, Francisco; Koehn, Philipp; Mourachko, Alexandre; Ropers, Christophe; Saleem, Safiyyah; Schwenk, Holger; Wang, Jeff (июнь 2024). “Scaling neural machine translation to 200 languages”. Nature [англ.]. 630 (8018): 841—846. Bibcode:2024Natur.630..841N. DOI:10.1038/s41586-024-07335-x. ISSN 1476-4687. PMC 11208141. PMID 38839963. Проверьте дату в |date= (справка на английском); |access-date= требует |url= (справка)
  41. Mamadouh, Virginie. Wikipedia: Mirror, Microcosm, and Motor of Global Linguistic Diversity // Handbook of the Changing World Language Map : [англ.]. — Springer International Publishing, 2020. — P. 3773–3799. — «Some versions have expanded dramatically using machine translation through the work of bots or web robots generating articles by translating them automatically from the other Wikipedias, often the English Wikipedia. […] In any event, the English Wikipedia is different from the others because it clearly serves a global audience, while other versions serve more localized audience, even if the Portuguese, Spanish, and French Wikipedias also serves a public spread across different continents». — ISBN 978-3-030-02438-3. — doi:10.1007/978-3-030-02438-3_200.
  42. Maiberg, Emanuel Jimmy Wales Says Wikipedia Could Use AI. Editors Call It the 'Antithesis of Wikipedia'. 404 Media (21 августа 2025). Дата обращения: 22 августа 2025. Архивировано 1 октября 2025 года.
  43. Crider, Michael Wikipedia goes to war against AI slop articles with new deletion policy (англ.). PC World (6 августа 2025). Дата обращения: 7 августа 2025. Архивировано 29 сентября 2025 года.

Литература

Категории