Контент-ферма

Контéнт-фéрма[1][2] (content farm или content mill) — это организация, которая ориентирована на создание большого количества веб-контента. Часто он разрабатывается для удовлетворения алгоритмов максимального поиска поисковых систем — поисковая оптимизация. Такие организации часто нанимают внештатных работников или используют инструменты искусственного интеллекта (ИИ) с целью создания большого количества контента за минимальное время и стоимость. Главная цель — увеличить просмотры страницы и тем самым получить больше доходов от рекламы. Появление таких СМИ часто связано со спросом на контент «истинного рыночного спроса», который основан на запросах в поисковых системах. Контент-фермы критикуют за их склонность к сенсационности[3], дезинформации и зависимости от ИИ инструментов. Всё это снизило точность информации в обращении.

История

Исторически сложилось так, что контент-фермы поручали написание своих статей людям из бедных стран или бедным людям из богатых стран, чтобы увеличить прибыль за счёт низкой оплаты труда[4]. Позже эти предприятия стали всё чаще использовать инструменты искусственного интеллекта (ИИ) для ускоренного создания контента[5]. Он может быть в форме коротких видеороликов, новостных статей, постов в социальных сетях. Контент — это всё, что существует на просторах интернета. Он необязательно имеет определённую цель. Как, например, Instagram фотография, получившая больше всего лайков — Яйцо из Instagram[6]. Контенту необходимо быть в актуальном или недавнем обращении[7].

В 1994 году компания AT&T разместила первый рекламный баннер на сайте HotWired.com — его коэффициент кликов составил 44 %[8]. С тех пор реклама претерпела радикальные изменения. AdWords автоматизировал рекламу, а с появлением таргетированной рекламы появился больший стимул к высокому трафику, потому что компаниям стало выгоднее покупать рекламу с более высокой рентабельностью рекламных расходов. Больше рекламы означало больше денег для авторов. Затем появился AdSense, который в рамках подписки автоматически размещал рекламу на сайтах. Он устранил необходимость в прямом взаимодействии рекламодателя с сайтом. На основе данных о пользователях, включая онлайн-активность, недавние запросы и многое другое, целевые объявления имеют в 5,3 раза более высокий коэффициент кликов. Это выгодно для Google, поскольку они владеют AdSense. Также это облегчило работу как создателям контента, так и рекламодателям. Самый большой доход Google получает от рекламы[9]. Те, кто подал заявку на AdSense, могли монетизировать свой контент. Это было осуществимо благодаря простому доступу к рекламе и возможности любого пользователя создавать контент. Подобная мотивация и практичность процесса привели к появлению ферм контента[6].

Характеристики

Некоторые контент-фермы производят тысячи статей ежемесячно, используя внештатных авторов или инструменты искусственного интеллекта. Например, в 2009 году журнал Wired сообщил, что Demand Media (владелец eHow) публикует миллион статей в месяц, что эквивалентно объёму контента, который производят четыре англоязычных Википедии в год[10]. Другим ярким примером является компания Associated Content, которую в 2010 году за 90 миллионов долларов купила организация Yahoo!. Позже компания сменила название на Yahoo! Voices, а в 2014 году прекратила своё существование[11].

Шкала окладов писателей на контент-фермах невелика по сравнению с зарплатами обычных писателей. Например, автор может получать 3,50 доллара за статью, хотя некоторые продуктивные писатели могут производить количество контента, которого хватит, чтобы зарабатывать на жизнь. Авторы часто не являются экспертами в темах, которые освещают.

С момента появления больших языковых моделей, таких как ChatGPT, контент-фермы сместились в сторону контента, который генерирует ИИ. В отчёте NewsGuard за 2023 год упоминается более чем 140 всемирно известных брендов, которые спонсируют контент-фермы на основе ИИ[5]. Инструменты ИИ позволяют этим сайтам генерировать сотни статей ежедневно, зачастую при минимальном контроле со стороны человека[12].

Критика контент-ферм

Критики утверждают, что контент-фермы ставят во главу угла поисковую оптимизацию и доходы от рекламы, а не точность и актуальность статей. Критики также подчёркивают возможность распространения дезинформации (к примеру, теорий заговора и фальшивых обзоров продуктов) с помощью контента, созданного искусственным интеллектом[13]. Некоторые сравнивают контент-фермы с индустрией быстрого питания, называя их поставщиками «быстрого контента», которые засоряют интернет бесполезными статьями[14]. Отметка «спонсированный» вызывает вопросы о надёжности сайта, поскольку в него, вероятно, вложили деньги, чтобы быть вывести на первые строчки поиска[15].

ИИ и контент-фермы критикуют из-за нового подхода к использованию инструментов ИИ и тенденции искусственного интеллекта «подтасовывать» факты. ИИ проник в журналистику, что привело к недоверию к этому инструменту. Подобное нашло своё отражение даже в тривиальных примерах — список книг на лето, опубликованный The Chicago Sun-Times, который был составлен ИИ. Популярность использования ИИ для помощи в создании контента с целью монетизации возросла и стала обычным явлением в интернете.

В социальных сетях нередко встречаются аккаунты с сотнями тысяч или миллионами подписчиков[16]. Использование ИИ в ситуациях крайней важности, таких как судебные разбирательства, а также в менее значимых случаях, таких как список книг на лето и публикации в социальных сетях, заставило многих подвергнуть сомнению роль ИИ в жизни общества.

Были отмечены и более значимые последствия для общества. К примеру ИИ подтасовывал факты, которые затем использовали адвокаты[17], — это приводило к срыву судебных дел. В качестве другого примера можно привести жителя Нью-Йорка, который использовал аватар ИИ для защиты в суде[18]. Это вызвало множество опасений. Они связаны с предвзятостью ИИ, его склонности к фальсификации информации и ошибками, которые ИИ допускает в вопросах различной важности (таких как письмо и юриспруденция).

Контент-фермы также страдают от «ИИ каннибализма». Это процесс, в котором большие языковые модели (LLM) (предназначены для интерпретации речи и перевода/генерации текста) начинают потреблять созданный ими же контент. Со временем эти генераторы текста могут демонстрировать значительные отклонения от исходной информации, на которой они изначально обучались. Если контент-ферма использует LLM для генерации текста, а LLM использует в качестве основы собственный контент, тогда точность итогового материала снизится. Это приведёт к дезинформации и ухудшению контента в целом.

Контент-фермы также использовали для преднамеренной дезинформации общества и попыток повлиять на результаты выборов. На выборах в США в 2016 году более 140 сайтов с фейковыми новостями из Велеса, Македонии, были замаскированы под американские сайты. На них писали сенсационные статьи для того, чтобы получить больше репостов в социальных сетях[19]. США выбрали в качестве мишени, поскольку у американских пользователей Facebook средний доход на человека выше (примерно в 4 раза), чем в целом по миру[20]. Потенциальный доход побуждал авторов создавать привлекающий внимание контент — они знали, что он станет популярен. Публикацией статей на контент-фермах могут заниматься сотни тысяч людей[19].

Аналогичным образом контент-фермы использовали ботов для создания фальшивых обзоров продуктов[12]. Сфабрикованный трафик веб-сайта побуждает рекламодателей предлагать более высокие цены за рекламное размещение. Большинство компаний автоматизировали этот процесс — из-за этого размещение на непроверенных сайтах может привести к убыткам. По оценкам, ежегодно на такую ​​рекламу уходит 13 миллиардов долларов[21].

Ответ поисковых систем

Поисковые системы, такие как Google, предприняли шаги, чтобы ограничить влияние ферм-контента. В 2011 году Google ввёл обновление Google Panda, чтобы снизить рейтинг низкокачественных сайтов[22]. Другие поисковые системы, такие как DuckDuckGo, также приняли меры по блокировке низкокачественных сайтов, основанных на искусственном интеллекте[23].

Контент-фермы стали проблемой для платформ обмена рекламой. У многих из таких сервисов есть политика, касающаяся контент-ферм, но её редко приводят в исполнение[21]. Компания Google заявила, что контент, сгенерированный ИИ, сам по себе не нарушает их рекламную политику. В частности, NewsGuard (оценщик надёжности веб-сайтов и новостных источников) обнаружил, что Google в подавляющем большинстве случаев размещает больше рекламы на контент-фермах[21].

Примечания

  1. Наталия Бурцева. Контент-ферма: цифровой завод нового поколения. Дзен.
  2. Что такое контент-ферма? — Москва24|Контент. Дата обращения: 26 июня 2025.
  3. How Teens In The Balkans Are Duping Trump Supporters With Fake News, BuzzFeed News. Дата обращения: 26 июня 2025.
  4. Knibbs, Kate. That Sports News Story You Clicked on Could Be AI Slop (англ.), Wired. Дата обращения: 15 июня 2025.
  5. 1 2 People Are Spinning Up Content Farms Using AI, Futurism. Дата обращения: 26 июня 2025.
  6. 1 2 Eichhorn, Kate. Content. — Cambridge, Massachusettes : The MIT Press, 2022. — ISBN 978-0-262-54328-6.
  7. Eichhorn, Kate. Content. — Cambridge, Massachusettes : The MIT Press, 2022. — P. 14—15. — ISBN 978-0-262-54328-6.
  8. LaFrance, Adrienne The First-Ever Banner Ad on the Web (англ.). The Atlantic (21 апреля 2017). Дата обращения: 9 июня 2025.
  9. Updates to how publishers monetize with AdSense (амер. англ.). Google (2 ноября 2023). Дата обращения: 9 июня 2025.
  10. » The Answer Factory: Demand Media and the Fast, Disposable, and Profitable as Hell Media Model (амер. англ.). WIRED. Дата обращения: 26 июня 2025.
  11. Plesser, Andy Yahoo Harvests "Content Farm" Associated Content for $90 Million, Report. Beet.TV (18 мая 2010). Архивировано 2 февраля 2023 года.
  12. 1 2 Thompson, Stuart A.. A.I.-Generated Content Discovered on News Sites, Content Farms and Product Reviews, The New York Times (May 19, 2023). Дата обращения: 24 декабря 2024.
  13. Marr, Bernard The Danger of AI Content Farms. Forbes (16 мая 2023). Дата обращения: 24 декабря 2024.
  14. Arrington, Michael The End Of Hand Crafted Content. TechCrunch (13 декабря 2009).
  15. Daily, Laura. "It's harder than ever to find reliable product recommendations online" (January 13, 2025). Дата обращения: 21 января 2025.
  16. Rise of the Newsbots: AI-Generated News Websites Proliferating Online (амер. англ.). NewsGuard. Дата обращения: 15 июня 2025.
  17. UK judge warns of risk to justice after lawyers cited fake AI-generated cases in court (англ.). AP News (7 июня 2025). Дата обращения: 14 июня 2025.
  18. From AI avatars to virtual reality crime scenes, courts are grappling with AI in the justice system (англ.). AP News (9 мая 2025). Дата обращения: 14 июня 2025.
  19. 1 2 Alexander, Craig Silverman, Lawrence How Teens In The Balkans Are Duping Trump Supporters With Fake News (англ.). BuzzFeed News (3 ноября 2016). Дата обращения: 15 июня 2025.
  20. Constine, Josh Facebook swells to 1.65B users and beats Q1 estimates with $5.38B revenue (амер. англ.). TechCrunch (27 апреля 2016). Дата обращения: 15 июня 2025.
  21. 1 2 3 Junk websites filled with AI-generated text are pulling in money from programmatic ads (англ.). MIT Technology Review. Дата обращения: 15 июня 2025.
  22. Singhal, Amit; Cutts, Matt Finding more high-quality sites in search. Official Google Blog. Blogspot. Дата обращения: 26 февраля 2011. Архивировано 26 февраля 2011 года.
  23. The Search Engine Backlash Against 'Content Mills'. MIT Technology Review. Дата обращения: 24 декабря 2024.