Контент-ферма

Контéнт-фéрма[1][2] (content farm или content mill) — это организация, которая ориентирована на создание большого количества веб-контента. Часто он разрабатывается для удовлетворения алгоритмов максимального поиска поисковых систем — поисковая оптимизация. Такие организации часто нанимают внештатных работников или используют инструменты искусственного интеллекта (ИИ) с целью создания большого количества контента за минимальное время и стоимость. Главная цель — увеличить просмотры страницы и тем самым получить больше доходов от рекламы. Появление таких СМИ часто связано со спросом на контент «истинного рыночного спроса», который основан на запросах в поисковых системах. Контент-фермы критикуют за их склонность к сенсационности[3], дезинформации и зависимости от ИИ инструментов. Всё это снизило точность информации в обращении.

История

Исторически сложилось так, что контент-фермы поручали написание своих статей людям из бедных стран или бедным людям из богатых стран, чтобы увеличить прибыль за счёт низкой оплаты труда[4]. Позже эти предприятия стали всё чаще использовать инструменты искусственного интеллекта (ИИ) для ускоренного создания контента[5]. Он может быть в форме коротких видеороликов, новостных статей, постов в социальных сетях. Контент — это всё, что существует на просторах интернета. Он необязательно имеет определённую цель. Как, например, Instagram фотография, получившая больше всего лайков — Яйцо из Instagram[6]. Контенту необходимо быть в актуальном или недавнем обращении[7].

В 1994 году компания AT&T разместила первый рекламный баннер на сайте HotWired.com — его коэффициент кликов составил 44 %[8]. С тех пор реклама претерпела радикальные изменения. AdWords автоматизировал рекламу, а с появлением таргетированной рекламы появился больший стимул к высокому трафику, потому что компаниям стало выгоднее покупать рекламу с более высокой рентабельностью рекламных расходов. Больше рекламы означало больше денег для авторов. Затем появился AdSense, который в рамках подписки автоматически размещал рекламу на сайтах. Он устранил необходимость в прямом взаимодействии рекламодателя с сайтом. На основе данных о пользователях, включая онлайн-активность, недавние запросы и многое другое, целевые объявления имеют в 5,3 раза более высокий коэффициент кликов. Это выгодно для Google, поскольку они владеют AdSense. Также это облегчило работу как создателям контента, так и рекламодателям. Самый большой доход Google получает от рекламы[9]. Те, кто подал заявку на AdSense, могли монетизировать свой контент. Это было осуществимо благодаря простому доступу к рекламе и возможности любого пользователя создавать контент. Подобная мотивация и практичность процесса привели к появлению ферм контента[6].

Характеристики

Некоторые контент-фермы производят тысячи статей ежемесячно, используя внештатных авторов или инструменты искусственного интеллекта. Например, в 2009 году журнал Wired сообщил, что Demand Media (владелец eHow) публикует миллион статей в месяц, что эквивалентно объёму контента, который производят четыре англоязычных Википедии в год[10]. Другим ярким примером является компания Associated Content, которую в 2010 году за 90 миллионов долларов купила организация Yahoo!. Позже компания сменила название на Yahoo! Voices, а в 2014 году прекратила своё существование[11].

Шкала окладов писателей на контент-фермах невелика по сравнению с зарплатами обычных писателей. Например, автор может получать 3,50 доллара за статью, хотя некоторые продуктивные писатели могут производить количество контента, которого хватит, чтобы зарабатывать на жизнь. Авторы часто не являются экспертами в темах, которые освещают.

С момента появления больших языковых моделей, таких как ChatGPT, контент-фермы сместились в сторону контента, который генерирует ИИ. В отчёте NewsGuard за 2023 год упоминается более чем 140 всемирно известных брендов, которые спонсируют контент-фермы на основе ИИ[5]. Инструменты ИИ позволяют этим сайтам генерировать сотни статей ежедневно, зачастую при минимальном контроле со стороны человека[12].

Критика контент-ферм

Критики утверждают, что контент-фермы ставят во главу угла поисковую оптимизацию и доходы от рекламы, а не точность и актуальность статей. Критики также подчёркивают возможность распространения дезинформации (к примеру, теорий заговора и фальшивых обзоров продуктов) с помощью контента, созданного искусственным интеллектом[13]. Некоторые сравнивают контент-фермы с индустрией быстрого питания, называя их поставщиками «быстрого контента», которые засоряют интернет бесполезными статьями[14]. Отметка «спонсированный» вызывает вопросы о надёжности сайта, поскольку в него, вероятно, вложили деньги, чтобы быть вывести на первые строчки поиска[15].

ИИ и контент-фермы критикуют из-за нового подхода к использованию инструментов ИИ и тенденции искусственного интеллекта «подтасовывать» факты. ИИ проник в журналистику, что привело к недоверию к этому инструменту. Подобное нашло своё отражение даже в тривиальных примерах — список книг на лето, опубликованный The Chicago Sun-Times, который был составлен ИИ. Популярность использования ИИ для помощи в создании контента с целью монетизации возросла и стала обычным явлением в интернете.

В социальных сетях нередко встречаются аккаунты с сотнями тысяч или миллионами подписчиков[16]. Использование ИИ в ситуациях крайней важности, таких как судебные разбирательства, а также в менее значимых случаях, таких как список книг на лето и публикации в социальных сетях, заставило многих подвергнуть сомнению роль ИИ в жизни общества.

Были отмечены и более значимые последствия для общества. К примеру ИИ подтасовывал факты, которые затем использовали адвокаты[17], — это приводило к срыву судебных дел. В качестве другого примера можно привести жителя Нью-Йорка, который использовал аватар ИИ для защиты в суде[18]. Это вызвало множество опасений. Они связаны с предвзятостью ИИ, его склонности к фальсификации информации и ошибками, которые ИИ допускает в вопросах различной важности (таких как письмо и юриспруденция).

Контент-фермы также страдают от «ИИ каннибализма». Это процесс, в котором большие языковые модели (LLM) (предназначены для интерпретации речи и перевода/генерации текста) начинают потреблять созданный ими же контент. Со временем эти генераторы текста могут демонстрировать значительные отклонения от исходной информации, на которой они изначально обучались. Если контент-ферма использует LLM для генерации текста, а LLM использует в качестве основы собственный контент, тогда точность итогового материала снизится. Это приведёт к дезинформации и ухудшению контента в целом.

Контент-фермы также использовали для преднамеренной дезинформации общества и попыток повлиять на результаты выборов. На выборах в США в 2016 году более 140 сайтов с фейковыми новостями из Велеса, Македонии, были замаскированы под американские сайты. На них писали сенсационные статьи для того, чтобы получить больше репостов в социальных сетях[19]. США выбрали в качестве мишени, поскольку у американских пользователей Facebook средний доход на человека выше (примерно в 4 раза), чем в целом по миру[20]. Потенциальный доход побуждал авторов создавать привлекающий внимание контент — они знали, что он станет популярен. Публикацией статей на контент-фермах могут заниматься сотни тысяч людей[19].

Аналогичным образом контент-фермы использовали ботов для создания фальшивых обзоров продуктов[12]. Сфабрикованный трафик веб-сайта побуждает рекламодателей предлагать более высокие цены за рекламное размещение. Большинство компаний автоматизировали этот процесс — из-за этого размещение на непроверенных сайтах может привести к убыткам. По оценкам, ежегодно на такую ​​рекламу уходит 13 миллиардов долларов[21].

Ответ поисковых систем

Поисковые системы, такие как Google, предприняли шаги, чтобы ограничить влияние ферм-контента. В 2011 году Google ввёл обновление Google Panda, чтобы снизить рейтинг низкокачественных сайтов[22]. Другие поисковые системы, такие как DuckDuckGo, также приняли меры по блокировке низкокачественных сайтов, основанных на искусственном интеллекте[23].

Контент-фермы стали проблемой для платформ обмена рекламой. У многих из таких сервисов есть политика, касающаяся контент-ферм, но её редко приводят в исполнение[21]. Компания Google заявила, что контент, сгенерированный ИИ, сам по себе не нарушает их рекламную политику. В частности, NewsGuard (оценщик надёжности веб-сайтов и новостных источников) обнаружил, что Google в подавляющем большинстве случаев размещает больше рекламы на контент-фермах[21].

Примечания