Автоматизированная журналистика

Автоматизированная журналистика (англ. Automated journalism, алгоритмическая журналистика, англ. algorithmic journalism, роботизированная журналистика, англ. robot journalism) — термин, обозначающий современные технологические процессы, проникшие в профессию журналиста, такие как статьи и видеоматериалы, создаваемые с помощью компьютерных программ^[1]^[2]^[3]. Существует четыре основных области применения автоматизированной журналистики: автоматизированное создание контента, поиск данных, распространение новостей и оптимизация материалов^[4]. Благодаря генеративному искусственному интеллекту, истории автоматически создаются компьютерами вместо журналистов-людей. В 2020-х годах применение генеративных предварительно обученных трансформеров позволило генерировать более сложные тексты на основе предоставленных запросов.

Автоматизированная журналистика рассматривается как возможность освободить журналистов от рутинных задач и предоставить им больше времени для комплексных расследований^[1]. Она обеспечивает эффективность и снижение издержек, что особенно важно для многих новостных организаций. Вместе с тем автоматизированная журналистика воспринимается и как угроза авторству, качеству новостей и занятости журналистов-людей^[2]^[3].

Изначально процесс включал в себя алгоритм, который анализировал большие массивы данных, выбирал подходящие шаблоны статей, упорядочивал ключевые моменты и автоматически подставлял имена, места, суммы, рейтинги, статистику и другие показатели^[5]. Такие программы интерпретируют, организуют и представляют данные в удобочитаемой форме, а выходной текст может быть настроен под определённый стиль или тон^[2]^[3]^[5]. На раннем этапе внедрения автоматизация применялась преимущественно для материалов, основанных на статистике и числовых данных: спортивные обзоры, прогнозы погоды, финансовые отчёты, анализ рынка недвижимости, квартальные и годовые обзоры^[3].

Компании из сферы науки о данных и искусственного интеллекта, такие как Automated Insights, Narrative Science, United Robots и Monok, разрабатывают подобные алгоритмы для новостных агентств.^[5]^[6]^[7]^[8] В 2016 году ранними пользователями технологии стали такие редакции, как Associated Press, Forbes, ProPublica и Los Angeles Times^[3].

Интернет-платформа StatSheet, освещающая студенческий баскетбол, работает полностью на автоматизированных программах.^[5] В 2006 году Thomson Reuters объявил о переходе к автоматизации для создания финансовых новостей на своей платформе.^[9] Reuters применяет инструмент Tracer для генерации новостей^[10]. Алгоритм Quakebot опубликовал новость о землетрясении в Калифорнии 2014 года на сайте Los Angeles Times через три минуты после завершения толчков^[5]^[6].

Associated Press использует автоматизацию для освещения 10 000 игр младших бейсбольных лиг в год, задействуя программу от Automated Insights и статистику от MLB Advanced Media^[11]. Вне спортивной тематики Associated Press также выпускает финансовые отчёты с применением автоматизации^[5]. С 2014 года агентство ежеквартально публикует финансовые материалы с помощью Automated Insights.^[12]

В мае 2020 года Microsoft сообщила о замене части журналистов-контрактников MSN на «роботов-журналистов»^[13]^[14]. 8 сентября 2020 года The Guardian опубликовала статью, написанную целиком нейросетью GPT-3, хотя опубликованный текст был отредактирован человеком^[15]. Все материалы Agentic Tribune полностью создаются искусственным интеллектом^[16].

В Кувейте, Греции, Южной Корее, Индии, Китае и Тайване телевещатели представляют новости с помощью ведущих на основе генеративных моделей искусственного интеллекта, что вызывает опасения по поводу потери рабочих мест среди людей и доверия аудитории к новостям, ранее опиравшегося на парасоциальные отношения.^[17]^[18]

В 2023 году Google тестировала инструмент для СМИ, обещавший «генерировать новостные материалы» на основе вводимых данных. Некоторые руководители СМИ восприняли его негативно, считая, что он недооценивает труд по созданию точных и содержательных публикаций^[19].

В феврале 2024 года Google запустила программу по выплатам небольшим издательствам за создание статей с помощью бета-версии генеративной ИИ-платформы. При этом источники, которыми пользуются авторы, не требуют согласия или уведомления, а опубликованные материалы не обязаны помечаться как созданные или изменённые ИИ^[20].

Meta AI — чат-бот на базе Llama 3, суммирующий новости; по замечаниям изданий, таких как Washington Post, он копирует отдельные предложения без прямого attribution и может уменьшать трафик к оригинальным ресурсам.

Скорость

Роботы-журналисты способны выдавать большое количество информации в сжатые сроки. Associated Press отмечала, что применение автоматизации увеличило объём публикаций отчётов о доходах клиентов более чем в 10 раз. С помощью программ Automated Insights и данных других компаний статьи объёмом 150—300 слов формируются столь же быстро, как журналисты выполняют вычисления вручную^[5]. Автоматизация рутинных задач позволяет высвободить время журналиста для сложной аналитики и расследований.^[2]^[3]

Франческо Маркони^[21]. из Associated Press заявил, что благодаря автоматизации агентство высвободило 20 % времени сотрудников для более значимых проектов^[22].

Стоимость

Автоматизированная журналистика дешевле, поскольку больше материалов создаётся за меньшее время. Это снижает издержки на оплату труда, отпуска, больничные и страхование. Автоматизация становится инструментом оптимизации расходов для СМИ с ограниченными бюджетами, позволяя поддерживать объём и качество юридического покрытия^[3]^[9].

Авторство

В случае с автоматизированными статьями часто возникает вопрос, кого считать автором. В одном из исследований часть респондентов приписывала авторство программисту, другие — самой редакции, подчёркивая коллективный характер работы^[3]. Кроме того, читатель не может проверить, написана статья роботом или человеком, что вызывает вопросы транспарентности, хотя аналогичные проблемы встречаются и при указании человеческого авторства.^[3]^[23]

Достоверность и качество

Вопросы доверия к автоматизированным материалам аналогичны сомнениям в объективности традиционных новостей. Критики опасаются, действительно ли алгоритмы обеспечивают «справедливость и точность, свободу от предвзятости, ошибок или влияния»^[24]. Часто отмечается, что машинам недоступны такие человеческие качества, как креативность или критическое мышление. Однако с развитием технологий цель — имитировать эти характеристики. При публикации полностью генеративной статьи нейросетью в The Guardian в сентябре 2020 года комментаторы указали, что ИИ всё же опирался на редакторские правки человека^[3]^[23]^[25].

Масштабное исследование оценки AI- и «человеческих» статей показало, что автоматизированные тексты считаются менее понятными из-за изобилия числовой информации, но по тону и структуре не уступают статьям людей^[26].

Кроме ручной оценки, существуют методы обнаружения автоматически сгенерированных текстов^[27], однако не исключены и ошибки генерации^[28].

В статье Никола Бруно для Nieman Reports (2017) обсуждается вопрос вытеснения журналистов машинами и делаются выводы, что искусственный интеллект будет помогать профессионалам, а не заменять их: «Ни одно автоматизированное ПО или репортёр-любитель не заменят хорошего журналиста»^[29].

Тем не менее в 2020 году Microsoft уволила 27 журналистов, заменив их ИИ. Один из сотрудников признал, что автоматизация — рискованный шаг, так как редакторы следили за строгостью стандартов и блокировали неуместный контент^[30].

В июне 2024 года Reuters Institute опубликовал Digital News Report 2024. По его данным, 52 % американцев и 47 % европейцев некомфортно воспринимают новости, созданные «преимущественно ИИ с человеческим контролем». 42 % американцев и 33 % европейцев отмечают, что им комфортно с материалами, созданными «в основном людьми с небольшой помощью ИИ». Темы политики, преступности или локальных новостей вызывают наибольшее недоверие при генерации их ИИ^[31].

Занятость

Среди основных рисков — сокращение рабочих мест для журналистов, поскольку редакции переходят на ИИ-решения^[3]^[5]^[32]. Использование автоматизации становится необходимостью для быстрой реакции на спрос^[4]. В 2014 году ежегодная перепись American Society of News Editors зафиксировала сокращение 3800 штатных редакторов^[33]. Это крупнейшее снижение с 2007—2008 годов^[33]^[34].

Сенаторы США Ричард Блументаль и Эми Клобушар выражали опасения относительно негативного воздействия генеративного искусственного интеллекта на локальные СМИ^[35]. В июле 2023 года OpenAI заключила соглашение с American Journalism Project о финансировании локальных редакций, что может привести к зависимости СМИ от генеративных сервисов^[36].

Зависимость от платформ и технологических компаний

Активно исследуется влияние платформенных компаний (Google и др.) на распространение и монетизацию новостей и на демократию.^[37]^[38] Современные исследования расширяют тему до автоматизированной журналистики и роли ИИ. В работе Феликса Саймона (Оксфорд, 2022) отмечается, что концентрация ИИ-инструментов в руках крупных техкомпаний (Google, Microsoft, Amazon Web Services) усиливает зависимость отрасли и риски привязки к поставщику^[39]. Такие компании получают не только контрактный, но и артефактный контроль над ИИ-инфраструктурой СМИ, что делает их критически зависимыми и затрудняет защиту источников информации^[40].

В январе 2023 года портал Futurism.com сообщил, что CNET использовал внутренний ИИ-инструмент для написания как минимум 77 статей; впоследствии в 41 статью внесли исправления^[41].

В апреле 2023 года немецкий таблоид Die Aktuelle опубликовал поддельное AI-интервью с гонщиком Михаэлем Шумахером, не появлявшимся на публике с 2013 года после травмы. Вскоре главного редактора уволили^[42].

Другие случаи публикации AI-сгенерированных или подозрительных материалов (часто с ошибками):

NewsBreak^[43]
СМИ группы Arena Group (Sports Illustrated, TheStreet, Men’s Journal^[44])
B&H Photo^[45]
СМИ Gannett (The Columbus Dispatch, USA Today, и др.)^[46]
MSN^[47]
News Corp^[48]
BuzzFeed^[49]
Newsweek^[50]
и другие СМИ и платформы.

После серии подобных случаев крупнейшие мировые СМИ (Wired, Associated Press, The Quint, Rappler, The Guardian) приняли и опубликовали публичные руководства по использованию генеративного ИИ^[51]^[52]^[53]^[54].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

Автоматизированная журналистика

История

Преимущества

Скорость

Стоимость

Проблемы и ограничения

Авторство

Достоверность и качество

Занятость

Зависимость от платформ и технологических компаний

Злоупотребления и ошибки

Примечания