Автоматизированная журналистика

Автоматизированная журналистика (англ. Automated journalism, алгоритмическая журналистика, англ. algorithmic journalism, роботизированная журналистика, англ. robot journalism) — термин, обозначающий современные технологические процессы, проникшие в профессию журналиста, такие как статьи и видеоматериалы, создаваемые с помощью компьютерных программ[1][2][3]. Существует четыре основных области применения автоматизированной журналистики: автоматизированное создание контента, поиск данных, распространение новостей и оптимизация материалов[4]. Благодаря генеративному искусственному интеллекту, истории автоматически создаются компьютерами вместо журналистов-людей. В 2020-х годах применение генеративных предварительно обученных трансформеров позволило генерировать более сложные тексты на основе предоставленных запросов.

Автоматизированная журналистика рассматривается как возможность освободить журналистов от рутинных задач и предоставить им больше времени для комплексных расследований[1]. Она обеспечивает эффективность и снижение издержек, что особенно важно для многих новостных организаций. Вместе с тем автоматизированная журналистика воспринимается и как угроза авторству, качеству новостей и занятости журналистов-людей[2][3].

История

Изначально процесс включал в себя алгоритм, который анализировал большие массивы данных, выбирал подходящие шаблоны статей, упорядочивал ключевые моменты и автоматически подставлял имена, места, суммы, рейтинги, статистику и другие показатели[5]. Такие программы интерпретируют, организуют и представляют данные в удобочитаемой форме, а выходной текст может быть настроен под определённый стиль или тон[2][3][5]. На раннем этапе внедрения автоматизация применялась преимущественно для материалов, основанных на статистике и числовых данных: спортивные обзоры, прогнозы погоды, финансовые отчёты, анализ рынка недвижимости, квартальные и годовые обзоры[3].

Компании из сферы науки о данных и искусственного интеллекта, такие как Automated Insights, Narrative Science, United Robots и Monok, разрабатывают подобные алгоритмы для новостных агентств.[5][6][7][8] В 2016 году ранними пользователями технологии стали такие редакции, как Associated Press, Forbes, ProPublica и Los Angeles Times[3].

Интернет-платформа StatSheet, освещающая студенческий баскетбол, работает полностью на автоматизированных программах.[5] В 2006 году Thomson Reuters объявил о переходе к автоматизации для создания финансовых новостей на своей платформе.[9] Reuters применяет инструмент Tracer для генерации новостей[10]. Алгоритм Quakebot опубликовал новость о землетрясении в Калифорнии 2014 года на сайте Los Angeles Times через три минуты после завершения толчков[5][6].

Associated Press использует автоматизацию для освещения 10 000 игр младших бейсбольных лиг в год, задействуя программу от Automated Insights и статистику от MLB Advanced Media[11]. Вне спортивной тематики Associated Press также выпускает финансовые отчёты с применением автоматизации[5]. С 2014 года агентство ежеквартально публикует финансовые материалы с помощью Automated Insights.[12]

В мае 2020 года Microsoft сообщила о замене части журналистов-контрактников MSN на «роботов-журналистов»[13][14]. 8 сентября 2020 года The Guardian опубликовала статью, написанную целиком нейросетью GPT-3, хотя опубликованный текст был отредактирован человеком[15]. Все материалы Agentic Tribune полностью создаются искусственным интеллектом[16].

В Кувейте, Греции, Южной Корее, Индии, Китае и Тайване телевещатели представляют новости с помощью ведущих на основе генеративных моделей искусственного интеллекта, что вызывает опасения по поводу потери рабочих мест среди людей и доверия аудитории к новостям, ранее опиравшегося на парасоциальные отношения.[17][18]

В 2023 году Google тестировала инструмент для СМИ, обещавший «генерировать новостные материалы» на основе вводимых данных. Некоторые руководители СМИ восприняли его негативно, считая, что он недооценивает труд по созданию точных и содержательных публикаций[19].

В феврале 2024 года Google запустила программу по выплатам небольшим издательствам за создание статей с помощью бета-версии генеративной ИИ-платформы. При этом источники, которыми пользуются авторы, не требуют согласия или уведомления, а опубликованные материалы не обязаны помечаться как созданные или изменённые ИИ[20].

Meta AI — чат-бот на базе Llama 3, суммирующий новости; по замечаниям изданий, таких как Washington Post, он копирует отдельные предложения без прямого attribution и может уменьшать трафик к оригинальным ресурсам.

Преимущества

Скорость

Роботы-журналисты способны выдавать большое количество информации в сжатые сроки. Associated Press отмечала, что применение автоматизации увеличило объём публикаций отчётов о доходах клиентов более чем в 10 раз. С помощью программ Automated Insights и данных других компаний статьи объёмом 150—300 слов формируются столь же быстро, как журналисты выполняют вычисления вручную[5]. Автоматизация рутинных задач позволяет высвободить время журналиста для сложной аналитики и расследований.[2][3]

Франческо Маркони[21]. из Associated Press заявил, что благодаря автоматизации агентство высвободило 20 % времени сотрудников для более значимых проектов[22].

Стоимость

Автоматизированная журналистика дешевле, поскольку больше материалов создаётся за меньшее время. Это снижает издержки на оплату труда, отпуска, больничные и страхование. Автоматизация становится инструментом оптимизации расходов для СМИ с ограниченными бюджетами, позволяя поддерживать объём и качество юридического покрытия[3][9].

Проблемы и ограничения

Авторство

В случае с автоматизированными статьями часто возникает вопрос, кого считать автором. В одном из исследований часть респондентов приписывала авторство программисту, другие — самой редакции, подчёркивая коллективный характер работы[3]. Кроме того, читатель не может проверить, написана статья роботом или человеком, что вызывает вопросы транспарентности, хотя аналогичные проблемы встречаются и при указании человеческого авторства.[3][23]

Достоверность и качество

Вопросы доверия к автоматизированным материалам аналогичны сомнениям в объективности традиционных новостей. Критики опасаются, действительно ли алгоритмы обеспечивают «справедливость и точность, свободу от предвзятости, ошибок или влияния»[24]. Часто отмечается, что машинам недоступны такие человеческие качества, как креативность или критическое мышление. Однако с развитием технологий цель — имитировать эти характеристики. При публикации полностью генеративной статьи нейросетью в The Guardian в сентябре 2020 года комментаторы указали, что ИИ всё же опирался на редакторские правки человека[3][23][25].

Масштабное исследование оценки AI- и «человеческих» статей показало, что автоматизированные тексты считаются менее понятными из-за изобилия числовой информации, но по тону и структуре не уступают статьям людей[26].

Кроме ручной оценки, существуют методы обнаружения автоматически сгенерированных текстов[27], однако не исключены и ошибки генерации[28].

В статье Никола Бруно для Nieman Reports (2017) обсуждается вопрос вытеснения журналистов машинами и делаются выводы, что искусственный интеллект будет помогать профессионалам, а не заменять их: «Ни одно автоматизированное ПО или репортёр-любитель не заменят хорошего журналиста»[29].

Тем не менее в 2020 году Microsoft уволила 27 журналистов, заменив их ИИ. Один из сотрудников признал, что автоматизация — рискованный шаг, так как редакторы следили за строгостью стандартов и блокировали неуместный контент[30].

В июне 2024 года Reuters Institute опубликовал Digital News Report 2024. По его данным, 52 % американцев и 47 % европейцев некомфортно воспринимают новости, созданные «преимущественно ИИ с человеческим контролем». 42 % американцев и 33 % европейцев отмечают, что им комфортно с материалами, созданными «в основном людьми с небольшой помощью ИИ». Темы политики, преступности или локальных новостей вызывают наибольшее недоверие при генерации их ИИ[31].

Занятость

Среди основных рисков — сокращение рабочих мест для журналистов, поскольку редакции переходят на ИИ-решения[3][5][32]. Использование автоматизации становится необходимостью для быстрой реакции на спрос[4]. В 2014 году ежегодная перепись American Society of News Editors зафиксировала сокращение 3800 штатных редакторов[33]. Это крупнейшее снижение с 2007—2008 годов[33][34].

Сенаторы США Ричард Блументаль и Эми Клобушар выражали опасения относительно негативного воздействия генеративного искусственного интеллекта на локальные СМИ[35]. В июле 2023 года OpenAI заключила соглашение с American Journalism Project о финансировании локальных редакций, что может привести к зависимости СМИ от генеративных сервисов[36].

Зависимость от платформ и технологических компаний

Активно исследуется влияние платформенных компаний (Google и др.) на распространение и монетизацию новостей и на демократию.[37][38] Современные исследования расширяют тему до автоматизированной журналистики и роли ИИ. В работе Феликса Саймона (Оксфорд, 2022) отмечается, что концентрация ИИ-инструментов в руках крупных техкомпаний (Google, Microsoft, Amazon Web Services) усиливает зависимость отрасли и риски привязки к поставщику[39]. Такие компании получают не только контрактный, но и артефактный контроль над ИИ-инфраструктурой СМИ, что делает их критически зависимыми и затрудняет защиту источников информации[40].

Злоупотребления и ошибки

В январе 2023 года портал Futurism.com сообщил, что CNET использовал внутренний ИИ-инструмент для написания как минимум 77 статей; впоследствии в 41 статью внесли исправления[41].

В апреле 2023 года немецкий таблоид Die Aktuelle опубликовал поддельное AI-интервью с гонщиком Михаэлем Шумахером, не появлявшимся на публике с 2013 года после травмы. Вскоре главного редактора уволили[42].

Другие случаи публикации AI-сгенерированных или подозрительных материалов (часто с ошибками):

После серии подобных случаев крупнейшие мировые СМИ (Wired, Associated Press, The Quint, Rappler, The Guardian) приняли и опубликовали публичные руководства по использованию генеративного ИИ[51][52][53][54].

Примечания