Стилистический анализ с противодействием
Стилистический анализ с противодействием (англ. adversarial stylometry) — это совокупность методов изменения стиля написания текста с целью усложнения или предотвращения идентификации автора или определения его характеристик при помощи стилистического анализа. Этой задачей также называют маскированием авторства или анонимизацией авторства. Стилистический анализ создаёт серьёзную проблему для конфиденциальности, поскольку позволяет раскрывать личность анонимных авторов или связывать образы псевдонимов с другими идентичностями автора, что, например, затрудняет деятельность разоблачителей, активистов, а также используется мошенниками и обманщиками. Ожидается, что риск для приватности будет увеличиваться по мере совершенствования методов машинного обучения и развития корпусных ресурсов.
В основе стилистического анализа с противодействием лежит идея тщательного парафразирования исходного текста таким образом, чтобы смысл не менялся, а стилистические маркеры автора размывались. Такой парафраз служит атакующим примером для алгоритма, занимающегося стилистическим анализом. Существует несколько основных подходов к этой задаче, иногда пересекающихся: имитация, то есть подражание стилю другого автора; перевод, использование машинного перевода для устранения индивидуального стиля; и обфускация, преднамеренная модификация стиля текста с целью сокрытия индивидуальных черт автора.
Вручную модифицировать стиль можно, но это трудоёмко; иногда такой подход необходим или предпочтителен. Существуют автоматизированные (частично или полностью) средства для помощи автору, однако вопрос о том, как лучше всего реализовать такие инструменты и саму задачу, остаётся предметом исследований. Хотя некоторые методы успешно противодействуют определённым аналитическим подходам, особенно не учитывающим возможную маскировку авторства, обеспечение надёжной защиты от неизвестных методов анализа остаётся проблемой. Критически важной задачей является также сохранение исходного смысла текста при автоматизированной обфускации.
Неясно, возможно ли по самому факту обнаружить применение противодействия стилистическому анализу. Некоторые исследования показывают, что определённые методы оставляют сигналы в результирующем тексте, но если анализатор не знает, какие именно техники были использованы, он может быть не способен выявить их надёжно.
История
Одной из ранних работ в области противодействия стилистическому анализу стала статья Бреннана и соавтором Adversarial stylometry: Circumventing Authorship Recognition to Preserve Privacy and Anonymity. Важным вкладом также стали работы Кармачика и Гамона (2006) и Бреннана с соавторами (2012), где впервые были экспериментально оценены методы анонимизации авторства на реальных текстах.
В 2009 году Бреннан и Гринстад представили первый специализированный корпус для оценки стилистических методов противодействия; известными также являются Международный конкурс подражания Хемингуэю, Faux Faulkner contest и мистификационный блог A Gay Girl in Damascus[1].
Мотивация
По мнению Рао и Рохатги (2000), короткие анонимные сообщения малочувствительны к идентификации автора по стилю, однако псевдонимные авторы, не использующие маскировку на больших корпусах (в тысячи слов), могут оказаться уязвимы. Крупномасштабное деанонимизационное исследование 100 тысяч блогов Нараянана и соавтором (2012) показало, что идентификация происходит заметно лучше случайной, но точного совпадения автора и блога достигается только в 20 % случаев. По данным Грёндаля и соавторов, вероятность совпадения увеличивается при большом количестве сообщений от автора в корпусе. Даже если автор напрямую не идентифицирован, его характеристики (например, пол или возраст) могут быть определены стилистически или сужается анонимный класс до такого размера, что дополнительные сведения делают идентификацию тривиальной. Определение характеристик автора обычно проще, чем точной идентификации из множества кандидатов.
Современные методы машинного обучения предоставляют мощные инструменты для идентификации; развитие корпусных ресурсов и вычислительных методов стилистики вызывает всё новые вызовы для приватности. Утверждение о неизменности «стилистического отпечатка» автора оспаривается, однако сам факт успешных атак на анонимность подтверждает наличие серьёзного риска для конфиденциальности.
Области применения противодействия стилистическому анализу включают: защиту разоблачителей, журналистов, активистов, авторов мошеннических или мистифицирующих текстов, фальшивых отзывов, литературных мистификаций, анонимных участников преступных сообществ, а также тех, кто стремится сохранить анонимность или использовать псевдонимы. Также такие методы могут применяться для удаления стилевых признаков, связанных с расой или полом, чтобы минимизировать возможную дискриминацию, а также для маскировки автоматически сгенерированных текстов как написанных человеком.
Методы
При методе имитации автор намеренно стилизует текст «под» другого человека, чтобы ввести аналитические алгоритмы в заблуждение. Неполная имитация, когда в тексте сочетаются черты настоящего и подражаемого автора, может выступать сигналом о применении маскирования. Имитация реализуема автоматически при помощи систем стилевого переноса, обычно требующих большого корпуса в нужном стиле.
Другой подход — многоэтапный машинный перевод исходного текста, при котором оригинальная стилистика нивелируется серией последовательных переводов («круговой перевод»). Такая техника может изменять текст до неузнаваемости или ухудшать его грамматику; современные улучшения качества переводчиков снижает этот риск, особенно для простых текстов. Машинный перевод сближается с автоматизированным стилевым переносом, когда вход и выход находятся на одном языке. При низком качестве перевода автор вынужден вручную исправлять ошибки, избегая возврата к исходному стилю. Исследования показали, что серьёзные ошибки у известных сервисов возникают редко, но при многократном переводе могут сохраняться отдельные простые предложения или опечатки исходника, что несёт идентификационный риск. По следам автоматического перевода иногда удаётся восстановить промежуточные языки и этапы.
Обфускация — это сознательное изменение стиля для уменьшения схожести текста с другими по заданному методу анализа. Это может быть сделано при написании или при правке с использованием обратной связи об успешности маскировки. Более сложный по форме оригинал обычно позволяет больше опций для обфускации без потери смысла, а жанры с высокой вариативностью — больше возможностей для скрытия особенностей. Однако длинные тексты труднее маскировать полностью. Если автор создаёт новый стиль, отличный как от своего, так и от заимствованных, граница между обфускацией и имитацией размыта. По отношению к характеристикам автора обфускация может либо добавлять признаки («объединение») имитируемых характеристик, либо удалять их, приводя к усреднённому стилю («пересечение»). Важным этапом возникает устранение типично авторских проявлений: характерных опечаток, индивидуальных словоупотреблений, особого форматирования и т. п. Простые признаки модифицировать относительно легко; сложные — например, частота букв — труднее, хотя имитация обычно эффективнее обфускации по количеству замаскированных характеристик. Автоматизированная обфускация требует значительных объёмов «эталонных» текстов самого автора.
Среди автоматических систем выделяют правило-ориентированные парафразаторы и энкодер-декдерные архитектуры, где текст преобразуется через нейтральное стилевое представление. Важный аспект — наличие обратной связи с идентификатором стиля: при таком подходе подбор парафраз описывается как эвристический поиск, который продолжается, пока текст не станет достаточно «отдалённым» (для обфускации) или, наоборот, «приближённым» (для имитации) по стилю. Примерно такую роль играют атакующие примеры для системы идентификации.
Оценка эффективности
Вопрос о том, какие стилистические признаки лучше всего маскировать и насколько автоматизация или ручной труд релевантны для разных типов текстов, остаётся открытым. В ряде случаев мануальное противодействие предпочтительно (например, если автор не желает доверять машине — как в ситуации разоблачителя). Компьютерные инструменты требуют поддержки и обновления; по состоянию на 2022 год не существует общедоступных и поддерживаемых программ для обфусцирования стиля. Лидирующими считаются системы DS-PAN и Mutant-X для автоматической обфускации. Самостоятельное изменение стиля требует значительных усилий и мало масштабируется; автоматизация может снизить нагрузку, но в разных случаях степень помощи разная. Детерминированные методы быстро теряют эффективность против классификаторов, обученных на противодействии (например, на парафразах, полученных от стилевого трансфера).
Поттхаст с соавторами (2016) выделяют три критерия оценки методов: безопасность (надёжное устранение стилевых признаков), сохранность (смысловая близость выходного текста к оригиналу) и естественность (грамматическая правильность, отсутствие подозрительных следов). Падение любого из трёх параметров ведёт к неприемлемости метода; при практическом применении обычно приходится искать компромисс. Автоматическая оценка естественности чрезвычайно сложна, лучше всего помогает ручной просмотр; автоматическая оценка сохранности перспективна, но пока уступает человеку.
Хотя безопасность крайне важна, её компромисс может быть оправдан, если раскрытие признака возможно иным путём, не по стилю (например, если автор обсуждает свой британский опыт, не имеет смысла маскировать свой британский английский стиль). Надёжность против неизвестных методов называется трансферальностью; степень устойчивости сильно зависит от угрозы — какую информацию имеет аналитик. Для авторов выделяют 4 типа угроз: запросный доступ (автор знает всё о методах и данных анализатора), доступ к архитектуре (знает только методы), доступ к данным (знает только обучающие корпуса), замещённый доступ (аналитик знает всё, автор — ничего). Чаще всего автоматические методики базируются на гипотезе о запросном доступе; её переносимость к реальных сценариям ограничена. Использование ансамбля моделей может повысить устойчивость к неизвестным атакам.
Потеря смысла в тексте делает коммуникацию невозможной; однако допускается небольшая степень искажения смысла, если сохраняется ядро сообщения. Иногда допустимо разрешать только логически эквивалентные перефразирования или частичное сжатие/реферирование. Автоматическая перекомпоновка требований к смыслу — одна из главных нерешённых проблем полностью автоматических методов.
Резко ухудшенная естественность текста (неграмматичность, несоответствие жанру) сигнализирует о провале техники, однако частичные потери иногда допустимы. Утрата естественности может стимулировать проведение сложных/дорогих экспертиз (например, лингвистических), а для ряда сценариев такая утрата опасна (для литературного подделывания — критична, а для желания остаться анонимным — несущественна). Случается, что тексты, созданные с помощью противодействия стилистическому анализу, имеют общее «маскировочное» звучание. Однако на текущем уровне исследований не доказано, что такие методы всегда обнаружимы автоматически. Сглаживание результатов автоматизации может снизить их распознаваемость.
Проблемы идентификации и верификации авторства в условиях противодействия радикально отличаются от задач узнавания «наивных» или кооперативных авторов. Маскировка ставит серьёзные вызовы современным методам стилистического анализа, и ручные методы резко снижают эффективность традиционных подходов.
Низкоразмерные стилистические модели (использующие мало признаков) менее устойчивы к противодействию. Авторы различаются по способности изменять свой стиль; некоторые успешно справляются с этим без предварительного обучения. В ряде экспериментов показано, что методы имитации, перевода и обфускации все успешно снижают эффективность атрибуции авторства, ручная обфускация работает лучше других. Даже простые автоматические подходы затрудняют идентификацию, хотя за счет потерь в смысле и естественности. Идентификация, осведомленная о методах противодействия, показывает лучшие результаты даже при неточном определении типа обфускации.
Примечания
- ↑ Wayback Machine. web.archive.org. Дата обращения: 24 ноября 2025.
Литература
- Brennan, Michael; Afroz, Sadia; Greenstadt, Rachel (2012). “Adversarial stylometry: Circumventing Authorship Recognition to Preserve Privacy and Anonymity” (PDF). ACM Transactions on Information and System Security. 15 (3). DOI:10.1145/2382448.2382450. Архивировано из оригинала (PDF) 2024-02-11. Дата обращения 2024-06-07. Используется устаревший параметр
|url-status=(справка) - Can Pseudonymity Really Guarantee Privacy? (англ.). USENIX Security Symposium. USENIX (2000). Дата обращения: 7 июня 2024. Архивировано 15 апреля 2023 года.
- Kacmarcik, Gary. Obfuscating document stylometry to preserve author anonymity // Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions / Gary Kacmarcik, Michael Gamon. — 17 июля 2006. — P. 444–451.
- Gröndahl, Tommi; Asokan, N. (2020). “Text Analysis in Adversarial Settings: Does Deception Leave a Stylistic Trace?”. ACM Computing Surveys. 52 (3): 1—36. DOI:10.1145/3310331. Дата обращения 2024-06-07.
|access-date=требует|url=(справка) - Narayanan, Arvind. On the Feasibility of Internet-Scale Author Identification // 2012 IEEE Symposium on Security and Privacy / Arvind Narayanan, Hristo Paskov, Neil Zhenqiang Gong. — 2012. — P. 300–314. — doi:10.1109/SP.2012.46.
- Almishari, Mishari. Fighting Authorship Linkability with Crowdsourcing // Proceedings of the second edition of the ACM conference on Online social networks - COSN '14 / Mishari Almishari, Ekin Oguz, Gene Tsudik. — 2014. — P. 69–82. — doi:10.1145/2660460.2660486.
- Juola, Patrick. Detecting Stylistic Deception // Proceedings of the Workshop on Computational Approaches to Deception Detection. — апрель 2012. — P. 91–96.