Репрезентативный вред

Репрезентативный вред (англ. representational harm) — вред, наносимый системами при искажённом или негативном представлении определённых социальных групп. К проявлениям репрезентативного вреда относят закрепление вредоносных стереотипов, умаление существования или значимости социальной группы (расовой, этнической, гендерной, религиозной и др.)[1]. Часто алгоритмы машинного обучения приводят к репрезентативному вреду при обучении на данных с алгоритмической предвзятостью; данный эффект подтверждён и для больших языковых моделей[2]. Несмотря на важность предотвращения данного вреда, у учёных долгое время не существовало чёткого определения репрезентативного вреда, его часто путали с аллокативным вредом (неравное распределение ресурсов между группами), который проще фиксировать и изучать[1]. Однако интерес к проблеме растёт, появляются методы количественной оценки и снижения репрезентативного вреда в алгоритмах[3][4].

Виды

Среди ключевых видов репрезентативного вреда выделяют стереотипизацию, очернение и ошибочное распознавание[5]. Все они несут опасности для отдельных людей и сообществ.

Стереотипы — это чрезмерно упрощённые и обычно негативные представления о группе, чаще всего по признаку расы или пола. В результате людям может отказываться в доступе к образованию, трудоустройству, жилью и пр[6].. Так, стереотип «примерного меньшинства» об азиатских американцах как исключительно способных к математике и высоким достижениям негативно отражается на их профессиональной и учебной среде[7].

Репрезентативный вред возникает, если представление о социальной группе усиливает вредные стереотипы, формируя социальную изоляцию и предвзятость. Особенно часто это проявляется в отношении маргинализованных групп: цветные люди, женщины, ЛГБТК+, люди с инвалидностью. В медиа такие группы часто изображаются однобоко, что закрепляет общественные предрассудки. Такие шаблонные представления поддерживают опасные стереотипы и маргинализацию.

Очернение — это несправедливая критика, умышленное преуменьшение достоинств целых групп[6]. Например, по запросу с «чёрным» именем некоторые поисковые системы показывают рекламу залоговых агентств, поддерживая ложное представление о преступности[8]. Система может формировать образ группы как обладающей низким социальным статусом, что ведёт к стигматизации и общественной маргинализации[6].

Оценки показывают, что вредные образы в медиа ведут к эмоциональным и социальным последствиям для личностей и сообществ. Лоренс Бобо анализировал этнические стереотипы в кино и рекламе — афроамериканцы обычно представлены как «агрессивные», «ленивые» или предназначенные только для комических ролей. Формально разнообразные, такие образы сохраняют систему господства белого населения и расового неравенства[9]. Примером является частое изображение темнокожих как преступников или в второстепенных ролях — это закрепляет этнические стереотипы и поддерживает институциональный расизм.

Ошибочное распознавание (или неправильная идентификация) проявляется в стирании и отчуждении групп, а также в лишении возможности самоидентификации[6]. Если социальная группа систематически слабо видна или исключается в алгоритмических системах, это ведёт к недостаточному представлению и повторному неравенству[6]. Запрет человеку на самоидентификацию равнозначен «стиранию» или исключению, что влечёт психологический вред, изоляцию и эмоциональную неуверенность[6].

Количественная оценка

По мере повышения осведомленности об опасности репрезентативного вреда появились методы количественного измерения этого эффекта в алгоритмах.

Моделирование стереотипизации — один из способов выявления репрезентативного вреда. Его можно оценить сравнением предсказанных моделью результатов для одной социальной группы с реальными (эталонными) результатами для этой группы в данных[3]. Например, если вероятность наступления события для группы A равна 60 %, а модель выдаёт систематически более высокую вероятность, это может свидетельствовать о стереотипизации[3]. Подобную оценку осуществляли для задач классификации, регрессии и кластеризации, с выведением формальных правил наличия стереотипизации в этих случаях.

Другие методы оценки фокусируются на анализе алгоритмов в специфичных областях, например, в генерации подписей к изображениям. В одном из исследований измерялись пять видов репрезентативного вреда. Оценка стереотипизации проводилась по числу ошибочных слов, вставленных моделью в подпись по сравнению с эталонной подписью[4]. Неправильные слова вручную анализировали на предмет соответствия стереотипам или случайным ошибкам, что позволяло косвенно количественно оценить масштабы стереотипизации[4]. Также исследовалась частота, с которой на изображениях люди вообще упоминаются в созданных моделью подписях — если люди не назывались, это трактовалось как проявление дегуманизации[4].

Примеры

Один из самых известных случаев репрезентативного вреда связан с компанией Google, алгоритм которой в 2015 году пометил афроамериканцев на фото как обезьян[10]. Разработчики объяснили проблему недостаточным числом лиц афроамериканцев в обучающей выборке алгоритма[11]. Google принесла извинения и исправила ошибку, заблокировав возможность классификации как примата вообще[11]. По состоянию на 2023 год алгоритмы компании по-прежнему не идентифицировали животных-обезьян на фотографиях[11].

Другой пример — закрепление стереотипов в векторных представлениях слов (word embeddings), которые обучаются на больших корпусах текстов. Эти векторы позволяют вычислять сходство между словами как массивами чисел в векторном пространстве[12]. Однако исследования показывают, что такие векторные представления могут кодировать вредоносные стереотипы — например, близость словосочетания «программист» к «мужчина», а не к «женщина», что трактуется как миcрепрезентация профессии и проявление репрезентативного вреда[13].

Преодоление репрезентативного вреда

Среди инициатив по снижению репрезентативного вреда — продвижение инклюзивных и достоверных образов в медиа. Учёные и активисты подчёркивают необходимость увеличения разнообразия авторов и героев, чтобы избежать односторонних стереотипов — то есть более широкое представительство маргинализованных групп за и перед камерой способствует коррекции стереотипов и аутентичному описанию опыта.

В последние годы появились позитивные примеры репрезентации людей из числа расовых меньшинств, женщин, ЛГБТК+ в крупном медиа — например, фильм «Сельма» режиссёра Авы ДюВерней и сериал «Поза», созданный Райаном Мёрфи, получили признание за глубокое и уважительное изображение маргинализованных сообществ, показывая сложных, неоднородных персонажей, выходящих за рамки упрощённых шаблонов.

Важным способом преодоления репрезентативного вреда является также самопредставление, т. е. создание и продвижение собственных историй силами маргинализованных групп. Это влечёт как выпуск медиа-контента представителями этих сообществ, так и сознательное сопротивление исторически укоренённым шаблонам их исключения.

Примечания

  1. 1 2 Blodgett, Su Lin (6 апреля 2021). Sociolinguistically Driven Approaches for Just Natural Language Processing. Doctoral Dissertations (Thesis) [англ.]. DOI:10.7275/20410631. Дата обращения 2024-09-17.
  2. Luo, Yiwei; Gligorić, Kristina; Jurafsky, Dan (28 мая 2024). “Othering and Low Status Framing of Immigrant Cuisines in US Restaurant Reviews and Large Language Models”. Proceedings of the International AAAI Conference on Web and Social Media [англ.]. 18: 985—998. arXiv:2307.07645. DOI:10.1609/icwsm.v18i1.31367. ISSN 2334-0770. Дата обращения 2024-09-17.
  3. 1 2 3 Abbasi, Mohsen; Friedler, Sorelle; Scheidegger, Carlos & Venkatasubramanian, Suresh (28 января 2019), Fairness in representation: quantifying stereotyping as representational harm, arΧiv:1901.09565 [cs.LG]. 
  4. 1 2 3 4 Wang, Angelina. Measuring Representational Harms in Image Captioning // 2022 ACM Conference on Fairness, Accountability, and Transparency : [англ.] / Angelina Wang, Solon Barocas, Kristen Laird … [et al.]. — New York, NY, USA : Association for Computing Machinery, 20 июня 2022. — P. 324–335. — ISBN 978-1-4503-9352-2. — doi:10.1145/3531146.3533099.
  5. Rusanen, Anna-Mari; Nurminen, Jukka K. Ethics of AI. ethics-of-ai.mooc.fi. Дата обращения: 17 сентября 2024.
  6. 1 2 3 4 5 6 Shelby, Renee. Sociotechnical Harms of Algorithmic Systems: Scoping a Taxonomy for Harm Reduction // Proceedings of the 2023 AAAI/ACM Conference on AI, Ethics, and Society : [англ.] / Renee Shelby, Shalaleh Rismani, Kathryn Henne … [et al.]. — New York, NY, USA : Association for Computing Machinery, 29 августа 2023. — P. 723–741. — ISBN 979-8-4007-0231-0. — doi:10.1145/3600211.3604673.
  7. Trytten, Deborah A.; Lowe, Anna Wong; Walden, Susan E. (2 января 2013). “"Asians are Good at Math. What an Awful Stereotype": The Model Minority Stereotype's Impact on Asian American Engineering Students”. Journal of Engineering Education [англ.]. 101 (3): 439—468. DOI:10.1002/j.2168-9830.2012.tb00057.x. ISSN 1069-4730. S2CID 144783391. Дата обращения 2024-09-17. |access-date= требует |url= (справка)
  8. Sweeney, Latanya (1 марта 2013). “Discrimination in Online Ad Delivery: Google ads, black names and white names, racial discrimination, and click advertising”. ACM Queue [англ.]. 11 (3): 10—29. arXiv:1301.6822. DOI:10.1145/2460276.2460278. ISSN 1542-7730. S2CID 35894627. Дата обращения 2024-09-17. |access-date= требует |url= (справка)
  9. Bobo, Lawrence D. (1996). “Race, Sociopolitical Participation, and Black Empowerment”. American Political Science Review [англ.]. Cambridge University Press. 90 (3): 493—508. Дата обращения 2024-09-17.
  10. Google извинилась за расистскую ошибку в приложении Photos (рус.), BBC News (1 июля 2015). Архивировано 4 октября 2025 года. Дата обращения: 17 сентября 2024.
  11. 1 2 3 Фото-приложения Google и Apple до сих пор не распознают горилл (рус.), The New York Times (22 мая 2023). Архивировано 12 октября 2025 года. Дата обращения: 17 сентября 2024.
  12. Major, Vincent; Surkis, Alisa; Aphinyanaphongs, Yindalon (2018). “Utility of General and Specific Word Embeddings for Classifying Translational Stages of Research”. AMIA ... Annual Symposium Proceedings. AMIA Symposium [англ.]. 2018: 1405—1414. ISSN 1942-597X. PMC 6371342. PMID 30815185. |access-date= требует |url= (справка)
  13. Bolukbasi, Tolga; Chang, Kai-Wei; Zou, James; Saligrama, Venkatesh & Kalai, Adam (21 июля 2016), Man is to Computer Programmer as Woman is to Homemaker? Debiasing Word Embeddings, arΧiv:1607.06520 [cs.CL]. 

Категории