Объяснимый искусственный интеллект
Объяснимый искусственный интеллект (англ. explainable artificial intelligence, XAI; также встречаются термины интерпретируемый искусственный интеллект, объяснимая машинная обучаемость, англ. explainable machine learning, XML) — область исследований на стыке искусственного интеллекта, разрабатывающая методы, предоставляющие человеку возможность интеллектуального контроля и анализа алгоритмов ИИ[1]. В центре внимания — логика рассуждений, лежащая в основе решений и предсказаний систем ИИ, что повышает их прозрачность и делаемость понятными для человека[2][3]. Объяснимый ИИ позволяет обеспечить пользователям возможность оценивать безопасность решений и критически анализировать автоматизированные механизмы принятия решений. XAI противостоит феномену «чёрного ящика» в машинном обучении, когда даже разработчики не могут объяснить, почему система пришла к тому или иному выводу[4][5].
XAI помогает пользователям эффективнее использовать системы на базе искусственного интеллекта, углубляя понимание их способов рассуждения[6]. XAI может быть реализации права на объяснение[7]. Даже при отсутствии такого юридического права или регуляторного требования объяснимый ИИ может повысить опыт конечного пользователя, усиливая доверие к качеству принимаемых системой решений[8]. XAI ставит целью объяснять, что сделано, что сейчас происходит и что будет дальше, а также раскрыть, на какой информации основаны эти действия[9]. Это позволяет подтверждать существующие знания, ставить их под сомнение и формулировать новые гипотезы[10].
Предпосылки
Машинное обучение (МО) в системах ИИ обычно делят на белый ящик и чёрный ящик[11]. Модели типа «белый ящик» дают результаты, понятные эксперту в области применения, тогда как «чёрные ящики» зачастую не поддаются объяснению даже для специалистов[12]. Алгоритмы XAI основываются на принципах прозрачности, интерпретируемости и объяснимости.
- Прозрачность означает возможность объяснить, как параметры модели извлекаются из обучающих данных и как она формирует предсказания на тестовых данных[13].
- Интерпретируемость характеризует возможность понять, как работает модель МО, и представить основания для её решений в понятной человеку форме[14].
- Объяснимость — важное, но всё ещё формализуемое понятие; одна из трактовок — совокупность признаков предметной области, которые привели к выделенному решению (например, к конкретной классификации или регрессии)[15].
В целом, интерпретируемость — способность пользователя понять результат модели; прозрачность — это симулируемость (воспроизводимость предсказаний), декомпозируемость (интуитивное объяснение параметров) и алгоритмическая прозрачность (понимание работы самого алгоритма). Функциональность модели включает текстовые описания, визуализацию, локальные объяснения и направлена на повышение удобства и понятности для пользователя[16].
Использование интерпретируемых моделей («белых ящиков») допустимо даже в задачах с высокой точностью, особенно когда важна возможность объяснить решения: например, концептуальные модели «бутылочного горлышка» позволяют объяснять выводы модели на уровне понятий[17]. Это принципиально важно для областей вроде медицины, обороны, финансов и права. Многие исследователи подчёркивают, что в обучении с учителем перспективно направление символьной регрессии, как способ поиска объяснимых математических моделей[18].
Системы ИИ оптимизируют своё поведение согласно математически заданной цели. Тем не менее, такие системы могут выявлять неочевидные и даже нежелательные закономерности, требующие аудита человеком для оценки их генерализуемости[19].
Цели
Сотрудничество между агентами — людьми и алгоритмами — основывается на доверии. Промежуточные цели на пути к формализованному доверию — прозрачность, интерпретируемость, объяснимость[20]. Это особенно важно в медицине, где врачам нужна уверенность в обоснованности решений систем[21][22].
Реальные примеры показывают, что иногда ИИ учится применять «трюки», которые оптимизируют заданные метрики, но не соответствуют ожиданиям людей и несут риск переноса знаний за пределы обучающей выборки[5][23][24].
Проект XAI Агентства перспективных исследовательских проектов Министерства обороны США (DARPA) направлен на создание так называемых моделей «стеклянного ящика», понятных человеку при минимальных потерях точности[25]. Другие применения XAI — извлечение знаний из «чёрных ящиков», сравнение моделей[26]. Понятие «стеклянного ящика» также применяется для инструментов аудита соблюдения этики и законности ИИ-систем[27].
Техники объяснимости и интерпретируемости
Существует различие между терминами объяснимость и интерпретируемость:
| Термин | Определение | Источник |
|---|---|---|
| Интерпретируемость | «Степень понимания того, как работает (ИИ-)технология» | ISO/IEC TR 29119-11:2020(en), 3.1.42 |
| Объяснимость | «Степень понимания того, как (ИИ-)система пришла к данному результату» | ISO/IEC TR 29119-11:2020(en), 3.1.31 |
Некоторые техники объяснимости не требуют понимания внутреннего устройства модели и могут работать для разных ИИ-систем. Например, анализируют зависимость результата от изменений во входных данных.
Объяснимость нужна для проверки того, что системы ИИ не принимают решения на основе нерелевантных или несправедливых признаков. В задачах классификации и регрессии популярны следующие методы:
- Графики частных зависимостей: показывают влияние одного признака на выход.
- SHAP (Shapley Additive Explanations): визуализирует вклад каждого входного признака посредством расчёта значений Шепли[28].
- Важность признаков : оценивает, насколько важен признак для модели. Чаще всего используется перестановочная важность.
- LIME (Local Interpretable Model-Agnostic Explanations): локальное аппроксимирование сложной модели простой интерпретируемой моделью[29].
- Многозадачное обучение: дополнительные выходы, которые помогают понять, чему научилась сеть[30].
В задачах компьютерного зрения используются карты значимости, визуализирующие части изображения, ключевые для предсказания модели[31].
Экспертные системы, как программные комплексы, созданные экспертами и реализующие знания через продукционные правила, предоставляют объяснения через систему построения обоснований.
Однако эти подходы слабо применимы к языковым моделям типа GPT, которые могут генерировать не всегда достоверные объяснения. Дополнительно используются анализ внимания, методы зондирования, причинный трейсинг и поиск ключевых подсетей; эти исследования тесно пересекаются с задачами выравнивания ИИ[32].
Термин «механистическая интерпретируемость» применяется к анализу внутренних механизмов нейросетей[33]. Исследования интерпретируемости особенно актуальны для современных базовых моделей, где задача — автоматизировать поиск признаков; улучшение этих методов ожидаемо повысит безопасность фронтирных ИИ-систем[34][35].
В свёрточных сетях инструмент DeepDream позволяет визуализировать, что активируют отдельные нейроны[37].
История и методы
В 1970—1990-х годах символические экспертные системы (например, MYCIN, GUIDON, SOPHIE, PROTOS) умели объяснять свои рассуждения[38][39]. В конце 1980-х—начале 1990-х развитие получили системы поддержания истинности (truth maintenance systems, TMS) и логический трейсинг рассуждений[40].
С 1990-х и особенно с развитием глубокого обучения возникает задача извлечения интерпретируемых правил из обученных «чёрных ящиков»[41]. Современные методы, такие как layerwise relevance propagation (LRP), позволяют оценить вклад отдельных признаков во входных данных[42]. Для локальной интерпретируемости — LIME, SHAP, а также подход к объяснению через наиболее близкие обучающие примеры[43].
Регулирование
По мере распространения ИИ-систем растёт нормативная потребность в прозрачности автоматизированных решений. Первая глобальная конференция по XAI состоялась в 2017 году[44]. В Евросоюзе «право на объяснение» в рамках Общего регламента по защите данных распространяется на отдельные автоматизированные решения. В США, например, страховые компании обязаны объяснить причины тарифных и страховых решений[45]. Во Франции «Закон о цифровой республике» гарантирует право граждан запрашивать объяснение принципов работы применяемых к их данным алгоритмов.
Ограничения
Несмотря на развитие XAI, существуют присущие ограничения:
- Вредоносные акторы. Объяснимость раскрывает внутренние закономерности — конкуренты или злоумышленники могут использовать это для обхода защитных механизмов[46].
- Адаптивность объяснений. Стандартные объяснения не учитывают уровень знаний пользователя: эксперты могут считать их слишком поверхностными, новички — сложными[47].
- Техническая сложность. Большинство современных методов объяснения сложны для непрофессионалов, что затрудняет реальное понимание конечными пользователями процесса принятия решений[46].
- Понимание и доверие. Цель XAI — не столько повысить доверие, сколько привести его к адекватному уровню, так как даже при понимании процесса пользователь может остаться настороженным к ИИ[48].
Критика
Ряд исследователей рассматривают объяснимость как второстепенную по сравнению с эффективностью ИИ[49]. С другой стороны, рекомендуется использовать изначально интерпретируемые модели вместо пост-хок объяснений.
Объяснимость в социальных науках
Идея объяснимости используется и в социальной теории решений, например, через аксиоматические обоснования, позволяющие прозрачнее конструировать или объяснять коллективные выборы[50].
Получены методы объяснения правил голосования на основе используемых в них аксиом[51].
Показано влияние вида объяснений (индивидуальных, групповых, механистических) на восприятие честности и доверия к бюджетному алгоритму[52].
Разработан алгоритм для объяснения распределения по значению Шепли через разложение на подигры[53].
Примечания
- ↑ Héder, Mihály (2023). “Explainable AI: A Brief History of the Concept” (PDF). ERCIM News [англ.] (134): 9—10. Дата обращения 2024-07-10.
- ↑ Phillips, P. Jonathon; Hahn, Carina A.; Fontana, Peter C.; Yates, Amy N.; Greene, Kristen; Broniatowski, David A.; Przybocki, Mark A. (29 сентября 2021). “Four Principles of Explainable Artificial Intelligence”. NIST. DOI:10.6028/nist.ir.8312. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Vilone, Giulia; Longo, Luca (2021). “Notions of explainability and evaluation approaches for explainable artificial intelligence”. Information Fusion. 76: 89—106. DOI:10.1016/j.inffus.2021.05.009. Дата обращения 2024-07-10.
- ↑ Castelvecchi, Davide (6 октября 2016). “Can we open the black box of AI?”. Nature [англ.]. 538 (7623): 20—23. DOI:10.1038/538020a. ISSN 0028-0836. PMID 27708329. S2CID 4465871. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ 1 2 Computer says no: why making AIs fair, accountable and transparent is crucial (англ.), The Guardian (5 ноября 2017). Дата обращения: 30 января 2018.
- ↑ Alizadeh, Fatemeh (2021). “I Don't Know, Is AI Also Used in Airbags?: An Empirical Study of Folk Concepts and People's Expectations of Current and Future Artificial Intelligence”. Icom. 20 (1): 3—17. DOI:10.1515/icom-2021-0009. S2CID 233328352. Дата обращения 2024-07-10.
- ↑ Edwards, Lilian; Veale, Michael (2017). “Slave to the Algorithm? Why a 'Right to an Explanation' Is Probably Not the Remedy You Are Looking For”. Duke Law and Technology Review. 16: 18. SSRN 2972855. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Do Couto, Mark Entering the Age of Explainable AI (англ.). TDWI (22 февраля 2024). Дата обращения: 11 сентября 2024. Архивировано 29 января 2024 года.
- ↑ Gunning, D.; Stefik, M.; Choi, J.; Miller, T.; Stumpf, S.; Yang, G.-Z. (18 декабря 2019). “XAI-Explainable artificial intelligence”. Science Robotics [англ.]. 4 (37). DOI:10.1126/scirobotics.aay7120. ISSN 2470-9476. PMID 33137719. Дата обращения 2024-07-10.
- ↑ Rieg, Thilo; Frick, Janek; Baumgartl, Hermann; Buettner, Ricardo (17 декабря 2020). “Demonstration of the potential of white-box machine learning approaches to gain insights from cardiovascular disease electrocardiograms”. PLOS ONE [англ.]. 15 (12). DOI:10.1371/journal.pone.0243615. ISSN 1932-6203. PMC 7746264. PMID 33332440.
|access-date=требует|url=(справка) - ↑ Vilone, Giulia; Longo, Luca (2021). “Classification of Explainable Artificial Intelligence Methods through Their Output Formats”. Machine Learning and Knowledge Extraction. 3 (3): 615—661. DOI:10.3390/make3030032. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Loyola-González, O. (2019). “Black-Box vs. White-Box: Understanding Their Advantages and Weaknesses From a Practical Point of View”. IEEE Access. 7: 154096—154113. DOI:10.1109/ACCESS.2019.2949286. ISSN 2169-3536. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Roscher, R.; Bohn, B.; Duarte, M. F.; Garcke, J. (2020). “Explainable Machine Learning for Scientific Insights and Discoveries”. IEEE Access. 8: 42200—42216. arXiv:1905.08883. DOI:10.1109/ACCESS.2020.2976199. ISSN 2169-3536. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Murdoch, W. James; Singh, Chandan; Kumbier, Karl; Abbasi-Asl, Reza; Yu, Bin (14 января 2019). “Interpretable machine learning: definitions, methods, and applications”. Proceedings of the National Academy of Sciences of the United States of America. 116 (44): 22071—22080. arXiv:1901.04592. DOI:10.1073/pnas.1900654116. PMC 6825274. PMID 31619572.
|access-date=требует|url=(справка) - ↑ Montavon, Grégoire; Samek, Wojciech; Müller, Klaus-Robert (1 февраля 2018). “Methods for interpreting and understanding deep neural networks”. Digital Signal Processing [англ.]. 73: 1—15. arXiv:1706.07979. DOI:10.1016/j.dsp.2017.10.011. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ Notovich, Aviv; Chalutz-Ben Gal, Hila; Ben-Gal, Irad. Explainable Artificial Intelligence (XAI): Motivation, Terminology, and Taxonomy. 971–985. In Machine Learning for Data Science Handbook: Data Mining and Knowledge Discovery Handbook. Дата обращения: 10 июля 2024. Архивировано 28 декабря 2024 года.
- ↑ Rudin, Cynthia (2019). “Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead”. Nature Machine Intelligence. 1 (5): 206—215. arXiv:1811.10154. DOI:10.1038/s42256-019-0048-x. ISSN 2522-5839. PMC 9122117. PMID 35603010.
|access-date=требует|url=(справка) - ↑ Wenninger, Simon; Kaymakci, Can; Wiethe, Christian (2022). “Explainable long-term building energy consumption prediction using QLattice”. Applied Energy. 308. DOI:10.1016/j.apenergy.2021.118300. S2CID 245428233. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ “How AI detectives are cracking open the black box of deep learning”. Science [англ.]. 5 июля 2017. Дата обращения 2018-01-30.
- ↑ Dosilovic, Filip; Brcic, Mario; Hlupic, Nikica (25 мая 2018). “Explainable Artificial Intelligence: A Survey” (PDF). MIPRO 2018 - 41st International Convention Proceedings. MIPRO 2018 [англ.]. Опатья, Хорватия. pp. 210—215. DOI:10.23919/MIPRO.2018.8400040. ISBN 978-953-233-095-3. Архивировано из оригинала (PDF) 2018-12-10. Дата обращения 2018-12-09.
- ↑ Bernal, Jose; Mazo, Claudia (11 октября 2022). “Transparency of Artificial Intelligence in Healthcare: Insights from Professionals in Computing and Healthcare Worldwide”. Applied Sciences [англ.]. 12 (20). DOI:10.3390/app122010228. ISSN 2076-3417.
- ↑ Antoniadi, Anna Markella; Du, Yuhan; Guendouz, Yasmine; Wei, Lan; Mazo, Claudia; Becker, Brett A.; Mooney, Catherine (январь 2021). “Current Challenges and Future Opportunities for XAI in Machine Learning-Based Clinical Decision Support Systems: A Systematic Review”. Applied Sciences [англ.]. 11 (11): 5088. DOI:10.3390/app11115088. ISSN 2076-3417. Проверьте дату в
|date=(справка на английском) - ↑ DeepMind Has Simple Tests That Might Prevent Elon Musk's AI Apocalypse (англ.), Bloomberg.com (11 декабря 2017). Архивировано 11 декабря 2017 года. Дата обращения: 30 января 2018.
- ↑ Learning from Human Preferences, OpenAI Blog (13 июня 2017). Архивировано 13 июня 2017 года. Дата обращения: 30 января 2018.
- ↑ Explainable Artificial Intelligence (XAI). DARPA. Дата обращения: 17 июля 2017. Архивировано 6 августа 2016 года.
- ↑ Biecek, Przemyslaw (23 июня 2018). “DALEX: explainers for complex predictive models”. Journal of Machine Learning Research. 19: 1—5. arXiv:1806.08915.
- ↑ Rai, Arun. «Explainable AI: From black box to glass box.» Journal of the Academy of Marketing Science 48 (2020): 137—141.
- ↑ Verma, Yugesh Complete Guide to SHAP - SHAPley Additive exPlanations for Practitioners (англ.). Analytics India Magazine (25 декабря 2021). Дата обращения: 10 июля 2024. Архивировано 27 декабря 2021 года.
- ↑ Rothman, Denis Exploring LIME Explanations and the Mathematics Behind It (англ.). Codemotion Magazine (7 октября 2020). Дата обращения: 10 июля 2024. Архивировано 28 августа 2025 года.
- ↑ Christian, Brian. TELL ME EVERYTHING: MULTITASK NETS // The Alignment Problem: Machine learning and human values. — W. W. Norton & Company, 2020. — ISBN 978-0-393-86833-3.
- ↑ Sharma, Abhishek What Are Saliency Maps In Deep Learning? (англ.). Analytics India Magazine (11 июля 2018). Дата обращения: 10 июля 2024. Архивировано 16 ноября 2019 года.
- ↑ Luo, Haoyan & Specia, Lucia (21 февраля 2024), From Understanding to Utilization: A Survey on Explainability for Large Language Models, arΧiv:2401.12874 [cs.CL].
- ↑ Olah, Chris Mechanistic Interpretability, Variables, and the Importance of Interpretable Bases. www.transformer-circuits.pub (27 июня 2022). Дата обращения: 10 июля 2024. Архивировано 13 сентября 2025 года.
- ↑ Ropek, Lucas New Anthropic Research Sheds Light on AI's 'Black Box' (англ.). Gizmodo (21 мая 2024). Дата обращения: 23 мая 2024. Архивировано 21 мая 2024 года.
- ↑ Perrigo, Billy (21 мая 2024). “Artificial Intelligence Is a 'Black Box.' Maybe Not For Long”. Time [англ.]. Дата обращения 2024-05-24.
- ↑ Ananthaswamy, Anil How Do Machines 'Grok' Data? (англ.). Quanta Magazine (12 апреля 2024). Дата обращения: 21 января 2025. Архивировано 24 сентября 2025 года.
- ↑ Barber, Gregory. “Inside the 'Black Box' of a Neural Network”. Wired [англ.]. ISSN 1059-1028. Дата обращения 2024-07-10.
- ↑ Fagan, L. M.; Shortliffe, E. H.; Buchanan, B. G. (1980). “Computer-based medical decision making: from MYCIN to VM”. Automedica. 3 (2): 97—108.
- ↑ Clancey, William. Knowledge-Based Tutoring: The GUIDON Program. — Кембридж (шт. Массачусетс) : The MIT Press, 1987.
- ↑ Russell, Stuart. Artificial Intelligence: A Modern Approach / Stuart Russell, Peter Norvig. — 2. — Upper Saddle River, Нью-Джерси : Prentice Hall, Pearson Education, 2003.
- ↑ Tickle, A. B.; Andrews, R.; Golea, M.; Diederich, J. (ноябрь 1998). “The truth will come to light: directions and challenges in extracting the knowledge embedded within trained artificial neural networks”. IEEE Transactions on Neural Networks. 9 (6): 1057—1068. DOI:10.1109/72.728352. ISSN 1045-9227. PMID 18255792. Дата обращения 2024-07-10. Проверьте дату в
|date=(справка на английском);|access-date=требует|url=(справка) - ↑ Bach, Sebastian; Binder, Alexander; Montavon, Grégoire; Klauschen, Frederick; Müller, Klaus-Robert; Samek, Wojciech (10 июля 2015). “On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation”. PLOS ONE. 10 (7). DOI:10.1371/journal.pone.0130140. ISSN 1932-6203. PMC 4498753. PMID 26161953.
- ↑ Koh, Pang Wei; Liang, Percy (17 июля 2017). “Understanding Black-box Predictions via Influence Functions”. International Conference on Machine Learning. PMLR: 1885—1894. arXiv:1703.04730.
- ↑ IJCAI 2017 Workshop on Explainable Artificial Intelligence (XAI). Earthlink. IJCAI. Дата обращения: 17 июля 2017. Архивировано 4 апреля 2019 года.
- ↑ Artificial Intelligence Has Some Explaining to Do, Bloomberg Businessweek (12 декабря 2018). Архивировано 12 декабря 2018 года. Дата обращения: 17 декабря 2018.
- ↑ 1 2 Bhatt, Umang. Explainable Machine Learning in Deployment // Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency : [англ.]. — 2022. — P. 648–657. — ISBN 978-1-4503-6936-7. — doi:10.1145/3351095.3375624.
- ↑ Yang, Wenli; Wei, Yuchen; Wei, Hanyu; Chen, Yanyu; Huang, Guan; Li, Xiang; Li, Renjie; Yao, Naimeng; Wang, Xinyi; Gu, Xiaotong; Amin, Muhammad Bilal; Kang, Byeong (10 августа 2023). “Survey on Explainable AI: From Approaches, Limitations and Applications Aspects”. Human-Centric Intelligent Systems [англ.]. 3 (3): 161—188. DOI:10.1007/s44230-023-00038-y. ISSN 2667-1336.
- ↑ Burrel, Jenna (2016). “How the machine 'thinks': Understanding opacity in machine learning algorithms”. Big Data & Society. 3 (1). DOI:10.1177/2053951715622512. S2CID 61330970. Дата обращения 2024-07-10.
|access-date=требует|url=(справка) - ↑ McCoy, Liam G.; Brenna, Connor T. A.; Chen, Stacy S.; Vold, Karina; Das, Sunit (5 ноября 2021). “Believing in black boxes: machine learning for healthcare does not need explainability to be evidence-based”. Journal of Clinical Epidemiology [англ.]. 142 (Online ahead of print): 252—257. DOI:10.1016/j.jclinepi.2021.11.001. ISSN 0895-4356. PMID 34748907. S2CID 243810442.
- ↑ Procaccia, Ariel D. (2019), Axioms Should Explain Solutions, Springer International Publishing, с. 195–199
- ↑ Cailloux, Olivier; Endriss, Ulle (9 мая 2016). “Arguing about Voting Rules”. Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems [англ.]: 287—295. ISBN 978-1-4503-4239-1.
- ↑ Yang, Joshua C.; Hausladen, Carina I.; Peters, Dominik; Pournaras, Evangelos; Regula Häenggli Fricker; Helbing, Dirk (2024). “Designing Digital Voting Systems for Citizens: Achieving Fairness and Legitimacy in Participatory Budgeting”. Digital Government: Research and Practice [англ.]. 5 (3): 1—30. arXiv:2310.03501. DOI:10.1145/3665332.
- ↑ Nizri, Meir; Hazon, Noam; Azaria, Amos (28 июня 2022). “Explainable Shapley-Based Allocation (Student Abstract)”. Proceedings of the AAAI Conference on Artificial Intelligence [англ.]. 36 (11): 13023—13024. DOI:10.1609/aaai.v36i11.21648. ISSN 2374-3468.
Ссылки
- the World Conference on eXplainable Artificial Intelligence
- ACM Conference on Fairness, Accountability, and Transparency (FAccT)
- Mazumdar, Dipankar; Neto, Mário Popolin; Paulovich, Fernando V. (2021). “Random Forest similarity maps: A Scalable Visual Representation for Global and Local Interpretation”. Electronics. 10 (22): 2862. DOI:10.3390/electronics10222862.
- Explaining How End-to-End Deep Learning Steers a Self-Driving Car
- DARPA is funding projects that will try to open up AI’s black boxes
- Alvarez-Melis, David & Jaakkola, Tommi S. (6 июля 2017), A causal framework for explaining the predictions of black-box sequence-to-sequence models, arΧiv:1707.01943 [cs.LG].