Галлюцинация (искусственный интеллект)
Галлюцинация (англ. hallucination; также искусственная галлюцинация; в англоязычной литературе нередко встречаются названия bullshitting[1], конфабуляция[2], делюзия) — термин в области искусственного интеллекта (ИИ), обозначающий ответ, сгенерированный ИИ, который содержит ложные или вводящие в заблуждение сведения, представляемые как факт[3][4]. Термин проводится по аналогии с понятием галлюцинации в человеческой психологии (ложное восприятие), но в случае ИИ речь идёт не о сенсорном образе, а о ошибочно сконструированном ответе (конфабуляции)[4].
Например, чат-бот, основанный на большой языковой модели (БЯМ), такой как ChatGPT, может генерировать правдоподобно звучащие, но на самом деле ложные или вымышленные сведения в своих ответах. Обнаружение и уменьшение количества подобного рода ошибок и галлюцинаций является серьёзной проблемой при практическом применении БЯМ в важных областях — например, в проектировании микросхем, логистике и медицинской диагностике[5]. Использование термина «галлюцинация ИИ» также подвергается критике за чрезмерную антропоморфизацию компьютеров[6][7].
Термин
В 1995 году Стивен Талер показал, как «галлюцинации» и фантомные переживания возникают в искусственных нейронных сетях из-за случайного возмущения весов связей[8][9][10][11][12].
В начале 2000-х годов термин «галлюцинация» использовался в области компьютерного зрения в позитивном смысле для обозначения процесса добавления подробностей к изображению. Например, задача генерации высокодетализированных лиц по низкокачественным входным данным называется face hallucination[13][14].
С конца 2010-х годов термин претерпел семантический сдвиг: теперь под «галлюцинацией» понимается генерация искусственными интеллектами фактически неверных или вводящих в заблуждение результатов при таких задачах, как перевод или обнаружение объектов[13]. Например, в 2017 году специалисты Google употребили этот термин для описания некорректного текста, который создают нейронные модели машинного перевода, если ответы не соответствуют исходному тексту[15]. В 2018 году термин использовался применительно к ошибочному обнаружению несуществующих объектов в результате атак на модели компьютерного зрения[16].
Широкое распространение термин «галлюцинация» в ИИ получил во время бума ИИ, в частности с массовым внедрением чат-ботов на основе БЯМ[17]. В июле 2021 года компания Meta при запуске BlenderBot 2 предупредила, что система склонна к «галлюцинациям», определяя данный эффект как «уверенные заявления, не являющиеся правдой»[18][19]. После выхода OpenAI ChatGPT в ноябре 2022 года пользователи отмечали, что чат-боты нередко бессмысленно подмешивают правдоподобные, но вымышленные содержательные элементы[20]. В СМИ, включая The New York Times, термин «галлюцинация» начал использоваться для описания ошибочных либо неконсистентных ответов моделей[21].
Некоторые исследователи отмечают, что в научной литературе нет единой трактовки и встречаются альтернативные термины — например, «конфабуляция», «фабрикация», «фактическая ошибка»[13] и др.
В 2023 году Кембриджский словарь обновил определение термина «галлюцинация», включив его смысл, специфичный для сферы искусственного интеллекта[22].
Использование и трактовки термина «галлюцинация» применительно к БЯМ включают[23]:
- «тенденция придумывать факты при отсутствии уверенности» (OpenAI, май 2023)[24];
- «логические ошибки модели» (OpenAI, май 2023);
- «полная фабрикация, но подающаяся как факты» (CNBC, май 2023);
- «придумывание информации» (The Verge, февраль 2023)[25];
- «вероятностные распределения» (используется в научном контексте).
Некоторые журналисты и учёные (например, Benj Edwards в Ars Technica) считают термин спорным, но метафора оказывается необходима; среди аналогий — «конфабуляция», «творческое заполнение пробелов»[2]. В июле 2024 года в докладе Белого дома вопрос галлюцинаций рассматривался исключительно как задача их сокращения, а первая в истории премия Нобеля за применение ИИ в белковом дизайне (2024) в формулировках избежала слова «галлюцинация», заменив его на «творческое белковое моделирование»[23].
В статье 2024 года Hicks, Humphries и Slater утверждают: выводы БЯМ представляют собой «чушь» в смысле Г. Франкфурта, являясь «безразличными к истине», а истинность или ошибочность отдельных высказываний оказываются случайными.
Ряд исследователей избегает слова «галлюцинация» как вводящего в заблуждение. Например, Усама Файяд (Институт экспериментального искусственного интеллекта, Северо-восточный университет) считает этот термин чрезмерно персонифицированным и нечётким[26]. Мэри Шоу описала термин как «ужасный» — он очеловечивает софт и преподносит ошибки генеративного ИИ как некие милые «особенности», а не объективно ошибочные ответы[6]. В «Salon» Гари Смит указывает, что БЯМ не «понимают слова», и термин бессмысленно очеловечивает машину[7]. Некоторые считают, что выводы ИИ не иллюзорны, а гипотетичны — т.е. вероятностно возможны, аналогично научным гипотезам. К тому же термин ассоциируется с психоделическим опытом[23].
В генерации естественного языка
В генерации естественного языка под галлюцинацией подразумевается сгенерированное содержимое, которое выглядит достоверно, но не опирается на исходные данные[27]. Галлюцинации классифицируют по признаку сверяемости с исходным текстом: если вывод не может быть проверен по источнику — это внешняя (экстраинспективная) галлюцинация; если противоречит источнику — внутренняя (интраспективная)[4]. По области — выделяют ограниченную (по конкретному запросу) и открытую (на любой ввод)[28].
Существует несколько причин, по которым языковые модели «галлюцинируют»[4][29]:
Основная причина — расхождение между исходным и целевым текстом в тренировочных данных. При обучении на таких данных модель склонна генерировать текст, не опираясь на предложенный источник[4].
Предобучение генеративных трансформеров заключается в угадывании следующего слова, и это поощряет «догадку» даже без уверенных данных[30]. Галлюцинации смягчаются дополнительным дообучением (тонкая настройка, ручной надзор, RLHF и др). Некоторые исследователи проводят аналогию с человеческим творчеством: стремление к новизне способствует ложным оригинальным ответам, а к пользе — банальному переписыванию[31][32].
Ошибки кодирования и декодирования внутри модели, неправильное сопоставление признаков данных, ошибка внимания к составляющим вводного текста, или особенности стратегии декодирования (например, top-k sampling) могут приводить к галлюцинациям[4].
Переполнение модели запомненными фактами также может вести к самоуверенному порождению ложных сведений. Так как БЯМ строит ответ итеративно, каждое дальнейшее слово «основано» на уже сгенерированных, что увеличивает шанс каскада ошибок[4].
В 2025 году анализ Anthropic внутренней работы модели Claude показал, что существуют внутренние «контуры», заставляющие модель отказываться от ответа при отсутствии уверенности, однако при неправильной работе эти механизмы могут сработать ошибочно, что ведёт к фальшивым, правдоподобным, но ложным ответам[33].
- В ноябре 2022 года Meta AI представила модель Galactica, снабжённую предупреждением «Outputs may be unreliable! Language Models are prone to hallucinate text». Галлюцинации проявились, в частности, в генерации несуществующих научных работ по реалистичной тематике; проект был закрыт через три дня из-за неточностей[34][35].
- ChatGPT — с момента запуска часто отмечается за генерацию вымышленных «правдоподобных» ответов, несуществующих ссылок, ошибок в фактах, фабрикаций художественных описаний и др[36].
- Галлюцинации были выявлены и в корпоративных применениях, напр., при подготовке юридических документов (казус Mata v. Avianca, Inc.), где моделями были сгенерированы несуществующие прецеденты[37][38].
- Неоднократно отмечаются ложные факты в ответах на вопросы по науке, истории, литературе, биографии, ошибочные «уверенные» ответы, подделка артикулов и ссылок[4].
В других модальностях
Термин «галлюцинация» применяется не только к тексту, но и к моделям для других модальностей.
В компьютерном зрении галлюцинации связаны с ошибками распознавания объектов, нередко возникающими под воздействием адверсариальных примеров. Иногда машины «видят» шаблоны, которые не видны человеку[16][39].
Модели текст-в-аудио, текст-в-изображение (например, Stable Diffusion, Midjourney) и текст-в-видео (Sora) также часто создают неточные объекты, фрагменты, неверные детали или абсурдные сцены, не встречающиеся в реальной жизни[40]. Известны случаи создания несуществующих или ошибочных персонажей, объектов, неверного отображения исторических сцен, а иногда — попытки соблюсти политкорректность вопреки реальности[41].
В научных исследованиях
Языковые модели, такие как ChatGPT, регулярно генерируют несуществующие ссылки, DOI, авторов и статьи в качестве «доказательств» информации[42]. Особая проблема — невозможность отличить автоматически сгенерированный реферат от реально написанного: современные плагиат-детекторы нередко считают тексты оригинальными (<100 %); даже эксперты ошибаются в 1/3 случаев[43]. Высокая степень фабрикации и ошибок ведёт к рискам внедрения ИИ в науку. Университеты и библиотеки вынуждены внедрять контроль над ссылками для отслеживания фальсифицированных источников[44].
В ряде случаев галлюцинации используются для генерации новых научных гипотез и необычных решений. Например, в лаборатории Дэвида Бейкера (Вашингтонский университет) были спроектированы миллионы новых белков, что привело к созданию десятков стартапов и патентов[23]; в Калифорнийском технологическом институте — новые формы катетеров с особыми свойствами для медицины[23]. В метеорологии, медицине, робототехнике галлюцинации помогают находить неожиданные решения, если их строго валидировать экспериментально[23].
Методы снижения галлюцинаций
Явление галлюцинации остаётся не до конца изученным. Часть исследователей полагает, что оно неизбежно при БЯМ[45] и ограничивается лишь мерами заметного снижения[46]. БЯМ также способны усиливать собственные ошибки[47]. Специалисты OpenAI считают, что галлюцинации возникают из-за того, что обучение и тестирование ИИ чаще поощряют угадывание, а не признание неуверенности.
Предлагаются две основные категории мер[4]:
- связанные с данными: создание корректных датасетов, очистка данных, дополнение источников внешней информацией;
- связанные с архитектурой и выводом: изменение внутреннего устройства, способов обучения (например, обучение с подкреплением), постобработка.
Существуют и более сложные схемы — дебаты между ИИ, валидация ответов поисковыми системами, внедрение оценки уверенности, использование логических правил, внешних баз данных знаний[48].
Детектор галлюцинаций может работать на основе анализа уверенности ИИ, проверки на реальных данных (knowledge-grounding, retrieval), использования специальных контрольных признаков и контрастного обучения, создания алгоритмов для выявления количественных или противоречивых ошибок[49].
На практике активно применяются инструменты для хардкодинга чувствительных ответов (Nvidia Guardrails), улучшения детектирования галлюцинаций офлайн и в реальном времени (SelfCheckGPT, Trustworthy Language Model и др)[50]. Подход к многократной оценке возможных вариантов ответа (confidence scoring) снижает ошибки, но увеличивает вычислительные издержки и задержки ответа, поэтому применяется в ответственных сферах[51].
Примечания
- ↑ Dolan, Eric W. Scholars: AI isn't "hallucinating" -- it's bullshitting (англ.). PsyPost - Psychology News (9 июня 2024). Дата обращения: 11 июня 2024. Архивировано 11 июня 2024 года.
- ↑ 1 2 Why ChatGPT and Bing Chat are so good at making things up, Ars Technica (6 апреля 2023). Архивировано 11 июня 2023 года. Дата обращения: 11 июня 2023.
- ↑ Maynez, Joshua. On Faithfulness and Factuality in Abstractive Summarization // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics / Joshua Maynez, Shashi Narayan, Bernd Bohnet … [и др.]. — 2020. — P. 1906–1919. — doi:10.18653/v1/2020.acl-main.173.
- ↑ 1 2 3 4 5 6 7 8 9 Ji, Ziwei; Lee, Nayeon; Frieske, Rita; Yu, Tiezheng; Su, Dan; Xu, Yan; Ishii, Etsuko; Bang, Ye Jin; Madotto, Andrea; Fung, Pascale (31 декабря 2023). “Survey of Hallucination in Natural Language Generation”. ACM Computing Surveys. 55 (12): 1—38. arXiv:2202.03629. DOI:10.1145/3571730.
- ↑ Chatbots May 'Hallucinate' More Often Than Many Realize, The New York Times (6 ноября 2023). Архивировано 7 декабря 2023 года. Дата обращения: 6 ноября 2023.
- ↑ 1 2 Kang, Eunsuk. tl;dr: Chill, y'all: AI Will Not Devour SE // Proceedings of the 2024 ACM SIGPLAN International Symposium on New Ideas, New Paradigms, and Reflections on Programming and Software / Eunsuk Kang, Mary Shaw. — 2024. — P. 303–315. — ISBN 979-8-4007-1215-9. — doi:10.1145/3689492.3689816.
- ↑ 1 2 An AI that can "write" is feeding delusions about how smart artificial intelligence really is, Salon (2 января 2023). Архивировано 5 января 2023 года. Дата обращения: 11 июня 2023.
- ↑ Thaler, S.L. (январь 1995). “'Virtual input' phenomena within the death of a simple pattern associator”. Neural Networks. 8 (1): 55—65. DOI:10.1016/0893-6080(94)00065-T. Проверьте дату в
|date=(справка на английском) - ↑ Ricciardiello, Luciana; Fornaro, Pantaleo (май 2013). “Beyond the cliff of creativity”. Medical Hypotheses. 80 (5): 534—543. DOI:10.1016/j.mehy.2012.12.018. PMID 23452643. Проверьте дату в
|date=(справка на английском) - ↑ Thaler, S. L. (2016). “Cycles of insanity and creativity within contemplative neural systems”. Medical Hypotheses. 96: 34—43. DOI:10.1016/j.mehy.2016.07.010. PMID 27515220.
- ↑ Thaler, Stephen L. (2014). “Synaptic Perturbation and Consciousness”. International Journal of Machine Consciousness. World Scientific Publishing Company. 6 (2): 75—107. DOI:10.1142/S1793843014400137.
- ↑ Thaler, S. L. (осень 1996). “The Death Dream and Near-Death Darwinism”. Journal of Near-Death Studies. 15 (1). Проверьте дату в
|date=(справка на английском) - ↑ 1 2 3 Maleki, Negar. AI Hallucinations: A Misnomer Worth Clarifying // 2024 IEEE Conference on Artificial Intelligence (CAI) / Negar Maleki, Balaji Padmanabhan, Kaushik Dutta. — 2024. — P. 133–138. — ISBN 979-8-3503-5409-6. — doi:10.1109/CAI59869.2024.00033.
- ↑ Liu, Ce; Shum, Heung-Yeung; Freeman, William T. (18 июля 2007). “Face Hallucination: Theory and Practice”. International Journal of Computer Vision. 75 (1): 115—134. DOI:10.1007/s11263-006-0029-5. ProQuest:1113669475.
- ↑ Hallucinations in Neural Machine Translation. research.google. Дата обращения: 2 апреля 2024. Архивировано 2 апреля 2024 года.
- ↑ 1 2 Simonite, Tom (9 марта 2018). “AI Has a Hallucination Problem That's Proving Tough to Fix”. Wired. Condé Nast. Архивировано из оригинала 2023-04-05. Дата обращения 2022-12-29. Используется устаревший параметр
|url-status=(справка) - ↑ Zhuo, Terry Yue; Huang, Yujin; Chen, Chunyang & Xing, Zhenchang (2023), Exploring AI Ethics of ChatGPT: A Diagnostic Analysis, arΧiv:2301.12867 [cs.CL].
- ↑ Blender Bot 2.0: An open source chatbot that builds long-term memory and searches the internet. ai.meta.com. Дата обращения: 2 марта 2024. Архивировано 5 августа 2025 года.
- ↑ Tung, Liam. Meta warns its new chatbot may forget that it's a bot, ZDNET (8 августа 2022). Архивировано 26 марта 2023 года. Дата обращения: 30 декабря 2022.
- ↑ The Alarming Deceptions at the Heart of an Astounding New Chatbot, Slate (13 декабря 2022). Архивировано 26 марта 2023 года. Дата обращения: 16 февраля 2023.
- ↑ When A.I. Chatbots Hallucinate (1 мая 2023). Архивировано 4 апреля 2024 года. Дата обращения: 8 мая 2023.
- ↑ Creamer, Ella 'Hallucinate' chosen as Cambridge dictionary's word of the year. The Guardian (15 ноября 2023). Дата обращения: 7 июня 2024.
- ↑ 1 2 3 4 5 6 Broad, William J.. How Hallucinatory A.I. Helps Science Dream Up Big Breakthroughs (23 декабря 2024). Архивировано 27 сентября 2025 года.
- ↑ OpenAI is pursuing a new way to fight A.I. 'hallucinations', CNBC (31 мая 2023). Архивировано 10 июня 2023 года. Дата обращения: 11 июня 2023.
- ↑ Google's AI chatbot Bard makes factual error in first demo, The Verge (8 февраля 2023). Архивировано 12 февраля 2023 года. Дата обращения: 11 июня 2023.
- ↑ Stening, Tanner What are AI chatbots actually doing when they 'hallucinate'? Here's why experts don't like the term. Northeastern Global News (10 ноября 2023). Дата обращения: 14 июня 2024. Архивировано 6 октября 2025 года.
- ↑ Tonmoy, S. M. Towhidul Islam; Zaman, S. M. Mehedi; Jain, Vinija; Rani, Anku; Rawte, Vipula; Chadha, Aman & Das, Amitava (8 января 2024), A Comprehensive Survey of Hallucination Mitigation Techniques in Large Language Models, arΧiv:2401.01313 [cs.CL].
- ↑ OpenAI (2023), GPT-4 Technical Report, arΧiv:2303.08774 [cs.CL].
- ↑ Barassi, Veronica (2024). “Toward a Theory of AI Errors: Making Sense of Hallucinations, Catastrophic Failures, and the Fallacy of Generative AI”. Harvard Data Science Review. 5. Bibcode:2024HDSRv...5ebbd4B. DOI:10.1162/99608f92.ad8ebbd4.
- ↑ Varanasi, Lakshmi Why AI chatbots hallucinate, according to OpenAI researchers. Business Insider. Дата обращения: 28 сентября 2025. Архивировано 24 сентября 2025 года.
- ↑ Amabile, Teresa M.; Pratt, Michael G. (2016). “The dynamic componential model of creativity and innovation in organizations: Making progress, making meaning”. Research in Organizational Behavior. 36: 157—183. DOI:10.1016/j.riob.2016.10.001.
- ↑ Mukherjee, Anirban; Chang, Hannah H. (2023). “Managing the Creative Frontier of Generative AI: The Novelty-Usefulness Tradeoff”. California Management Review. Архивировано из оригинала 2024-01-05. Дата обращения 2024-01-05. Используется устаревший параметр
|url-status=(справка) - ↑ Nuñez, Michael Anthropic scientists expose how AI actually 'thinks' — and discover it secretly plans ahead and sometimes lies. VentureBeat (27 марта 2025). Дата обращения: 3 апреля 2026. Архивировано 28 марта 2025 года.
- ↑ Taylor, Ross (16 ноября 2022), Galactica: A Large Language Model for Science, arΧiv:2211.09085 [cs.CL].
- ↑ New Meta AI demo writes racist and inaccurate scientific literature, gets pulled, Ars Technica (18 ноября 2022). Архивировано 10 апреля 2023 года. Дата обращения: 30 декабря 2022.
- ↑ A new AI chatbot might do your homework for you. But it's still not an A+ student, NPR (19 декабря 2022). Архивировано 20 января 2023 года. Дата обращения: 29 декабря 2022.
- ↑ Lawyer apologizes for fake court citations from ChatGPT, CNN Business (27 мая 2023). Архивировано 28 сентября 2025 года.
- ↑ Federal judge: No AI in my courtroom unless a human verifies its accuracy, Ars Technica (31 мая 2023). Архивировано 26 июня 2023 года. Дата обращения: 26 июня 2023.
- ↑ Matsakis, Louise (8 мая 2019). “Artificial Intelligence May Not 'Hallucinate' After All”. Wired. Архивировано из оригинала 2023-03-26. Дата обращения 2022-12-29. Используется устаревший параметр
|url-status=(справка) - ↑ Zhang, Chenshuang; Zhang, Chaoning; Zheng, Sheng; Zhang, Mengchun; Qamar, Maryam; Bae, Sung-Ho & Kweon, In So (2023-04-02), A Survey on Audio Diffusion Models: Text To Speech Synthesis and Enhancement in Generative AI, arΧiv:2303.13336 [cs.SD].
- ↑ Google apologizes for "missing the mark" after Gemini generated racially diverse Nazis, The Verge (21 февраля 2024). Архивировано 21 февраля 2024 года. Дата обращения: 14 августа 2024.
- ↑ Goddard, Jerome (ноябрь 2023). “Hallucinations in ChatGPT: A Cautionary Tale for Biomedical Researchers”. The American Journal of Medicine. 136 (11): 1059—1060. DOI:10.1016/j.amjmed.2023.06.012. PMID 37369274. Проверьте дату в
|date=(справка на английском) - ↑ Else, Holly (19 января 2023). “Abstracts written by ChatGPT fool scientists”. Nature. 613 (7944): 423. Bibcode:2023Natur.613..423E. DOI:10.1038/d41586-023-00056-7. PMID 36635510.
- ↑ Teel, Zoë (Abbie); Wang, Ting; Lund, Brady (2023). “ChatGPT conundrums: Probing plagiarism and parroting problems in higher education practices”. College & Research Libraries News. 84 (6). DOI:10.5860/crln.84.6.205.
- ↑ Xu, Ziwei; Jain, Sanjay & Kankanhalli, Mohan (2024), Hallucination is Inevitable: An Innate Limitation of Large Language Models, arΧiv:2401.11817 [cs.CL].
- ↑ Nie, Feng. A Simple Recipe towards Reducing Hallucination in Neural Surface Realisation // Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics / Feng Nie, Jin-Ge Yao, Jinpeng Wang … [и др.]. — 2019. — P. 2673–2679. — doi:10.18653/v1/P19-1256.
- ↑ Dziri, Nouha. On the Origin of Hallucinations in Conversational Models: Is it the Datasets or the Models? // Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies / Nouha Dziri, Sivan Milton, Mo Yu … [и др.]. — 2022. — P. 5271–5285. — doi:10.18653/v1/2022.naacl-main.387.
- ↑ ChatGPT 'hallucinates.' Some researchers worry it isn't fixable. (30 мая 2023). Архивировано 17 июня 2023 года. Дата обращения: 31 мая 2023.
- ↑ Luo, Junliang; Li, Tianyu; Wu, Di; Jenkin, Michael; Liu, Steve & Dudek, Gregory (2024), Hallucination Detection and Hallucination Mitigation: An Investigation, arΧiv:2401.08358 [cs.CL].
- ↑ Nvidia has a new way to prevent A.I. chatbots from 'hallucinating' wrong facts, CNBC (25 апреля 2023). Архивировано 6 октября 2025 года. Дата обращения: 15 июня 2023.
- ↑ Xing, Wei Why OpenAI's solution to AI hallucinations would kill ChatGPT tomorrow. The Conversation (12 сентября 2025). Дата обращения: 16 сентября 2025. Архивировано 11 октября 2025 года.