Рассуждения на основе прецедентов

Рассуждения на основе прецедентов (англ. case-based reasoning, CBR) — это процесс решения новых задач на основе решений ранее возникавших аналогичных задач. Например, автомеханик, который ремонтирует двигатель, вспомнив, что у другого автомобиля были те же признаки поломки, использует рассуждение на основе прецедентов. Юрист, который апеллирует к судебным прецедентам для защиты позиции, также использует данный тип рассуждения. То же касается и инженера, который копирует решения из природы, воспринимая её как «базу данных решений». Рассуждение на основе прецедентов — это один из видов рассуждений по аналогии. Считается, что рассуждения на основе прецедентов не только эффективны как модель для вычислительных систем, но и широко применяются людьми для решения повседневных задач. Более того, существует точка зрения, что любое рассуждение по сути является основанным на прецедентах, поскольку опирается на предыдущий опыт[1].

Контекст

Прежде чем обсуждать рассуждения на основе прецедентов, важно определить контекст и задачи данной методики. Рассуждение на основе прецедентов (CBR) является разновидностью экспертных систем в искусственном интеллекте. Экспертная система — это система, имитирующая поведение эксперта для решения задач разной природы; она повторяет действия, которые бы предпринял сам человек, например, в случае диагностики поломок автомобиля. Преимуществами экспертных систем являются автоматизация деятельности экспертов, снижение затрат и повышение доступности консультационных услуг. Однако увеличение объёма информации в системах приводит к трудностям с обработкой больших массивов данных, что затрудняет или делает невозможным их практическое применение. Тем не менее, экспертные системы оказываются крайне полезными во многих случаях.

Для эффективности экспертная система должна обладать двумя ключевыми качествами: уметь объяснять свою цепочку рассуждений (правила или шаги вывода из фактов к заключениям) и быть способной к приобретению новых знаний. Без этого система быстро устареет. В современных условиях используются смешанные подходы, объединяющие различные технологии; примером служат интеллектуальные агенты для переговоров и поиска в онлайн-ресурсах.

Структура экспертной системы обычно включает базу знаний (хранилище экспертной информации по предметной области), базу фактов (выводимые в процессе работы знания), выводящий механизм (имитация человеческого рассуждения) и интерфейс с пользователем, отвечающий за сбор входных данных и взаимодействие.

Стратегии работы экспертных систем можно разделить по типу используемого вывода:

Экспертные системы на правилах

Такой тип основывается на наборе правил, составляющих базу знаний эксперта, и позволяет получать новые знания «от фактов к цели» (прямой вывод) или «от цели к фактам» (обратный вывод).

Экспертные системы на байесовских сетях

Такие системы используют байесовские сети — вероятностные графовые модели, связывающие случайные переменные, и принимают решения исходя из теории вероятностей.

Экспертные системы на основе прецедентов

Данный тип подробно рассматривается далее: его работа опирается на набор ранее встречавшихся ситуаций (прецедентов) и позволяет решать новые задачи через ассоциации с имеющимся опытом. Такой способ наиболее близок к человеческому мышлению, когда, например, ребёнок, однажды обжёгшись о горячую кастрюлю, в будущем избегает повторения ошибки, а наблюдая, как взрослые берут горячее полотенцем, начинает использовать такой же подход.

Определение

Рассуждения на основе прецедентов (CBR) — это разновидность экспертных систем, в которых ключевое понятие — «прецедент» (англ. case), понимаемый как минимальная единица опыта, представляющая конкретную ситуацию из прошлого. Прецедент содержит не только подробное описание происшедшего, но и контекст, в котором это произошло. То есть каждый случай не является абстрактным правилом, а базируется на реальном опыте.

Важный аспект — обобщение: в базе содержатся только те случаи, которые дают новое знание для решения поставленных задач. Вся суть подхода — достижение целей рассуждения с помощью актуализации подходящих прецедентов.

Такой анализ позволяет подойти к рассмотрению прикладных подходов к реализации CBR в искусственном интеллекте, а также истории и эволюции направления.

История

Термин и метод рассуждений на основе прецедентов были разработаны в начале 1980-х в рамках работ Роджера Шенка и его учеников в Йельском университете. Его динамическая модель памяти[2] положена в основу первых CBR-систем: CYRUS Джанет Колоднер[3] и IPP Майкла Лебовица[4]. В те же годы другая исследовательская школа изучала CBR в праве, работе с примерами на параллельных вычислительных машинах и комбинированных с другими видами рассуждений. В 1990-х вырос международный интерес к CBR, организована первая международная конференция по CBR в 1995 году и национальные семинары в Европе.

CBR-технологии дали ряд успешных промышленных решений: первая промышленная система — CLAVIER фирмы Lockheed[5]. CBR внедрён во многих корпоративных приложениях (например, система поддержки Compaq SMART[6]), а также реализован в коммерчески доступных инструментах:

  • k-Commerce от eGain (ранее Inference Corporation)
  • Kaidara Advisor от Kaidara (ранее AcknoSoft)
  • SMART от Illation

Терминология

Для обозначения CBR применяются и смежные понятия:

  • Рассуждения на основе примеров: акцент на том, что прецеденты в базе знаний — это примеры ранее произошедших событий. Ключевая задача — правильно классифицировать добавляемые примеры, различая уже известные и действительно новые случаи.
  • Рассуждения на основе экземпляров: специализация предыдущего подхода, ориентированная на синтаксический анализ сходства между прецедентами. Часто реализуется с помощью векторных представлений (исследования Киблера и Аха).
  • Рассуждения на основе памяти: вся совокупность прецедентов рассматривается как память, а задача CBR — эффективный поиск и доступ к ней.
  • Рассуждения на основе прецедентов: обычно используется как общий термин; подразумевает наличие богато структурированных, хорошо описанных случаев, которые могут быть адаптированы к новым ситуациям.
  • Рассуждения по аналогии: термин-синквин для случаев, когда требуется перенос решения из другой предметной области при наличии структурных или ролевых сходств. Ключевой задачей является поиск и сопоставление доменных структур (mapping).

В дальнейших разделах под CBR подразумеваются все описанные выше варианты.

Принцип работы

Существуют два основных подхода к организации рассуждений на основе прецедентов:

  • Циклическая модель процесса (CBR-цикл)
  • Декомпозиция по задачам

Оба подхода дополняют друг друга: первый отражает последовательность этапов — от поиска аналогов до обработки новых случаев, второй позволяет подробнее анализировать внутренние задачи на каждом этапе.

Цикл рассуждений на основе прецедентов

В типовой CBR-процесс выделяют четыре этапа:

  1. Вспомнить похожие случаи.
  2. Повторно использовать информацию и знания этих случаев для решения текущей задачи.
  3. Проверить предложенное решение.
  4. Сохранить релевантный опыт для будущих задач.

Каждый раз при столкновении с новой проблемой система или человек ищет наиболее похожие прецеденты в базе, адаптирует найденное решение к текущему контексту, испытывает вариант сценария в реальных или смоделированных условиях и сохраняет результат (и успешные, и ошибочные решения) в памяти для использования в будущем.

undefined

Иерархическая задача CBR

Помимо последовательной цепочки действий, процесс можно разложить на иерархию задач, каждая из которых реализуется определённым методом (например, поиск, адаптация, оценка, интеграция, обучение). Такое представление облегчает реализацию гибких и параллельных схем рассуждения, выделяя задачи по уровням подчинения и зависимости от подзадач.

Проблемы и ограничения

Реализация CBR сопряжена с двумя основными группами проблем:

  • поддержка, организация и масштабируемость базы знаний (структурирование прецедентов и индексов);
  • разработка эффективных алгоритмов поиска и анализа аналогий.

Организация и хранение прецедентов

Классические модели:

  • Динамическая память (модель Шенка и Колоднер): группирует случаи с общими свойствами в обобщённые эпизоды (generalized episode) с разделением на общие характеристики (нормы), отдельные случаи и выделяющие различия индексы. Поддерживается иерархическая и избыточная структура, позволяющая быстро находить релевантные эпизоды.
  • Модель категорий и примеров (Портер и Барейс): каждый случай рассматривается как реальный пример объекта, характеризуемого неравнозначными признаками и принадлежащего определённой категории. Связи между случаями, категориями и их характеристиками реализуются через разные типы индексов. Хранение новых случаев осуществляется с возможностью объединения, если различия несущественны.

Методы поиска и сопоставления

Процесс поиска включает:

  • Идентификация характеристик: сбор максимально полного набора признаков задачи и её контекста.
  • Поиск первичных совпадений: формирование набора кандидатов на основе совпадающих признаков по индексам или путём последовательного перебора.
  • Оценка и отбор: углублённый анализ и ранжирование кандидатов по степени соответствия; аргументация выбора в случае необходимости; формирование итогового списка для адаптации.

Методы повторного использования (реюза)

Адаптация найденных случаев бывает двух видов:

  • Копирование: прямое перенесение релевантных характеристик в новую ситуацию (применяется при высокой схожести).
  • Адаптация: изменение ранее использованного решения с учётом различий между старым и новым случаем, включая как транзакцию целевых значений, так и изменение стратегии.

Методы проверки решения

Проверка состоит в:

  • Оценке решения: проверка его работоспособности на практике или в симуляции и сравнение результата с ожидаемым;
  • Исправлении ошибок: фиксации как правильных, так и ошибочных решений; провалившиеся случаи сохраняются в системе как примеры ошибок, помогающие избежать аналогичных ошибок в будущем.

Методы обучения

Фаза приобретения нового опыта включает:

  • Извлечение: сохранение всех значимых характеристик, описаний и обоснований решения (если оно было найдено без использования прецедентов, формируется новый случай).
  • Индексация: выбор набора индексов — характеристик для быстрого доступа при поиске.
  • Интеграция: корректное добавление нового или обновлённого случая в базу знаний без потери целостности и доступности.

Примеры

Система на основе прецедентов для дистанционного обучения

Пример CBR-приложения — экспертная система для поддержки дистанционного образования. Система моделирует опыт взаимодействия преподавателей и студентов, выявляет общие и воспроизводимые процедуры и автоматизирует подбор материалов, составление стратегий обучения, рекомендации по дополнительным материалам, анализ активности учащегося и генерацию новых моделей обучения. Каждый элемент (учитель, ученик) представлен в виде агента, который взаимодействует с остальными в рамках единой цели — повышения эффективности и индивидуализации учебного процесса[7].

Система на основе прецедентов для моделирования бизнес-процессов

Другой пример — система для проектирования бизнес-моделей на основе анализа и переформулирования известных решений для типовых задач. Использование CBR позволяет более гибко и качественно разрабатывать бизнес-решения в вариативных средах — преимущество перед системами на жёстких правилах для плохо структурированных областей.

Примечания

  1. Kolodner, Janet. Case-Based Reasoning : [англ.]. — Morgan Kaufmann, 1993. — ISBN 978-1558602372.
  2. Schank, Roger. Dynamic Memory: A Theory of Learning in Computers and People : [англ.]. — Cambridge University Press, 1982. — ISBN 0-521-28262-9.
  3. Kolodner, Janet (1983). “Reconstructive Memory: A Computer Model”. Cognitive Science [англ.]. 7 (4): 281—328. DOI:10.1016/S0364-0213(83)80004-8. Дата обращения 2024-06-30. |access-date= требует |url= (справка)
  4. Lebowitz, Michael (1983). “Memory-Based Parsing”. Artificial Intelligence [англ.]. 21: 363—404. DOI:10.1016/S0004-3702(83)80013-6. Дата обращения 2024-06-30. |access-date= требует |url= (справка)
  5. Mark, Bill (1989). “Case-Based Reasoning for Autoclave Management”. Proceedings of the Case-Based Reasoning Workshop [англ.]. Дата обращения 2024-06-30. |access-date= требует |url= (справка)
  6. Nguyen, Trung; Czerwinski, Mary; Lee, Dan (1993). COMPAQ QuickSource: Providing the Consumer with the Power of Artificial Intelligence (PDF). Proceedings of the Fifth Annual Conference on Innovative Applications of Artificial Intelligence [англ.]. AAAI Press. pp. 142—151. Дата обращения 2024-06-30.
  7. Althoff, Klaus-Dieter (2000). “Case-Based Reasoning for Distance Learning Environments”. Lecture Notes in Computer Science [англ.]. 1886: 259—269. DOI:10.1007/3-540-44527-7_22. Дата обращения 2024-06-30. |access-date= требует |url= (справка)

Литература

  • Aamodt, Agnar, and Enric Plaza. «Рассуждения на основе прецедентов: фундаментальные вопросы, методологические различия и архитектуры систем» // Artificial Intelligence Communications. 1994. Vol. 7, no. 1. С. 39-52.
  • Althoff, Klaus-Dieter, Ralph Bergmann, L. Karl Branting (ред.). Case-Based Reasoning Research and Development: Proceedings of the Third International Conference on Case-Based Reasoning. Берлин: Springer Verlag, 1999.
  • Колоднер, Джанет. Case-Based Reasoning. Сан-Матео: Morgan Kaufmann, 1993.
  • Leake, David. «CBR in Context: The Present and Future», in: Case-Based Reasoning: Experiences, Lessons, and Future Directions. AAAI Press/MIT Press, 1996, 1-30.
  • Leake, David, Enric Plaza (ред.). Case-Based Reasoning Research and Development: Proceedings of the Second International Conference on Case-Based Reasoning. Берлин: Springer Verlag, 1997.
  • Riesbeck, Christopher, Roger Schank. Inside Case-based Reasoning. Northvale, NJ: Erlbaum, 1989.
  • Veloso, Manuela, Agnar Aamodt (ред.). Case-Based Reasoning Research and Development: Proceedings of the First International Conference on Case-Based Reasoning. Берлин: Springer Verlag, 1995.
  • Watson, Ian. Applying Case-Based Reasoning: Techniques for Enterprise Systems. Morgan Kaufmann, 1997.

Категории