Логико-лингвистическое моделирование

Логико-лингвистическое моделирование — это метод построения систем на основе знаний, обладающих способностью к обучению, с использованием концептуальных моделей из мягких системных методологий, модальной предикатной логики и языков логического программирования, таких как Пролог.

Общая характеристика

Логико-лингвистическое моделирование — это шестиступенчатый метод, разработанный преимущественно для создания систем на основе знаний, но также применимый в ручных системах поддержки принятия решений и анализе источников информации. Логико-лингвистические модели внешне напоминают концептуальные графы Джона Сова (John F. Sowa)[1]; обе методики используют диаграммы пузырьковой структуры, обе оперируют понятиями, могут быть выражены в логических формализмах и применяются в искусственном интеллекте. Однако логико-лингвистические модели существенно отличаются как по логической форме, так и по способу построения.

Метод был разработан для решения теоретических проблем, обнаруженных в мягком системном подходе при проектировании информационных систем. Главная задача исследований заключалась в демонстрации того, как мягкая системная методология может быть расширена до области искусственного интеллекта.

Предпосылки

В SSM используются три моделирующих инструмента: насыщенные рисунки, корневые определения и концептуальные модели человеческих деятельностных систем. Корневые определения и концептуальные модели разрабатываются самими заинтересованными лицами в ходе итерационного обсуждения, организуемого фасилитатором. Преимущества данного метода заключаются, во-первых, в его гибкости и способности решать любые проблемные ситуации, а во-вторых, в том, что найденное решение принадлежит самим участникам организации, а не навязывается внешним аналитиком.

Анализ информационных требований развил базовый метод SSM, показав, как концептуальные модели могут быть доработаны до уровня детального проектирования информационных систем[2]. IRA требует дополнительно двух инструментов: «категории информации», которые отображают требуемые входные и выходные данные для различных видов деятельности, и «Мальтийский крест», представляющий собой матрицу, показывающую входы и выходы из категорий информации и указывающий, где необходимы новые процедуры обработки данных. Завершённый Мальтийский крест достаточно информативен для детального проектирования транзакционных систем.

Первоначальный толчок к развитию логико-лингвистического моделирования был связан с проблемой, как информационная система может быть связана с физическим миром. Эта задача является актуальной как для IRA, так и для других устоявшихся методов, поскольку ни один из них не основывает проектирование ИС на моделях физического мира. IRA исходит из условных концептуальных моделей, а SSADM — из моделей движения документов.

Разработанное решение оказалось применимо не только для проектирования транзакционных систем, но и для КБС с возможностью обучения[3].

Брайан Уилсон заложил фундамент методологии мягких систем (SSM), а Фрэнк Грегори создал теоретический мост между качественным системным анализом и искусственным интеллектом. Грегори предложил интерпретировать концептуальные модели SSM как «языковую игру» в духе философии Людвига Витгенштейна, что позволило формализовать их с использованием логики.

Шесть этапов логико-лингвистического моделирования

undefined

Метод логико-лингвистического моделирования включает шесть этапов[3].

1. Системный анализ

На первом этапе для анализа систем используется SSM. На этой стадии структурируется проблемная ситуация в организации-клиенте: выявляются заинтересованные стороны, моделируются организационные цели, обсуждаются возможные решения. На данном этапе не предполагается, что КБС обязательно станет решением; часто логико-лингвистическое моделирование приводит к выводам, не требующим автоматизированной КБС.

Экспертные системы обычно фиксируют экспертные знания разных специалистов по одной тематике. Напротив, КБС, создаваемые посредством логико-лингвистического моделирования, направлены на фиксацию знаний специалистов одной организации по разным вопросам. Основной акцент делается на извлечении организационных или коллективных знаний, а не знаний отдельных экспертов. Фактически в логико-лингвистическом моделировании заинтересованные лица становятся экспертами.

Конечной целью этапа выступает построение концептуальной модели по стилю SSM (см. рис. 1).

2. Создание языка

undefined

Согласно теории логико-лингвистического моделирования, процесс построения концептуальных моделей SSM представляет собой витгенштейновскую языковую игру, в ходе которой участники разрабатывают язык для описания проблемной ситуации. Логико-лингвистическая модель формализует этот язык в виде системы определений (см. рис. 2).

3. Извлечение знаний

После построения модели языка заинтересованные стороны могут добавить предполагаемые знания о реальном мире. Традиционные концептуальные модели SSM используют только одну логическую связь — необходимое условие. Для описания причинно-следственных связей дополнительно требуются условия достаточности и необходимые и достаточные условия. В логико-лингвистическом моделировании этот недостаток устраняется введением дополнительных видов логических связок. Результатом третьего этапа становится эмпирическая модель (см. рис. 3). В современных условиях для автоматизации извлечения и первичной формализации знаний из неструктурированных текстов начинают применяться большие языковые модели (LLM)[4].

4. Представление знаний

undefined

В качестве формального средства представления знаний используется модальная предикатная логика (объединение модальной и предикатной логики). Связки из языковой модели считаются логически истинными (что обозначается модальным оператором «L»), а добавленные на этапе извлечения знаний — возможными (обозначаются оператором «M»). Перед переходом к пятому этапу все модели переводятся в формулы логики.

5. Компьютерная реализация

Формулы предикатной логики легко транслируются в язык искусственного интеллекта Пролог. Модальности реализуются с помощью двух различных типов правил Пролога: правила из этапа создания языка считаются неоспоримыми, а правила, полученные на этапе извлечения знаний, отмечаются как гипотетические. Построенная система не ограничивается поддержкой принятия решений, а обладает встроенными возможностями обучения.

6. Верификация

Система на основе знаний, разработанная этим методом, верифицирует себя самостоятельно. Верификация происходит в процессе использования КБС клиентами и продолжается на протяжении всего срока эксплуатации системы. Если представления участников о реальном мире оказываются ошибочными, это обнаруживается при добавлении фактов Пролога, вступающих в противоречие с гипотетическими правилами. Механизм работает в соответствии с классическим принципом фальсифицируемости, характерным для научной методологии[5].

Процесс верификации знаний в логико-лингвистическом моделировании концептуально близок к современным методам борьбы с «галлюцинациями» в больших языковых моделях (LLM), выступая в качестве механизма логического контроля и факт-чекинга[6].

Применение

Компьютерные системы на основе знаний

Путём логико-лингвистического моделирования были созданы полнофункциональные КБС, например, для управления пациентами с сахарным диабетом в поликлинике[7].

Ручная поддержка принятия решений

В ряде проектов переход к программной реализации на Прологе был признан нецелесообразным, поскольку печатные логико-лингвистические модели сами по себе служили удобным инструментом поддержки принятия решений. Например, система для одобрения ипотечных кредитов[8].

Анализ источников информации

В некоторых случаях создание КБС было невозможно в силу отсутствия у организации всех необходимых знаний для поддержки своей деятельности. В этих ситуациях логико-лингвистическое моделирование выявляло недостаточную обеспеченность информацией и определяло направления для её пополнения. К примеру, производственный отдел компании в сфере телекоммуникаций.

Связь с современными методами ИИ

Концептуальное ядро логико-лингвистического моделирования, представляющее собой сочетание логики, лингвистики и баз знаний, активно развивается в рамках современных архитектур гибридного и нейросимвольного искусственного интеллекта[9]. Метод идеологически связан с техникой цепочки рассуждений (Chain-of-Thought, CoT) в больших языковых моделях (LLM), позволяя эмулировать структурированный логический вывод[10][11].

В гибридных системах модальная логика применяется для верификации рассуждений LLM[12]. Кроме того, языки логического программирования используются совместно с LLM для обеспечения исполнимости и логической корректности планов автономных ИИ-агентов[13].

Критика

Хотя логико-лингвистическое моделирование преодолевает трудности перехода от концептуальной модели SSM к компьютерному коду, оно достигает этого ценой существенного усложнения создаваемых участниками моделей. Преимущества подобной сложности остаются спорными[14], а весь метод может оказаться гораздо сложнее в применении, чем альтернативные подходы[15].

Эта точка зрения подтверждается последующими исследованиями: в одном из проектов по моделированию решений о покупке промышленного оборудования для двенадцати компаний потребовалась значительная упрощённость моделей и отказ от использования модальных элементов.

В современную эпоху символьные подходы, к которым относится логико-лингвистическое моделирование, подвергаются критике за хрупкость и сложность ручного ввода знаний по сравнению со способностью нейросетей к обучению[16].

Вместе с тем, из-за проблем нейросетей с интерпретируемостью (проблема «чёрного ящика»), актуальным трендом является создание гибридных нейро-символических систем, объединяющих логичность и прозрачность символьных моделей с вычислительной мощностью нейросетей[16].

Примечания

Литература

Категории