Дескрипционная логика

Дескрипцио́нная логика^[1] (описательная логика, ранние наименования — терминологическая система, логика концептов) — язык представления знаний, позволяющий формализованно и однозначно описывать понятия предметной области, организованный по типу языков математической логики. Дескрипционные логики сочетают богатые выразительные возможности и хорошие вычислительные свойства, такие как разрешимость и относительно невысокая вычислительная сложность основных логических проблем, что обеспечивает их практическое применение и компромисс между выразительностью и разрешимостью. Их можно рассматривать как разрешимые фрагменты логики предикатов, а синтаксически они близки к модальным логикам.

Термин дескрипционная логика (англ. description logic) был закреплён в 1980-е годы, когда они исследовались как расширения теорий фреймовых структур и семантических сетей механизмами формальной логики. В 2000-е годы дескрипционные логики получили широкое распространение в рамках концепции семантической паутины, где используются для построения онтологий. Фрагменты стандарта OWL-DL и OWL-Lite языка веб-онтологий OWL основаны на дескрипционных логиках.

Дескрипционные логики оперируют понятиями «концепт» и «роль», которые соответствуют в других разделах математической логики понятиям «одноместный предикат» (или множество, класс) и «двуместный предикат» (или бинарное отношение). Интуитивно, концепты используются для описания классов объектов, например, «Люди», «Женщины», «Машины». Роли описывают двуместные отношения между объектами (например, «X есть_родитель_для Y» или «X имеет_в_собственности Y»). С помощью языка дескрипционной логики можно формулировать как общие утверждения о классах (например, всякая Женщина есть Человек, всякая Машина не более чем у одного Человека), так и частные — о конкретных объектах (например, Мария есть Женщина, Иван имеет_в_собственности Машину1).

Набор общих утверждений или терминологии (англ. terminology) называется TBox, а набор утверждений (англ. assertions) частного вида — ABox; вместе они образуют базу знаний^[2] или онтологию. Онтологии на основе дескрипционных логик используются во многих областях — биоинформатика, генетика, медицина, химия, биология. Реализация логического вывода на уровне программ обеспечивают так называемые механизмы рассуждений (англ. reasoners), которые позволяют автоматически выводить знания из онтологий и выполнять другие операции.

В математической логике язык определяется своим синтаксисом — правилами построения выражений, и семантикой — способом приписывания этим выражениям значения.

Для описания синтаксиса дескрипционной логики задаётся конечное множество атомарных концептов и атомарных ролей, из которых по определённым конструкторам и индуктивным правилам строятся сложные концепты и роли.

Типичные конструкторы составных концептов:

пересечение (или конъюнкция) концептов: $C\sqcap D$ ;
объединение (или дизъюнкция) концептов: $C\sqcup D$ ;
дополнение (отрицание) концепта: $\neg C$ ;
ограничение на значения роли (квантор всеобщности): $\forall R.C$ ;
экзистенциальное ограничение (квантор существования): $\exists R.C$ ;
численные ограничения: $({\leq }n\,R)$ , $({\geq }n\,R.C)$ и др.

В дескрипционных логиках обозначения конъюнкции/дизъюнкции иные, чтобы подчеркнуть специфику. В некоторых логиках есть также составные роли, строящиеся из простых с помощью операций инверсии, пересечения, объединения, дополнения, композиции, транзитивного замыкания и др^[2]

ALC

Дескрипционная логика ${\mathcal {ALC}}$ (от англ. attributive language with complement) разработана в 1991 году^[3]. и является базовой системой: многие логики строятся на её основе. Пусть заданы конечные множества атомарных концептов и ролей. Составные концепты в ${\mathcal {ALC}}$ определяются индуктивно:

всякий атомарный концепт — концепт;
$\top$ и $\bot$ — концепты;
если $C$ — концепт, то $\neg C$ — концепт;
если $C$ и $D$ — концепты, то $C\sqcap D$ и $C\sqcup D$ — концепты;
если $C$ — концепт, а $R$ — роль, то $\forall R.C$ и $\exists R.C$ — концепты.

Фактически ${\mathcal {ALC}}$ — это семейство логик с конкретным набором атомарных символов, что аналогично сигнатуре теории первого порядка.

Семантика дескрипционных логик задаётся интерпретацией атомарных концептов как множеств объектов (англ. individual), а ролей — как множеств пар объектов (бинарных отношений) на домене $\Delta ^{\mathcal {I}}$ .

Интерпретация ${\mathcal {I}}$ состоит из:

домена $\Delta ^{\mathcal {I}}$ (непустое множество);
функции, сопоставляющей каждому атомарному концепту $A$ подмножество $A^{\mathcal {I}}\subseteq \Delta ^{\mathcal {I}}$ , а каждой атомарной роли $R$ — подмножество $R^{\mathcal {I}}\subseteq \Delta ^{\mathcal {I}}\times \Delta ^{\mathcal {I}}$ .

Правила для ${\mathcal {ALC}}$ :

$\top ^{\mathcal {I}}=\Delta ^{\mathcal {I}}$
$\bot ^{\mathcal {I}}=\varnothing$
$(\neg C)^{\mathcal {I}}=\Delta ^{\mathcal {I}}\setminus C^{\mathcal {I}}$
$(C\sqcap D)^{\mathcal {I}}=C^{\mathcal {I}}\cap D^{\mathcal {I}}$
$(C\sqcup D)^{\mathcal {I}}=C^{\mathcal {I}}\cup D^{\mathcal {I}}$
$(\forall R.C)^{\mathcal {I}}=\{\,e\in \Delta ^{\mathcal {I}}\mid \forall d\in \Delta ^{\mathcal {I}}:(e,d)\in R^{\mathcal {I}}\Rightarrow d\in C^{\mathcal {I}}\,\}$
$(\exists R.C)^{\mathcal {I}}=\{\,e\in \Delta ^{\mathcal {I}}\mid \exists d\in \Delta ^{\mathcal {I}}:(e,d)\in R^{\mathcal {I}}\land d\in C^{\mathcal {I}}\,\}$

Например, если $M$ — множество мужчин, $R$ — «есть родитель для», то $\forall R.M$ — множество людей, у которых все дети мужского пола; $M\sqcap \exists R.\top$ — множество отцов.

В 1991 году^[4] было показано, что ${\mathcal {ALC}}$ эквивалентна многомодальной модальной логике $\mathbf {K} _{n}$ (n независимых модальностей): атомарные концепты переходят в пропозициональные переменные, пересечение/объединение/отрицание — в булевы связки, $\forall R_{j}$ — в $\Box _{j}$ , $\exists R_{j}$ — в $\Diamond _{j}$ . Фактически, это один и тот же язык в разных обозначениях, и их семантика согласуется (семантика Крипке и др.), что даёт возможность переносить результаты по разрешимости, сложности и процедурам из модальных логик.

Дескрипционные логики (включая ${\mathcal {ALC}}$ ) можно рассматривать как фрагменты логики предикатов, когда концепты переводятся в формулы с одним объектным переменным. Атомарные концепты $A_{i}$ переходят в $P_{i}(x)$ , роли $R_{j}$ — в $S_{j}(x,y)$ . Выражения $\forall R_{j}.C$ — в $\forall y(S_{j}(x,y)\Rightarrow C'(y))$ , $\exists R_{j}.C$ — в $\exists y(S_{j}(x,y)\land C'(y))$ (где $C'$ — перевод $C$ ). В этом переводе используются только две переменные^[5], поэтому ${\mathcal {ALC}}$ и её расширения — это фрагменты логики предикатов с двумя переменными, которая разрешима^[6].

Концепты дескрипционных логик важны как инструмент для формализации знаний об описываемой предметной области. Знания делятся на общие (интенсиональные — о понятиях и связях) и знания об объектах (экстенсиональные — о свойствах и отношениях между ними).

Выделяют:

набор терминологических аксиом — $TBox{\mathcal {T}}$
набор утверждений о конкретных объектах — $ABox{\mathcal {A}}$

Их объединение образует базу знаний ${\mathcal {K}}={\mathcal {T}}\cup {\mathcal {A}}$ .

Терминологические аксиомы

Аксиома вложенности концептов — $C\sqsubseteq D$ , аксиома эквивалентности — $C\equiv D$ (для ролей — аналогично). Терминология (TBox) — конечный набор таких аксиом. Иногда аксиомы для ролей выделяют отдельно как RBox. В терминологии могут быть и другие аксиомы (например, транзитивность ролей).

Аксиома $C\sqsubseteq D$ выполняется в интерпретации ${\mathcal {I}}$ , если $C^{\mathcal {I}}\subseteq D^{\mathcal {I}}$ . Моделью терминологии называется интерпретация, в которой выполняются все аксиомы.

Пример TBox для ${\mathcal {ALC}}$ :

{\mathsf {Woman}}\equiv {\mathsf {Person}}\sqcap {\mathsf {Female}}

{\mathsf {Mother}}\equiv {\mathsf {Woman}}\sqcap \exists {\mathsf {hasChild}}.\top

\forall {\mathsf {hasChild}}.{\mathsf {Person}}\sqsubseteq {\mathsf {Person}}

{\mathsf {Doctor}}\sqsubseteq {\mathsf {Person}}

Интуитивно: женщина = человек и женского пола; мать = женщина и имеет ребёнка; у человека все дети — тоже люди; любой доктор — человек.

Утверждения об объектах

Для конкретных объектов утверждения бывают двух видов:

объект $a$ принадлежит концепту $C$ : $C(a)$
между $a$ и $b$ выполняется роль $R$ : $R(a,b)$

Набор таких утверждений называется $ABox$ .

Семантика: имя объекта интерпретируется элементом домена. $C(a)$ выполняется, если $a^{\mathcal {I}}\in C^{\mathcal {I}}$ ; $R(a,b)$ — если $(a^{\mathcal {I}},b^{\mathcal {I}})\in R^{\mathcal {I}}$ . Интерпретация, где выполняются все утверждения, называется моделью ABox.

Пример ABox:

{\mathsf {Mary}}\colon {\mathsf {Woman}}\sqcap \neg {\mathsf {Doctor}}

{\mathsf {Mary}}\colon \exists {\mathsf {hasChild}}.{\mathsf {Female}}

{\mathsf {Mary}}\,{\mathsf {hasChild}}\,{\mathsf {Peter}}

{\mathsf {Peter}}\colon {\mathsf {Doctor}}\sqcap \forall {\mathsf {hasChild}}.\bot

Имена объектов Mary и Peter; утверждения означают, что Mary — женщина, не доктор, у неё есть девочка-ребёнок, у Mary есть ребёнок Peter, Peter — доктор и не имеет детей.

Часто принимается соглашение о различии имён объектов (unique name assumption); в OWL оно не по умолчанию, но может быть явно указано.

Отличие от баз данных

В отличие от баз данных, в ДЛ принимается предположение об открытости мира: если утверждение не известно, оно не объявляется ложным (в отличие от замкнутых баз данных). Это существенно влияет на логический вывод и понятие логического следования.

Существуют расширения ${\mathcal {ALC}}$ дополнительными конструкторами и аксиомами. Принято обозначать буквой добавленную возможность:

${\mathcal {F}}$	Функциональность ролей: $({\leq }1\,R)$ — не более одного R-последователя
${\mathcal {N}}$	Ограничения кардинальности: $({\leq }n\,R)$
${\mathcal {Q}}$	Качественные ограничения: $({\leq }n\,R.C)$
${\mathcal {I}}$	Обратные роли: $R^{-}$
${\mathcal {O}}$	Номиналы: $\{a\}$ — одноэлементное множество
${\mathcal {H}}$	Иерархия ролей: аксиомы $R\sqsubseteq S$
${\mathcal {S}}$	Транзитивные роли: аксиомы ${\mathsf {Tr}}(R)$
${\mathcal {R}}$	Составные аксиомы вложенности ролей ( $R\circ S\sqsubseteq R$ )
$(D)$	Расширения конкретными доменами (типами данных)

Например, ${\mathcal {ALCIOQ}}$ — логика с инверсными ролями, номиналами и качественными ограничениями. ${\mathcal {SHIQ}}$ — расширения инверсными ролями ( $I$ ), качественными ограничениями ( $Q$ ), транзитивными ролями ( $S$ ) и иерархией ролей ( $H$ ). Буква $S$ выбрана из-за исторической связи с модальной логикой $\mathbf {S4}$ ^[4].

Для некоторых логик дополнительные ограничения требуются для разрешимости^[7].

Базы знаний из дескрипционных логик применяются не только для представления знаний, но и для логического анализа (англ. reasoning) — проверки непротиворечивости знаний, логического вывода, ответа на запросы.

Определения:

концепт $C$ выполняется в интерпретации ${\mathcal {I}}$ , если $C^{\mathcal {I}}\neq \varnothing$
выполнимый концепт — существует интерпретация, где он выполняется
вложение: $C$ вложен в $D$ , если во всех интерпретациях $C^{\mathcal {I}}\subseteq D^{\mathcal {I}}$

Аналогично для TBox, ABox и базы знаний ${\mathcal {K}}={\mathcal {T}}\cup {\mathcal {A}}$ .

Практически важные задачи:

выполнимость концепта (относительно TBox)
вложение концептов
совместимость TBox (есть ли модель)
совместимость базы знаний (модель для пары TBox, ABox)
построение таксономии (иерархии) концептов
извлечение экземпляров концепта
наименее общий над-концепт
наилучшее описание для объекта
ответ на запрос к базе знаний

Запросы вида конъюнктивных запросов похожи на методы в базах данных; для более сложных запросов вычислительная трудоёмкость высока или задача становится неразрешимой^[8]^[9].

Ключевые свойства:

разрешимость основных задач
вычислительная сложность, в том числе сложность по данным (англ. data complexity)
свойство конечности моделей (англ. finite model property)
свойство древовидности моделей (англ. tree model property)

Исследованы многочисленные результаты по этим характеристикам^[10].

Язык OWL служит для формализации и публикации в сети сетевых онтологий — утверждений о концептах и объектах области знаний. Важным требованием OWL является точная семантика и разрешимость ключевых логических задач при приемлемой сложности. Дескрипционные логики были выбраны как логическая основа OWL благодаря этим свойствам.

Понятия дескрипционных логик (концепт, роль, объект, база знаний) в OWL соответствуют понятиям «класс», «свойство», «объект», «онтология».

Официальная рекомендация W3C от 10 февраля 2004 года:

OWL-Lite — соответствует ${\mathcal {SHIF}}(D)$
OWL-DL — соответствует ${\mathcal {SHOIN}}(D)$
OWL-Full — не соответствует никакой разрешимой логике

Рабочий проект OWL 1.1 (будущая версия) охватывает логику $s{\mathcal {ROIQ}}(D)$ , допуская составные аксиомы вложенности ролей (буква $R$ ), аксиомы непересекаемости, рефлексивности, асимметрии и др. новые конструкции^[11].

OWL 2 позволит выражать онтологии на языке ${\mathcal {EL}}$ (с полиномиальной сложностью), расширит средства для запросов и аналитики^[12].

Существует множество программных систем (машин вывода), реализующих автоматические рассуждения в дескрипционных логиках: проверка непротиворечивости онтологий, построение таксономий, анализ выполнимости (табло-алгоритм, резолюция и др.), поддержка различных форматов и языков.

Некоторые известные reasoners^[13]:

CEL — реализует ${\mathcal {EL}}+$ (полиномиальная сложность), написан на Лисп^[14]
FaCT++ — поддержка $s{\mathcal {ROIQ}}(D)$ и OWL 2.0, реализует табло-алгоритм (C++)^[15]
Kaon2 — реализует ${\mathcal {SHIQ}}$ и специальные правила, механизм резолюции (Java)^[16]
Pellet — реализует $s{\mathcal {ROIQ}}(D)$ и OWL 1.1 (Java)^[17]
RacerPro — реализует ${\mathcal {SHIQ}}(D)$ (Лисп)^[18]

Широко используются редакторы онтологий; например, Protégé, поддерживающий OWL Full и подключение reasoner-рассуждателя.

Предположение об уникальности имён

↑ Лапшин В. А., Онтологии в компьютерных системах. RSDN Magazine, 4, 2009. (неопр.) Дата обращения: 21 октября 2012. Архивировано 26 февраля 2013 года.
↑ ¹ ² Franz Baader, Diego Calvanese, Deborah L. McGuinness, Daniele Nardi, Peter F. Patel-Schneider. The Description Logic Handbook: Theory, Implementation, and Applications. — Cambridge University Press, 2003. — ISBN 0-521-78176-0.
↑ Schmidt-Schauß, M.; Smolka, G. (1991). “Attributive concept descriptions with complements”. Artificial Intelligence [англ.]. 48: 1—26. Дата обращения 2023-12-01.
↑ ¹ ² Schild, K. (1991). “A correspondence theory for terminological logics: Preliminary report”. Proc. of the 12th Int. Joint Conf. on Artificial Intelligence (IJCAI'91) [англ.]: 466—471.
↑ Lutz, C.; Sattler, U.; Wolter, F. (2001). “Modal logics and the two-variable fragment”. Annual Conference of the European Association for Computer Science Logic (CSL'2001) [англ.].
↑ Grädel, E.; Otto, M.; Rosen, E. (1997). “Two variable logic with counting is decidable”. Proc. of the 12th IEEE Symp. on Logic in Computer Science (LICS'97) [англ.]: 306—317.
↑ Horrocks, I.; Sattler, U.; Tobies, S. (1999). “Practical reasoning for expressive Description Logics”. Proc. of the 6th Int. Conference on Logic for Programming and Automated Reasoning (LPAR'99) [англ.]: 161—180.
↑ Tessaris, S. Questions and answers: Reasoning and querying in Description Logic (PhD Thesis) : [англ.]. — University of Manchester, 2001.
↑ Glimm, B.; Horrocks, I.; Lutz, C.; Sattler, U. (2007). “Conjunctive query answering for the description logic SHIQ”. Proc. of the 20th Int. Joint Conf. on Artificial Intelligence (IJCAI 2007) [англ.]. 31: 151—198.
↑ Навигатор по сложности дескрипционных логик (рус.). cs.manchester.ac.uk. Дата обращения: 1 декабря 2023. Архивировано 6 января 2010 года.
↑ Сайт разработчиков языка OWL 1.1 (неопр.). Дата обращения: 17 июня 2009. Архивировано 16 февраля 2008 года.
↑ Новые возможности языка OWL 2.0 (неопр.). Дата обращения: 17 июня 2009. Архивировано 26 июня 2009 года.
↑ Список машин ДЛ-вывода (неопр.). owl.cs.manchester.ac.uk. Дата обращения: 4 мая 2017. Архивировано 27 октября 2015 года.
↑ CEL (неопр.). lat.inf.tu-dresden.de. Дата обращения: 17 июня 2009. Архивировано 1 сентября 2009 года.
↑ FaCT++ (неопр.). owl.cs.manchester.ac.uk. Дата обращения: 17 июня 2009. Архивировано 6 июня 2009 года.
↑ Kaon2 (неопр.). kaon2.semanticweb.org. Дата обращения: 17 июня 2009. Архивировано 6 января 2006 года.
↑ Pellet (неопр.). Дата обращения: 1 января 2010. Архивировано 25 сентября 2007 года.
↑ RacerPro (неопр.). racer-systems.com. Дата обращения: 17 июня 2009. Архивировано 7 июня 2009 года.

Рассел С., Норвиг П. Искусственный интеллект: современный подход. — ИД «Вильямс», 2006. — P. 1408. — ISBN 5-8459-0887-6.
Franz Baader, Diego Calvanese, Deborah L. McGuinness, Daniele Nardi, Peter F. Patel-Schneider. The Description Logic Handbook: Theory, Implementation, and Applications. — Cambridge University Press, 2003. — ISBN 0-521-78176-0.

Официальный сайт сообщества исследователей дескрипционных логик
Навигатор по вычислительной сложности дескрипционных логик
Список reasoners по дескрипционным логикам

[1] Лапшин В. А., Онтологии в компьютерных системах. RSDN Magazine, 4, 2009. (неопр.) Дата обращения: 21 октября 2012. Архивировано 26 февраля 2013 года.

[Description_Logic_Handbook-2] ¹ ² Franz Baader, Diego Calvanese, Deborah L. McGuinness, Daniele Nardi, Peter F. Patel-Schneider. The Description Logic Handbook: Theory, Implementation, and Applications. — Cambridge University Press, 2003. — ISBN 0-521-78176-0.

[3] Schmidt-Schauß, M.; Smolka, G. (1991). “Attributive concept descriptions with complements”. Artificial Intelligence [англ.]. 48: 1—26. Дата обращения 2023-12-01.

[Schild91-4] ¹ ² Schild, K. (1991). “A correspondence theory for terminological logics: Preliminary report”. Proc. of the 12th Int. Joint Conf. on Artificial Intelligence (IJCAI'91) [англ.]: 466—471.

[5] Lutz, C.; Sattler, U.; Wolter, F. (2001). “Modal logics and the two-variable fragment”. Annual Conference of the European Association for Computer Science Logic (CSL'2001) [англ.].

[6] Grädel, E.; Otto, M.; Rosen, E. (1997). “Two variable logic with counting is decidable”. Proc. of the 12th IEEE Symp. on Logic in Computer Science (LICS'97) [англ.]: 306—317.

[7] Horrocks, I.; Sattler, U.; Tobies, S. (1999). “Practical reasoning for expressive Description Logics”. Proc. of the 6th Int. Conference on Logic for Programming and Automated Reasoning (LPAR'99) [англ.]: 161—180.

[8] Tessaris, S. Questions and answers: Reasoning and querying in Description Logic (PhD Thesis) : [англ.]. — University of Manchester, 2001.

[9] Glimm, B.; Horrocks, I.; Lutz, C.; Sattler, U. (2007). “Conjunctive query answering for the description logic SHIQ”. Proc. of the 20th Int. Joint Conf. on Artificial Intelligence (IJCAI 2007) [англ.]. 31: 151—198.

[10] Навигатор по сложности дескрипционных логик (рус.). cs.manchester.ac.uk. Дата обращения: 1 декабря 2023. Архивировано 6 января 2010 года.

[11] Сайт разработчиков языка OWL 1.1 (неопр.). Дата обращения: 17 июня 2009. Архивировано 16 февраля 2008 года.

[12] Новые возможности языка OWL 2.0 (неопр.). Дата обращения: 17 июня 2009. Архивировано 26 июня 2009 года.

[13] Список машин ДЛ-вывода (неопр.). owl.cs.manchester.ac.uk. Дата обращения: 4 мая 2017. Архивировано 27 октября 2015 года.

[14] CEL (неопр.). lat.inf.tu-dresden.de. Дата обращения: 17 июня 2009. Архивировано 1 сентября 2009 года.

[15] FaCT++ (неопр.). owl.cs.manchester.ac.uk. Дата обращения: 17 июня 2009. Архивировано 6 июня 2009 года.

[16] Kaon2 (неопр.). kaon2.semanticweb.org. Дата обращения: 17 июня 2009. Архивировано 6 января 2006 года.

[17] Pellet (неопр.). Дата обращения: 1 января 2010. Архивировано 25 сентября 2007 года.

[18] RacerPro (неопр.). racer-systems.com. Дата обращения: 17 июня 2009. Архивировано 7 июня 2009 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Дескрипционная логика

Общие сведения

Синтаксис

ALC

Семантика

Связь с модальной логикой

Связь с логикой предикатов

База знаний

Терминологические аксиомы

Утверждения об объектах

Отличие от баз данных

Выразительные дескрипционные логики

Логический анализ

Свойства

Связь с языком OWL

Машины вывода и редакторы

См. также

Примечания

Литература

Ссылки

Категории