Отображение онтологий

Отображение онтологий (англ. ontology alignment, англ. ontology matching) — это процесс определения соответствий между понятиями в различных онтологиях. Набор таких соответствий называется отображением (алайнментом). Термин имеет несколько различные значения в информатике, когнитивной науке и философии.

В информатике

В информатике под понятиями понимаются метки для данных. Исторически потребность в отображении онтологий возникла из необходимости интеграции разнородных баз данных, разработанных независимо и использующих собственные словари данных. С развитием семантической паутины, в которой множество участников создаёт собственные онтологии, задача отображения онтологий приобрела ключевое значение для обеспечения взаимодействия разнородных ресурсов. Инструменты отображения онтологий находят классы данных, которые семантически эквивалентны, например, «truck» и «lorry» («грузовик» и «фургон»). При этом такие классы могут быть не эквивалентны логически. По данным Ж. Эзена и П. Швайко[1], выделяют три основные размерности для подобия: синтаксическая, внешняя и семантическая. Интересно, что эти измерения примерно соответствуют выделяемым в когнитивных науках. Для отображения онтологий были разработаны различные инструменты и фреймворки, некоторые из которых опираются на идеи когнитивных наук, а другие независимы.

Инструменты для отображения онтологий обычно разрабатываются для операций с схемами баз данных[2], XML-схемами[3], таксономиями[4], формальными языками, ER-моделями[5], словарями и другими моделями меток. Обычно такие структуры преобразуют в графовое представление перед сопоставлением. В среде семантической паутины такие графы могут быть представлены с использованием RDF как тройки вида <subject, predicate, object>, например, в синтаксисе Notation3. В этом контексте отображение онтологий часто называют «ontology matching».

Задача отображения онтологий в настоящее время решается путём автоматического вычисления совпадений (matching), а затем построения отображения (mapping) на их основе. Системы, такие как DSSim, X-SOM[6] и COMA++ уже достигли высоких показателей точности и полноты[3]. Оценочная инициатива отображения онтологий занимается сравнением, анализом и совершенствованием различных подходов.

Формальное определение

Пусть заданы две онтологии и , где  — множество классов,  — множество отношений,  — множество индивидов,  — типы данных,  — множество значений. Можно выделить различные типы межонтологических отношений[1]. Все такие отношения называют отображениями (alignments), которые классифицируются по ряду признаков:

  • подобие vs логика: различие между совпадениями (matching, охарактеризованными мерой семантического сходства терминов онтологий) и отображениями (mapping, логические аксиомы, как правило, выражающие логическую эквивалентность или включение понятий)
  • атомарные vs комплексные: отображения могут связывать одну пару терминов или несколько (например, отображения в терминах LAV/GAV)
  • однородные vs неоднородные: отображения могут связывать только однотипные термины (класс-класс, индивид-индивид) или допускать различные типы
  • тип отображения: семантика связи — например, субсумпция, эквивалентность, disjointness, part-of или произвольные отношения

Атомарные, однородные, субсумптивные отображения служат «строительными блоками» для построения более сложных связей и имеют формальную семантику в любой дескрипционной логике.

Более формально отображение (matching) и mapping определяются следующим образом:

Атомарное однородное совпадение (matching) — это отображение, обладающее коэффициентом близости , который описывает степень сходства двух терминов из входных онтологий и . Совпадения могут вычисляться эвристическими алгоритмами или выводиться на основе других совпадений.

Формально совпадение — это четвёрка , где и  — однородные термины онтологий, а  — степень их сходства. Mapping (атомарная, однородная, субсумптивная связь) определяется как пара .

В когнитивной науке

В исследованиях по когнитивной науке под «понятиями» чаще понимаются узлы в семантических сетях в мозге — то есть компоненты индивидуальных концептуальных систем. Ключевой вопрос: если у каждого — уникальный опыт, а значит, различающиеся семантические сети, как мы способны понимать друг друга? Эта проблема рассматривается в рамках модели ABSURDIST (Aligning Between Systems Using Relations Derived Inside Systems for Translation). Для подобия были выделены три основные размерности, формализуемые как «внутренняя схожесть, внешняя схожесть и взаимное торможение»[7].

Методы отображения онтологий

В области отображения онтологий выделяют два направления: монолингвальное и межъязыковое отображение. Монолингвальное отображение подразумевает сопоставление онтологий, размеченных на одном и том же естественном языке; межъязыковое — «процесс установления отношений между онтологическими ресурсами двух и более независимых онтологий, размеченных на разных языках»[8]. Основные методы монолингвального отображения рассмотрены у Эзена и Швайко (2007)[1]. Подходы к межъязыковому отображению описаны у Фу и соавторов (2011)[9].

Примечания

  1. 1 2 3 Jérôme Euzenat, Pavel Shvaiko. 2013. Ontology matching. Springer-Verlag. ISBN 978-3-642-38720-3. Архивировано 16 января 2010 года. Ontology matching (англ.). book.ontologymatching.org. Springer-Verlag. Дата обращения: 23 июня 2024. Архивировано 16 января 2010 года.
  2. J. Berlin, A. Motro. 2002. Database Schema Matching Using Machine Learning with Feature Selection. Proc. of the 14th International Conference on Advanced Information Systems Engineering, pp. 452—466. Database Schema Matching Using Machine Learning with Feature Selection (англ.). dit.unitn.it. Дата обращения: 23 июня 2024. Архивировано 23 апреля 2024 года.
  3. 1 2 D. Aumueller, H. Do, S. Massmann, E. Rahm. 2005. Schema and ontology matching with COMA++. Proc. of the 2005 International Conference on Management of Data, pp. 906—908. Schema and ontology matching with COMA++ (англ.). dit.unitn.it. Дата обращения: 23 июня 2024. Архивировано 19 января 2022 года.
  4. S. Ponzetto, R. Navigli. 2009. Large-Scale Taxonomy Mapping for Restructuring and Integrating Wikipedia. Proc. of the 21st International Joint Conference on Artificial Intelligence (IJCAI 2009), Pasadena, California, pp. 2083—2088. Large-Scale Taxonomy Mapping for Restructuring and Integrating Wikipedia (англ.). ijcai.org. Дата обращения: 23 июня 2024. Архивировано 15 июля 2011 года.
  5. A. H. Doan, A. Y. Halevy. Semantic integration research in the database community: A brief survey. AI Magazine, 26(1), 2005. Semantic integration research in the database community: A brief survey (англ.). cs.wisc.edu. Дата обращения: 23 июня 2024. Архивировано 3 мая 2024 года.
  6. Carlo A. Curino, Giorgio Orsi, Letizia Tanca (2007). “X-SOM: A Flexible Ontology Mapper” (PDF). International Workshop on Semantic Web Architectures for Enterprises (SWAE'07) in Conjunction with the 18th International Conference on Database and Expert Systems Applications (DEXA'07). Архивировано из оригинала (PDF) 2009-07-04. Используется устаревший параметр |url-status= (справка)
  7. R. Goldstone, B. Rogosky. 2002. Using relations within conceptual systems to translate across conceptual systems. Cognition 84, с. 295—320. Using relations within conceptual systems to translate across conceptual systems (англ.). media.mit.edu. Дата обращения: 23 июня 2024. Архивировано 10 марта 2004 года.
  8. Bo Fu, Rob Brennan, Declan O’Sullivan. A Configurable Translation-Based Cross-Lingual Ontology Mapping System to adjust Mapping Outcomes. Journal of Web Semantics, Volume 15, стр. 15-36, ISSN 1570-8268, 2012. A Configurable Translation-Based Cross-Lingual Ontology Mapping System to adjust Mapping Outcomes (англ.). ScienceDirect. Дата обращения: 23 июня 2024. Архивировано 18 апреля 2024 года.
  9. Fu B., Brennan R., O’Sullivan D. Using Pseudo Feedback to Improve Cross-Lingual Ontology Mapping. В: Proceedings of the 8th Extended Semantic Web Conference (ESWC 2011), LNCS 6643, стр. 336—351, Ираклион, Греция, май 2011. Using Pseudo Feedback to Improve Cross-Lingual Ontology Mapping (англ.). Springer. Дата обращения: 23 июня 2024.

Ссылки