Отображение онтологий
Отображение онтологий (англ. ontology alignment, англ. ontology matching) — это процесс определения соответствий между понятиями в различных онтологиях. Набор таких соответствий называется отображением (алайнментом). Термин имеет несколько различные значения в информатике, когнитивной науке и философии.
В информатике
В информатике под понятиями понимаются метки для данных. Исторически потребность в отображении онтологий возникла из необходимости интеграции разнородных баз данных, разработанных независимо и использующих собственные словари данных. С развитием семантической паутины, в которой множество участников создаёт собственные онтологии, задача отображения онтологий приобрела ключевое значение для обеспечения взаимодействия разнородных ресурсов. Инструменты отображения онтологий находят классы данных, которые семантически эквивалентны, например, «truck» и «lorry» («грузовик» и «фургон»). При этом такие классы могут быть не эквивалентны логически. По данным Ж. Эзена и П. Швайко[1], выделяют три основные размерности для подобия: синтаксическая, внешняя и семантическая. Интересно, что эти измерения примерно соответствуют выделяемым в когнитивных науках. Для отображения онтологий были разработаны различные инструменты и фреймворки, некоторые из которых опираются на идеи когнитивных наук, а другие независимы.
Инструменты для отображения онтологий обычно разрабатываются для операций с схемами баз данных[2], XML-схемами[3], таксономиями[4], формальными языками, ER-моделями[5], словарями и другими моделями меток. Обычно такие структуры преобразуют в графовое представление перед сопоставлением. В среде семантической паутины такие графы могут быть представлены с использованием RDF как тройки вида <subject, predicate, object>, например, в синтаксисе Notation3. В этом контексте отображение онтологий часто называют «ontology matching».
Задача отображения онтологий в настоящее время решается путём автоматического вычисления совпадений (matching), а затем построения отображения (mapping) на их основе. Системы, такие как DSSim, X-SOM[6] и COMA++ уже достигли высоких показателей точности и полноты[3]. Оценочная инициатива отображения онтологий занимается сравнением, анализом и совершенствованием различных подходов.
Пусть заданы две онтологии и , где — множество классов, — множество отношений, — множество индивидов, — типы данных, — множество значений. Можно выделить различные типы межонтологических отношений[1]. Все такие отношения называют отображениями (alignments), которые классифицируются по ряду признаков:
- подобие vs логика: различие между совпадениями (matching, охарактеризованными мерой семантического сходства терминов онтологий) и отображениями (mapping, логические аксиомы, как правило, выражающие логическую эквивалентность или включение понятий)
- атомарные vs комплексные: отображения могут связывать одну пару терминов или несколько (например, отображения в терминах LAV/GAV)
- однородные vs неоднородные: отображения могут связывать только однотипные термины (класс-класс, индивид-индивид) или допускать различные типы
- тип отображения: семантика связи — например, субсумпция, эквивалентность, disjointness, part-of или произвольные отношения
Атомарные, однородные, субсумптивные отображения служат «строительными блоками» для построения более сложных связей и имеют формальную семантику в любой дескрипционной логике.
Более формально отображение (matching) и mapping определяются следующим образом:
Атомарное однородное совпадение (matching) — это отображение, обладающее коэффициентом близости , который описывает степень сходства двух терминов из входных онтологий и . Совпадения могут вычисляться эвристическими алгоритмами или выводиться на основе других совпадений.
Формально совпадение — это четвёрка , где и — однородные термины онтологий, а — степень их сходства. Mapping (атомарная, однородная, субсумптивная связь) определяется как пара .
В когнитивной науке
В исследованиях по когнитивной науке под «понятиями» чаще понимаются узлы в семантических сетях в мозге — то есть компоненты индивидуальных концептуальных систем. Ключевой вопрос: если у каждого — уникальный опыт, а значит, различающиеся семантические сети, как мы способны понимать друг друга? Эта проблема рассматривается в рамках модели ABSURDIST (Aligning Between Systems Using Relations Derived Inside Systems for Translation). Для подобия были выделены три основные размерности, формализуемые как «внутренняя схожесть, внешняя схожесть и взаимное торможение»[7].
Методы отображения онтологий
В области отображения онтологий выделяют два направления: монолингвальное и межъязыковое отображение. Монолингвальное отображение подразумевает сопоставление онтологий, размеченных на одном и том же естественном языке; межъязыковое — «процесс установления отношений между онтологическими ресурсами двух и более независимых онтологий, размеченных на разных языках»[8]. Основные методы монолингвального отображения рассмотрены у Эзена и Швайко (2007)[1]. Подходы к межъязыковому отображению описаны у Фу и соавторов (2011)[9].
Примечания
Литература
Ссылки
- ITM Align: полуавтоматизированный инструмент отображения онтологий
- Optima: инструмент для визуального отображения онтологий
- AgreementMaker: отображение крупных реальных схем и онтологий
- Biomixer: веб-ориентированный инструмент визуализации онтологий
- SDI (Semantic Data Integration) Tool: инструмент для семантического отображения и генерации, использующий UML для системных инженеров