Онтология высшего уровня
Онтология высшего уровня в информационных науках — это онтология, состоящая из очень общих понятий (таких как «объект», «свойство», «отношение»), которые применимы ко всем предметным областям. Важная функция онтологии высшего уровня — обеспечивать широкую семантическую совместимость между многочисленными предметно-ориентированными онтологиями посредством предоставления общего отправного пункта для формулирования определений. Термины предметных онтологий иерархически располагаются под терминами онтологии высшего уровня, например, классы такой онтологии выступают суперклассами или супермножествами для всех классов в специализированных предметных онтологиях.
Системы библиотечной классификации возникли раньше, чем системы онтологий высшего уровня. Несмотря на то, что библиотечные классификации также организуют и категоризируют знания с помощью общих понятий, применимых ко всем областям, эти две системы не заменяют друг друга.
Развитие
Любая стандартизованная фундаментальная онтология, скорее всего, будет предметом споров между различными группами, придерживающимися альтернативных представлений о «том, что существует». Одним из факторов, усугублявших отсутствие единого подхода, является нехватка открытых программных средств, позволяющих тестировать различные онтологии в единой вычислительной среде. Поэтому различия зачастую обсуждаются только теоретически или вытекают из личных предпочтений. Тем не менее, фундаментальные онтологии можно сравнивать с точки зрения их внедрения для целей поддержки совместимости между специализированными онтологиями.
На сегодняшний день ни одна из онтологий высшего уровня не получила широкого признания в качестве де-факто стандарта. Различные организации предпринимали попытки разработки стандартов для определённых предметных областей. Например, стандарт Process Specification Language (PSL) был создан Национальным институтом стандартов и технологий США.
Другой важной причиной отсутствия массового распространения существующих онтологий высшего уровня является их сложность. Некоторые такие онтологии — например, часто упоминаемая Cyc — весьма обширны и содержат тысячи элементов (классов, отношений), с комплексными связями между ними и сложностью, сравнимой с человеческим естественным языком, а процесс изучения может быть даже длиннее, чем для обычного языка, из-за непривычного формата и логических правил. Мотивация к преодолению этого барьера обучения зачастую отсутствует из-за недостатка общедоступных примеров использования. В результате, разработчики локальных предметных онтологий зачастую создают максимально простые доменные онтологии, не связанные с онтологиями высшего уровня. Такие онтологии могут работать удовлетворительно для локальных целей, однако объединение их с другими специализированными онтологиями становится очень трудоёмким.
Для решения этой проблемы были разработаны некоторые действительно универсальные онтологии верхнего уровня, намеренно минимально пересекающиеся с доменными: примерами являются Basic Formal Ontology (BFO) и DOLCE.
Исторически во многих обществах предпринимались попытки навязать или определить единый набор фундаментальных понятий, полагаемых более первичными, истинными или рациональными, чем все остальные. Распространённый аргумент против такого подхода указывает на то, что человеку недоступна своеобразная всеведущая перспектива — или взгляд Бога — необходимая для достижения этой цели. Мы ограничены языком и культурой и, следовательно, не обладаем объективной точкой зрения на всю совокупность концептов, не можем вывести абсолютный стандарт. Так, Томассон[1] в разделе «1.5 Скептицизм в отношении систем категорий» отмечает: «Системы категорий, по крайней мере в традиционном виде, как представляется, предполагают, что существует единственный истинный ответ на вопрос о том, каковы категории сущего — и именно поиск этого ответа зачастую становится целью исследований в онтологических категориях. Однако доступные системы категорий столь разнообразны, что даже краткий обзор исторических систем способен подорвать веру в возможность нахождения такой уникальной, истинной и полной системы категорий. При наличии столь разнообразных ответов на вопрос, каковы онтологические категории, по каким критериям мы можем выбрать из них единственно верную?»
Другой аргумент связан с проблемой формулирования определений. Онтологии высшего уровня должны максимально способствовать совместимости между широким спектром понятий. Поэтому они должны состоять из терминов, выражающих крайне общие понятия — но такие понятия настолько фундаментальны для нашего мышления, что их невозможно определить (поскольку само определение предполагает, что менее фундаментальное понятие разъясняется через более фундаментальное). Подобные понятия зачастую можно лишь пояснить примерами или перефразировать.
- Не существует самоочевидного способа деления мира на концепты, и уж тем более способа, который был бы общепризнанным.
- Нет нейтральной платформы, способной служить средством перевода между специализированными («низкоуровневыми» или «прикладными») онтологиями.
- Сам человеческий язык уже представляет собой произвольное приближение лишь к одной из многих возможных ментальных карт. Сопоставление английских слов с произвольным числом концептов ведёт к неоднозначностям; тот же WordNet полезен именно потому, что не претендует на роль универсальной онтологии высшего уровня, а служит инструментом для семантической и синтаксической дезамбигуации, глубоко укоренённым в английском языке.
- Любая иерархическая либо топологическая система понятий всегда строится с определённой онтологической, эпистемологической, лингвистической, культурной и прагматической точки зрения. Политические и социальные аспекты не могут быть игнорированы.
Скептики возможности универсальных онтологий склонны спрашивать: «Какова конкретная прикладная цель данной карты сущностей и какое практическое значение будет иметь её применение?» Подобная прагматическая позиция исключает надежды на создание формальной онтологической модели типа: «Мир есть всё, что имеет место» (Витгенштейн, Tractatus Logico-Philosophicus).
Имеются также технические и этические возражения, схожие с теми, что выдвигаются против искусственного интеллекта. Технически, освоение комплексных абстракций и участие в социальных—лингвистических взаимодействиях человеком наводит на мысль, что любая аксиоматизация «наиболее базовых» понятий окажется крайне сложной или биологически обусловленной. Этически же существует опасность, что универсальная онтология может быть использована как инструмент для идеологического или даже политического диктата; история показывает, что несовместимые и иррациональные системы убеждений способны привести к социальному ущербу, а сколько вреда может причинить рациональная система, если в её основе окажутся несовместимые с жизнью посылки?
Многие критики идеи универсальной онтологии попадают в один из двух методологических капканов:
- утверждается, что невозможна универсальная договорённость по поводу любой концептуальной схемы; однако для практического применения онтологии достаточно большой пользовательской базы — как в случае с естественным языком;
- указывается на то, что локальные системы данных требуют разных форм представления; но это ещё не означает, что такие формы логически несовместимы.
Фактически, разные описания утверждений о реальном мире, если они корректно отражают действительность, должны быть логически совместимы, даже если фокусируются на разных аспектах одних и тех же объектов. Если два утверждения логически несовместимы, то как минимум одно ошибочно — и это уже экспериментальный, а не онтологический вопрос. На практике концептуализации реальности являются лишь приближениями, служащими конкретным задачам, и использование их ограничено точностью данных. Современные онтологии вполне способны представлять приближения и альтернативные варианты, сопоставлять их или отмечать различия. Логически несовместимые модели могут быть выделены как отдельные теории внутри единой структуры. Не доказано, что невозможна спецификация различных моделей посредством базового набора понятий; напротив, существуют примеры, когда даже очень отличающиеся теории удаётся формально специфицировать с помощью небольшого набора фундаментальных категорий.
Многие возражения против онтологий высшего уровня связаны с жизненно важными решениями или «неаксиоматизируемыми» областями вроде права или политики, объективность в которых затруднена даже для людей. Часть этих проблем не относится к объектам и абстракциям, создаваемым и регулируемым людьми по взаимной договорённости, — например, стандарты подключения электрических систем или сигналы светофора.
Критики также часто не учитывают, что возможно согласование по ограниченному набору «семантических примитивов» и формирование интероперабельных описаний на их основе. Это позволяет ограничить объём договорённости относительно структуры онтологии, что облегчает дальнейшее логическое преобразование и трактовку новых или специализированных терминов. Доменные онтологии, использующие базовые элементы онтологии высшего уровня, автоматически получают совместимость с другими онтологиями, построенными по тому же принципу. Логически несовместимые теории могут быть представлены как альтернативные расширения.
Большинство сторонников онтологий высшего уровня полагают, что может существовать несколько удачных онтологий с различным акцентом и детализацией; крайне редко кто-то требует выявления единственно возможной онтологии на уровне естественного языка или даже академического поля. Обычно речь идёт о стандартизации существующих концептуальных описаний коммуникации. Некоторые специалисты утверждают, что между различными онтологиями высшего уровня на самом деле существует значительный перекрёст понятий — акценты расставлены по-разному, но существенных противоречий между мирами нет, и создание целостной интегративной онтологии, включающей перевод между всеми существующими взглядами, теоретически возможно (хотя и весьма трудоёмко организационно и финансово).
Многие аргументы против онтологий высшего уровня путают вопросы определения понятий, языка и фактов. Различия в терминологии — не всегда различия в концептуализации; формальные онтологии используют ярлыки (названия) для ссылок на элементы, а содержание элемента определяется только его аксиоматикой, а не названием. Сторонники указывают, что смысл элементов (классов, отношений, правил) зависит только от их логической формы. Более того, обозначения могут быть не только словами, но и изображениями, мультимедиа-примерами и пр.
Другой популярный аргумент — субъективность убеждений. Однако одна и та же онтология может представлять разные системы убеждений как различные теории и описывать это различие; само по себе наличие разных взглядов не препятствует моделированию структуры мира, пусть даже как альтернативных позиций.
Даже споры о существовании объекта предполагают согласование если не в фактах, то хотя бы в концептах и их именах. Чёткость в разделении веры, дефиниции и наименования способна уменьшить конфликты. Многие люди в процессе объяснения любым собеседникам неизвестных понятий и терминов исходят из ряда «семантических примитивов», что позволяет использовать базовое множество логических строительных блоков для расширения и перевода терминов между онтологиями.
Все основные возражения к онтологиям высшего уровня встречаются и в человеческом сотрудничестве, поэтому по мере усложнения обмена концепциями такие онтологии становятся всё более востребованными, особенно в условиях развития машинного перевода.
Сводная таблица формальных онтологий высшего уровня
Данные основаны преимущественно на статье V Mascardi, V Cordi и P Rosso «A Comparison of Upper Ontologies»[2].
| Название | Первый релиз | Последний релиз | Разработчик | Основная область фокуса | Лицензия | URL | Метрики | Отличительные особенности | Версии |
|---|---|---|---|---|---|---|---|---|---|
| Онтология Совы (Sowa's Ontology) | 1999 | 1999 | Джон Ф. Соува | Логические, философские и вычислительные основания | свободная | Sowa's UO[3][4], | 30 классов, 5 отношений, 30 аксиом | Логическая лаконичность, компактность | |
| Cyc | 1984 | версия 6.1 — 27 ноября 2017 | Компания Cycorp (с 1994) | Общечеловеческие знания (common sense), цель — возможности ИИ для «человекообразного» вывода | проприетарная | cyc.com | 300 000 концепций, 3 000 000 утверждений (фактов и правил), 15 000 отношений | 12 000 синсетов WordNet, огромный объём | OpenCyc, ResearchCyc |
| YAMATO | 1999 | 14 июля 2012 | Д-р Риичиро Мизогучи[5] | Качество и количество, представления, объекты, процессы и события | YAMATO[6] | Ролевые концепты | |||
| BFO | 2002 | BFO 2020 ISO/IEC 21838-2 | Барри Смит и др. | Онтология верхнего уровня для интероперабельности доменных онтологий | BSD License | basic-formal-ontology.org[7][8] | 34 категории, 8 отношений; формализации OWL, CLIF, OBO, Isabel | Крупная пользовательская база, детальная документация | Версия 2.0 |
| gist | 2007 | Версия 11.0.0 на 2022 | Semantic Arts, Inc. | Минималистская онтология верхнего уровня для корпоративных ИС | free, Creative Commons Share Alike | semanticarts.com/gist/ | 143 класса, 132 свойства, 9 примитивных классов, 18 корневых, 1690 аксиом | База для ~10 корпоративных онтологий | |
| BORO | конец 1980-х — начало 1990-х | Группа KPMG под руководством К. Патриджа | Экстенсиональная 4D-онтология с чёткой идентификацией | borosolutions.net | Строится на ряде метафизических выборов; база для модели идентичности | ||||
| GFO | 1999 | 2008 (в разработке) | Генрих Херре | Широкий охват современных философских идей | Open | onto-med.de/ontologies/gfo | 2008 г. | Модель персистенции и времени | gfo.owl, gfo-basic.owl |
| IDEAS | IDEAS Group | Выше по уровню, экстенсиональна, 4D, построена по BORO-методу | Не предназначена для вывода; модель бизнес-объектов | ||||||
| ISO 15926 | 2003 | EPISTLE — European Process Industries STEP Technical Liaison Executive | Представление жизненного цикла промышленных объектов, пригодна для любых объектов при наличии референс-библиотеки данных | Свободная | iso.org/standard/29557.html | Универсальная модель: 201 тип сущности, библиотеки — 40 000 концептов, расширяемые пользователем | Модель 4D, исключает прикладные ограничения | ISO 15926-2:2003 | |
| SUMO | 2000 | v1.1 — ontologyportal.org/SUMOhistory/SUMO1.1.txt | IEEE, рабочая группа P1600.1 | Для исследований и приложений в поиске, лингвистике и рассуждениях | Открытая | ontologyportal.org | 13 457 терминов, 193 812 аксиом, 6055 правил | Крупнейшая открытая формальная онтология, связана со всем WordNet | 2024 — github.com/ontologyportal/sumo |
| UMBEL | 2008 | версия 1.50, 2016 | Structured Dynamics | Связь разных источников информации между собой | CC by 3.0 | Около 35 000 концептов | Общие точки сопоставления между онтологиями/схемами | UMBEL 1.50 | |
| WordNet | сер. 1980-х | версия 3.1, 2011 | Принстонский университет | Семантическая сеть на психолингвистических принципах | BSD-подобная | wordnet.princeton.edu | 155 327 слов, 175 979 синсетов, всего — 207 016 пар «слово-значение» | Не полностью формализована; применяется в обработке естественного языка | Версия 3.1 |
Доступные онтологии высшего уровня
Фреймворк Basic Formal Ontology (BFO), разработанный Барри Смитом с коллегами, состоит из ряда субонтологий на разных уровнях детализации. Выделяются два типа: описывающие устойчивые (continuant) сущности — трёхмерные объекты, и изменяющиеся (occurrent) сущности — в основном процессы, разворачивающиеся во времени. Таким образом, BFO совмещает трёх- и четырёхмерную перспективы мира. Связи между этими типами онтологий организованы специально для обеспечения адекватного представления как статических/пространственных, так и динамических/временных характеристик реальности. Вся BFO и любые созданные на её основе доменные онтологии трактуются как «окно» на определённую область мира с заданной степенью детализации. Более 350 онтологических фреймворков, базирующихся на BFO, описаны на официальном сайте BFO[9]. Архитектура BFO применяется в биомедицинских, оборонных, промышленных и других онтологиях, реализована стратегия «downward population». Примеры: Cell Ontology, Ontology for Biomedical Investigations (OBI), Common Core Ontology, SDG Interface Ontology (Программы ООН по окружающей среде), Industrial Ontologies Foundry (IOF). BFO подробно описана в книге Building Ontologies with Basic Formal Ontology (2015, MIT Press)[10].
Business Objects Reference Ontology — онтология верхнего уровня для построения онтологических и семантических моделей больших и сложных операций. Включает верхний слой и процесс конструирования онтологии, базируется на ряде продуманных метафизических допущений, обеспечивает прочный фундамент критериев идентичности (экстенсиональность, 4D-подход). Используется в ряде стандартов, например, ISO 15926, и легла в основу стандартов IDEAS, DODAF 2.0.
Хотя CIDOC CRM формально является доменной онтологией в сфере культурного наследия, её подсистема CRM Core играет роль универсальной онтологии верхнего уровня. Включает категории пространства-времени, событий, материальных и нематериальных объектов, а также их устойчивую идентичность и семантические связи[11].[12]
COSMO (Common Semantic Model) — фондурующая онтология, созданная рабочей группой COSMO с целью универсальной семантической совместимости. Открыта для развития, содержит элементы из OpenCyc, SUMO, BFO, DOLCE и др. Расширяется по мере интеграции новых доменов; актуальная OWL-версия (2021) содержит более 24 000 классов, 1350 отношений, 21 000 ограничений (доступна, см. «Внешние ссылки»).
Cyc — проприетарный проект (разработка с 1986), включает ядро-онтологию и ряд предметных онтологий («микро-теорий»). Подмножества Ontology были выпущены под лицензиями OpenCyc (до 2016) и ResearchCyc (для некоммерческого использования).
Descriptive Ontology for Linguistic and Cognitive Engineering (DOLCE) — фундаментальная онтология, созданная в 2002 г. в рамках проекта WonderWeb (ЕС)[13] (Никола Гуарино и Laboratory for Applied Ontology). DOLCE ориентирована на категории, лежащие в основе естественного языка и здравого смысла. Категории трактуются как когнитивные артефакты, зависящие от восприятия и культурных факторов, и разрабатываются как описательные, а не нормативные. Упрощённая версия DOLCE-Ultralite[14], распространена в проектах OWL и основана на паттернах онтологического проектирования[15].
General Formal Ontology (GFO), разработанная Генрихом Херре (группа Onto-Med, Лейпциг), объединяет объекты и процессы, включает современные философские идеи, отличается гибкостью аксиоматизаций (например, атомарность/плотность времени). Ключевые публикации:[16][17] Введена категория «персистент» — для классов, сохраняющих идентичность во времени; интервалы времени берутся как примитивы.
gist разрабатывается и поддерживается Semantic Arts как минималистская онтология верхнего уровня, применимая в корпоративных ИС и здравоохранении. Свободно распространяется под Creative Commons Share Alike, используется в различных ведомствах и корпорациях. Отмечена как простая и переиспользуемая[18].[19]
ISO 15926 — международный стандарт для представления информации о жизненном цикле промышленных объектов; включает универсальную концептуальную модель данных и специализированные библиотеки. Обеспечивает совместимость между приложениями засчёт общих стандартных данных. Стандарт разрабатывается техническим комитетом ISO/TC 184 и подкомитетом SC 4.
SUMO — одна из наиболее комплексных открытых онтологий верхнего уровня. Создана рабочей группой IEEE P1600.1 (изначально: Иэн Найлз и Адам Пис), расширяется набором доменных онтологий и полным соответствием WordNet.
UMBEL (Upper Mapping and Binding Exchange Layer) — онтология сопоставления из 28 000 концептов, с упрощённым соответствием OpenCyc. Издаётся как open source, официально сопоставлена с Wikipedia, DBpedia, PROTON и GeoNames[20].
WordNet — свободно доступная база данных, созданная как семантическая сеть на психолингвистических принципах, позднее расширенная определениями, т. е. и как словарь. Соответствует онтологии верхнего уровня тем, что включает как общие, так и специализированные концепты, связывает их посредством разных видов отношений (part-of, cause и др.). Однако не формализована аксиоматически для точного вывода. Широко используется в исследовании обработки естественного языка.
YAMATO (Yet Another More Advanced Top Ontology) — разработка Риичиро Мизогучи (ранее: Университет Осаки, затем Jaist). Основные особенности:
- Развёрнутая модель качества, свойств, атрибутов и количеств[21];
- Онтология представлений[22];
- Детальная модель событий и процессов[23];
- Использование теории ролей[24].
YAMATO используется в ряде прикладных онтологий: медицины[25], генетики[26], педагогики[27], исследования устойчивого развития[28], культуры[29].


