Arabic Ontology

Arabic Ontology — лингвистическая онтология для арабского языка, которая может использоваться как арабская версия WordNet с онтологически корректным содержанием. Также применяется в качестве иерархии (то есть классификатора) понятий и значений арабских терминов. Это формальное представление понятий, выраженных арабскими словами; содержание онтологии выстроено на строгих онтологических принципах и опирается на научные достижения и авторитетные источники знаний, в отличие от традиционных wordnet-проектов, которые отражают наивные представления носителей языка[1][2]. Дерево понятий онтологии доступно для онлайн-обзора[1].

Что важно знать
Arabic Ontology
URL ontology.birzeit.edu
Коммерческий нет
Тип сайта онтология
Язык (-и) арабский и английский
Владелец Birzeit University
Автор Мустафа Джаррар
Начало работы 2018
Текущий статус активен
Страна

Структура онтологии

Структура онтологии (то есть модель данных) аналогична структуре WordNet. Каждому понятию присваивается уникальный идентификатор (URI), также даётся неофициальное описание (глосс), после чего понятие лексикализуется одним или несколькими синонимичными леммами. Каждая пара термин-понятие называется значением и имеет собственный идентификатор SenseID. Набор значений образует набор синонимов. Понятия и значения описываются дополнительными атрибутами, такими как эпоха и область использования — для уточнения времени и места применения, тип лексикализации, пример предложения, пример использования, онтологический анализ и другие параметры. Между понятиями определяются семантические отношения (например, подтип, часть и другие). В онтологии также представлены некоторые важные индивидуальные объекты, такие как отдельные страны или моря; каждому индивиду присваивается отдельный идентификатор (IndividualID) и устанавливается связь InstanceOf с понятием.

Соответствие с другими ресурсами

Понятия внутри Arabic Ontology соотнесены с synset-ами WordNet, а также с BFO и DOLCE (верхнеуровневыми онтологиями). Используемые термины сопоставлены с леммами базы данных SAMA (LDC).

Arabic Ontology и Arabic WordNet

Arabic Ontology часто рассматривается как следующая итерация WordNet — или как онтологически цельная арабская WordNet. Она основана на той же модели данных, что и WordNet, и полностью сопоставлена с английским WordNet. Однако между ними есть принципиальные различия:

  1. Онтология опирается на новейшие научные открытия, в то время как WordNet отражает наивные представления носителей языка.
  2. Структура онтологии управляется научно и философски обоснованными верхнеуровневыми категориями.
  3. В отличие от WordNet, все понятия в онтологии формальны: понятие определяется через множество индивидуумов (то есть как класс), поэтому квазипонятия вроде «горизонт» в онтологии не допускаются.
  4. Глоссы в онтологии строго формализованы и фокусируются на отличительных признаках, чего нет в WordNet.

Применение

Arabic Ontology может использоваться в различных сферах, включая:

  1. Информационный поиск — для расширения поисковых запросов (например, в поисковых системах) и повышения качества выдачи, обеспечивая семантический (а не только строковый) поиск;
  2. Машинный перевод и разрешение лексической многозначности — для точного сопоставления понятий между языками, особенно с учётом того, что арабская онтология сопоставлена с WordNet;
  3. Интеграция данных и интероперабельность — Arabic Ontology может выступать как семантический стандарт для связывания баз данных и информационных систем;
  4. Семантическая паутина и Web 3.0 — как семантический справочник для уточнения значений терминов на веб-сайтах, а также в других областях.

Cтруктура URL

Ссылки (URL) в Arabic Ontology построены в соответствии с рекомендациями W3C по публикации семантических данных (Linked Data). Используемые схемы URL позволяют исследовать все содержимое базы как граф:

  1. Понятие онтологии: каждое понятие имеет ConceptID и доступно по адресу: https://{домен}/concept/{ConceptID | Term}. Если передан термин, возвращается множество всех понятий, связанных с этим термином. Если указан ConceptID — страница самого понятия и его прямых подтипов, например: https://ontology.birzeit.edu/concept/293198
  2. Семантические связи: отношения между понятиями доступны по следующим схемам: (i) https://{домен}/concept/{RelationName}/{ConceptID} — извлечение отношений между понятиями; (ii) https://{домен}/lexicalconcept/{RelationName}/{lexicalConceptID} — извлечение связей между лексическими понятиями. Пример: https://ontology.birzeit.edu/concept/instances/293121 возвращает экземпляры понятия 293121. В базе используются отношения: {subtypes, type, instances, parts, related, similar, equivalent}.

Примечания