AGROVOC

AGROVOC (сокращение от «аграрная экономика» и «вокабуляр») — многоязычный контролируемый вокабуляр, охватывающий все сферы деятельности Продовольственной и сельскохозяйственной организации Объединённых Наций (англ. Food and Agriculture Organization of the United Nations, ФАО). К этим сферам относятся продовольствие, сельское хозяйство, рыболовство, лесное хозяйство, почвоведение, социально-экономические науки и экология. В состав AGROVOC входит около 40 000 понятий (англ. concepts) и около 850 000 наименований (англ. terms) на различных языках[1]. AGROVOC разрабатывается экспертным сообществом и координируется ФАО. ФАО предоставляет AGROVOC в виде концептуальной схемы форматов RDF/SKOS-XL и публикует как набор связанных данных, согласованный с 16 другими вокабулярами.

История

AGROVOC впервые был опубликован ФАО в начале 1980-х годов на английском, испанском и французском языках. Целью создания AGROVOC было обеспечение контролируемого вокабуляра для индексирования публикаций в области аграрных наук и сельскохозяйственных технологий, в первую очередь ориентированного на библиографическую базу данных AGRIS.

В 1990-х годах AGROVOC был оцифрован и перенесён в реляционную базу данных. В 2004 году начались попытки формализовать AGROVOC с использованием языка онтологий для веба (OWL). В этот же период было разработано интернет-ориентированное средство для редактирования, изначально называвшееся WorkBench, впоследствии переименованное в VocBench. С 2009 года AGROVOC реализован на основе SKOS. В настоящее время AGROVOC доступен как концептуальная схема SKOS-XL на различных языках и опубликован как связанный открытый набор данных (англ. Linked Open Data, LOD). Сегодня AGROVOC согласован с 25 другими вокабулярами.

Пользователи

AGROVOC используется исследователями, библиотекарями и управляющими информацией для индексирования, поиска и организации данных в информационных системах и веб-сайтах, посвящённых аграрным наукам[2]. В контексте семантической паутины возникают новые группы пользователей, такие как разработчики программного обеспечения и специалисты по онтологиям.

Поддержка и развитие

Команда AGROVOC, базирующаяся в главном офисе ФАО в Риме, координирует редакционную работу по развитию вокабуляра. Текущая поддержка осуществляется сообществом редакторов и организаций[3] по каждой из языковых версий.

При работе над AGROVOC сообщество использует VocBench — редакторскую платформу, специально разработанную для потребностей семантической паутины и среды связанных открытых данных. VocBench предоставляет функции для организации совместной работы, поддержки многоязычности, администрирования и управления группами пользователей. Эти средства позволяют гибко распределять роли в отношении поддержки, валидации и контроля качества.

Кроме того, ФАО несёт ответственность за поддержание AGROVOC, включая его публикацию как набора открытых связанных данных. Техническую поддержку AGROVOC и руководство развитием VocBench осуществляет Университет Тор Вергата (Рим, Италия)[4].

Структура

Все 40 000 понятий тезауруса AGROVOC организованы иерархически под 25 основными концепциями. Основные концепции AGROVOC представляют собой общие и надстроечные понятия, такие как «деятельность», «организмы», «места», «продукты» и т. д. Более половины понятий (свыше 20 000) относятся к основной концепции «организм», что подчёркивает специфику AGROVOC, ориентированного на аграрный сектор.

Поскольку AGROVOC реализован как схема RDF/SKOS-XL, концептуальный и терминологический уровни в нём разделены. Ключевые элементы таких схем — концепции, термины и отношения.

  • Концепции

Вся информация в AGROVOC строится на концепциях. Концепции представлены через наименования. Под термином «концепция» понимается совокупность наименований на разных языках, обозначающих данное понятие. В SKOS концепции определяются как skos:Concept и имеют уникальный идентификатор URI (унифицированный указатель ресурсов). Например, концепция AGROVOC с URI aims.fao.org/aos/agrovoc/c_12332 соответствует «кукурузе».

  • Наименования

Наименования — это возможные словесные формы концепции на разных языках или её альтернативные названия. Например, «maize», «maïs», «玉米» и «ข้าวโพด» — это наименования одной и той же концепции на английском, французском, китайском и тайском языках соответственно. Наименования в AGROVOC реализованы с помощью расширения SKOS-XL, используемого для работы с метками (labels). Основные свойства: skosxl: preflabel (для предпочтительных наименований) и skosxl: altlabel (для альтернативных наименований).

  • Отношения

В SKOS иерархические отношения между концепциями выражаются с помощью свойств skos: broader и skos: narrower, соответствующих классическим отношениям тезауруса «родовое/видовое», BT/NT. Неиерархические отношения обозначают ассоциативную связь между понятиями. AGROVOC использует как стандартное свойство SKOS — skos: related (аналог классического RT), так и специализированное вокабулярное расширение для отношений — Agrontology[5].

Благодаря расширению SKOS-XL AGROVOC также позволяет устанавливать связи между метками (наименованиями).

Связанные данные

AGROVOC доступен как набор связанных данных и согласован с 16 другими вокабулярами аграрных наук (см. таблицу ниже). Версия AGROVOC в формате связанных данных (Linked Data) реализована с использованием механизма контентной переговорки и представлена в форматах RDF и HTML. Также поддерживается доступ через SPARQL Endpoint.

Преимущество тезауруса наподобие AGROVOC, публикуемого как связанный открытый набор данных (LOD), — автоматическая увязка индексированных ресурсов после интеграции самого тезауруса. Примером такого подхода служит AGRIS, веб-приложение типа mash-up, которое связывает библиографическое репозитории AGRIS (индексированное с помощью AGROVOC) с другими ресурсами, также индексированными его понятиями.

Ресурс Тематика Количество связанных концепций Языки Связанные данные Тип связи
ASFA Рыболовство 1784 skos: closeMatch
FAO Biotechnology Glossary Биотехнологии 810 EN, ES, FR и ещё 3 Да skos: closeMatch
Chinese Agriculture Thesaurus (CAT) Сельское хозяйство Китая Да skos: closeMatch
EARTh Экология 1363 EN+ Да skos: closeMatch
EUROVOC Европейская тематика 1297 EN, ES, FR и ещё 21 Да skos: exactMatch
GEMET Окружающая среда 1191 EN, ES, FR и ещё 30 Да skos: exactMatch
Library of Congress Subject Headings (LCSH) Общие понятия 1093 EN Да skos: exactMatch
NAL Thesaurus Аграрная тематика США 13390 EN, ES Да skos: exactMatch
RAMEAU Répertoire d’autorité-matière encyclopedique et alphabetique unifie Общие понятия (Франция) 686 FR Да skos: exactMatch
STW — Thesaurus for Economics Экономика 1136 EN, DE Да skos: exactMatch
TheSoz — Thesaurus for the Social Sciences Социальные науки 846 EN, DE Да skos: exactMatch
Geopolitical Ontology Геополитические объекты 253 AR, CH, EN, ES, FR, RU Да skos: exactMatch
Dewey Decimal Classification (DDC) Общие категории 409 EN, ES, FR и ещё 8 Да skos: exactMatch
DBpedia Общие знания 10989 EN, ES, FR и ещё 8 Да skos: exactMatch
SWD (Schlagwortnormdatei) Немецкая предметная рубрика 6245 DE Да skos: exactMatch skos: closeMatch skos: broadMatch skos: narrowMatch
GeoNames Географические объекты 212 EN, ES, FR и ещё 63 Да skos: exactMatch

Авторские права и лицензирование

Права на AGROVOC на английском, французском, русском и испанском языках принадлежат ФАО и распространяются в соответствии с лицензией Attribution-NonCommercial-ShareAlike 3.0 Unported[6]. Права на остальные языковые версии принадлежат учреждениям, ответственным за соответствующие переводы.

Примечания

Литература