AGROVOC
AGROVOC (сокращение от «аграрная экономика» и «вокабуляр») — многоязычный контролируемый вокабуляр, охватывающий все сферы деятельности Продовольственной и сельскохозяйственной организации Объединённых Наций (англ. Food and Agriculture Organization of the United Nations, ФАО). К этим сферам относятся продовольствие, сельское хозяйство, рыболовство, лесное хозяйство, почвоведение, социально-экономические науки и экология. В состав AGROVOC входит около 40 000 понятий (англ. concepts) и около 850 000 наименований (англ. terms) на различных языках[1]. AGROVOC разрабатывается экспертным сообществом и координируется ФАО. ФАО предоставляет AGROVOC в виде концептуальной схемы форматов RDF/SKOS-XL и публикует как набор связанных данных, согласованный с 16 другими вокабулярами.
История
AGROVOC впервые был опубликован ФАО в начале 1980-х годов на английском, испанском и французском языках. Целью создания AGROVOC было обеспечение контролируемого вокабуляра для индексирования публикаций в области аграрных наук и сельскохозяйственных технологий, в первую очередь ориентированного на библиографическую базу данных AGRIS.
В 1990-х годах AGROVOC был оцифрован и перенесён в реляционную базу данных. В 2004 году начались попытки формализовать AGROVOC с использованием языка онтологий для веба (OWL). В этот же период было разработано интернет-ориентированное средство для редактирования, изначально называвшееся WorkBench, впоследствии переименованное в VocBench. С 2009 года AGROVOC реализован на основе SKOS. В настоящее время AGROVOC доступен как концептуальная схема SKOS-XL на различных языках и опубликован как связанный открытый набор данных (англ. Linked Open Data, LOD). Сегодня AGROVOC согласован с 25 другими вокабулярами.
Пользователи
AGROVOC используется исследователями, библиотекарями и управляющими информацией для индексирования, поиска и организации данных в информационных системах и веб-сайтах, посвящённых аграрным наукам[2]. В контексте семантической паутины возникают новые группы пользователей, такие как разработчики программного обеспечения и специалисты по онтологиям.
Поддержка и развитие
Команда AGROVOC, базирующаяся в главном офисе ФАО в Риме, координирует редакционную работу по развитию вокабуляра. Текущая поддержка осуществляется сообществом редакторов и организаций[3] по каждой из языковых версий.
При работе над AGROVOC сообщество использует VocBench — редакторскую платформу, специально разработанную для потребностей семантической паутины и среды связанных открытых данных. VocBench предоставляет функции для организации совместной работы, поддержки многоязычности, администрирования и управления группами пользователей. Эти средства позволяют гибко распределять роли в отношении поддержки, валидации и контроля качества.
Кроме того, ФАО несёт ответственность за поддержание AGROVOC, включая его публикацию как набора открытых связанных данных. Техническую поддержку AGROVOC и руководство развитием VocBench осуществляет Университет Тор Вергата (Рим, Италия)[4].
Структура
Все 40 000 понятий тезауруса AGROVOC организованы иерархически под 25 основными концепциями. Основные концепции AGROVOC представляют собой общие и надстроечные понятия, такие как «деятельность», «организмы», «места», «продукты» и т. д. Более половины понятий (свыше 20 000) относятся к основной концепции «организм», что подчёркивает специфику AGROVOC, ориентированного на аграрный сектор.
Поскольку AGROVOC реализован как схема RDF/SKOS-XL, концептуальный и терминологический уровни в нём разделены. Ключевые элементы таких схем — концепции, термины и отношения.
- Концепции
Вся информация в AGROVOC строится на концепциях. Концепции представлены через наименования. Под термином «концепция» понимается совокупность наименований на разных языках, обозначающих данное понятие. В SKOS концепции определяются как skos:Concept и имеют уникальный идентификатор URI (унифицированный указатель ресурсов). Например, концепция AGROVOC с URI aims.fao.org/aos/agrovoc/c_12332 соответствует «кукурузе».
- Наименования
Наименования — это возможные словесные формы концепции на разных языках или её альтернативные названия. Например, «maize», «maïs», «玉米» и «ข้าวโพด» — это наименования одной и той же концепции на английском, французском, китайском и тайском языках соответственно. Наименования в AGROVOC реализованы с помощью расширения SKOS-XL, используемого для работы с метками (labels). Основные свойства: skosxl: preflabel (для предпочтительных наименований) и skosxl: altlabel (для альтернативных наименований).
- Отношения
В SKOS иерархические отношения между концепциями выражаются с помощью свойств skos: broader и skos: narrower, соответствующих классическим отношениям тезауруса «родовое/видовое», BT/NT. Неиерархические отношения обозначают ассоциативную связь между понятиями. AGROVOC использует как стандартное свойство SKOS — skos: related (аналог классического RT), так и специализированное вокабулярное расширение для отношений — Agrontology[5].
Благодаря расширению SKOS-XL AGROVOC также позволяет устанавливать связи между метками (наименованиями).
Связанные данные
AGROVOC доступен как набор связанных данных и согласован с 16 другими вокабулярами аграрных наук (см. таблицу ниже). Версия AGROVOC в формате связанных данных (Linked Data) реализована с использованием механизма контентной переговорки и представлена в форматах RDF и HTML. Также поддерживается доступ через SPARQL Endpoint.
Преимущество тезауруса наподобие AGROVOC, публикуемого как связанный открытый набор данных (LOD), — автоматическая увязка индексированных ресурсов после интеграции самого тезауруса. Примером такого подхода служит AGRIS, веб-приложение типа mash-up, которое связывает библиографическое репозитории AGRIS (индексированное с помощью AGROVOC) с другими ресурсами, также индексированными его понятиями.
| Ресурс | Тематика | Количество связанных концепций | Языки | Связанные данные | Тип связи |
|---|---|---|---|---|---|
| ASFA | Рыболовство | 1784 | skos: closeMatch | ||
| FAO Biotechnology Glossary | Биотехнологии | 810 | EN, ES, FR и ещё 3 | Да | skos: closeMatch |
| Chinese Agriculture Thesaurus (CAT) | Сельское хозяйство Китая | Да | skos: closeMatch | ||
| EARTh | Экология | 1363 | EN+ | Да | skos: closeMatch |
| EUROVOC | Европейская тематика | 1297 | EN, ES, FR и ещё 21 | Да | skos: exactMatch |
| GEMET | Окружающая среда | 1191 | EN, ES, FR и ещё 30 | Да | skos: exactMatch |
| Library of Congress Subject Headings (LCSH) | Общие понятия | 1093 | EN | Да | skos: exactMatch |
| NAL Thesaurus | Аграрная тематика США | 13390 | EN, ES | Да | skos: exactMatch |
| RAMEAU Répertoire d’autorité-matière encyclopedique et alphabetique unifie | Общие понятия (Франция) | 686 | FR | Да | skos: exactMatch |
| STW — Thesaurus for Economics | Экономика | 1136 | EN, DE | Да | skos: exactMatch |
| TheSoz — Thesaurus for the Social Sciences | Социальные науки | 846 | EN, DE | Да | skos: exactMatch |
| Geopolitical Ontology | Геополитические объекты | 253 | AR, CH, EN, ES, FR, RU | Да | skos: exactMatch |
| Dewey Decimal Classification (DDC) | Общие категории | 409 | EN, ES, FR и ещё 8 | Да | skos: exactMatch |
| DBpedia | Общие знания | 10989 | EN, ES, FR и ещё 8 | Да | skos: exactMatch |
| SWD (Schlagwortnormdatei) | Немецкая предметная рубрика | 6245 | DE | Да | skos: exactMatch skos: closeMatch skos: broadMatch skos: narrowMatch |
| GeoNames | Географические объекты | 212 | EN, ES, FR и ещё 63 | Да | skos: exactMatch |
Авторские права и лицензирование
Права на AGROVOC на английском, французском, русском и испанском языках принадлежат ФАО и распространяются в соответствии с лицензией Attribution-NonCommercial-ShareAlike 3.0 Unported[6]. Права на остальные языковые версии принадлежат учреждениям, ответственным за соответствующие переводы.


