Darwin Core

Darwin Core (англ. Darwin Core, DwC) — расширение стандарта Dublin Core для информатики в области биологического разнообразия. Он предоставляет стандартный и устойчивый подход к обмену информацией о биологическом разнообразии[1]. Термины, описанные в данном стандарте, входят в состав более широкого набора словаря и технических спецификаций, которые разрабатываются и поддерживаются организацией Стандарты информационного обеспечения биоразнообразия (ранее — Рабочая группа по таксономическим базам данных, TDWG, по аббревиатуре на английском).

Описание

Darwin Core представляет собой набор стандартов. В него входит глоссарий терминов (в других контекстах их могут называть свойствами, элементами, полями, колонками, атрибутами или понятиями), призванный облегчить обмен информацией о биологическом разнообразии, предоставляя эталонные определения, примеры и комментарии. Основная идея Darwin Core строится на основе таксонов, их встречаемости в природе, зафиксированной с помощью наблюдений, образцов и других примеров, а также связанной информации. Стандарт включает документы, описывающие процессы управления терминами, расширения набора терминов для новых нужд, а также способы их использования.

Простой Darwin Core[2] — это отдельная спецификация, которая позволяет использовать термины и обмениваться данными о таксонах и их встречаемости в природе в более простой и структурированной форме. Такой подход позволяет практически любому участнику «форматировать свои данные по стандарту Darwin Core».

Каждый термин снабжён определением и дополнительными комментариями, которые способствуют последовательному использованию терминологии в разных приложениях и дисциплинах. Эволюционирующие комментарии, уточняющие, расширяющие или переводящие определения и примеры, доступны по ссылкам в атрибуте «Комментарии» каждого термина. Такой способ документирования стандарта позволяет легко адаптировать его для новых целей без искажения ранее созданных приложений. Это подразумевает чёткое разграничение терминов, определённых в стандарте, и тех, что используются в приложениях. Например, типы данных и их ограничения явно не указываются в определениях терминов, однако даются рекомендации по ограничению значений в соответствующих случаях.

На практике Darwin Core отделяет определение и семантику отдельных терминов от их применения в различных технологиях, таких как XML, RDF или простых текстовых файлах CSV. Для этих целей создаются отдельные руководства, в которых описано, каким образом кодировать термины в формате XML или текстовых файлов[3][4].

История

Darwin Core изначально был создан в виде профиля Z39.50 Группой реализаторов биологических Z39.50 (ZBIG, по аббревиатуре на английском), при финансовой поддержке от гранта Национального научного фонда США[5]. Название «Darwin Core» изначально предложил Аллен Аллисон на первой встрече ZBIG, прошедшей в Канзасском университете в 1998 году — тогда обсуждалась схожесть концепции профиля Z39.50 со стандартом Dublin Core. Позднее профиль Darwin Core был оформлен в документ с описанием XML-схемы для применения в протоколе распределённого поиска информации DiGIR (по аббревиатуре на английском). Для рецензирования стандарта был создан рабочий комитет Стандарты информационного обеспечения биоразнообразия, и 9 октября 2009 года официальный ратифицированный стандарт метаданных был опубликован.

Несмотря на официальную ратификацию TDWG/Стандартами информационного обеспечения биоразнообразия, ранее использовались различные версии Darwin Core для производственных нужд. В опубликованном стандарте приведена хронология релизов, предшествующих текущей версии[6].

Версии Darwin Core
Название Количество терминов Дата выпуска
Darwin Core 1.0 24 1998
Darwin Core 1.2 (классический) 46 11 сентября 2001
Darwin Core 1.21 (MaNIS/HerpNet/ORNIS/FishNet2) 63 15 марта 2003
Darwin Core OBIS 27 10 июля 2005
Darwin Core 1.4 (стандарт, проект) 46 23 апреля 2007
Термины Darwin Core (свойства) 172 9 октября 2009

Крупные проекты, использующие Darwin Core

  • Глобальное информационное пространство о биоразнообразии (GBIF)[7]
  • Ocean Biogeographic Information System (OBIS)[8]
  • Атлас живой Австралии (ALA)
  • Online Zoological Collections of Australian Museums (OZCAM)
  • Млекопитающие сети информации (MaNIS)
  • Орнитологическая информационная система (ORNIS)
  • FishNet 2
  • VertNet
  • Canadensys
  • Система Nature 3.0
  • Энциклопедия жизни
  • Integrated Digitized Biocollections (iDigBio)[9][10]

Примечания

Категории