Darwin Core
Darwin Core (англ. Darwin Core, DwC) — расширение стандарта Dublin Core для информатики в области биологического разнообразия. Он предоставляет стандартный и устойчивый подход к обмену информацией о биологическом разнообразии[1]. Термины, описанные в данном стандарте, входят в состав более широкого набора словаря и технических спецификаций, которые разрабатываются и поддерживаются организацией Стандарты информационного обеспечения биоразнообразия (ранее — Рабочая группа по таксономическим базам данных, TDWG, по аббревиатуре на английском).
Описание
Darwin Core представляет собой набор стандартов. В него входит глоссарий терминов (в других контекстах их могут называть свойствами, элементами, полями, колонками, атрибутами или понятиями), призванный облегчить обмен информацией о биологическом разнообразии, предоставляя эталонные определения, примеры и комментарии. Основная идея Darwin Core строится на основе таксонов, их встречаемости в природе, зафиксированной с помощью наблюдений, образцов и других примеров, а также связанной информации. Стандарт включает документы, описывающие процессы управления терминами, расширения набора терминов для новых нужд, а также способы их использования.
Простой Darwin Core[2] — это отдельная спецификация, которая позволяет использовать термины и обмениваться данными о таксонах и их встречаемости в природе в более простой и структурированной форме. Такой подход позволяет практически любому участнику «форматировать свои данные по стандарту Darwin Core».
Каждый термин снабжён определением и дополнительными комментариями, которые способствуют последовательному использованию терминологии в разных приложениях и дисциплинах. Эволюционирующие комментарии, уточняющие, расширяющие или переводящие определения и примеры, доступны по ссылкам в атрибуте «Комментарии» каждого термина. Такой способ документирования стандарта позволяет легко адаптировать его для новых целей без искажения ранее созданных приложений. Это подразумевает чёткое разграничение терминов, определённых в стандарте, и тех, что используются в приложениях. Например, типы данных и их ограничения явно не указываются в определениях терминов, однако даются рекомендации по ограничению значений в соответствующих случаях.
На практике Darwin Core отделяет определение и семантику отдельных терминов от их применения в различных технологиях, таких как XML, RDF или простых текстовых файлах CSV. Для этих целей создаются отдельные руководства, в которых описано, каким образом кодировать термины в формате XML или текстовых файлов[3][4].
История
Darwin Core изначально был создан в виде профиля Z39.50 Группой реализаторов биологических Z39.50 (ZBIG, по аббревиатуре на английском), при финансовой поддержке от гранта Национального научного фонда США[5]. Название «Darwin Core» изначально предложил Аллен Аллисон на первой встрече ZBIG, прошедшей в Канзасском университете в 1998 году — тогда обсуждалась схожесть концепции профиля Z39.50 со стандартом Dublin Core. Позднее профиль Darwin Core был оформлен в документ с описанием XML-схемы для применения в протоколе распределённого поиска информации DiGIR (по аббревиатуре на английском). Для рецензирования стандарта был создан рабочий комитет Стандарты информационного обеспечения биоразнообразия, и 9 октября 2009 года официальный ратифицированный стандарт метаданных был опубликован.
Несмотря на официальную ратификацию TDWG/Стандартами информационного обеспечения биоразнообразия, ранее использовались различные версии Darwin Core для производственных нужд. В опубликованном стандарте приведена хронология релизов, предшествующих текущей версии[6].
| Название | Количество терминов | Дата выпуска |
|---|---|---|
| Darwin Core 1.0 | 24 | 1998 |
| Darwin Core 1.2 (классический) | 46 | 11 сентября 2001 |
| Darwin Core 1.21 (MaNIS/HerpNet/ORNIS/FishNet2) | 63 | 15 марта 2003 |
| Darwin Core OBIS | 27 | 10 июля 2005 |
| Darwin Core 1.4 (стандарт, проект) | 46 | 23 апреля 2007 |
| Термины Darwin Core (свойства) | 172 | 9 октября 2009 |
Крупные проекты, использующие Darwin Core
- Глобальное информационное пространство о биоразнообразии (GBIF)[7]
- Ocean Biogeographic Information System (OBIS)[8]
- Атлас живой Австралии (ALA)
- Online Zoological Collections of Australian Museums (OZCAM)
- Млекопитающие сети информации (MaNIS)
- Орнитологическая информационная система (ORNIS)
- FishNet 2
- VertNet
- Canadensys
- Система Nature 3.0
- Энциклопедия жизни
- Integrated Digitized Biocollections (iDigBio)[9][10]