Стандарт минимальной информации
Стандарт минимальной информации (англ. Minimum information standard) — наборы руководящих принципов и форматов для представления данных, полученных с помощью определённых высокопроизводительных методов. Их целью является обеспечение возможности лёгкой проверки, анализа и интерпретации данных, созданных этими методами, широкой научной общественностью. В конечном итоге такие стандарты способствуют переходу данных из научных публикаций (неструктурированные данные) в базы данных (структурированные данные) в виде, пригодном для сквозного анализа множества наборов данных. Стандарты минимальной информации разработаны для самых различных типов экспериментов, включая микроматрицы (MIAME), RNA-seq (MINSEQE), метаболомику (MSI) и протеомику (MIAPE)[1].
Стандарты минимальной информации обычно состоят из двух частей. Во-первых, существует перечень требований к представлению — как правило, в виде таблицы или контрольного списка. Во-вторых, существует определённый формат данных. Информация об эксперименте должна быть представлена в соответствующем формате данных для загрузки в специализированную базу данных. В случае MIAME этот формат реализован в виде электронных таблиц (MAGE-TAB). Некоторые профессиональные сообщества, поддерживающие стандарты минимальной информации, также разрабатывают инструменты для помощи исследователям в аннотировании своих данных[1].
MI-стандарты
Конкретные стандарты минимальной информации разрабатываются сообществами узкопрофильных специалистов, специализирующихся на методах экспериментальной биологии. Эти стандарты определяют, какая информация об экспериментах (метаданные) является ключевой и обязательной для публикации вместе с исходными данными, чтобы обеспечить их полноту и воспроизводимость.[2][3] Необходимость стандартизации связана прежде всего с развитием высокопроизводительных экспериментальных методов, генерирующих колоссальные объёмы данных. С 2008 года развитие стандартов минимальной информации для различных методов координируется в рамках проекта «Стандарт минимальной информации о биомедицинских и биологических исследованиях» (англ. Minimum Information about a Biomedical or Biological Investigation, MIBBI)[4].
MIAPPE — открытый проект, развиваемый научным сообществом для гармонизации данных о фенотипических исследованиях растений. MIAPPE включает концептуальный контрольный список метаданных, необходимых для полного описания эксперимента.
MIQE (Стандарт минимальной информации для публикации количественных ПЦР-экспериментов в реальном времени)
Впервые опубликованные в 2009 году, эти рекомендации легли в основу требований ряда научных журналов при подаче данных по количественной ПЦР в реальном времени, однако на практике соблюдаются не всегда[5].
Стандарт минимальной информации о микроматричном эксперименте (англ. Minimum Information About a Microarray Experiment, MIAME)[3] определяет набор минимально достаточной информации, необходимой для надёжной интерпретации и, возможно, воспроизведения результатов микроматричного эксперимента, а также способствует распространению данных. Этот стандарт был опубликован обществом FGED в 2001 году и стал первым стандартом минимальной информации для высокопроизводительных биологических экспериментов.
MIAME включает ряд расширений для специфических биологических направлений, таких как MIAME-env, MIAME-nut и MIAME-tox, применяемых соответственно к экологической, нутригеномике и токсикогеномике.
Электрофизиология — область, изучающая электрические свойства биологических клеток и тканей. Обычно электрофизиологические исследования предполагают измерение изменений напряжения или электрического тока, начиная с отдельных ионных каналов и заканчивая целыми тканями. Документ MINI-электрофизиологии — это самостоятельный модуль, часть семейства стандартов MINI для отчётности, созданный на основе экспертизы сообщества и открытый для публичных комментариев. Он содержит перечень сведений, необходимых для описания набора данных при публикации, что облегчает доступ, анализ и интерпретацию данных, а также способствует воспроизводимости экспериментов[6].
Стандарт минимальной информации об эксперименте с РНК-интерференцией (MIARE) — это руководство по представлению данных, определяющее минимально необходимую для публикации информацию, позволяющую однозначно интерпретировать и при необходимости воспроизвести результаты РНКи-эксперимента.
Развитие геномики и функциональной геномики позволило проводить крупномасштабный анализ функций генов и белков методами высокопроизводительных клеточных тестов. Клетки в культуре могут быть подвергнуты различным воздействиям, а возникающие эффекты — зарегистрированы и проанализированы. Такие воздействия включают введение различных молекул (например, siРНК, экспрессионных конструкций, малых химических соединений, лигандов рецепторов), а также физико-химические изменения среды. Цель — выявление молекулярных событий и принципов биологических процессов. Стандарт минимальной информации о клеточном тесте (MIACA) и объектная модель CA-OM предназначены для обмена и сопоставления информации из разных методов и интеграции результатов.
Документы о минимальной информации для протеомных экспериментов описывают, какие сведения должны сопровождать публикацию результатов таких исследований. Основной документ регламентирует общие принципы, на основе которых вырабатываются специфические стандарты для различных этапов масс-спектрометрического протеомного анализа.
Этот документ разработан рабочей группой по молекулярным взаимодействиям HUPO-PSI и регламентирует сведения, которые должны сопровождать публикацию результатов экспериментов по изучению молекулярных взаимодействий.
Стандарт разработан рабочей группой по молекулярным взаимодействиям HUPO-PSI совместно с инициативой по антителам HUPO и европейским консорциумом производителей белковых реагентов. Он нацелен на повышение качества описания веществ, включая антитела, используемых для идентификации белков.
Документ MIABE разработан при участии представителей крупных фармацевтических компаний и академических институтов. Он применяется для стандартизации описания малых молекул — потенциальных лекарств, гербицидов, пестицидов, пищевых добавок, действующих в живых организмах. Стандарт поддерживается программой EMBL-EBI Industry.
Данный стандарт разрабатывается Консорциумом геномных стандартов.
Минимально необходимая информация о проточном цитометрическом эксперименте (MIFlowCyt) определяет критерии регистрации сведений об экспериментальной постановке, образцах, оборудовании и анализе данных.[2][7][8] Он способствует унифицированной аннотации клинических, биологических и технических аспектов проточных цитометрических исследований[2].
Критерии стандарта минимальной информации о филогенетических анализах впервые были опубликованы в 2006 году[9].
Проект MIRAGE реализуется и координируется институтом Бейльштейна для стандартизации представления и обработки данных в исследованиях гликомики[10][11].
Минимально необходимая информация для аннотирования моделей (англ. MIRIAM) — свод правил по структурированию и аннотированию количественных моделей биологических систем.
Стандарт минимальной информации о моделирующем эксперименте (англ. MIASE) нацелен на стандартизацию описания моделирующих экспериментов в системной биологии.
Стандарт отчётности о данных по энзимологии (STRENDA) — инициатива, направленная на выработку руководящих принципов по представлению (метаданных) энзимологических экспериментов, с целью повышения качества публикаций по данным энзимологии.