Материал из РУВИКИ — свободной энциклопедии

Однонуклеотидный полиморфизм

Однонуклеотидный полиморфизм (англ. single-nucleotide polymorphism, SNP, мн. ч. SNPs) — это герминативная замена одного нуклеотида в определённой позиции генома. Хотя некоторые определения требуют, чтобы такая замена встречалась в достаточно большой доле популяции (например, 1 % и более)[1], многие публикации[2][3][4] не используют такой порог частоты.

Например, нуклеотид G, присутствующий в определённой позиции референсного генома, может быть заменён на A у части особей. Два возможных варианта нуклеотида в этом SNP — G или A — называются аллелями[5].

SNPs могут объяснять различия в восприимчивости к широкому спектру заболеваний в популяции. Например, распространённый SNP в гене CFH ассоциирован с повышенным риском возрастной макулярной дегенерации[6]. Различия в тяжести заболевания или ответе на лечение также могут быть проявлением генетических вариаций, вызванных SNP. Например, два распространённых SNP в гене APOE, rs429358 и rs7412, приводят к формированию трёх основных аллелей APO-E с разным риском развития болезни Альцгеймера и возрастом её начала.

Однонуклеотидные замены с частотой аллеля менее 1 % иногда называют однонуклеотидными вариантами[7]. Термин «вариант» также может использоваться как общий для любых однонуклеотидных изменений в последовательности ДНК[8], охватывая как распространённые SNP, так и редкие мутации, как герминативные, так и соматические[9][10]. Термин «однонуклеотидный вариант» также используется для обозначения точечных мутаций, обнаруженных в раковых клетках[11]. Варианты ДНК также часто учитываются в молекулярной диагностике, например, при разработке праймеров для ПЦР для обнаружения вирусов, когда образец вирусной РНК или ДНК может содержать однонуклеотидные варианты. Однако такая номенклатура использует произвольные различия (например, частота аллеля 1 %) и не применяется последовательно во всех областях; это привело к призывам к более единой системе наименования различий в последовательностях ДНК между двумя образцами[12][13].

Верхняя молекула ДНК отличается от нижней в одной паре оснований (полиморфизм G/A)
Типы однонуклеотидного полиморфизма (SNP)

Однонуклеотидные полиморфизмы могут располагаться в кодирующих последовательностях генов, некодирующих областях генов или в интергенных регионах (между генами). SNP в кодирующей последовательности не обязательно изменяют аминокислотную последовательность белка, который синтезируется, из-за вырожденности генетического кода.

SNP в кодирующей области бывают двух типов: синонимичные и несинонимичные. Синонимичные SNP не влияют на последовательность белка, тогда как несинонимичные изменяют аминокислотную последовательность белка[14].

  • SNP в некодирующих областях могут приводить к повышенному риску рака, а также влиять на структуру мРНК и восприимчивость к заболеваниям. Некодирующие SNP также могут изменять уровень экспрессии гена, выступая в роли eQTL (локус количественного признака экспрессии).
  • SNP в кодирующих областях:
    • синонимичные замены по определению не приводят к изменению аминокислоты в белке, но всё же могут влиять на его функцию иным образом. Примером может служить кажущаяся «тихой» мутация в гене множественной лекарственной устойчивости 1 (MDR1), кодирующем мембранный насос, выкачивающий лекарства из клетки: она может замедлять трансляцию и позволять полипептидной цепи складываться в необычную конформацию, делая мутантный насос менее функциональным (например, полиморфизм C1236T в белке MDR1 изменяет кодон GGC на GGT в позиции 412 полипептида (оба кодируют глицин), а полиморфизм C3435T изменяет ATC на ATT в позиции 1145 (оба кодируют изолейцин))[15].
    • несинонимичные замены:

SNP, не находящиеся в кодирующих областях белков, могут влиять на сплайсинг генов, связывание транскрипционных факторов, деградацию мРНК или последовательность некодирующих РНК. Экспрессия гена, изменяемая таким SNP, называется eSNP (expression SNP) и может находиться выше или ниже по потоку относительно гена.

В человеческой популяции выявлено более 600 миллионов SNP по всему геному[18]. Типичный геном отличается от референсного человеческого генома в 4-5 миллионах позиций, большинство из которых (более 99,9 %) составляют SNP и короткие инделы[19].

Внутри генома[править | править код]

Геномное распределение SNP неоднородно; SNP встречаются в некодирующих областях чаще, чем в кодирующих, или, в целом, там, где действует естественный отбор и «фиксирует» аллель (устраняя другие варианты) SNP, обеспечивающий наилучшую генетическую адаптацию[20]. Другие факторы, такие как генетическая рекомбинация и скорость мутаций, также определяют плотность SNP[21].

Плотность SNP можно предсказать по наличию микросателлитов: особенно AT-микросателлиты являются мощными предикторами плотности SNP, причём длинные участки (AT)(n) обычно встречаются в областях с существенно сниженной плотностью SNP и низким содержанием GC[22].

Внутри популяции[править | править код]

Поскольку существуют различия между человеческими популяциями, SNP-аллель, распространённый в одной географической или этнической группе, может быть редким в другой. Однако такой паттерн встречается относительно редко; в глобальной выборке из 67,3 миллиона SNP Human Genome Diversity Project не обнаружил ни одного частного варианта, который был бы фиксирован на определённом континенте или в крупном регионе. Наивысшие частоты достигаются у нескольких десятков вариантов, присутствующих более чем у 70 % (и у нескольких тысяч — более чем у 50 %) в Африке, Америке и Океании. В то же время, максимальные частоты вариантов, частных для Европы, Восточной Азии, Ближнего Востока или Центральной и Южной Азии, достигают лишь 10-30 %.

Внутри популяции SNP можно охарактеризовать по минорной аллельной частоте (MAF) — наименьшей частоте аллеля в локусе, наблюдаемой в данной популяции. Это просто меньшая из двух частот аллелей для SNP.

Используя эти знания, учёные разработали новые методы анализа структуры популяций у малоизученных видов[23][24][25]. Применяя методы пуллирования, стоимость анализа значительно снижается[26]. Эти методы основаны на секвенировании популяции в объединённом образце вместо секвенирования каждого индивида по отдельности. Новые биоинформатические инструменты позволяют исследовать структуру популяции, генетический поток и миграцию генов по частотам аллелей во всей популяции. Такие протоколы позволяют сочетать преимущества SNP с микросателлитными маркерами[27]. Однако при этом теряется информация о неравновесии по сцеплению и зиготности.

Применение

[править | править код]

Однонуклеотидные полиморфизмы служат мощными молекулярными маркерами в современной генетике и клинической практике. Ассоциативные исследования, особенно геномные ассоциативные исследования (GWAS), являются основным применением технологии SNP для выявления генетических вариантов, связанных с заболеваниями и признаками человека[28]. Эти комплексные анализы исследуют сотни тысяч генетических маркеров одновременно для выявления статистических ассоциаций между конкретными SNP и фенотипическими характеристиками, что позволяет выявлять генетические факторы сложных заболеваний, включая сердечно-сосудистые заболевания, диабет и неврологические заболевания[29].

Разработка методологии tag SNP значительно повысила эффективность геномных исследований за счёт использования паттернов неравновесия по сцеплению в геноме человека. Tag SNP выступают в роли репрезентативных маркеров, охватывающих генетическое разнообразие в определённых хромосомных регионах, позволяя исследовать большие участки генома без необходимости генотипирования каждого варианта[30]. Такой подход снижает финансовые и вычислительные затраты при сохранении достаточной мощности для выявления локусов, связанных с заболеваниями. Выбор оптимальных tag SNP основан на сложных алгоритмах, определяющих маркеры, способные охватить максимум генетической информации в заданных интервалах[31].

Гаплотипная реконструкция — ещё одно фундаментальное применение SNP, позволяющее характеризовать наследуемые блоки генов. Учёные используют плотные карты SNP для выявления и анализа структуры гаплотипов, представляющих собой наборы тесно сцепленных аллелей, которые, как правило, передаются вместе[32]. Эти паттерны гаплотипов дают представление об истории популяций, демографических событиях и эволюционных процессах, формировавших современное генетическое разнообразие. Международный проект HapMap — пример такого применения, создавший карты распространённых гаплотипов в различных человеческих популяциях[33].

Анализ неравновесия по сцеплению лежит в основе многих SNP-методов в популяционной генетике и картировании заболеваний. Это явление описывает неслучайную ассоциацию аллелей в разных позициях генома, когда варианты наследуются вместе чаще, чем ожидалось бы случайно[34]. Степень неравновесия по сцеплению между SNP зависит в первую очередь от физического расстояния на хромосомах и локальных рекомбинационных частот: чем ближе варианты, тем сильнее их ассоциация. Понимание этих паттернов позволяет прогнозировать, какие SNP дадут избыточную информацию, и выбирать информативные маркеры для ассоциативных исследований[35].

В генетической эпидемиологии SNP стали важнейшими инструментами для изучения путей передачи заболеваний и структуры популяций. Полное секвенирование генома использует вариации SNP для определения кластеров передачи при вспышках инфекционных заболеваний, когда случаи с похожими генетическими профилями могут быть связаны передачей[36]. Это особенно ценно для эпиднадзора и отслеживания контактов при туберкулёзе, где традиционные методы могут не выявить все связи передачи. Кроме того, SNP-анализы способствуют пониманию стратификации популяций и происхождения, что важно для корректного подбора контрольных групп и интерпретации результатов ассоциативных исследований в разных этнических группах[37].

Значение[править | править код]

Вариации в последовательностях ДНК человека могут влиять на развитие заболеваний и реакцию на патогены, химические вещества, лекарства, вакцины и другие агенты. SNP также критически важны для персонализированной медицины[38]. Примеры включают биомедицинские исследования, судебную медицину, фармакогенетику и изучение причин заболеваний.

Клинические исследования[править | править код]

Геномные ассоциативные исследования (GWAS)[править | править код]

Одним из основных вкладов SNP в клинические исследования являются геномные ассоциативные исследования (GWAS)[39]. Геномные данные могут быть получены с помощью различных технологий, включая SNP-матрицы и полное секвенирование генома. GWAS широко применяются для выявления SNP, связанных с заболеваниями или клиническими фенотипами. Поскольку GWAS охватывает весь геном, требуется большая выборка для достижения достаточной статистической мощности. Некоторые SNP оказывают относительно малое влияние на заболевания или фенотипы. Для оценки мощности исследования необходимо учитывать генетическую модель заболевания: доминантную, рецессивную или аддитивную. Из-за генетической гетерогенности анализ GWAS должен корректироваться по расе.

Кандидатные генные ассоциативные исследования[править | править код]

Кандидатные генные ассоциативные исследования применялись в генетике до появления высокопроизводительных технологий генотипирования и секвенирования[40]. Они исследуют ограниченное число заранее выбранных SNP на предмет ассоциации с заболеваниями или фенотипами. Это гипотезо-ориентированный подход, для которого достаточно небольшой выборки. Кандидатные исследования также часто используются для подтверждения результатов GWAS на независимых выборках.

Картирование гомозиготности при заболеваниях[править | править код]

Геномные данные по SNP могут использоваться для картирования гомозиготности[41]. Картирование гомозиготности — метод выявления гомозиготных аутосомно-рецессивных локусов, что может быть мощным инструментом для поиска генов, вовлечённых в патогенез заболеваний.

Метилирование ДНК[править | править код]

Связь между SNP, паттернами метилирования и экспрессией генов биологических признаков

Недавние исследования показали, что SNP являются важными компонентами эпигенетической программы у организмов[42]. Кроме того, исследования европейских и южноазиатских популяций выявили влияние SNP на метилирование определённых CpG-участков[43]. Анализ обогащения meQTL с использованием базы GWAS показал, что эти ассоциации важны для предсказания биологических признаков[43][44][45].

Судебная медицина[править | править код]

SNP исторически использовались для сопоставления судебных ДНК-образцов с подозреваемыми, но были вытеснены технологиями STR-ДНК-дактилоскопии. Однако развитие NGS может расширить применение SNP для фенотипических признаков, таких как этническая принадлежность, цвет волос и цвет глаз, с высокой вероятностью совпадения. Это также может повысить точность реконструкции внешности по ДНК, предоставляя информацию, которая иначе была бы недоступна, и использоваться для идентификации подозреваемых даже без совпадения STR-профиля.

Недостатки использования SNP по сравнению с STR заключаются в том, что SNP дают меньше информации, поэтому для анализа требуется больше SNP до получения профиля подозреваемого. Кроме того, SNP сильно зависят от наличия базы данных для сравнительного анализа. Однако при деградированных или малых образцах SNP-методы являются отличной альтернативой STR-методам. SNP (в отличие от STR) обладают большим количеством потенциальных маркеров, могут быть полностью автоматизированы, а длина требуемого фрагмента может быть сокращена до менее 100 пар оснований[22].

Фармакогенетика[править | править код]

Фармакогенетика занимается выявлением генетических вариаций, включая SNP, связанных с различиями в ответе на лечение[46]. Многие ферменты метаболизма лекарств, мишени лекарств или их пути могут быть под влиянием SNP. SNP, влияющие на ферменты метаболизма, могут изменять фармакокинетику, а SNP, влияющие на мишень или путь, — фармакодинамику. Поэтому SNP — потенциальные генетические маркеры для прогнозирования экспозиции или эффективности терапии. Геномные фармакогенетические исследования называются фармакогеномикой. Фармакогенетика и фармакогеномика важны для развития прецизионной медицины, особенно при жизнеугрожающих заболеваниях, таких как рак.

Заболевания[править | править код]

Лишь небольшая часть SNP в человеческом геноме влияет на заболевания. Крупномасштабные GWAS проведены для наиболее значимых заболеваний человека, включая сердечно-сосудистые заболевания, метаболические заболевания, аутоиммунные заболевания, нейродегенеративные и психические расстройства[39]. Большинство SNP с относительно крупным эффектом уже выявлены. Эти открытия значительно улучшили понимание патогенеза и молекулярных путей заболеваний, а также способствовали разработке новых методов лечения. Дальнейшие GWAS с большими выборками выявят SNP с меньшим эффектом. Для распространённых и сложных заболеваний, таких как сахарный диабет 2 типа, ревматоидный артрит и болезнь Альцгеймера, в этиологии участвуют множественные генетические факторы. Кроме того, взаимодействие ген-ген и ген-среда также играет важную роль в инициации и прогрессировании заболеваний[47].

  • rs6311 и rs6313 — SNP в гене серотонинового рецептора 5-HT2A на 13-й хромосоме человека[48].
  • SNP −3279C/A (rs3761548) — один из SNP в промоторной области гена Foxp3, может быть вовлечён в прогрессию рака.
  • SNP в гене F5 вызывает тромбофилию Фактора V Лейден[49].
  • rs3091244 — пример триаллельного SNP в гене CRP на 1-й хромосоме человека[50].
  • TAS2R38 кодирует способность ощущать вкус PTC и содержит 6 аннотированных SNP[51].
  • rs148649884 и rs138055828 в гене FCN1, кодирующем M-фиколин, нарушают способность связывания лиганда у рекомбинантного M-фиколина.
  • rs12821256 на cis-регуляторном элементе изменяет уровень транскрипции гена KIT-лиганд. У северных европейцев высокий уровень транскрипции приводит к каштановым волосам, а низкий — к светлым. Это пример явного, но не патологического фенотипического изменения, вызванного одним SNP[52].
  • Внутригенный SNP в гене репарации несоответствий ДНК PMS2 (rs1059060, Ser775Asn) ассоциирован с повышенным повреждением ДНК сперматозоидов и риском мужского бесплодия.

Базы данных

[править | править код]

Как и для генов, существуют биоинформатические базы данных SNP.

  • dbSNP — база данных SNP от NCBI. По состоянию на июнь 2015 года в dbSNP было зарегистрировано 149 735 377 SNP у человека[53][54].
  • Kaviar[55] — компиляция SNP из различных источников, включая dbSNP.
  • SNPedia — вики-база данных для аннотирования, интерпретации и анализа персональных геномов.
  • База данных OMIM описывает ассоциации между полиморфизмами и заболеваниями (например, приводит заболевания в текстовой форме).
  • dbSAP — база данных одноаминокислотных полиморфизмов для обнаружения вариаций белков[56].
  • Human Gene Mutation Database — база данных мутаций, вызывающих или ассоциированных с наследственными заболеваниями человека и функциональных SNP.
  • Международный проект HapMap, в рамках которого исследователи определяют для идентификации набора гаплотипов у каждого индивида.
  • GWAS Central — позволяет визуально анализировать сводные данные ассоциативных исследований генома.

Международная рабочая группа по SNP сопоставила последовательности, фланкирующие каждый SNP, с геномной последовательностью крупных клонов в Genebank. Эти выравнивания были конвертированы в хромосомные координаты, приведённые в таблице 1[57]. С тех пор этот список значительно увеличился: например, база Kaviar теперь содержит 162 миллиона однонуклеотидных вариантов.

Хромосома Длина (п.н.) Все SNP SNP TSC
Всего SNP кб на SNP Всего SNP кб на SNP
1 214 066 000 129 931 1,65 75 166 2,85
2 222 889 000 103 664 2,15 76 985 2,90
3 186 938 000 93 140 2,01 63 669 2,94
4 169 035 000 84 426 2,00 65 719 2,57
5 170 954 000 117 882 1,45 63 545 2,69
6 165 022 000 96 317 1,71 53 797 3,07
7 149 414 000 71 752 2,08 42 327 3,53
8 125 148 000 57 834 2,16 42 653 2,93
9 107 440 000 62 013 1,73 43 020 2,50
10 127 894 000 61 298 2,09 42 466 3,01
11 129 193 000 84 663 1,53 47 621 2,71
12 125 198 000 59 245 2,11 38 136 3,28
13 93 711 000 53 093 1,77 35 745 2,62
14 89 344 000 44 112 2,03 29 746 3,00
15 73 467 000 37 814 1,94 26 524 2,77
16 74 037 000 38 735 1,91 23 328 3,17
17 73 367 000 34 621 2,12 19 396 3,78
18 73 078 000 45 135 1,62 27 028 2,70
19 56 044 000 25 676 2,18 11 185 5,01
20 63 317 000 29 478 2,15 17 051 3,71
21 33 824 000 20 916 1,62 9 103 3,72
22 33 786 000 28 410 1,19 11 056 3,06
X 131 245 000 34 842 3,77 20 400 6,43
Y 21 753 000 4 193 5,19 1 784 12,19
RefSeq 15 696 674 14 534 1,08
Итого 2 710 164 000 1 419 190 1,91 887 450 3,05

Номенклатура

[править | править код]

Для SNP существует несколько вариантов обозначения, однако единого стандарта нет.

Стандарт rs###, принятый в dbSNP, использует префикс «rs» (reference SNP) и уникальный номер[58]. SNP часто обозначают по номеру rs, как в примерах выше.

Стандарт HGVS содержит больше информации о SNP. Примеры:

  • c.76A>T: «c.» — кодирующая область, далее номер позиции нуклеотида, далее однобуквенное обозначение нуклеотида (A, C, G, T или U), далее знак «>» для замены, далее буква заменяющего нуклеотида[59][60][61]
  • p.Ser123Arg: «p.» — белок, далее трёхбуквенное обозначение аминокислоты, далее номер позиции, далее обозначение заменяющей аминокислоты[62].

SNP легко анализировать, поскольку они содержат только два возможных аллеля и три возможных генотипа: гомозиготный A, гомозиготный B и гетерозиготный AB, что позволяет использовать множество методов анализа. Среди них: секвенирование ДНК; капиллярный электрофорез; масс-спектрометрия; анализ одноцепочечной конформационной полиморфии (SSCP); однобазовое удлинение; электрохимический анализ; денатурирующий ВЭЖХ и гель-электрофорез; анализ рестрикционных фрагментов; гибридизационный анализ.

Программы для предсказания эффектов SNP

[править | править код]

Важная группа SNP — те, что соответствуют миссенс-мутациям, вызывающим замену аминокислоты в белке. Точечная мутация определённого остатка может по-разному влиять на функцию белка (от отсутствия эффекта до полной потери функции). Обычно замена аминокислот схожего размера и свойств (например, лейцин на валин) имеет слабый эффект, и наоборот. Аналогично, если SNP нарушает элементы вторичной структуры (например, замену на пролин в области альфа-спирали), такая мутация может повлиять на всю структуру и функцию белка. Используя эти и другие правила, основанные на машинном обучении, были разработаны программы для предсказания эффекта SNP:[63]

  • SIFT — программа для оценки влияния миссенс- или несинонимичной мутации на функцию белка на основе физических свойств аминокислот и гомологии последовательностей.
  • LIST (Local Identity and Shared Taxa)[64] — оценивает потенциальную вредоносность мутаций, исходя из их влияния на функцию белка. Основана на предположении, что вариации, наблюдаемые у близкородственных видов, более значимы для оценки консервативности, чем у дальних.
  • SNAP2
  • SuSPect
  • PolyPhen-2
  • PredictSNP
  • MutationTaster
  • Variant Effect Predictor от проекта Ensembl
  • SNPViz — программа для 3D-визуализации белка с выделением изменённой аминокислоты, что позволяет врачам оценить патогенность мутантного белка[65].
  • PROVEAN
  • PhyreRisk — база данных, сопоставляющая варианты с экспериментальными и предсказанными структурами белков[66].
  • Missense3D — инструмент для стереохимического анализа влияния миссенс-вариантов на структуру белка[67].

Примечания

[править | править код]
  1. single-nucleotide polymorphism / SNP | Learn Science at Scitable. www.nature.com. Дата обращения: 13 ноября 2015. Архивировано 10 ноября 2015 года.
  2. Sherry, S. T.; Ward, M.; Sirotkin, K. (1999). “dbSNP—Database for Single Nucleotide Polymorphisms and Other Classes of Minor Genetic Variation”. Genome Research. 9 (8): 677—679. DOI:10.1101/gr.9.8.677. S2CID 10775908.
  3. Lander, E. S.; et al. (2001). “Initial sequencing and analysis of the human genome”. Nature. 409 (6822): 860—921. Bibcode:2001Natur.409..860L. DOI:10.1038/35057062. HDL:2027.42/62798.
  4. Auton, Adam; et al. (2015). “A global reference for human genetic variation”. Nature. 526 (7571): 68—74. Bibcode:2015Natur.526...68T. DOI:10.1038/nature15393.
  5. Monga, Isha; Qureshi, Abid; Thakur, Nishant; Gupta, Amit Kumar; Kumar, Manoj (September 2017). “ASPsiRNA: A Resource of ASP-siRNAs Having Therapeutic Potential for Human Genetic Disorders and Algorithm for Prediction of Their Inhibitory Efficacy”. G3. 7 (9): 2931—2943. DOI:10.1534/g3.117.044024. PMC 5592921.
  6. Calippe, Bertrand; Guillonneau, Xavier; Sennlaub, Florian (March 2014). “Complement factor H and related proteins in age-related macular degeneration”. Comptes Rendus Biologies. 337 (3): 178—184. DOI:10.1016/j.crvi.2013.12.003. ISSN 1631-0691. PMID 24702844.
  7. Definition of single nucleotide variant - NCI Dictionary of Genetics Terms (англ.). www.cancer.gov (20 июля 2012). Дата обращения: 2 мая 2023.
  8. Wright, Alan F (September 23, 2005), Genetic Variation: Polymorphisms and Mutations, eLS, Wiley, ISBN 978-0-470-01617-6, DOI 10.1038/npg.els.0005005 
  9. Goya, R.; Sun, M. G.; Morin, R. D.; Leung, G.; Ha, G.; Wiegand, K. C.; Senz, J.; Crisan, A.; Marra, M. A.; Hirst, M.; Huntsman, D.; Murphy, K. P.; Aparicio, S.; Shah, S. P. (2010). “SNVMix: predicting single nucleotide variants from next-generation sequencing of tumors”. Bioinformatics. 26 (6): 730—736. DOI:10.1093/bioinformatics/btq040. PMC 2832826.
  10. Katsonis, Panagiotis; Koire, Amanda; Wilson, Stephen Joseph; Hsu, Teng-Kuei; Lua, Rhonald C.; Wilkins, Angela Dawn; Lichtarge, Olivier (2014-10-20). “Single nucleotide variations: Biological impact and theoretical interpretation”. Protein Science. 23 (12): 1650—1666. DOI:10.1002/pro.2552. ISSN 0961-8368. PMC 4253807. PMID 25234433.
  11. Khurana, Ekta; Fu, Yao; Chakravarty, Dimple; Demichelis, Francesca; Rubin, Mark A.; Gerstein, Mark (2016-01-19). “Role of non-coding sequence variants in cancer”. Nature Reviews Genetics. 17 (2): 93—108. DOI:10.1038/nrg.2015.17. ISSN 1471-0056. PMID 26781813. S2CID 14433306.
  12. Karki, Roshan; Pandya, Deep; Elston, Robert C.; Ferlini, Cristiano (July 15, 2015). “Defining "mutation" and "polymorphism" in the era of personal genomics”. BMC Medical Genomics. Springer Science and Business Media LLC. 8 (1): 37. DOI:10.1186/s12920-015-0115-z. ISSN 1755-8794. PMC 4502642. PMID 26173390.
  13. Li, Heng SNP vs SNV. Heng Li's blog (15 марта 2021). Дата обращения: 3 мая 2023.
  14. Chu, Duan; Wei, Lai (2019-04-16). “Nonsynonymous, synonymous and nonsense mutations in human cancer-related genes undergo stronger purifying selections than expectation”. BMC Cancer. 19 (1): 359. DOI:10.1186/s12885-019-5572-x. ISSN 1471-2407. PMC 6469204. PMID 30991970.
  15. Kimchi-Sarfaty C, Oh JM, Kim IW, Sauna ZE, Calcagno AM, Ambudkar SV, Gottesman MM (January 2007). “A "silent" polymorphism in the MDR1 gene changes substrate specificity”. Science. 315 (5811): 525—8. Bibcode:2007Sci...315..525K. DOI:10.1126/science.1135308. PMID 17185560. S2CID 15146955.
  16. Al-Haggar M, Madej-Pilarczyk A, Kozlowski L, Bujnicki JM, Yahia S, Abdel-Hadi D, Shams A, Ahmad N, Hamed S, Puzianowska-Kuznicka M (November 2012). “A novel homozygous p.Arg527Leu LMNA mutation in two unrelated Egyptian families causes overlapping mandibuloacral dysplasia and progeria syndrome”. European Journal of Human Genetics. 20 (11): 1134—40. DOI:10.1038/ejhg.2012.77. PMC 3476705. PMID 22549407.
  17. Cordovado SK, Hendrix M, Greene CN, Mochal S, Earley MC, Farrell PM, Kharrazi M, Hannon WH, Mueller PW (February 2012). “CFTR mutation analysis and haplotype associations in CF patients”. Molecular Genetics and Metabolism. 105 (2): 249—54. DOI:10.1016/j.ymgme.2011.10.013. PMC 3551260. PMID 22137130.
  18. What are single nucleotide polymorphisms (SNPs)?: MedlinePlus Genetics (англ.). medlineplus.gov. Дата обращения: 22 марта 2023.
  19. Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, Marchini JL, McCarthy S, McVean GA, Abecasis GR (October 2015). “A global reference for human genetic variation”. Nature. 526 (7571): 68—74. Bibcode:2015Natur.526...68T. DOI:10.1038/nature15393. PMC 4750478. PMID 26432245.
  20. Barreiro LB, Laval G, Quach H, Patin E, Quintana-Murci L (March 2008). “Natural selection has driven population differentiation in modern humans”. Nature Genetics. 40 (3): 340—5. DOI:10.1038/ng.78. PMID 18246066. S2CID 205357396.
  21. Nachman MW (September 2001). “Single nucleotide polymorphisms and recombination rate in humans”. Trends in Genetics. 17 (9): 481—5. DOI:10.1016/S0168-9525(01)02409-X. PMID 11525814.
  22. 1 2 Varela MA, Amos W (March 2010). “Heterogeneous distribution of SNPs in the human genome: microsatellites as predictors of nucleotide diversity and divergence”. Genomics. 95 (3): 151—9. DOI:10.1016/j.ygeno.2009.12.003. PMID 20026267.
  23. Hivert, Valentin; Leblois, Raphaël; Petit, Eric J.; Gautier, Mathieu; Vitalis, Renaud (2018-07-30). “Measuring Genetic Differentiation from Pool-seq Data”. Genetics. 210 (1): 315—330. DOI:10.1534/genetics.118.300900. ISSN 0016-6731. PMC 6116966. PMID 30061425.
  24. Ekblom, R; Galindo, J (2010-12-08). “Applications of next generation sequencing in molecular ecology of non-model organisms”. Heredity. 107 (1): 1—15. DOI:10.1038/hdy.2010.152. ISSN 0018-067X. PMC 3186121. PMID 21139633.
  25. Ellegren, Hans (January 2014). “Genome sequencing and population genomics in non-model organisms”. Trends in Ecology & Evolution. 29 (1): 51—63. Bibcode:2014TEcoE..29...51E. DOI:10.1016/j.tree.2013.09.008. ISSN 0169-5347. PMID 24139972.
  26. Chen, Chao; Parejo, Melanie; Momeni, Jamal; Langa, Jorge; Nielsen, Rasmus O.; Shi, Wei; Smartbees Wp Diversity Contributors, null; Vingborg, Rikke; Kryger, Per; Bouga, Maria; Estonba, Andone; Meixner, Marina (2022-01-21). “Population Structure and Diversity in European Honey Bees (Apismellifera L.)-An Empirical Comparison of Pool and Individual Whole-Genome Sequencing”. Genes. 13 (2): 182. DOI:10.3390/genes13020182. ISSN 2073-4425. PMC 8872436. PMID 35205227.
  27. Dorant, Yann; Benestan, Laura; Rougemont, Quentin; Normandeau, Eric; Boyle, Brian; Rochette, Rémy; Bernatchez, Louis (2019). “Comparing Pool-seq, Rapture, and GBS genotyping for inferring weak population structure: The American lobster (Homarus americanus) as a case study”. Ecology and Evolution [англ.]. 9 (11): 6606—6623. Bibcode:2019EcoEv...9.6606D. DOI:10.1002/ece3.5240. ISSN 2045-7758. PMC 6580275. PMID 31236247.
  28. Uffelmann, Emil; Huang, Qin Qin; Munung, Nchangwi Syntia; de Vries, Jantina; Okada, Yukinori; Martin, Alicia R.; Martin, Hilary C.; Lappalainen, Tuuli; Posthuma, Danielle (2021-08-26). “Genome-wide association studies”. Nature Reviews Methods Primers [англ.]. 1 (1): 59. DOI:10.1038/s43586-021-00056-9. ISSN 2662-8449.
  29. Buniello, Annalisa; MacArthur, Jacqueline A. L.; Cerezo, Maria; Harris, Laura W.; Hayhurst, James; Malangone, Cinzia; McMahon, Aoife; Morales, Joannella; Mountjoy, Edward; Sollis, Elliot; Suveges, Daniel; Vrousgou, Olga; Whetzel, Patricia L.; Amode, Ridwan; Guillen, Jose A. (2019-01-08). “The NHGRI-EBI GWAS Catalog of published genome-wide association studies, targeted arrays and summary statistics 2019”. Nucleic Acids Research. 47 (D1): D1005—D1012. DOI:10.1093/nar/gky1120. ISSN 1362-4962. PMC 6323933. PMID 30445434.
  30. Carlson, Christopher S.; Eberle, Michael A.; Rieder, Mark J.; Yi, Qian; Kruglyak, Leonid; Nickerson, Deborah A. (January 2004). “Selecting a maximally informative set of single-nucleotide polymorphisms for association analyses using linkage disequilibrium”. American Journal of Human Genetics. 74 (1): 106—120. DOI:10.1086/381000. ISSN 0002-9297. PMC 1181897. PMID 14681826.
  31. Sebastiani, Paola; Lazarus, Ross; Weiss, Scott T.; Kunkel, Louis M.; Kohane, Isaac S.; Ramoni, Marco F. (2003-08-19). “Minimal haplotype tagging”. Proceedings of the National Academy of Sciences of the United States of America. 100 (17): 9900—9905. Bibcode:2003PNAS..100.9900S. DOI:10.1073/pnas.1633613100. ISSN 0027-8424. PMC 187880. PMID 12900503.
  32. Gabriel, Stacey B.; Schaffner, Stephen F.; Nguyen, Huy; Moore, Jamie M.; Roy, Jessica; Blumenstiel, Brendan; Higgins, John; DeFelice, Matthew; Lochner, Amy; Faggart, Maura; Liu-Cordero, Shau Neen; Rotimi, Charles; Adeyemo, Adebowale; Cooper, Richard; Ward, Ryk (2002-06-21). “The structure of haplotype blocks in the human genome”. Science. 296 (5576): 2225—2229. Bibcode:2002Sci...296.2225G. DOI:10.1126/science.1069424. ISSN 1095-9203. PMID 12029063.
  33. Altshuler, David; Donnelly, Peter; The International HapMap Consortium (October 2005). “A haplotype map of the human genome”. Nature [англ.]. 437 (7063): 1299—1320. Bibcode:2005Natur.437.1299T. DOI:10.1038/nature04226. ISSN 1476-4687. PMC 1880871. PMID 16255080.
  34. Slatkin, Montgomery (June 2008). “Linkage disequilibrium--understanding the evolutionary past and mapping the medical future”. Nature Reviews. Genetics. 9 (6): 477—485. DOI:10.1038/nrg2361. ISSN 1471-0064. PMC 5124487. PMID 18427557.
  35. Wall, Jeffrey D.; Pritchard, Jonathan K. (September 2003). “Assessing the performance of the haplotype block model of linkage disequilibrium”. American Journal of Human Genetics. 73 (3): 502—515. DOI:10.1086/378099. ISSN 0002-9297. PMC 1180676. PMID 12916017.
  36. Walker, Timothy M.; Ip, Camilla L. C.; Harrell, Ruth H.; Evans, Jason T.; Kapatai, Georgia; Dedicoat, Martin J.; Eyre, David W.; Wilson, Daniel J.; Hawkey, Peter M.; Crook, Derrick W.; Parkhill, Julian; Harris, David; Walker, A. Sarah; Bowden, Rory; Monk, Philip (February 2013). “Whole-genome sequencing to delineate Mycobacterium tuberculosis outbreaks: a retrospective observational study”. The Lancet. Infectious Diseases. 13 (2): 137—146. DOI:10.1016/S1473-3099(12)70277-3. ISSN 1474-4457. PMC 3556524. PMID 23158499.
  37. Price, Alkes L.; Patterson, Nick J.; Plenge, Robert M.; Weinblatt, Michael E.; Shadick, Nancy A.; Reich, David (August 2006). “Principal components analysis corrects for stratification in genome-wide association studies”. Nature Genetics [англ.]. 38 (8): 904—909. DOI:10.1038/ng1847. ISSN 1546-1718. PMID 16862161.
  38. Carlson, Bruce (15 June 2008). “SNPs — A Shortcut to Personalized Medicine”. Genetic Engineering & Biotechnology News. Mary Ann Liebert, Inc. 28 (12). Архивировано из оригинала 26 December 2010. Дата обращения 2008-07-06. (subtitle) Medical applications are where the market's growth is expected Используется устаревший параметр |url-status= (справка)
  39. 1 2 Visscher, Peter M.; Wray, Naomi R.; Zhang, Qian; Sklar, Pamela; McCarthy, Mark I.; Brown, Matthew A.; Yang, Jian (July 2017). “10 Years of GWAS Discovery: Biology, Function, and Translation”. The American Journal of Human Genetics. 101 (1): 5—22. DOI:10.1016/j.ajhg.2017.06.005. ISSN 0002-9297. PMC 5501872. PMID 28686856.
  40. Dong, Linda M.; Potter, John D.; White, Emily; Ulrich, Cornelia M.; Cardon, Lon R.; Peters, Ulrike (2008-05-28). “Genetic Susceptibility to Cancer”. JAMA. 299 (20): 2423—2436. DOI:10.1001/jama.299.20.2423. ISSN 0098-7484. PMC 2772197. PMID 18505952.
  41. Alkuraya, Fowzan S. (April 2010). “Homozygosity mapping: One more tool in the clinical geneticist's toolbox”. Genetics in Medicine. 12 (4): 236—239. DOI:10.1097/gim.0b013e3181ceb95d. ISSN 1098-3600. PMID 20134328. S2CID 10789932.
  42. Vohra, Manik; Sharma, Anu Radha; Prabhu B, Navya; Rai, Padmalatha S. (2020). “SNPs in Sites for DNA Methylation, Transcription Factor Binding, and miRNA Targets Leading to Allele-Specific Gene Expression and Contributing to Complex Disease Risk: A Systematic Review”. Public Health Genomics. 23 (5—6): 155—170. DOI:10.1159/000510253. ISSN 1662-4246. PMID 32966991. S2CID 221886624.
  43. 1 2 Hawe, Johann S.; Wilson, Rory; Schmid, Katharina T.; Zhou, Li; Lakshmanan, Lakshmi Narayanan; Lehne, Benjamin C.; Kühnel, Brigitte; Scott, William R.; Wielscher, Matthias; Yew, Yik Weng; Baumbach, Clemens; Lee, Dominic P.; Marouli, Eirini; Bernard, Manon; Pfeiffer, Liliane (January 2022). “Genetic variation influencing DNA methylation provides insights into molecular mechanisms regulating genomic function”. Nature Genetics [англ.]. 54 (1): 18—29. DOI:10.1038/s41588-021-00969-x. ISSN 1546-1718. PMC 7617265. PMID 34980917. S2CID 256821844.
  44. Perzel Mandell, Kira A.; Eagles, Nicholas J.; Wilton, Richard; Price, Amanda J.; Semick, Stephen A.; Collado-Torres, Leonardo; Ulrich, William S.; Tao, Ran; Han, Shizhong; Szalay, Alexander S.; Hyde, Thomas M.; Kleinman, Joel E.; Weinberger, Daniel R.; Jaffe, Andrew E. (2021-09-02). “Genome-wide sequencing-based identification of methylation quantitative trait loci and their role in schizophrenia risk”. Nature Communications [англ.]. 12 (1): 5251. Bibcode:2021NatCo..12.5251P. DOI:10.1038/s41467-021-25517-3. ISSN 2041-1723. PMC 8413445. PMID 34475392.
  45. Hoffmann, Anke; Ziller, Michael; Spengler, Dietmar (December 2016). “The Future is The Past: Methylation QTLs in Schizophrenia”. Genes [англ.]. 7 (12): 104. DOI:10.3390/genes7120104. ISSN 2073-4425. PMC 5192480. PMID 27886132.
  46. Daly, Ann K (2017-10-11). “Pharmacogenetics: a general review on progress to date”. British Medical Bulletin. 124 (1): 65—79. DOI:10.1093/bmb/ldx035. ISSN 0007-1420. PMID 29040422.
  47. Musci, Rashelle J.; Augustinavicius, Jura L.; Volk, Heather (2019-08-13). “Gene-Environment Interactions in Psychiatry: Recent Evidence and Clinical Implications”. Current Psychiatry Reports. 21 (9): 81. DOI:10.1007/s11920-019-1065-5. ISSN 1523-3812. PMC 7340157. PMID 31410638.
  48. Giegling I, Hartmann AM, Möller HJ, Rujescu D (November 2006). “Anger- and aggression-related traits are associated with polymorphisms in the 5-HT-2A gene”. Journal of Affective Disorders. 96 (1—2): 75—81. DOI:10.1016/j.jad.2006.05.016. PMID 16814396.
  49. Kujovich JL (January 2011). “Factor V Leiden thrombophilia”. Genetics in Medicine. 13 (1): 1—16. DOI:10.1097/GIM.0b013e3181faa0f2. PMID 21116184.
  50. Morita A, Nakayama T, Doba N, Hinohara S, Mizutani T, Soma M (June 2007). “Genotyping of triallelic SNPs using TaqMan PCR”. Molecular and Cellular Probes. 21 (3): 171—6. DOI:10.1016/j.mcp.2006.10.005. PMID 17161935.
  51. Prodi DA, Drayna D, Forabosco P, Palmas MA, Maestrale GB, Piras D, Pirastu M, Angius A (October 2004). “Bitter taste study in a sardinian genetic isolate supports the association of phenylthiocarbamide sensitivity to the TAS2R38 bitter receptor gene”. Chemical Senses. 29 (8): 697—702. DOI:10.1093/chemse/bjh074. PMID 15466815.
  52. Guenther, Catherine A.; Tasic, Bosiljka; Luo, Liqun; Bedell, Mary A.; Kingsley, David M. (July 2014). “A molecular basis for classic blond hair color in Europeans”. Nature Genetics [англ.]. 46 (7): 748—752. DOI:10.1038/ng.2991. ISSN 1546-1718. PMC 4704868. PMID 24880339.
  53. National Center for Biotechnology Information, United States National Library of Medicine. 2014. NCBI dbSNP build 142 for human. [DBSNP-announce] DBSNP Human Build 142 (GRCh38 and GRCh37.p13). Дата обращения: 11 сентября 2017. Архивировано 10 сентября 2017 года.
  54. National Center for Biotechnology Information, United States National Library of Medicine. 2015. NCBI dbSNP build 144 for human. Summary Page. DBSNP Summary. Дата обращения: 11 сентября 2017. Архивировано 10 сентября 2017 года.
  55. Glusman G, Caballero J, Mauldin DE, Hood L, Roach JC (November 2011). “Kaviar: an accessible system for testing SNV novelty”. Bioinformatics. 27 (22): 3216—7. DOI:10.1093/bioinformatics/btr540. PMC 3208392. PMID 21965822.
  56. Cao R, Shi Y, Chen S, Ma Y, Chen J, Yang J, Chen G, Shi T (January 2017). “dbSAP: single amino-acid polymorphism database for protein variation detection”. Nucleic Acids Research. 45 (D1): D827—D832. DOI:10.1093/nar/gkw1096. PMC 5210569. PMID 27903894.
  57. Sachidanandam R, Weissman D, Schmidt SC, Kakol JM, Stein LD, Marth G, Sherry S, Mullikin JC, Mortimore BJ, Willey DL, Hunt SE, Cole CG, Coggill PC, Rice CM, Ning Z, Rogers J, Bentley DR, Kwok PY, Mardis ER, Yeh RT, Schultz B, Cook L, Davenport R, Dante M, Fulton L, Hillier L, Waterston RH, McPherson JD, Gilman B, Schaffner S, Van Etten WJ, Reich D, Higgins J, Daly MJ, Blumenstiel B, Baldwin J, Stange-Thomann N, Zody MC, Linton L, Lander ES, Altshuler D (February 2001). “A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms”. Nature. 409 (6822): 928—33. Bibcode:2001Natur.409..928S. DOI:10.1038/35057149. PMID 11237013.
  58. Clustered RefSNPs (rs) and Other Data Computed in House // SNP FAQ Archive. — Bethesda (MD) : U.S. National Center for Biotechnology Information, 2005.
  59. J.T. Den Dunnen. Recommendations for the description of sequence variants. Human Genome Variation Society (20 февраля 2008). Дата обращения: 5 сентября 2008. Архивировано 14 сентября 2008 года.
  60. den Dunnen JT, Antonarakis SE (2000). “Mutation nomenclature extensions and suggestions to describe complex mutations: a discussion”. Human Mutation. 15 (1): 7—12. DOI:10.1002/(SICI)1098-1004(200001)15:1<7::AID-HUMU4>3.0.CO;2-N. PMID 10612815.
  61. Ogino S, Gulley ML, den Dunnen JT, Wilson RB (February 2007). “Standard mutation nomenclature in molecular diagnostics: practical and educational challenges”. The Journal of Molecular Diagnostics. 9 (1): 1—6. DOI:10.2353/jmoldx.2007.060081. PMC 1867422. PMID 17251329.
  62. Sequence Variant Nomenclature. varnomen.hgvs.org. Дата обращения: 2 декабря 2019.
  63. Johnson, Andrew D. (October 2009). “SNP bioinformatics: a comprehensive review of resources”. Circulation: Cardiovascular Genetics. 2 (5): 530—536. DOI:10.1161/CIRCGENETICS.109.872010. ISSN 1942-325X. PMC 2789466. PMID 20031630.
  64. Nawar Malhis; Matthew Jacobson; Steven J. M. Jones; Jörg Gsponer (2020). “LIST-S2: Taxonomy Based Sorting of Deleterious Missense Mutations Across Species”. Nucleic Acids Research. 48 (W1): W154—W161. DOI:10.1093/nar/gkaa288. PMC 7319545. PMID 32352516.
  65. “View of SNPViz - Visualization of SNPs in proteins”. genomicscomputbiol.org [англ.]. DOI:10.18547/gcb.2018.vol4.iss1.e100048. Архивировано из оригинала 2020-08-07. Дата обращения 2018-10-20.
  66. Ofoegbu TC, David A, Kelley LA, Mezulis S, Islam SA, Mersmann SF, et al. (June 2019). “PhyreRisk: A Dynamic Web Application to Bridge Genomics, Proteomics and 3D Structural Data to Guide Interpretation of Human Genetic Variants”. Journal of Molecular Biology. 431 (13): 2460—2466. DOI:10.1016/j.jmb.2019.04.043. PMC 6597944. PMID 31075275.
  67. Ittisoponpisan S, Islam SA, Khanna T, Alhuzimi E, David A, Sternberg MJ (May 2019). “Can Predicted Protein 3D Structures Provide Reliable Insights into whether Missense Variants Are Disease Associated?”. Journal of Molecular Biology. 431 (11): 2197—2212. DOI:10.1016/j.jmb.2019.04.009. PMC 6544567. PMID 30995449.

Литература

[править | править код]