научная статья по теме СОВРЕМЕННОЕ СОСТОЯНИЕ ИССЛЕДОВАНИЙ В ОБЛАСТИ ЭТНОГЕНОМИКИ: ПОЛНОГЕНОМНЫЙ АНАЛИЗ И ОДНОРОДИТЕЛЬСКИЕ МАРКЕРЫ Биология

Текст научной статьи на тему «СОВРЕМЕННОЕ СОСТОЯНИЕ ИССЛЕДОВАНИЙ В ОБЛАСТИ ЭТНОГЕНОМИКИ: ПОЛНОГЕНОМНЫЙ АНАЛИЗ И ОДНОРОДИТЕЛЬСКИЕ МАРКЕРЫ»

ГЕНЕТИКА, 2015, том 51, № 4, с. 503-516

УДК 575.174:599.9

СОВРЕМЕННОЕ СОСТОЯНИЕ ИССЛЕДОВАНИЙ В ОБЛАСТИ ЭТНОГЕНОМИКИ: ПОЛНОГЕНОМНЫЙ АНАЛИЗ И ОДНОРОДИТЕЛЬСКИЕ МАРКЕРЫ

© 2015 г. С. С. Литвинов1, 2, Э. К. Хуснутдинова1, 2

Институт биохимии и генетики Уфимского научного центра Российской академии наук, Уфа 450054

e-mail: elzakh@mail.ru

2Башкирский государственный университет, кафедра генетики и фундаментальной медицины, Уфа 450074

e-mail: seregtg@gmail.com Поступила в редакцию 07.05.2014 г.

В настоящей работе проведен краткий обзор современного состояния этногеномики. Описаны основные крупные достижения в этой области, проведен небольшой исторический обзор и кратко рассмотрены методы и подходы, использующиеся в настоящий момент при изучении Y-хромосо-мы, митохондриальной ДНК и полногеномном анализе аутосомных SNPs.

DOI: 10.7868/S0016675815040086

В настоящее время в популяционной генетике наблюдается переход от изучения отдельных ло-кусов на геномный уровень, что в перспективе позволит получать принципиально новую информацию о генетической структуре популяций человека. Раздел популяционной геномики человека, занимающийся данной проблематикой — этногеномика (изначально термин был известен как "этническая генетика", или "этногенетика" [1]), а также тесно связанные смежные дисциплины: геногеография человека и археогенетика [2, 3], — постепенно входят в фазу полногеномного секвенирования [4]. Эффективная работа в этом направлении неразрывно связана с привлечением математиков и программистов, способных обеспечить адекватную обработку колоссальных объемов данных, полученных методом секвенирования следующего поколения (next-generation sequencing). При этом существенной проблемой является необходимость для их обработки больших вычислительных мощностей, что частично может быть компенсировано разработкой производительных алгоритмов анализа больших объемов данных. В то же время стандартные методы анализа полиморфизма ДНК, к которым уже можно отнести и ряд подходов при обработке так называемых полногеномных (genome-wide) данных, остаются весьма эффективными при изучении генетической структуры, истории и филогенетических взаимоотношений популяций мира. В настоящей работе нами не ставилась цель полностью описать все существующие стандартные методы и подходы, поскольку это невозможно в рамках одной статьи. Мы также не рассматривали классические маркеры, под которыми

подразумеваются белковые маркеры [5]. Перед нами стояла иная задача — вкратце охарактеризовать те подходы этногеномики, которые связаны с изучением полиморфных вариантов ДНК, повсеместно используются для решения наиболее остро стоящих вопросов и позволяют это сделать максимально эффективно. Таковыми подходами на сегодняшний день являются: изучение полиморфных вариантов мтДНК и У-хромосомы, полногеномный анализ данных аутосомных 8МР8, а также полногеномное секвенирование аутосом, мтДНК и У-хромосомы.

ИЗУЧЕНИЕ ПОЛИМОРФИЗМА МИТОХОНДРИАЛЬНОЙ ДНК

Из всех систем генетических маркеров именно маркеры митохондриальной ДНК являются наиболее изученными. Причин этому несколько. Во-первых, мтДНК передается только по материнской линии, что позволяет проследить генетическую историю по женской линии. Кроме того, в отличие от другого популярного объекта изучения, У-хромосомы, мтДНК можно анализировать и у мужчин, и у женщин, что зачастую упрощает задачу исследователя по набору адекватной выборки. Немаловажное значение имеет и небольшой размер молекулы мтДНК, позволяющий относительно легко получать последовательности нуклеотидов всей молекулы. Именно это обстоятельство, наряду с быстрой изменчивостью, привело к выбору мтДНК в качестве объекта исследования более 30 лет назад. В 1980 г. американский исследователь Уэсли Браун опубликовал работу, в которой была проанализирована мтДНК у 21 ин-

дивида. Эти индивиды представляли различные расовые и географические группы: в выборку были включены люди из США, Филиппин, Египта и Китая. При этом для анализа было использовано 18 эндонуклеаз рестрикции, а мишенью для них выступала мтДНК целиком [6]. Таким образом, эта работа, проведенная еще до изобретения по-лимеразной цепной реакции, достаточно сильно отличается от тех подходов к использованию мтДНК, которые повсеместно применяются в современных ПЦР лабораториях. Однако это первая подобная работа по мтДНК, и потому ее значение для современных исследований сложно переоценить. Интересно, что на основе этих данных уже тогда была проведена попытка рассчитать время, когда популяция человека испытала существенное сокращение численности. По данным Брауна это произошло 180000 лет назад [6].

Подлинный переход к тому, что мы сегодня называем филогенетическим анализом мтДНК, произошел позже, когда в 1992 и 1993 гг. вышли работы итальянского исследователя Антонио Торрони, в которых было проведено изучение коренных народов Америки. В 1992 г. на основе ре-стрикционного анализа было выделено четыре кластера гаплотипов [7]. Уже через год эти результаты были дополнены данными, полученными в результате секвенирования D-петли мтДНК (341 пн), и использован термин "гаплогруппа" по отношению к выделенным в 1992 г. кластерам (или группам) гаплотипов [8]. Именно этой работе мы обязаны тому универсальному принципу классификации, который сегодня используется в работах по анализу филогенетической структуры популяций мира с использованием не только мтДНК, но и У-хромосомы [9]. К настоящему времени с помощью анализа гаплогрупп мтДНК были выявлены некоторые важные аспекты ранней истории человечества. Так, согласно современным представлениям, наименее удаленный общий предок человека по женской линии ("митохондриальная Ева") обитал в Африке южнее Сахары, выход откуда, как ранее считалось, произошел около 50000—65000 лет до н.э. [9, 10]. В настоящий момент, однако, имеются свидетельства того, что выход из Африки произошел раньше — 70000— 50000 лет до н.э. [11]. Изучение гаплогрупп мтДНК позволило выявить пути заселения континентов, а также изучить множество частных вопросов истории и генетических взаимоотношений локальных этнических групп мира [9, 10, 12— 18]. В качестве примеров можно привести работы по изучению гаплогрупп мтДНК Восточной Азии. Так, подробный анализ гаплогрупп С и D мтДНК в работе Деренко с соавт. [19] указывает на присутствие их наиболее древних линий в Восточной Азии, в то время как большинство североазиатских вариантов этих гаплогрупп начало распространяться после Последнего ледникового

максимума, что позволило сделать вывод о послеледниковой реколонизации Северной Азии. В работе Федоровой с соавт. [20] было показано, что возраст достаточно большого количества гаплогрупп мтДНК популяции якутов (C4a1c, C4a1d, C4a2, C4b1, C4b3, C5b1a, D4i2, D4j2, D4j4, D4j5, D4j8, D4o2) приходится на сибирский неолит, что указывает на важную роль неолитических экспансий в Южную Сибирь и последующих миграций в Якутию в становлении существенной части митохондриального пула этого региона. С другой стороны, анализ некоторых других гаплогрупп мтДНК (D5a2a2, M13a1b, A8, G2a5), наряду с анализом Y-хромосомы, выявил для якутов общие генетические черты с монгольскими популяциями (бурятами, хамниганами, монголами), что согласуется с гипотезой о происхождении якутов от древней тюркоязычной общности курыкан.

В течение достаточно долгого времени основным источником информации о филогенетической структуре мтДНК был анализ гипервариабельного сегмента 1 (ГВС1) и отдельных локусов контрольного региона. При этом направленность мутаций отсчитывалась относительно так называемой обновленной Кембриджской референтной последовательности (Cambridge reference sequence, или rCRS), которая является последовательностью, определенной у современного человека [21, 22]. Это вызывало некоторые сложности и путаницу в интерпретации данных, особенно в медико-генетических исследованиях, поскольку выбор в качестве точки отсчета современной ДНК не позволял определить, какой из аллелей является предковым. Именно поэтому в 2012 г. была предложена новая точка отсчета, полученная в результате реконструкции на основе данных по 18843 полным митохондриальным последовательностям и определенная как Реконструированная референтная последовательность человека (Reconstructed Sapiens Reference Sequence, RSRS) [23]. Поскольку в результате введения RSRS изменилась система отсчета с перенесением начала координат в филогенетически более обоснованную позицию, эта переоценка была названа авторами "коперниковской". Сравнение позволяет более наглядно оценить ее необходимость. Так, при использовании rCRS в качестве эталона, сама эта референтная последовательность формально не имеет мутаций, в то время как по последней классификации обладатели rCRS относятся к гаплогруппе H2a2a1 и только по филогенетически информативным позициям имеют мутации в 49 позициях кодирующего и контрольного региона (таблица) [23, 24].

Следует отметить, что в работе [23], в которой в качестве точки отсчета была предложена RSRS, также впервые были опубликованы 8216 полных последовательностей мтДНК дополнительно к уже имеющимся, что позволило довести филоге-

Филогенетически информативные мутации в rCRS относительно RSRS в кодирующем и контрольном регионе мтДНК [21]. При использовании rCRS в качестве точки отсчета они формально отсутствуют

Мутации

в кодирующем регионе в контрольном регионе

G73A, С146Т, С152Т, С195Т, A247G, G263A, G750A, A16129G, Т16187С, С16189Т, Т16223С, G16230A,

A769G, A825T, A1018G, G1438A, G2706A, A2758G, Т16278С, С16311Т

С2885Т, Т3594С, G4104A, Т4312С, G4769A, Т7028С,

G7146A, Т7256С, A7521G, Т8468С, Т8655С, G8701A,

G8860A, С9540Т, G10398A, Т10664С, A10688G,

С10810Т, С10873Т, С10915Т, A11719G, A11914G,

Т12705С, G13105A, G13276A, Т13506С, Т13650С,

Т14766С, G15326A

нетическое разрешение древа мтДНК до беспрецедентного уровня. В самом деле, небольшой размер мтДНК (всего 16569 пн для RSRS) позволяет относительно легко анализировать полную последовательность, т.е. добиваться в каждом конкретном случае максимально возможного разрешения. Благодаря этой особенности современн

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком