научная статья по теме МЕТАГЕНОМИКА КАК ИНСТРУМЕНТ ИЗУЧЕНИЯ “НЕКУЛЬТИВИРУЕМЫХ” МИКРООРГАНИЗМОВ Биология

Текст научной статьи на тему «МЕТАГЕНОМИКА КАК ИНСТРУМЕНТ ИЗУЧЕНИЯ “НЕКУЛЬТИВИРУЕМЫХ” МИКРООРГАНИЗМОВ»

ГЕНЕТИКА, 2015, том 51, № 5, с. 519-528

ОБЗОРНЫЕ И ТЕОРЕТИЧЕСКИЕ СТАТЬИ

УДК 579.252

МЕТАГЕНОМИКА КАК ИНСТРУМЕНТ ИЗУЧЕНИЯ "НЕКУЛЬТИВИРУЕМЫХ" МИКРООРГАНИЗМОВ

© 2015 г. Н. В. Равин1, 2, А. В. Марданов1, К. Г. Скрябин1,2

Центр "Биоинженерия" Российской академии наук, Москва 117312

e-mail nravin@biengi.ac.ru 2Московский государственный университет им. М.В. Ломоносова, кафедра биотехнологии, Москва 119234 Поступила в редакцию 20.11.2014 г.

Некультивируемые микроорганизмы представляют большую часть биоразнообразия на Земле. В природных экосистемах не более 0.1—1% составляют микроорганизмы, культивируемые в лабораторных условиях. Поэтому необходимы новые методические подходы для выявления и описания некультивируемых микробов, изучения генетического разнообразия и структуры микробных сообществ, понимания их экологической роли в биосфере. Метагеномика как независимый от культивирования метод анализа коллективного генома микробного сообщества позволяет ответить на фундаментальные вопросы микробиологии и экологии микроорганизмов. Другим продуктивным методом анализа некультивируемых микроорганизмов является "геномика единичных клеток" — выделение из микробных сообществ отдельных клеток и секвенирование их геномов. Разработанные в последнее десятилетие высокопроизводительные технологии секвенирования нового поколения вносят решающий вклад в решение задач реконструкции геномов всех микроорганизмов, присутствующих и взаимодействующих в экосистемах. В обзоре рассмотрены основные методические подходы, используемые при проведении метагеномного анализа микробных сообществ, а также успехи, достигнутые с их помощью в области поиска новых некультивируемых микроорганизмов, расшифровки их геномов и выяснения их роли в экосистемах.

DOI: 10.7868/S0016675815050069

ЗАДАЧИ МЕТАГЕНОМИКИ

Как правило, получение чистой культуры является первым шагом при изучении нового микроорганизма. Однако стандартные культуральные методы позволяют охарактеризовать не более 0.1—1% разнообразия микроорганизмов в большинстве природных экосистем [1]. Хотя в последние годы были достигнуты значительные успехи в разработке методов культивирования ранее "некультивируемых" микроорганизмов, независимые от культивирования молекулярные методы в любом случае необходимы для характеристики сотен—тысяч видов, присутствующих в природных экосистемах.

Новым этапом в экологии микроорганизмов стало применение методов секвенирования нуклеиновых кислот как способа описания некультивируемых бактерий. Первым примером стала опубликованная 30 лет назад работа по секвени-рованию клонированных генов 58 рРНК, полученных из библиотеки кДНК симбиотического микробного сообщества кольчатого червя ЩИа раекурШа [2]. Однако наибольший вклад в изучение природного разнообразия микроорганизмов внесли методы, основанные на ПЦР амплификации и секвенировании последовательностей генов 168 рРНК. Так, анализ 168 рРНК, выделен-

ных из термальных источников, морской воды и донных осадков, почв, позволил идентифицировать несколько десятков новых филогенетических линий высокого таксономического уровня у бактерий и архей [3—5]. Обнаружение этих новых групп микроорганизмов стимулировало работы по культивированию их представителей для последующего микробиологического, биохимического и геномного анализа. Однако для некоторых видов микроорганизмов получение чистых культур оказалось невозможным, в этих случаях основным инструментом их исследования становится расшифровка и анализ геномов. Когда Woese [6] впервые предложил универсальную систему филогении живых организмов, на основе 16S рРНК, были известны 12 филумов (phylum, таксон высшего ранга, иногда в русскоязычной литературе обозначается как "тип") прокариот, для каждого из которых были известны культивируемые представители. В последующие годы было описано около 20 других филумов, имеющих культивируемых представителей. Однако анализ последовательностей генов 16S рРНК из природных экосистем позволил предложить еще около 50 "кандидатных" филумов, для которых в настоящее время нет культивируемых представителей [7]. Таким образом, более половины известных

филумов бактерий и архей не имеют культивируемых представителей и остаются неохарактеризо-ванными с помощью методов классической микробиологии и биохимии.

Метагеномика, известная также как "экологическая геномика", предполагает анализ "суммарной" ДНК исследуемого сообщества [8]. Преимуществом метагеномики является ее универсальная применимость для анализа любого сообщества, из которого можно выделить необходимое количество ДНК. Функциональная метагеномика базируется на скрининге клональных экспрессионных библиотек с целью поиска генов с определенными функциями. Структурная метагеномика включает биоинформационный анализ данных, полученных при секвенировании метагеномной ДНК [9—11]. Первый подход, хотя и позволяет открывать новые гены, даже не имеющие сходства с уже известными, фокусируется на поиске отдельных функций, а не на описании целого сообщества. В настоящем обзоре основное внимание будет уделено метаге-номным исследованиям, предполагающим секве-нирование для выявления новых таксонов и анализа всего метагенома сообщества.

Целью любого проекта по метагеномному секве-нированию является характеристика микробного сообщества, позволяющая ответить на два основных вопроса, — "какие микроорганизмы в нем присутствуют" и "что каждый из них делает" [10]. Для этого необходимо определить: 1) состав сообщества, т.е. какие виды в нем присутствуют и в каком количестве; 2) генетический потенциал каждого члена сообщества; 3) внутривидовую и внутрипопу-ляционную гетерогенность генов. Конечной целью является полная реконструкция геномов всех микроорганизмов сообщества. Однако решение этих задач в большинстве случаев затруднено вследствие технических ограничений в выделении ДНК из всех микроорганизмов, а также в возможностях секве-нирования и анализа его результатов.

ПРОФИЛИРОВАНИЕ МИКРОБНЫХ СООБЩЕСТВ

Первоначально попытки ответить на вопрос о том, какие микроорганизмы присутствуют в сообществе, основывались на идентификации видов по последовательностям генов рибосомной РНК, определяемым в результате секвенирова-ния ампликонов 168 рРНК, анализа с помощью микрочипов [12] или электрофоретических методов (DGGE и T-RFLP). Каждый из этих методов имеет свои ограничения и все они основываются на наличии известного представительного набора ре-ференсных последовательностей 168 рРНК.

Методически сходный с профилированием по 168 РНК подход может быть использован для "функционального" профилирования сообществ,

т.е. идентификации генов определенных семейств. Как и в предыдущем случае, эта цель может быть достигнута либо с помощью микрочиповых методов [13], либо в результате секвенирования ампликонов, полученных с использованием "консервативных" праймеров на соответствующее семейство генов [14]. Строго говоря, эти подходы не являются метагеномными, поскольку не позволяют получить информацию о других имеющихся в сообществе генах, помимо амплифицированных.

МЕТОДЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ СЕКВЕНИРОВАНИЯ МЕТАГЕНОМОВ

Принцип анализа ДНК, выделенной прямо из природного источника, был предложен в работе Pace et al. [15] и применен для поиска генов 16S РНК в библиотеке геномной ДНК из морской воды [16]. В последующие два десятилетия использование метагеномных подходов расширялось по мере развития технологий геномного секвениро-вания. Например, в работе 1996 г. [17] были представлены результаты секвенирования фрагмента ДНК длиной 40 тпн, принадлежащего некульти-вируемой морской архее, что стало серьезным достижением того времени. Уже в 2004 г. группой Venter [18] было проведено крупномасштабное секвенирование метагенома воды Саргассова моря, при котором были получены неповторяющиеся нуклеотидные последовательности общей длиной около одного миллиарда нуклеотидов.

Разработка технологий секвенирования нового поколения (NGS) позволила проводить метаге-номные исследования сложных микробных сообществ с меньшими затратами и большим объемом прочтенных нуклеотидных последовательностей, чем при использовании Сэнжеровского секвенирования. Эти новые возможности секвенирования успешно использованы для характеристики сложных по составу сообществ, таких как микробиом человека и животных (например, микробиоты кишечника термитов [19] и человека [20], слюны [21], рубца коровы [22]), микробные сообщества почв, морской воды и донных осадков [10].

Новые технологии секвенирования, используемые в метагеномике, имеют свои достоинства и недостатки, которые необходимо учитывать при анализе полученных результатов. Большой объем данных при короткой длине чтения индивидуальных реакций секвенирования ("reads") ставит вопрос о способе анализа этих данных в целях "максимизации" научного значения результатов. Метод пиросеквенирования (454/Roche) [23], позволяющий получать чтения длиной 600—700 н (как и при Сэнжеровском секвенировании), активно используется для секвенирования ампликонов 16S рРНК и полных метагеномов. Более высокопроизводительные платформы Illumina и SOLiD могут обеспечить получение большего

Рис. 1. Схема проведения метагеномного анализа.

объема данных, однако получаемые индивидуальные чтения очень короткие (35—150 н), что усложняет их анализ, а также de novo сборку геномов на основе данных метагеномного секве-нирования. Перспективной технологией для ме-тагеномного секвенирования может стать мономолекулярное секвенирование, реализованное компанией Pacific Biosciences [24] и позволяющее получать чтения длиной несколько тысяч нуклео-тидов (прибор PacBio RS II).

АНАЛИЗ МЕТАГЕНОМНЫХ ДАННЫХ

В целях приближения к наиболее полной реконструкции геномов анализ данных секвениро-

вания проводят по двум взаимосвязанным и взаимодополняющим направлениям (рис. 1): 1) сборка отдельных чтений в контиги, для которых проводятся таксономическая классификация и предсказание функций найденных в контигах генов; 2) функциональная и таксономическая характеристика сообщества в результате анализа отдельных чтений.

При сборке метагеномных последовательностей в контиги су

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком