научная статья по теме МНОЖЕСТВЕННЫЕ ГОРИЗОНТАЛЬНЫЕ ПЕРЕНОСЫ И ДУПЛИКАЦИИ ГЕНОВ – ИСТОЧНИК РАЗНООБРАЗИЯ -L-РАМНОЗИДАЗ У CLOSTRIDIUM METHYLPENTOSUM DSM5476 Биология

Текст научной статьи на тему «МНОЖЕСТВЕННЫЕ ГОРИЗОНТАЛЬНЫЕ ПЕРЕНОСЫ И ДУПЛИКАЦИИ ГЕНОВ – ИСТОЧНИК РАЗНООБРАЗИЯ -L-РАМНОЗИДАЗ У CLOSTRIDIUM METHYLPENTOSUM DSM5476»

МИКРОБИОЛОГИЯ, 2013, том 82, № 4, с. 408-416

УДК 575.852112:577.152.321:579.852.13

ЭКСПЕРИМЕНТАЛЬНЫЕ СТАТЬИ

МНОЖЕСТВЕННЫЕ ГОРИЗОНТАЛЬНЫЕ ПЕРЕНОСЫ И ДУПЛИКАЦИИ ГЕНОВ - ИСТОЧНИК РАЗНООБРАЗИЯ a-L-РАМНОЗИДАЗ У CLOSTRIDIUM METHYLPENTOSUM DSM5476

© 2013 г. Д. Г. Наумов1

Институт микробиологии им. С.Н. Виноградского Российской академии наук, Москва

Поступила в редакцию 15.10.2012 г.

a-L-Рамнозидазы — важная группа гликозил-гидролаз, представленная у многих организмов из самых разнообразных таксонов прокариот. На основании гомологии каталитических доменов все эти ферменты отнесены к семействам GH78 и GH106 гликозил-гидролаз. Однако геномы большинства прокариот не содержат гены, кодирующие белки этих двух семейств. Нами обнаружен и исследован уникальный геном Clostridium methylpentosum DSM5476, содержащий 83 гена белков этих двух семейств. Отсутствие гомологичных генов в секвенированных геномах большинства штаммов рода Clostridium указывает на важную экологическую роль этих генов, в частности, у C. methylpentosum. Проведенный филогенетический анализ продемонстрировал многочисленные горизонтальные переносы и дупликации соответствующих генов.

Ключевые слова: Clostridium methylpentosum, гликозил-гидролаза, a-L-рамнозидаза, семейство GH78, семейство GH106, эволюция белков, филогенетическое древо белков, горизонтальный перенос, дупликация генов, паралог.

DOI: 10.7868/S0026365613040083

a-L-Рамнозидазы (К.Ф. 3.2.1.40) — широко распространенная и промышленно значимая группа гликозил-гидролаз, ответственных за отщепление с нередуцирующего конца углеводов и их производных терминальных остатков a-L-рам-нозы [1—5]. На основании гомологии каталитических доменов почти все ферменты этой группы отнесены в классификации гликозил-гидролаз CAZy (Carbohydrate-Active enZymes) к семействам GH78 и GH106, при этом каких-либо других энзиматиче-ских активностей у белков этих двух семейств не обнаружено [6]. Однако ферменты из этих семейств несколько различаются по субстратной специфичности [7, 8]. Согласно базе данных CAZy, семейства GH78 и GH106 содержат 483 и 86 белков соответственно. При этом большинство полностью се-квенированных геномов прокариот не содержат генов, кодирующих белки этих двух семейств, в то время как некоторые геномы содержат по несколько паралогов [6]. Недавно проведенные нами сравнительные исследования a-L-рамнозидаз показали, что списки семейств GH78 и GH106, представленные на сайте CAZy, являются неполными. Общее число белков, содержащих ката-

1 Автор для корреспонденции (e-mail: damil_naumoff@yahoo. com).

литические домены белков этих семейств, в базе данных GenPept (раздел "non-redundant protein sequences"), согласно результатам скрининга с помощью программы blastp, по состоянию на конец августа 2012 г. составляло 1981 [9].

На материале штамма ATCC43829/DSM5476 в 1989 г. был описан новый вид Clostridium methyl-pentosum, выделенный из кишечника человека и характеризующийся необычной способностью ферментировать только пентозы и метилпентозы, включая L-рамнозу [10]. Это указывает на возможное наличие у него a-L-рамнозидазной активности. Недавно была депонирована геномная последовательность этого организма (GenBank, ACEC00000000.1), представленная в виде 146 кон-тигов. Проведенный нами анализ позволил выявить в ней 83 гена, кодирующих белки, содержащие домены, характерные для семейств GH78 и GH106 гликозил-гидролаз [11]. При этом подавляющее большинство секвенированных геномов бактерий рода Clostridium не кодируют белки семейств GH78 и GH106 [6]. Осталось неясным эволюционное происхождение генов гипотетических a-L-рамнозидаз C. methylpentosum DSM5476: появились ли они в результате небольшого числа горизонтальных переносов и последующих множественных дупликаций или же горизонтальные пере-

носы были многочисленными? В настоящей работе мы попытались найти ответ на этот вопрос.

РЕЗУЛЬТАТЫ

Семейство GH106 гликозил-гидролаз. Анализ аминокислотных последовательностей ранее обнаруженных нами [11] 46 белков C. methylpentosum, содержащих домен семейства GH106, показал, что три из них являются неполноразмерными белками. Два из этих трех (GenPept, EEG29402.1 и EEG29403.1) оказались двумя фрагментами одного и того же белка, ген которого прерван стоп-кодо-ном. Третий белок (EEG30591.1) может быть продлен путем выбора альтернативного старт-кодона. Соответствующие два белка были нами отредактированы, и для дальнейшего анализа использовались их "полноразмерные" версии.

Анализ одного из фрагментов (GenBank, ACEC01000062.1) геномной последовательности C. methylpentosum позволил нам выявить еще один потенциальный ген белка, содержащего домен семейства GH106 гликозил-гидролаз. На основе попарного сравнения вычисленных аминокислотных последовательностей (42% идентичности) удалось установить, что эволюционно наиболее близким к нему является ген CL0STMETH_00114 (GenPept, EEG32242.1). Обнаружение множественных стоп-кодонов в соответствующей потенциальной рамке считывания, а также протяженной деле-ции позволили сделать вывод о том, что это псевдоген. Однако соответствующий участок генома проаннотирован как содержащий два коротких гена: CL0STMETH_01918 (EEG30477.1) и CLOSTMETH_01919 (EEG30478.1). Из дальнейшего анализа этот псевдоген был исключен.

Для проведения филогенетического анализа было взято 343 белка, содержащих домен семейства GH106, в том числе 45 белков из C. methylpen-tosum. Деревья были построены с использованием алгоритмов ближайшего соседа (Neighbor-Joining Method, NJ; рис. 1) и максимальной экономии (Protein Sequence Parsimony Method, MP; рисунок не приводится). В основе алгоритма ближайшего соседа лежит многократное попарное объединение наиболее сходных последовательностей, а алгоритма максимальной экономии — требование наименьшего числа эволюционных изменений. В силу принципиальности различий, лежащих в основе этих двух алгоритмов, сходство топологий соответствующих деревьев свидетельствует об их вероятном соответствии реальным событиям, имевшим место в процессе эволюции. На обоих деревьях белки из C. methylpentosum оказались принадлежащими трем четко обособленным кластерам. В один из этих кластеров (с бутстреп-под-держкой 100 и 99% на NJ- и MP-деревьях соответственно; обозначен цифрой "1" на рис. 1) наряду с 38 белками C. methylpentosum попало по несколь-

ко белков из грибов-аскомицетов и актинобакте-рий, а также один белок из Lachnospiraceae bacterium (GenPept, EGN36798.1). Второй кластер (100% поддержки на обоих деревьях; обозначен цифрой "2" на рис. 1) содержит шесть белков из C. methylpentosum, а также белки ряда бактерий отдела Bacteroidetes. Третий кластер (81 и 96% поддержки на NJ- и MP-деревьях соответственно; обозначен цифрой "3" на рис. 1) содержит лишь один белок C. methylpentosum (EEG28461.1) наряду с белками из бактерий отделов Bacteroidetes и Proteobacteria.

Семейство GH78 гликозил-гидролаз. Попарное сравнение аминокислотных последовательностей ранее обнаруженных нами [11] 37 белков C. methylpentosum, содержащих домен семейства GH78, выявило, что 28 из них могут быть объединены в две группы близкородственных белков, каждая из которых появилась в результате дупликации предкового гена. Одна из этих групп содержит 22 белка C. methylpentosum. Филогенетический анализ этих 22 белков, а также 161 их близких гомолога показал, что все белки C. methylpentosum принадлежат кластеру из 49 белков, имеющему 94% (рис. 2; общий кластер на рисунке обведен пунктиром) и 89% (рисунок не приводится) бутстреп-поддержки на NJ- и MP-деревьях соответственно. В пределах этого кластера существуют один (обозначен цифрой "4" на рис. 2) и три ("1", "2" и "3") стабильных подкла-стера (не менее 80% поддержки на NJ- и MP-де-ревьях), образованных белками бактерий из отделов Actinobacteria и Bacteroidetes соответственно. Помимо этого, в состав данного кластера попали два белка из других бактерий отдела Firmicutes: Lachnospiraceae bacterium (GenPept, EGN42892.1) и Paenibacillus sp. (ACX65306.1).

Шесть белков C. methylpentosum второй группы вместе с 57 их близкими гомологами были использованы нами для построения еще одного филогенетического древа. При этом все белки C. methylpento-sum вместе с 33 белками из других организмов (главным образом, бактерий отдела Bacteroidetes) образовали стабильный кластер (100% поддержки) на NJ- (рисунок не приводится) и MP-деревьях (рис. 3).

Список остальных девяти белков C. methylpentosum, содержащих домен семейства GH78, а также информация об их ближайших гомологах представлены в таблице. При этом двое из этих белков (EEG28703.1 и EEG28728.1), имея 47% идентичности аминокислотных последовательностей, вероятно, появились в результате недавней дупликации предкового гена.

ОБСУЖДЕНИЕ

Гликозил-гидролазы хорошо известны как разнообразная и широко распространенная группа ферментов, представленная почти во всех живых организмах [6, 12]. Гены, кодирующие глико-зил-гидролазы, и их гомологи, составляют около 1% всех секвенированных генов. Однако относительное и абсолютное количество этих генов, а также набор энзиматических активностей у кодируемых ими белков варьируют в широких пределах даже у близкородственных микроорганизмов. Так, согласно базе данных CAZy [6], в геноме Flavobacteri-um johnsoniae UW101 (GenBank, CP000685.1) обнаружено 146 генов гипотетических гликозил-гидролаз (или 2.91% от всех белок-кодирующих генов), а у Flavobacterium psychrophilum JIP02/86 (AM398681.1) — только 9 генов (0.37%); у Mycoplasma fermentans JER (CP001995.1) - 8 генов (1.00%), а у Mycoplasma bovis Hubei-1 (CP002513.1) — ни одного. Подобная картина объясняется большой ролью дупликаций, элиминаций и горизонтального переноса в эволюции генов гликозил-гидролаз практически во всех таксономических группах живых организмов и обусловливается, в первую очередь, особенностями занимаемых ими экологических ниш.

В настоящее время доступны геномные последовательности нескольких тысяч видов прокариот. Это открывает возможность определения распространенности и представленности любого гена среди организмов различных таксонов. Actinobacte

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком