научная статья по теме ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ α-ГАЛАКТОЗИДАЗ СЕМЕЙСТВА GH27 Биология

Текст научной статьи на тему «ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ α-ГАЛАКТОЗИДАЗ СЕМЕЙСТВА GH27»

МОЛЕКУЛЯРНАЯ БИОЛОГИЯ, 2004, том 38, № 3, с. 463-476

БИОИНФОРМАТИКА

УДК 575.152.321:575.852:577.124.2

ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ а-ГАЛАКТОЗИДАЗ

СЕМЕЙСТВА GH27

© 2004 г. Д. Г. Наумов*

Государственный научный центр Российской Федерации "ГосНИИгенетика", Москва, 117545

Поступила в редакцию 21.10.2003 г.

На основе анализа аминокислотных последовательностей а-галактозидаз и других белков семейства GH27 гликозилгидролаз в его составе выделено три основных подсемейства (27a-27c). Особое положение занимает уникальная изомальтодекстраназа из Arthrobacter globiformis. Эукариотичес-кие белки образуют на филогенетическом древе семейства пять кластеров. Бактериальные представители семейства GH27 относительно немногочисленны и не образуют на древе стабильных кластеров. Использование родственных белков из семейства GH36 гликозидаз позволило доказать мо-нофилетическое происхождение семейства GH27. Обсуждается строение активного центра и эволюция а-галактозидаз.

Ключевые слова: а-галактозидазная активность, мелибиаза, гликозилгидролаза, утилизация углеводов, семейство белков, филогенетическое древо белков, классификация ферментов, эволюция, множественное выравнивание последовательностей, горизонтальный перенос.

Гликозилгидролазы (гликозидазы или карбо-гидразы) - это группа ферментов [К.Ф. 3.2.1], катализирующих гликолитическое расщепление O-гликозидной связи. Их принято относить к ката-болическим ферментам углеводного обмена, и в течение многих десятилетий они являются объектами разнообразных биохимических исследований [1-4].

Все известные гликозилгидролазы объединены в 90 семейств на основании гомологии их аминокислотных последовательностей (http://afmb.cnrs-mrs.fr/CAZY/). Родственные семейства образуют кланы: 46 семейств включены в состав 14 кланов (GH-A - GH-N). Многие гликозидазы состоят из двух и более доменов независимого происхождения, часть из которых может не иметь энзиматиче-ских активностей, участвуя в связывании субстрата или выполняя другие функции. В таких случаях каждый каталитический домен классифицирован независимо. К одному семейству и даже клану традиционно относят только гликозидазы, имеющие одинаковый механизм гидролиза гликозид-ной связи: с сохранением (retaining) или обращением (inverting) ее оптической конфигурации в процессе катализируемой реакции.

Установление общности эволюционного происхождения позволяет выявлять группы белков-гомологов более высокого иерархического ранга, чем клан. Например, нами ранее обнаружено фуранозидазное (Р-фруктозидазное) суперсемейство, объединяющее кланы GH-F (семейства

Эл. почта: daniil-naumoff@yahoo.com

GH43 и GH62) и GH-J (семейства GH32 и GH68), каждое из которых характеризуется различным механизмом гидролиза (с обращением и сохранением оптической конфигурации субстрата соответственно) [5-9].

а-Галактозидазы, или мелибиазы [К.Ф. 3.2.1.22], - это гликозидазы, способные отщеплять, с сохранением их оптической конфигурации, терминальные нередуцирующие остатки а-D-галактозы от a-D-галактозидов, в том числе от галактоолигосахаридов, галактоманнанов и га-лактолипидов. В ряде случаев у мелибиаз обнаружена трансгалактозидазная активность [10-14]. На основании гомологии аминокислотных последовательностей а-галактозидазы относятся к четырем семействам гликозилгидролаз: GH4, GH27, GH36 и GH57. Семейства GH4 и GH57 состоят, главным образом, из ферментов с другими глико-зидазными активностями. Большинство известных а-галактозадаз принадлежит к семействам GH27 и GH36, которые образуют клан GH-D (ht-tp://afmb.cnrs-mrs.fr/CAZY/). При изучении двух представителей семейства GH27 - a-N-ацетилга-лактозаминидазы [К.Ф. 3.2.1.49] курицы Gallus gallus [15] и а-галактозидазы риса Oryza sativa [16] - недавно получены данные об их трехмерной структуре. Эти белки состоят из N-концевого каталитического домена в виде (Р/а)8-бочонка (TIM barrel-type structure) и C-концевого домена, состоящего из восьми антипараллельных Р-слоев (P-sandwich fold, Greek key motif). При анализе аминокислотных последовательностей обнаружена гомология между (Р/а)8-доменом гликози-

даз семейства GH27 и гликозидазами семейств GH31 и GH36 [8, 17-19], что позволило нам объединить эти три семейства в а-галактозидазное суперсемейство [17, 19]. Филогенетический анализ показал, что семейство GH36 является полифиле-тическим и в его составе можно выделить четыре подсемейства, 36A-36D, в то время как семейство GH27 монофилетично [19]. В настоящей работе проведено сравнительное исследование последовательностей а-галактозидаз и других гликози-даз, образующих семейство GH27.

АНАЛИЗ ДАННЫХ

В работе анализировали аминокислотные последовательности белков, хранящиеся в базе данных NCBI (http://www.ncbi.nlm.nih.gov/). Каждому из исследуемых белков присвоено уникальное де-вятибуквенное название (согласно номенклатуре, применяемой в базе данных SWISS-PROT; http://cn.expasy.org/sprot/). Список белков представлен в таблице. Для поиска белков-гомологов а-га-лактозидаз использовали программы PSI-BLAST и Genomic BLAST pages (http://www.ncbi.nlm.nih.gov/ BLAST/). При скрининге базы данных с помощью программы PSI-BLAST использовали пороговое значение величины Е (E-value) для включения последовательности в следующую итерацию, равное 0.01 или 0.001. Множественные выравнивания аминокислотных последовательностей проводили вручную в программе-редакторе BioEdit (http://www.mbio.ncsu.edu/BioEdit/bioedit.html), при этом учитывали результаты попарных выравниваний с помощью PSI-BLAST и Genomic BLAST. Результаты множественного выравнивания (после удаления наиболее вариабельных участков последовательностей) использовали для построения филогенетических деревьев с помощью программ PROTPARS (метод максимальной экономии, Protein Sequence Parsimony method, MP) и NEIGHBOR (метод ближайших соседей, Neighbor-Joining method, NJ) из пакета PHYLIP (http://evolution.gs.washington.edu/phylip.html). Статистическую надежность узлов оценивали с использованием бутстреп-анализа (по 1000 псевдореплик для каждого древа). Программу TreeView Win32 (http://taxonomy.zoology.gla.ac.uk/rod/treeview.html) применяли для получения графических изображений деревьев. В работе использовали классификацию гликозилгидролаз на семейства и кланы, приведенную на сайте Carbohydrate-Active Enzymes server (http://afmb.cnrs-mrs.fr/CAZY/) и классификацию живых организмов - на сайте NCBI Taxonomy Homepage (http://www.ncbi.nlm.nih.gov/Taxonomy/).

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Белки, представленные в списке семейства GH27 на сайте Carbohydrate-Active Enzymes server,

были использованы для скрининга полной базы данных аминокислотных последовательностей GenPept на сайте NCBI. Полученная база данных гликозидаз семейства GH27 была пополнена за счет результатов виртуальной трансляции нукле-отидных последовательностей, обнаруженных путем скрининга геномных последовательностей с помощью программы Genomic BLAST. Нами также исследованы а-галактозидазы бактерии Pseudomonas fluorescens [20] и грибов Ganoderma lucidum [14], Penicillium simplicissimum [21] и Ther-momyces lanuginosus [22], не представленные в компьютерных базах данных аминокислотных последовательностей. В общей сложности обнаружено около 150 белков, принадлежащих семейству GH27. Из дальнейшего анализа исключали белки, имеющие высокую степень сходства (95% и более идентичных аминокислотных остатков), короткие фрагменты белков (частичные последовательности), а также два псевдогена, расположенные на хромосоме III дрожжей Schizosaccha-romyces pombe (GenBank, AL022243 и AL031825), псевдоген риса Oryza sativa (GenBank, AC092489) и фрагмент кДНК рыбы Danio rerio, содержащий несколько стоп-кодонов (GenBank, BE202113).

Множественное выравнивание полных последовательностей белков семейства GH27 (список представлен в таблице) показало, что все они содержат оба домена, характерных для этого семейства гликозидаз (исключение составляют лишь три энзиматически не охарактеризованных белка, один из которых выделен из гриба Aspergillus nidu-lans, а другие - из асцидий Ciona intestinalis и C. sav-ignyi, содержащих только N-концевой домен: AGL2_ASPNI, NAGA_CIOIN и NAGA_CIOSA соответственно). Каталитический N-концевой домен семейства GH27 более консервативен и в его составе можно выделить несколько высококонсервативных участков, шесть из которых представлены на рис. 1 (участки I-VI). Некоторые белки (как правило, из прокариот) содержат также дополнительные домены, которые нам удалось сгруппировать в восемь семейств на основе гомологии их последовательностей (рис. 2). Два из этих семейств известны как семейства углевод-связывающих модулей (Carbohydrate-Binding Module) CBM6 и CBM13, и каждый из этих модулей обнаружен нами в семи белках семейства GH27. Как показано ранее, домен CBM6 способен связываться с целлюлозой, ксиланом и Р-глюка-ном, а домен CBM13 - с маннозой и ксиланом. Энзиматически не охарактеризованный белок AGL4_MAGGR из гриба Magnaporthe grisea содержит в своей C-концевой части два дополнительных домена, представляющих семейство CBM1 углевод-связывающих модулей и семейство CE1 карбоэстераз. Модуль CBM1 характерен почти исключительно для белков грибов и отвечает за связывание с целлюлозой и хитином

ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ а-ГАЛАКТОЗИДАЗ СЕМЕЙСТВА ОИ27 Список белков, проанализированных в работе

Название белка1 Семейство, подсемейство2 Организм Фермент3 Длина белка4 Регистрационный номер5

MEL5_YEAST GH27a Saccharomyces cerevisiae CBS4411 а-ГАЛ 471 CAA85 740

MELP_YEAST GH27a Saccharomyces paradoxus 61-248 а-ГАЛ 471 CAA64759

MELD_YEAST GH27a Saccharomyces bayanus uvarum MCYC623 ОРС 471 AACA01000043*

MELX_YEAST GH27a Saccharomyces pastorianus NCYC396 а-ГАЛ 471 AAA34769

MELJ_YEAST GH27a Saccharomyces mikatae IFO1816 а-ГАЛ 471 CAA64760

MELT_YEAST GH27a Torulaspora delbrueckii IFO1255 а-ГАЛ 474 BAA86883

MELR_YEAST GH27a Zygosaccharomyces mrakii IFO1835 а-ГАЛ 470 BAA99555

MELC_YEAST GH27a Zygosaccharomyces cidri CBS5666 а-ГАЛ 469 AAA35280

MEL1_SACKL* GH27a Saccharomyces kluyveri IFO1685 а-ГАЛ 469 AB037406*, AACE01001029*, AACE01001587*

MEL4_SACKL GH

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком