научная статья по теме СТРУКТУРА И ЭВОЛЮЦИЯ ГЕНА MASMC4 ПОЛЕВКИ MICROTUS ARVALIS (ARVICOLIDAE, RODENTIA) Биология

Текст научной статьи на тему «СТРУКТУРА И ЭВОЛЮЦИЯ ГЕНА MASMC4 ПОЛЕВКИ MICROTUS ARVALIS (ARVICOLIDAE, RODENTIA)»

когезина, принимают участие в формировании пластинки кинетохора [18].

Гетородимер SMC1-SMC3 входит в состав комплексов рекомбинации и рекомбинационной репарации. Репарация повреждений, вызванных ультрафиолетовым и ионизирующим излучением, химическими мутагенами, происходит при участии гетеродимеров SMC5-SMC6 (см. обзоры [6-9, 13, 19-37]). Белки SMC2 и SMC4 обнаружены в составе инсуляторов дрожжей [38]. Конден-син-подобный комплекс нематод Caenorhabditis elegans участвует в репрессии генов половых хромосом [39-41].

Целью данной работы было исследование структуры и эволюции генов белков семейства SMC, в частности, подсемейства SMC4. Сравнительный генетический подход расширяет возможности обнаружения консервативных регуля-торных районов, которые могут быть выявлены при сравнении 5'-районов генов ортологов SMC4 у видов M. musculus, M. arvalis, R. norvegicus, H. sapiens. Хотя сравнительный анализ геномных последовательностей не дает однозначного ответа о роли консервативных нетранскрибируемых последовательностей, однако значительно сужает район поиска регуляторных элементов и упрощает последующую экспериментальную проверку.

МАТЕРИАЛЫ И МЕТОДЫ

Все методы, связанные со скринингом геномной библиотеки, выделением, очисткой, клонированием, амплификацией и сиквенсом ДНК, выполнялись по стандартным протоколам [42], а также, как описано ранее [43]. Компьютерный анализ последовательностей ДНК выполнен с помощью пакетов программ BLAST [44], FASTA [45].

Поиск гомологичных последовательностей ДНК проводили на сервере MapWier (http://www. ncbi.nlm.nih.gov/MapWier), BLAt (http://genome. ucsc. edu/cgi-bin/hgBlat), Encembl (http://encembl.org). Множественное выравнивание проводили с помощью програмы Clustal-X [46]. Анализ гомологии генов выполнялся программой PIPMaker и multiPIPMaker на сайте http://nog.sce.psu.edu/ multipipmaker. Последовательности ДНК генов с учетом гомологии на уровне аминокислот выравнивали с помощью программы BioEdit Sequense Alignment Editor [58]. Коэффициенты синонимичных и несинонимичных замен определяли программой K-estimator [47]. Выявление и анализ островков CpG проводили с помощью пакета программ EMBOSS (CpGPlot/CpGReport/Isochore) на сайте http://www.ebi.ac.uk/emboss. Потенциал связывания последовательности ДНК с нуклеосомой определяли программой Recon на сайте http://www. mgs.bionet.nsc.ru/mgs/programs/recon. Поиск потенциальных сайтов связывания факторов тран-

скрипции в промоторных областях генов проводили с помощью программы TESS (http://www. cbil.upenn.edu) в базе данных Transfac 4.0. Филогенетический футпринт in silico потенциальных сайтов связывания факторов транскрипции в выравненных промоторных областях ортологичных генов выполняли программой FootPrint v1.0 на сайте http://compel.bionet.nsc.ru/FunSite/footprint/ FootPrint.html.

РЕЗУЛЬТАТЫ

Ранее была определена последовательность ДНК гена SMC4 полевки M. arvalis, в которой отсутствовали данные о структуре промоторной области и двух первых экзонов [43]. В данной работе были выявлены недостающие фрагменты гена, которые зарегистрированы в базе данных EMBL (AM236222), проведен детальный анализ особенностей структуры и эволюцонный статус отдельных доменов белков суперсемейства SMC на примере гена SMC4.

Организация генов SMC4 мыши, крысы и человека

Ортологичные гены, кодирующие белки семейства SMC4 у мыши, крысы, полевки и человека, состоят из 24 экзонов, рамка считывания начинается в экзоне 2. Анализ первичной структуры генов семейства белков SMC4 у четырех видов с помощью программы PIPMaker выявил значительную гомологию экзонов генов. Экзон-ин-тронная структура гена SMC4 у мыши, крысы, полевки и человека консервативна. Сохранены все экзоны и фазы рамки считывания в них, соответствующие экзоны 3-24 исследуемых видов имеют одинаковые размеры.

Гены SMC4-белков локализуются на хромосомах человека, мыши и крысы в синтенных группах. Данные по цитологической локализации и позиции генов SMC4 на нуклеотидных картах хромосом человека, мыши и крысы были получены на сервере NCBI, BLAT и суммированы в табл. 1.

Мы оценили процент дивергенции и значение Ka/Ks для ортологичных пар генов SMC4 у мыши, крысы и человека. Значения Ks (количество синонимичных замен на общее число синонимичных сайтов) и Ka (количество несинонимичных замен на общее число несинонимичных сайтов) зависят от эволюционного времени и давления отбора. Степень давления отбора отображает отношение Ka/Ks (см. табл. 2). По данным MGSC (Mouse Genome Sequence Consortium), среднее значение отношения Ka/Ks для экзонов ортологичных генов составляет 0.115. Если гены подвержены сильному давлению стабилизирующего отбора, то значение Ka/Ks составляет меньше, чем 0.060, если слабому - то больше, чем 0.150 [48].

СТРУКТУРА И ЭВОЛЮЦИЯ ГЕНА MaSMC4 ПОЛЕВКИ Таблица 1. Характеристика генов белков SMC у человека, мыши и крысы

Ген Организм Цитологическая локализация Позиция на физической карте, Мпн Размер гена, пн Количество экзонов CpG-островок

SMC1L1 (а) H. sapiens M. musculus R. norvegicus M. arvalis Хр11.22 XF2 Xq31 Х 51.1 129 63.8 44016 46838 44586 25 25 25 + + +

SMC1L2(e) H. sapiens M. musculus R. norvegicus 22q13 15 7 44.0 85.3 111.6 69012 67259 61678 24 25 23 + + +

SMC2 H. sapiens M. musculus 9q31 4B1 98.6 51.3 45332 46592 25 25 + +

SMC3 H. sapiens M. musculus R. norvegicus 10q25 19D2 1q55 111.5 53.6 274.3 36909 44021 44282 29 29 27 + + +

SMC4 H. sapiens M. musculus R. norvegicus M. arvalis 3q25 3Е2 2q31 21q8-q9 150 69 150.8 34158 28317 27096 32000 24 24 24 24 + + + +

SMC5 H. sapiens M. musculus R. norvegicus 9q21.11 19B 1q52 64.7 22.8 246.7 93432 65233 68145 23 23 23 + + +

SMC6 H. sapiens M. musculus R. norvegicus 2p24.3 12A1 ? 6q14 17.8 11.4 27.5 88408 53116 ? 27 27 ? + + +

Среднее значение Ка/К для кодирующих районов генов БМС4 равно 0.123. Дивергенция аминокислотных последовательностей генов БМС4 варьирует от 4.7% между генами мыши и крысы до 25% между генами крысы и шпорцевой лягушки. Анализ нуклеотидных и аминокислотных замен в гене БМС4 показал, что наименее консервативным является экзон 2, и его размер варьирует у исследуемых видов.

Степень дивергенции последовательностей ДНК второго экзона генов ДНК колеблется от 10% между генами БМС4 крысы и мыши до 56.4% между генами мыши и шпорцевой лягушки (5.6 и 17.7% соответственно для полной последовательности мРНК). Среднее значение отношения Ка/К экзона 2 гена БМС4 (для генов полевки, крысы, мыши, человека и шпорцевой лягушки), равное 0.715, свидетельствует об очень слабом действии стабилизирующего отбора на данный участок гена.

Среднее значение Ка/К для области экзонов 3-24 гена БМС4 в парах генов полевки, мыши, крысы, человека и шпорцевой лягушки составляет 0.111. Отношение Ка/К между генами БМС4 (экзоны 3-24) эволюционно далеких видов полев-

ки и шпорцевой лягушки составляет 0.093, у человека и шпорцевой лягушки Ka/Ks = 0.088. Эти данные свидетельствуют о значительном давлении стабилизирующего отбора на экзоны 3-24 гена SMC4 в ходе эволюции.

Была проанализирована степень консервативности последовательностей ДНК, кодирующих определенные домены белка SMC4 (см. табл. 2). Среднее значение Ka/Ks = 0.025 для ДНК С-гло-булярного домена, содержащего характерный мотив ДА-бокса белков SMC. Высокая степень консервативности С-глобулярного домена определена его функциональной значимостью и, очевидно, связана с наличием WalkerB АТФазного сайта в составе ДА-бокса. Наименее консервативным участком гена SMC4 является район, кодирующий второй спиральный домен, прилегающий к С-глобулярному домену. Среднее значение Ka/Ks = 0.173. Функциональное значение "спиральных" фрагментов белка SMC определяется их вторичной структурой и наличием гептадных повторов для формирования спираль-спиральных взаимодействий доменов в гетеродимере белков SMC.

Таблица 2. Среднее значение Ka/Ks для экзонов и доменов генов, подверженных действию стабилизирующего отбора

Последовательность ДНК Ka/Ks Дивергенция, %

Экзоны (MGSC), действие 21.5%

стабилизирующего отбора

среднее 0.115

высокое <0.06

слабое >0.15

SMC4 экзоны 2-24* 0.123 5.6-28

SMC4 экзон 2 0.715 10.0-55.7

SMC4 экзоны 3-24 0.111 5.6-27.0

Домены (MGSC)

каталитические 0.033

некаталитические 0.068

SMC4 "N-конец"** 0.083

SMC4 "спираль № 1" 0.121

SMC4 "шарнир" 0.133

SMC4 "спираль № 2" 0.173

SMC4 "С-конец" 0.025

* Среднее значение Ka/Ks для пар ортологичных генов SMC4 полевки, мыши, крысы, человека, шпорцевой лягушки. ** В расчетах не учитывался экзон 2.

Участки интронов генов SMC4 исследуемых видов также имеют значительный процент гомологии нуклеотидных последовательностей, например, у генов мыши и крысы он составляет 79%. Дивергенция последовательностей интро-

нов шла, по-видимому, как за счет нейтральной эволюции, так и за счет инсерций мобильных элементов. Наиболее представлены в генах SMC4 исследуемых видов повторы ДНК класса SINE (В1-В4, Alu, MIR). Процесс встраивания в интроны мобильных элементов более интенсивно проходил у грызунов, что видно на рис. 1, где приведены структуры генов белка SMC4 человека, мыши и крысы. Как видно из табл. 3 и рис. 1, интроны гена SMC4 человека менее насыщены мобильными элементами, чем интроны грызунов. В интро-не 13 гена белка SMC4 человека присутствует значительный фрагмент LINE1 (1750 пн) элемента, который у грызунов представлен в еще более редуцированном, фрагментарном и перестроенном виде (100 пн в 13-м интроне мыши и крысы, 526 и 370 пн в 13-м интроне полевки).

Анализ 5'-области гена SMC4 у полевки, мыши, крысы и человека

Гены SMC4 у полевки, человека, мыши и крысы содержат в 5'-области островки CpG, которые простираются в область интрона 2 (рис. 1, 2). Результаты анализа генов SMC4 с помощью пакета программ EMBOSS (CpGPlot/CpGReport/Isochore) приведены на рис. 2. Островки CpG в промотор-ной области и первых экзонов характерны для генов домашнего хозяйства с высоким конститутивным уровнем экспрессии. Промоторы генов домашнего хозяйства в составе островков CpG, как правило, характеризуются наличием инициатор-ной последовательности INR в обла

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком