научная статья по теме ИССЛЕДОВАНИЕ ЭВОЛЮЦИИ НЕКОДИРУЮЩИХ РНК В ГЕНОМЕ DROSOPHILA MELANOGASTER Биология

Текст научной статьи на тему «ИССЛЕДОВАНИЕ ЭВОЛЮЦИИ НЕКОДИРУЮЩИХ РНК В ГЕНОМЕ DROSOPHILA MELANOGASTER»

БИОФИЗИКА, 2015, том 60, вып. 5, с. 906-913

МОЛЕКУЛЯР НАЯ БИОФИЗИКА

УДК 577.3

ИССЛЕДОВАНИЕ ЭВОЛЮЦИИ НЕКОДИРУЮЩИХ РНК В ГЕНОМЕ Drosophila melanogaster

© 2015 г. Е.В. Журавлева, А.А. Миронов

Факультет биоинженерии и биоинформатики Московского государственного университета им. М.В. Ломоносова, 119234, Москва, ГСП-1, Ленинские горы, 1/73;

Институт проблем передачи информации им. А .А. Xаркевича РАН, 127051, Москва, Большой Каретный переулок, 19/1 Email: zhuravlka@mail.ru Поступила в p едакцию 16.07.15 г.

Известно, что некодирующие РНК являются важными p егулято рными молекулами клетки и функционируют за счет определенной вторичной структуры. Вторичная структура молекул, определяемая последовательностью некодирующих РНК, может быть представлена такими элементами вторичной структуры, как петли, стебли, псевдоузлы. Каждый локальный участок молекулы РНК, как и вся молекула, стремится к достижению структуры с наименьшей свободной энергией. Новые мутации могут изменить свободную энергию структуры и, таким образом, изменить оптимальную структуру молекулы, что может привести к изменению функциональности. Вероятность того, что замена нуклеотида приведет к изменению структуры молекулы, определяется тем, в каком элементе структуры произошла мутация. В предыдущих исследованиях были показаны различные значения по дивергенции в спаренных и неспаренных участках, что объясняется отбором на поддержание вторичной структуры некодирующих РНК. Выявление более тонких эволюционных различий в петлях и стеблях, а также р асширенный анализ, проведенный во всех наиболее значимых классах некодирующих РНК, может представлять интерес для разработки алгоритмов по поиску генов некодирующих РНК в геномах. В этой работе рассмотрен отбор в петлях и стеблях пяти основных классов некодирующих РНК генома Drosophila melanogaster.

Ключевые слова: нкРНК, вторичная структура, эволюция нкРНК.

Некодирующие РНК (нкРНК) - это РНК, которые не транслируются в белок. Некодирующие РНК являются важными функциональными молекулами, которые принимают участие во множестве клеточных процессов, таких как регуляция трансляции и транскрипции, химическая модификация молекул в клетке, поддержание теломер [1]. На основе структурных и функциональных особенностей часто подр азде-ляют классы: микроРНК, мяРНК, мякРНК, длинные некодирующие РНК, регулято рные элементы.

Вто ричная и четвертичная структура молекул РНК классов имеет большое значение для их функциональности. Структура РНК позволяет ей взаимодействовать с другими молекулами РНК, лигандами и белками, которые связываются с Р НК [2]. Механизм регуляции может заключаться в предоставлении нкРНК дополнительных сайтов связывания или же закрытии сайтов связывания белков.

Сокращение: нкРНК - некодирующие РНК.

Из длинной линейной последовательности РНК потенциально возможно формирование множества различных вторичных структур. Количество возможных структур растет экспоненциально с увеличением длины последовательности [3]. Часто структура РНК является динамической и претерпевает конформационные изменения в зависимости от условий и характеристик раствора. Молекулы РНК характеризуются высокой чувствительностью и специфичностью к изменениям окружающей среды, изменения в растворе приводят к конкретным изменениям в молекулах РНК с определенной структурой. Эффективность и быстр ота подобных механизмов объясняет их шир окое использование в клетке, в частности в процессах клеточного ответа на изменения внутренних и внешних условий [4].

Нуклеотиды в составе РНК могут находиться в спаренном и в неспаренном состоянии. На уровне вторичной структуры можно наблюдать различные структурные элементы, такие как стебли и петли различной топологии. Свобод-

ная энер гия стр уктуры складывается из энергий стекинговых взаимодействий пар оснований в стеблях и энтропийного вклада неспаренных оснований в петлях. Эти термодинамические параметры экспериментально определены [5].

В ряде исследований сравнивали скорость нуклеотидных замен в позициях, соответствующих спаренным и неспаренным основаниям в структуре нкРНК. Были попытки придумать аналог оценки отбора для нкРНК, наподобие отношения доли возможных синонимических замен к доле несинонимических (ёК/ёБ) в белках [6]. Однако петли могут быть довольно консервативны, поскольку именно петлевые участки РНК часто участвуют во взаимодействии с другими молекулами. Неспар енные сайты зрелых микроРНК эволюционируют медленнее по сравнению со спаренными [7]. Рассмотрение петель в качестве модели нейтральной эволюции зачастую ведет к ошибочным оценкам силы отбора.

Спаренные основания в стеблях должны отличаться меньшей дивергенцией с точки зрения их большей роли в поддержании консервативной вторичной структуры. Были попытки классификации позиций в стеблях на основе их термодинамических особенностей на терминальные, субтерминальные и позиции в теле стебля [6]. В этом исследовании было показано, что в рРНК, мяРНК и некоторых других классах нкРНК консер вативность определенны х позиций коррелирует с величиной ожидаемого термодинамического эффекта, т.е. структура поддерживается действием отрицательного отбора.

Сила действия отбора в различных элементах вторичной стр уктуры зависит как от важности поддержания функциональной стабильной структуры в растворе, так и от поддержания сайтов связывания на нкРНК. Необходим сравнительный анализ эволюционных законо-мер ностей для элементов стр уктуры различных классов нкРНК, поскольку каждый класс характеризуется собственными структурными и функциональными особенностями. Улучшение понимания закономерностей действия отбора в различных элементах структуры нкРНК может значительно улучшить понимание механизмов функционирования молекул нкРНК и их идентификации в геномах, основанной в том числе на диффузионных процессах [8].

Xотя многие классы нкРНК - микроРНК, мякРНК, мяРНК, регулято рные элементы и некоторые длинные некодирующие РНК - имеют высококонсервативные вторичные структуры, другие классы - пиРНК (piwi-белок взаимодействующих РНК) - на настоящий момент счи-

таются слабоструктурированными [9]. Однако в силу небольшого количества данных об этом недавно опр еделенном классе нкРНК исследование их эволюции представляется важной задачей современной биологии.

МАТЕРИАЛЫ И МЕТОДЫ

В данном разделе описаны пр оцедуры подготовки данных и методология анализа. Для изучения отбора, действующего на последовательность, были посчитаны отношения dN и dS - частоты встречаемо сти межвидовых замен по последовательностям нкРНК р азличных классов и по нейтрально эволюционирующим сайтам соответственно. В качестве нейтр ально эволюционирующих сайтов были рассмотрены четырежды вырожденные позиции кодонов аминокислот. Межвидовая вар иация была посчитана между видами D. melanogaster и D. simulans.

Были рассмотрены нкРНК из генома Dro-sophila melanogaster. Координаты нкРНК в геноме D. melanogaster взяты из базы данных Rfam [10], которая включает в себя семейства нкРНК с консервативной вторичной структурой. П редсказание вторичных структур по ковариационным моделям Rfam можно считать наиболее точным, поскольку оно основано на эволюционных данных, а также на экспериментальных данных о стр уктуре. Мы использовали средства пакета Infernal [11] для предсказания структуры нкРНК по ковариационным моделям Rfam. На основе пр едсказанной структур ы мы разделили позиции в нкРНК на относящиеся к стеблю или петлевым участкам. В совокупности нами было рассмотрено 298 нкРНК из 140 семейств в пяти класса х нкРНК: микроРНК, мяРНК, мяшРНК, длинная некодир ующая РНК и регулято рные элементы. Координаты пиРНК в геноме Drosophila melanogaster были взяты из базы данных piRNABank [12].

Для оценки скорости эволюции последовательности нкРНК были посчитаны отношения по дивергенции и полиморфизму между петлями и стеблями к нейтрально эволюционирующим сайтам - четырежды вырожденным позициям кодонов аминокислот. Для оценки параметра а - доли замен нуклеотидов, зафиксировавшихся в результате положительного отбора, был использован эволюционный тест Макдональда-Крейтмана [13].

Значение а определено от до 1. Отрицательные значения а могут свидетельствовать о недооценке этого параметра в силу присутствия слабовредных мутаций. Для того чтобы улучшить оценивание этого параметра, были

Таблица 1. Дивергенция (D. melanogaster vs. D. simulans)

^КРНК^ петля ^кРНК/^ стебель Отношение (петля/стебель)

Длинные некодирующие 0,05 0,05 1,15

Регуляторные элементы 0,08 0,11 0,76

мяРНК 0,05 0,04 1,3

мякРНК 0,1 0,14 0,74

микроРНК 0,08 0,03 2,97

Все классы 0,08 0,06 1,24

Примечание. Показано отношение по дивергенции в петлях и стеблях классов нкРНК.

отфильтр ованы низкочастотные полиморфизмы (с частотой < 5%), как это было предложено в работе [14].

Четырежды вырожденные позиции в геноме Drosophila melanogaster были получены из множественного выравнивания ортологичных кодирующих последовательностей базы данных FlyBase [15] для филогенетической группы melanogaster. Координаты экзонов в транскриптах, а также координаты кодирующей части последовательности в экзонах были получены при помощи средств BioMart Ensembl [16].

Координаты внутривидовых замен и их ал-лельные частоты по последовательностям нкРНК и нейтрально эволюционирующим позициям были посчитаны по 623 геномам Drosophila melanogaster [17-19]. Полное выравнивание этих геномов было взято из проекта Dro-sophila Genome Nerns 1.0 [20]. Мы использовали разработанные нами скр ипты для идентификации и подсчета частот по SNP.

Мы посчитали межвидовую вариацию из полногеномных выравниваний, полученных с помощью MultiZ [21] из UCSC Genome Browser [22]. Все расчеты проводили для пяти версий генома Drosophila melanogaster. В работе использовали конвертер координат, представленный на FlyBase [15]. Мы посчитали частоты нуклеотидных замен в спаренных и неспарен-ных позициях нкРНК, а также в четырежды выр ожденных позициях кодонов аминокислот.

Для каждой структуры нкРНК была измерена ее свободная энергия средствами rnaeval пакета ViennaRNA [23]. Далее мы разделили нкРНК в каждом класс

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком