научная статья по теме CRISPR-СИСТЕМЫ: СТРУКТУРА И ГИПОТЕТИЧЕСКИЕ ФУНКЦИИ Физика

Текст научной статьи на тему «CRISPR-СИСТЕМЫ: СТРУКТУРА И ГИПОТЕТИЧЕСКИЕ ФУНКЦИИ»

CRISPR-системы: структура и гипотетические функции

А.А.Гоглева, И.И.Артамонова

Мир микробов жесток. Чтобы выжить, бактерии должны размножаться как можно быстрее. Основные ограничения на скорость деления накладывает размер генома. У прокариот он действительно относительно невелик — на несколько порядков меньше, чем у эукари-от. Средний размер генома бактерии составляет около 3 млн пар оснований, и все функции, необходимые и достаточные для ее успешной и эффективной жизни, кодируются, в среднем, 3 тыс. генов. Казалось бы, избыточность генетического материала для бактерий непозволительна, однако, как выяснилось, их геномы помимо уникальных последовательностей нуклеотидов включают и небольшое число повторяющихся*. Одна из самых загадочных геномных структур — это короткие инвертированные повторы (со средней длиной 32 пары оснований), регулярно расположенные группами. Между повторами, как правило, идентичными, располагаются уникальные последовательности примерно той же длины (около 30 пар оснований) — спейсеры. Описанная структура получила название CRISPR (от англ. Clustered Regularly Interspaced Short Palindromic Repeats — короткие

* Подробнее см.: Смирнов Г.Б. Повторы в геномах бактерий и в жизни // Природа. 2010. №4. С.3—11. — Примеч. ред.

© Гоглева А.А., Артамонова И.И., 2014

Анна Анатольевна Гоглева, аспирант группы биоинформатики отдела вычислительной системной биологии Института общей генетики им. Н.И.Вавилова РАН (ИОГен). Занимается изучением СШЗРЕ-систем прокариотического иммунитета в микробиоме человека.

Ирена Игоревна Артамонова, кандидат биологических наук, руководитель группы биоинформатики ИОГен, доцент МГУ им. М.В. Ломоносова, старший научный сотрудник Учебно-научного центра «Биоинформатика» Института проблем передачи информации им. А.А.Харкевича РАН. Область научных интересов — эволюционная геномика, биоинформатика, аннотация геномов.

палиндромные повторы, регулярно расположенные группами). Число повторяющихся единиц (повтор + спейсер) может достигать нескольких сотен, и CRISPR-локусы весьма широко представлены в геномах бактерий. Почему же прокариоты терпят такую, на первый взгляд, непозволительную избыточность генетического материала? Зачем нужны эти повторы и вся CRISPR-структура?

Портрет CRISPR

Впервые необычные повторяющиеся последовательности равной длины, перемежающиеся уникальными участками, были описаны в 1987 г. в геноме основного модельного организма микробиологии и молекулярной биологии — кишечной палочки (Escherichia coli) [1]. Чуть позже похожие структуры стали находить у многих других прокариот, причем не только у разных, филогенетически очень далеких

друг от друга, видов бактерий, но и у архей. Среди них, например, архея Haloferax mediter-ranei, живущая в очень соленой воде Мертвого и Средиземного морей; цианобактерии рода Ana-baena; патогенные бактерии Mycobacterium tuberculosis — возбудитель туберкулеза и Streptococcus pyogenes (вызывает многие заболевания — от ангины до разнообразных воспалений кожи и мышц у человека и других млекопитающих) [2 — 5]. К настоящему времени CRISPR-структуры найдены у 45% всех известных бактерий и 85% архей [6]. В геномах эукариот и вирусов ничего подобного обнаружено не было.

По мере изучения CRISPR стало понятно, что это сложная многокомпонентная система, а повторы — всего лишь малая часть CRISPR-«айсбер-га». Из чего же он состоит?

В первую очередь — из кассет, содержащих повторы с расположенными между ними спейсера-ми. Число составных звеньев (повтор + спейсер) в CRISPR-кассете может варьировать от двух до нескольких сотен. Пока рекордсменом в этом признана морская протеобактерия Haliangium ochraceum с 587 спейсерами в кассете [6]. Часто в геномах содержится более одной CRISPR-кассе-ты. Самое большое их число обнаружено в ДНК метаногенной термофильной археи Methanocal-dococcus jannaschii — 18 кассет занимают почти 1% ее генома.

СRISPR-структуры чаще располагаются на основной хромосоме (нуклеоиде), но иногда входят в состав плазмид (маленьких кольцевых, автономно реплицирующихся молекул ДНК).

Повторы в одной кассете, как правило, строго совпадают между собой по длине (напомним, около 32 пар оснований) и последовательности нук-леотидов. Лишь последний повтор кассеты иногда отличается от канонической последовательности остальных, да и то лишь в нескольких концевых позициях.

Для повторов характерна частичная диадная симметрия — части последовательностей в начале и в конце повтора обратно комплементарны. Благодаря этому концы таких палиндромных повторов могут взаимодействовать между собой с образованием устойчивых вторичных структур, прежде всего так называемых шпилек.

Спейсеры в пределах кассеты часто равны по длине, но отличаются по последовательности нук-леотидов. Наборы спейсеров в кассетах штаммов одного вида тоже могут очень сильно различаться. Благодаря такой высокой вариабельности CRISPR, еще задолго до того, как выяснилась их роль в клетках прокариот, стали использовать для быстрого типирования штаммов известных бактерий:

Рис.1. Основные элементы CRISPR-кассеты.

возбудителя чумы — Yersiniapestis [7], дифтерии — Corynebacterium diphtheriae [8], гастроэнтерита — Campylobacter jejuni [9], а также уже упоминавшихся Mycobacterium tuberculosis [2] и Streptococcus pyogenes [4].

Монотонно чередующиеся повторы и спейсе-ры составляют «тело» CRISPR-кассеты. Головой служит лидерная последовательность. Она часто разделяет кассету и ассоциированные с системой гены и задает направление транскрипции кассеты (рис.1). По сравнению с типичными повторами и спейсерами лидерная последовательность гораздо длиннее — до 400 пар нуклеотидов. Установлено, что лидерные последовательности не содержат открытых рамок считывания, т.е. не кодируют белки и не встречаются нигде больше в прокариотических геномах, кроме как в начале CRISPR-кассет.

Примечательная особенность лидерных последовательностей — высокое содержание двух азотистых оснований — аденина (A) и тимина (T). Как известно, A-Т — это уотсон-криковская пара, которая удерживается только двумя водородными связями, в то время как G-С — тремя, поэтому двухцепочечную ДНК в AT-богатых участках легче расплести и превратить в одноцепочечную. Кроме того, в AT-богатых регионах малая бороздка ДНК более узкая — такая топология служит характерным местом посадки для многих белков, взаимодействующих с ДНК. AT-богатые участки часто встречаются в различных регуляторных последовательностях (например, промоторах) и точках начала репликации. Поэтому предполагают, что лидерная последовательность отвечает за регуляцию транскрипции CRISPR-кассеты, а значит и функционирования всей системы [10]. Для некоторых организмов наличие промоторов в лидерной области удалось подтвердить экспериментально.

Спейсеры, повторы, лидерная последовательность — таков обобщенный портрет геномной CRISPR-структуры (см. рис.1). Но можно ли, глядя на него, предположить, какую роль CRISPR-кассе-ты играют в клетке?

Гипотетические функции

Гипотеза 1: сегрегация хромосом. Для выживания прокариотам важно делиться не только быстро, но и качественно — так, чтобы генетический материал родительской клетки стабильно наследовался, т.е. правильно удваивался и равномерно распределялся между потомками.

За распределение хромосом между дочерними клетками отвечают системы сегрегации. У эукари-от правильное расхождение хромосом обеспечивают центромеры — участки с особенной последовательностью и специальной структурой, соединяющие сестринские хроматиды. Прокариоты значительно проще эукариот по организации целого ряда процессов, необходимых клетке. В частности, центромер у прокариот нет. Однако выяснилось, например, что у низкокопийных бактериальных плазмид P и F1 есть система par, которая служит для правильного расхождения двух копий плазмиды после репликации [11]. Важный элемент par-системы — итероны (рис.2). Эти короткие, тандемно расположенные повторы, собраны в область под названием parC, с которой связывается белок parR, а тот в свою очередь с parM и, возможно, с другими белками. Таким образом, parC-об-ласть представляет собой что-то вроде центра кипения, на котором, как пузырьки в чайнике, собираются клеточные белки системы сегрегации. В этом смысле принцип действия parC аналогичен принципу действия центромер эукариот. Как мы уже упомянули, важной особенностью этой области считается тандемное расположение повторов, что очень напоминает CRISPR-кассеты.

Например, в геномах двух видов архей — На1о-/етах volcanii и Н.твёИеггапв1 — обнаружено по несколько CRISPR-кассет общей протяженностью до 1600 пар нуклеотидов [6]. Что будет, если удалить CRISPR-кассеты из клетки? Или, наоборот, увеличить (например, удвоить) их число? Оказалось, что при введении дополнительных копий CRISPR-кассет у Н.ьо1сапи часто наблюдаются отклонения в распределении генетического материала при делении клеток и снижается их жизнеспособность [3]. Стоит отметить, что CRISPR-кас-сеты Н.ьо1сапи и H.mediteттanei находятся в мега-плазмидах и собственно хромосомной ДНК, т.е. наиболее крупных репликонах (молекулах ДНК, копирование которых начинается с одной точки). На что может указывать такое расположение? Если CRISPR действительно работает системой сегрегации, то в основном и отвечает за правильное распределение по дочерним клеткам важных генов крупных репликонов, а расхождение мелких плазмид с несущественными для выживания генами происходит более или менее случайно. Такой гипотетический сценарий вполне соответствует тому, что мы сейчас знаем и думаем (или думаем, что знаем) о системах сегрегации репли-конов у прокариот. Все эти наблюдения могут свидетельствовать в пользу участия CRISPR-локу-сов в расхождении хромосом.

Гипотеза 2: рекомбинация по повторам. Вторая гипотеза тоже опирается, в основном, на повторы CRISPR-системы, но учитывает не их тандемное расположение, а идентичность.

Часто повторы в геномах служат горячими точками для различных геномных перестроек.

Рис.2. Пример сегрегации репликонов у прокариот (Streptococcus pneumoniae) с участием par-системы [12]. Par-белки формируют фи

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком