научная статья по теме МОЖНО ЛИ ИCПОЛЬЗОВАТЬ ЛОКАЛЬНУЮ ЭНЕPГЕТИЧЕCКУЮ МИНИМИЗАЦИЮ ДЛЯ УТОЧНЕНИЯ PDB-CТPУКТУP PАЗНОГО PАЗPЕШЕНИЯ? Биология

Текст научной статьи на тему «МОЖНО ЛИ ИCПОЛЬЗОВАТЬ ЛОКАЛЬНУЮ ЭНЕPГЕТИЧЕCКУЮ МИНИМИЗАЦИЮ ДЛЯ УТОЧНЕНИЯ PDB-CТPУКТУP PАЗНОГО PАЗPЕШЕНИЯ?»

БИОФИЗИКА, 2009, том 54, вып.4, c.622-629

МОЛЕКУЛЯР НАЯ БИОФИЗИКА =

УДК 577.3

МОЖНО ЛИ И СПОЛЬЗОВАТЬ ЛОКАЛЬНУЮ ЭНЕР ГЕТИЧЕСКУЮ МИНИМИЗАЦИЮ ДЛЯ УТОЧНЕНИЯ PDB-СТРУКТУР РАЗНОГО РАЗР ЕШЕНИЯ?

© 2009 г. М.Г. Годзи, А.П. Громова, И.В. Оферкин, П.В. Миронов

Физический факультет Московского государственного университета им. М.В. Ломоносова,

119234, Москва, Воробьевы горы

E-mail: mzx@mail.ru Поступила в p едакцию 27.04.09 г.

Cтатиcтичеcки исследована применимость метода локальной энеpгетической минимизации к pешению задачи уточнения структур PDB-банка, которая рассматривается как приближение стр уктур к их истинному кр исталлическому со стоянию. Из всех стр уктур банка PDB были выделены группы, со стоящие из нескольких кр исталлических структур одного и того же белка, полученных с разными разрешениями. Составив пары внутри выделенных групп и применив к ним метод структур ного выравнивания, мы получили распр еделение RMSD для всех пар. Аналогичное распределение было построено после минимизации всех отобранных структур квазиньютоновским методом с использованием силового поля MMFF94 для расчета энер гии белков. Сравнение ср едних величин RMSD двух распределений показало, что структурные различия в большинстве пар возр о сли после минимизации, что было бы невозможным в случае пр иближения после локальной минимизации каждой из структур в пар е к единому истинному со стоянию. Это доказывает, что локальная энергетическая минимизация не является универсальным методом уточнения стр уктур PDB-банка. Увеличение структурных различий в р езультате минимизации можно объяснить тем, что структуры разного разрешения одного белка попадают в разные минимумы энергетического ландшафта. Таким образом, развитие минимизации как метода уточнения приводит к задаче нахождения многих локальных энергетических минимумов и поиска критериев для их отбора. Эта задача решаема в случае низкой плотности минимумов в конфигурационном пространстве, соответствующих пр омежу-точным состояниям, поскольку в противном случае локальная энергетическая минимизация соответствует случайному изменению координат атомов белка с амплитудой, аналогичной минимизационным изменениям. Путем моделирования таких случайных искажений для структур выборки и сравнения распр еделений по RMSD в парах разного разрешения минимизир ованных и случайно возмущенных структур нам удалось доказать, что задача нахождения минимумов и отбор а из их числа минимума истинного состояния белка в кр исталле принципиально решаема.

Ключевые слова: минимизация энергии белка, уточнение структуры белка, MMFF94, рентгено-структурный анализ, энергетический ландшафт, структурное выравнивание, молекулярная ме-x аника.

Ключевым ресурсом для анализа атомных стр уктур белков на сегодняшний день является Б рукхэвенский банк данных РББ. 87% структур этого банка получены методом рентгено стр ук-турного анализа кр исталлов белков. Самые точные из структур РББ обладают разрешением

0,54 А. В ср еднем же по банку оно составляет 2,2 А. Дальнейшее развитие экспериментальных техник данного метода не приводит к заметному увеличению точности ожидаемых поступлений. Вместе с острой необходимостью улучшать уже исследованные структуры, это придает актуальность разработкам универсального метода уточнения белковых структур, который

позволил бы перейти от структур РББ-банка к идеально распознанной структуре белка в кристалле.

Одним из возможных путей решения этой проблемы является применение методов молекулярной механики, таких как локальная энергетическая минимизация. Однако пр облема выбора расчетных параметров для этих методов не может быть решена прямой экспериментальной проверкой предсказанных конформаций и оставляет много открытых вопросов об универсальности применения молекулярной механики в задаче уточнения. Выбрав наиболее перспективный метод силового поля, мы поставили задачу проверить пригодность локальной энер-

гетической минимизации, пpоведенной c его иcпользованием для уточнения PDB-cтpуктуp pазного p азp ешения, cтатиcтичеcким методом. Под уточнением здеcь и далее мы подразумеваем пр иближение pазpешенной cтp уктуры белка к его истинному отстоянию в кpиcталле.

МЕТОДЫ

Выбор метода проверки минимизации как уточнения. Ввиду оcобенноcтей p ентгено cтp ук-туpного метода (вcегда еcть ошибки, cвязанные c качеcтвом кpиcталла и c опpеделением длины волны) не cущеcтвует эталонныx cтpуктуp, по котоpым можно было бы cудить о качестве pезультатов уточнения.

Для некотоpыx белков в PDB могут быть найдены cтpуктуpы, cоответcтвующие одному и тому же белку и отличающиеcя между обой лишь значением экcпеpиментального разрешения cтpуктуpы белка в кpиcталле (шиpиной пика дифpакционной каpтины) или пpоцедуp ой поcледующей обpаботки данныx дифpакции. Это позволяет cчитать локальную энергетиче-cкую минимизацию пpигодной для уточнения cтp уктуp PDB, еcли c ее помощью удастся пp и-веcти cтp уктуpы большего pазpешения к cтp ук-туpам меньшего pазpешения.

Иcxодно пpедполагая, что локальная минимизация является унивеpcальным методом уточнения, мы тем cамым поcтулиpуем, что минимизация cтpуктуp одного белка, отличающиxcя лишь pазp ешением, пpиведет cтpуктуpы в единую конфоpмацию минимума энеpгетичеcкого ландшафта белка [1]. Т .е. пpименение локальной минимизации к стр уктуpам одного белка должно значительно уменьшать геометpичеcкие различия между ними. В пр отивном cлучае наше иcxодное пpедположение будет опpовеp гнуто.

Мы пpедъявляем дополнительные требования к пpоводимому анализу, cчитая необходимым доказать не пpоcто возможность уточнения структуp неcколькиx белков [2], а принципиальную пpименимоcть локальной энеpгетической минимизации как унивеpcального метода уточнения в pамкаx вcего PDB. Эти требования выpажаютcя в необxодимоcти пpовеcти многоуp овневый cтатиcтичеcкий анализ выборки многиx белков, из cтpуктуp pазного разрешения котоpыx поcтpоены паpы cpавнения. В этиx паp аx пpедполагаетcя выявить уменьшение геометp ичеcкиx pазличий поcле энеp гетичеcкой минимизации.

Получение пар структур разного разрешения. C учетом изложенные выше тpебований мы пр оизвели выбоp ку белков из PDB, для котоpыx доcтупно неcколько cтp уктуp, абсолютно иден-

тичных в cвоей последовательности и образуемых ими комплекcаx, а также во вcеx парамет-pаx выделения и кpиcталлизации, кроме отличий в дифpакционной картине и методаx ее обpаботки. Для этого изначально использова-лиcь кластеры 95-пpоцентных cовпадений последовательностей - результат еженедельной кластер изации белков PDB-банка методом BLAST. В состав полученных кластеров, помимо белков, входили также отдельные домены, которые были отсеяны, поскольку минимизация изолированных доменов заведомо не позволяет уточнить структуру белка в целом в силу ненулевых значений индивидуальных для белка междоменных взаимодействий. Далее из рассмотрения были исключены все белки, для которых явным образом не было указано значение рН для условий кристаллизации, а затем все кластер ы, содер жащие один элемент. Затем была проведена повторная кластеризация так, чтобы внутри каждого кластера находились стр ук-туры только одного и того же белка. Из нескольких сотен оставшихся структур из PDB, упорядоченных в кластеры, были отобраны лишь те, для которых внутри кластера находились структуры, абсолютно идентичные по параметрам ионного окружения, по температуре кристаллизации, по последовательности аминокислот, по входящим в структуру ор ганиче-ским и неорганическим комплексам. Таким образом, единственные различия между структурами одного кластера заключаются в параметрах точности разрешения.

Отобранные таким образом белки (табл. 1), структуры которых подлежат геометрическим сравнениям, представляют собой случайную выборку по функциональным свойствам и принадлежат разным эволюционным классам, что позволяет считать выбор ку репрезентативной.

Важно отметить, что в некоторых структурах с низким значением разрешения встречались аминокислоты и отдельные атомы, имеющие несколько вариантов возможного расположения, из которых невозможно выбрать наиболее верный в силу недостаточной точности дифракционной картины. Для последующих вычислений энергии в ходе минимизации, а также для вычисления структурной разницы между белками в случае множественного задания в файле координат атома из PDB выбирали пер вый из вариантов.

Для доказательства репрезентативно сти выборки по типам белков, представленных в ней, была исследована зависимость попарных геометрических различий между стр уктурами кластер а от разницы разрешений внутри пары. Оценивая геометрические различия методом

Таблица 1. Пары стр уктур PDB-банка, выбр анные для сравнения

PDB-код o Pазp ешение, A PDB-код o Pазpешение, A o Pазница p азр ешений, A o Cpеднее pазрешение, A

4PCY 2,15 5PCY 1,80 0,35 1,98

4PCY 2,15 6PCY 1,90 0,25 2,03

5PCY 1,80 6PCY 1,90 0,10 1,85

1GM4 2,05 1UPD 1,40 0,65 1,73

1GMB 2,00 1UP9 1,35 0,65 1,68

1RCC 2,40 1RCI 2,00 0,40 2,20

2UWT 2,50 2UWV 2,13 0,37 2,32

2UXJ 2,25 2UXL 2,88 0,63 2,57

2UXK 2,31 2UXM 2,70 0,39 2,51

1XUF 1,90 1XUG 1,50 0,40 1,70

1C5H 1,55 1C5I 1,80 0,25 1,68

2AL1 1,50 2AL2 1,85 0,35 1,68

1HAU 1,90 1HAW 1,90 0,00 1,90

структурного выравнивания Frtmalign [3], в котором осуществляется минимизация средне -квадратичных расстояний между Са-атомами (RMSD) сравниваемых структур путем их не-деформирующего наложения (суперимпозиции), мы получили зависимости, приведенные на рис. 1а. Видно, что закономерность, полученная O. Carugo [4] для одного белка, не наблюдается в случае выборки разных белков. Более того, точки, соответствующие парам структур одного белка, также не лежат на одной пр ямой. Анализ этой зависимости показал, что структур ные различия одного и того же белка, определенного с р азными разр ешениями, зависят не только от разницы разрешений, но и от свойств белка, которые, однако, не могут быть сведены к учету длины его последовательности и количеству цепей, входящих в его состав. Для всей выборки не обнаружено корреляции RMSD с разницей разрешений структур, в том числе и пр и

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком