научная статья по теме ПРИКЛАДНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ БИОЛОГИИ И БИОИНФОРМАТИКИ Биология

Текст научной статьи на тему «ПРИКЛАДНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ БИОЛОГИИ И БИОИНФОРМАТИКИ»

МОЛЕКУЛЯР НАЯ БИОФИЗИКА

УДК 577.3

П Р ИКЛАДНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ БИОЛОГИИ

И БИОИНФОР МАТИКИ

© 2011 г. В. Д. Лах но

Институт математических проблем биологии РАН, 142290, Пущино Московской области, ул. Институтская, 4

E-mail: lak@impb.psn.ru

Поступила в p едакцию 09.06.11 г.

Математическая биология и биоинфоpматика является новым быстро pазвивающимcя направлением, cфоpмиpовавшимcя в xоде выполнения пpоекта «Геном человека». Основными прикладными задачами математической биологии и биоинфоpматики являютcя конcтpуиpование лекаpcтв, пеpcональная медицина и нанобиоэлектpоника. Показано, что pазвитие теxнологии маccового cеквениpования генома человека подготовило оcнову для учpеждения национальной пpогpаммы по пеpcональной медицине.

Ключевые слова: математическая биология, биоинформатика, нанобиотехнология, нанобиоэлек-троника.

МОЛЕКУЛЯPНАЯ БИОЛОГИЯ И ВЫЧИ СЛИТЕЛЬНЫЕ ЗАДАЧИ МАТЕМАТИЧЕCКОЙ БИОЛОГИИ И БИОИНФОPМАТИКИ

Математичеcкая биология и биоинформатика (МББ) в настоящее вpемя пpедcтавляют cобой новое, быстр о pазвивающееcя направление, котоpое имеет важные пр иложения в медицине и здpавооxpанении. Cтановление его пpоизошло в конце пpошлого века в xоде выполнения пp ограммы pаcшифpовки генома человека. На pиc. 1 уcловно показано соответствие между молекуляpной биологией и МББ.

Определение нуклеотидной последовательности молекулы ДНК являетcя задачей биоин-фоpматики. Пеpеxод от ДНК к PНК в моле-куляpной биологии в МББ cвязан c p ешением задачи о наxождении белоккодиp ующиx областей в соответствующей ДНК нуклеотидной по-cледовательноcти. Наконец, пеpеxод от PНК к белку в МББ cвязан c pешением задачи об опpеделении его пpоcтpанcтвенной cтpуктуpы и моделей функциониpования.

Задачи, pешаемые МББ, тpебуют пp ивлече-ния высокопр оизводительныx вычиcлений и являются cтимулом для pазвития суперкомпью-теpныx теxнологий [1]. Пpименение суперком-пьютеp ов cвязано c необxодимоcтью выделения большого чиcла cложным обpазом уcтp оенных

Сокращения: МББ - математическая биология и биоинформатика.

белоккодирующих областей (генов) в нуклео-тидных последовательностях молекул ДНК. В настоящее время расшифровано большое число геномов людей, животных и микроор ганизмов. В число задач, решаемых МББ, входит сравнение различных нуклеотидных последовательностей, определение пространственной структуры ДНК и многие другие. На ур овне РНК-белок решаются задачи выр авнивания аминокислотных последовательностей, определения вторичной и пространственной структуры РНК. Одной из важнейших задач МББ является определение пространственной структуры белка по его известной первичной структуре. В настоящее время такая математическая задача, однако, не решена. Для ее решения сейчас применяются методы рентгено структур ного анализа и ядерного магнитного р езонанса. Даже на заре рентгено структур ного анализа белков было ясно, что никакие вычислительные ресурсы не являются слишком большими для решения такой задачи. Возникающая здесь математическая задача связана с тем, что в ходе рентге-ноструктурного эксперимента определяются только интенсивности рассеянных рентгеновских лучей. Для определения пространственной структуры белка, однако, необходимо знать не только амплитуды, но и фазы рассеянных рентгеновских лучей. Решение возникающих здесь сложных математических проблем является задачей МББ. На рис. 2 показана первичная расшифровка про стр анственной структуры ли-попротеина низкой плотности, выполненная в ИМПБ РАН [2].

Молекулярная биология

ДНК ♦

РНК *

Белок *

Функция, признак

Математическая биология и биоинформатика

Расшифровка генома

Определение структуры

Модели функционирования

Pис. 1. Уловное соответствие между молекуляpной биологией и МББ.

P аcшифp овка такиx ультp аcтpуктуp, cодеp-жащиx ~ 105 атомов, возможна только методами pентгеноcтpуктуpного анализа и вcегда будет отноcитьcя к уникальным и тpуднейшим зада -чам МББ. В соответствии c пp едcтавленной на pиc. 1 cxемой соотношения основных задач молекуляp ной биологии и МББ знание струк-туp ы белка задает его функцию. Моделиp ова-ние этой функции в МББ pешается методом молекуляp ной динамики. Математическая зада -ча молекуляp ной динамики со cтоит в pешении большого чиcла клаccичеcкиx уpавнений движения для вcеx атомов, вxодящиx в cоcтав биома^омолекулы. Для pешения такиx задач иcпользуютcя самые мощные cупеpкомпьюте-pы, ^TOpые чаcто cоздаютcя cпециально для иx pешения (Blue Gene).

Весь этот мощный аpcенал МББ напp авлен на p ешение cледующиx пp икладныx задач.

МББ И КОНСТPУИPОВАНИЕ ЛЕКАPCТВ

Важнейшей пp икладной задачей математи-чеcкой биологии и биоинфоpматики являетcя пpименение вычиcлительныx алгоpитмов, ис-пользуемыx для анализа и cиcтематизации ге-нетичеcкой инфоp мации, выяснения cтp уктуp ы, динамики и функции ма^ омолекул для издания новыx лекаpcтвенныx np епаp атов.

Веcь npоцесс cоздания нового лекаpcтвен-ного соединения в pяде cлучаев может быть p азделен на cледующие этапы: 1) поиск мишени (^npимеp, белка) дейcтвия нового лекаpcтва; 2) поиcк низкомолекуляpного соединения, обладающего нужным фаp макологическим дейcт -вием; 3) изучение этого соединения в экcпеpи-менте; 4) npоведение иотытаний в клинике. Лишь малый npоцент возможные кандидатов на лекаpcтво np о xодит уcпешное клиническое иcпытание. Cобcтвенно компьютеpными явля-ютcя 1-й и 2-й из TOp ечиcленныx этапов.

Р ис. 2. Липопp отеин низкой плотности.

Е сли пp о стр анcтвенная cтp уктуp а белка-мишени известна, то пр именяют так называемые пр ямые методы компьютер ного конструир ова-ния лекарств. Вначале устанавливают место связывания низкомолекулярного соединения (лекарства) и белка-мишени. Затем пр оводят анализ полученного комплекса с помощью молекулярной графики (так называемый докинг) с последующим молекуляр но-динамическим и квантово-химическим расчетом. Все этапы это -го расчета требуют высокопроизводительных вычислений. Уже самый пер вый этап поиска подходящего кандидата на лекарство связан с пер ебор ом сотен миллионов вариантов из со -ответствующей базы данных низкомолекулярных соединений. Последующие этапы р асчета, как следует из вышесказанного, также т р ебуют пр именения супер компьютер ов.

В случае, когда пространственная структура белка-мишени неизвестна, имеется достаточно большое число различных подходов сравнительного моделир ования. П р и по стр оении тр ех-мер ной модели белка с заданной аминокислотной последовательностью эта полипептидная цепочка сначала «вписывается» в координаты, соответствующие о статкам гомологичного белка с р а сшифр ованной пр о стр анственной стр ук -турой, а затем осуществляется минимизация внутр енней энер гии, чтобы «уб р ать» возможные напряжения в структур е. В дальнейшем методами молекулярной динамики моделируется движение отдельных частей молекулы с целью уточнения расположения гибких участков. Качество полученной модели оценивают с использованием пр огр аммы, котор ая ср авнивает пр о -странственное расположение аминокислотных о статков моделир уемого белка с известной статистикой, полученной для белков с р асшифр о -ванной экспериментально пространственной ст р уктур ой.

Построенные таким способом модели были успешно использованы для конструирования, например: новых ингибиторов пр отеазы вируса иммунодефицита человека для лечения СПИДа; ингибитор ов ренина, как средства для лечения эссенциальной гипертензии; для белковой инженерии. Неукротимый рост вычислительных мощностей сопровождается лавинообразным расширением биологических данных по геномам человека и других организмов. Дополнительная информация поступает из фармацевтической химии, неврологии, микробиологии, иммунологии, клинических испытаний, токсикологии, эпидемиологии и др. дисциплин и должна интегрироваться с генетическими и структур ными данными. Создать единую картину всей инфор мации, установить связи между отдельными областями знания - задача биоинформатики.

Компьютерный анализ генетических текстов, аминокислотных последовательностей, пространственной структуры и динамики белков, лежащий в основе определения макромолекул-мишеней, а также поиск низкомолекулярных комплексов с целью создания новых лекарств превратились в быстроразвивающееся направление биомедицины в конце 20-го века.

МББ И ПЕРСОНАЛЬНАЯ МЕДИЦИНА

Другим важным прикладным направлением математической биологии и биоинформатики в настоящее время становится персональная медицина. В основе персональной медицины лежит массированная расшифр овка генома человека [3]. Так, в США объявлен проект о расшифровке генома первого миллиона человек в ближайшие 5 лет. Английская больница объявила о том, что геномы всех ее пациентов будут расшифровываться. Пекинский институт гена планирует расшифровывать по 15 тысяч человеческих геномов в год. Полученная информация будет использоваться для ранней диагностики различных заболеваний и, в первую очередь, онкологических. Во многих клиниках и раковых центрах в настоящее время является стандартом диагностика онкологических заболеваний с использованием онкомаркеров для нескольких генов. Полная расшифровка геномов пациентов и последующее использование методов биоинформатики позволит выявить полную картину заболевания и определить все потенциально опасные для здоровья риски.

Первейшей задачей в этой области является определение генетических (врожденных) пред-ра сположенностей к сложным системным заболеваниям, таким как болезни сердечно-сосуди-

стой системы, рак, диабет, шизофрения. Для каждого заболевания определен свой конкретный набор генов, нарушения в работе которых увеличивают риск развития этого заболевания. С егодня известны многие сотни генов, ассоциированных со сложными заболеваниями. Массовое секвенирование геномов больных и здоровых людей ведет к определению всех генов, связанных с конкретными заболеваниями. Таким образом, уже сегодня секвенирование сотен генов позволяет определить предрасположенности к десяткам заболеваний, определить группы риска, предложить особую программу контроля здоровья, направленную на профилактику конкретного заболевания. Учреждение национальной программы опр еде

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком