УЧЕТ СРЕДНЕОЖИДАЕМОГО СЦЕПЛЕНИЯ В БИОМЕТРИЧЕСКОМ АНАЛИЗЕ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ

МИХАЙЛОВ М.Э.

ГЕНЕТИКА, 2015, том 51, № 8, с. 953-962

МАТЕМАТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ

УДК 575.1

УЧЕТ СРЕДНЕОЖИДАЕМОГО СЦЕПЛЕНИЯ В БИОМЕТРИЧЕСКОМ АНАЛИЗЕ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ

Институт генетики, физиологии и защиты растений Академии наук Республики Молдова,

Кишинев MD 2002, Молдова e-mail: mihailov-me@mail.ru Поступила в редакцию 30.07.2014 г.

Для аддитивно-доминантной модели решалась задача расчета генетических оценок при ожидаемом среднем сцеплении, соответствующем случайному расположению генов в хромосомах. Модифицированы оценки Комстока—Робинсона для суммы квадратов доминантных эффектов, суммы квадратов аддитивных эффектов и средней степени доминирования. Модифицирована также оценка Райта для числа локусов, контролирующих изменчивость по количественному признаку, и расширена область ее применения. Для указанных величин выведены формулы, которые должны в среднем элиминировать влияние сцепления. Несмещенные оценки применены к анализу биометрических данных по кукурузе. Результат показал, что более вероятной причиной гетерозиса у кукурузы является доминирование, а не сверхдоминирование, и что основную часть гетерозисного эффекта обеспечивают несколько десятков генов.

DOI: 10.7868/S0016675815060119

Влияние сцепления на генетические оценки — давняя и до сих пор до конца не решенная проблема биометрической генетики. Из-за возможного сцепления биометрические данные часто не допускают однозначной интерпретации, и теоретические решения, полученные для случая не-сцепленных генов, становятся бесполезными или полезными лишь условно.

В первую очередь это касается такой важной величины, как степень доминирования. Принятый в классическом анализе способ оценки средней степени доминирования по соотношению дисперсий разработан для случая несцепленных генов. Применение этого способа к анализу экспериментальных данных обычно сопровождается оговорками, что полученное значение может быть завышенным из-за сцепления (например, [1, 2]). Такие оценки могут иметь сравнительную ценность при сопоставлениях, но сами по себе малоинформативны, так как указывают только на верхнюю границу степени доминирования.

Между тем знание средней степени доминирования весьма важно и для практической селекции, и для теории гетерозиса. Например, из-за отсутствия несмещенных оценок до сих пор остается открытым вопрос о реальности сверхдоминирования [3]. Заметим, что проблема искажающего влияния сцепления на оценку степени доминирования сохраняется и в анализе количественных признаков методом молекулярных маркеров [4, 5].

Из других величин отметим число локусов, влияющих на значение признака. Оценка Райта

также справедлива для случая несцепленных генов. В общем же случае эта оценка показывает не число локусов, а число так называемых эффективных факторов — групп сцепленных генов, которые рекомбинируют как один ген [6].

Искажение, вносимое сцеплением, индивидуально в каждом случае и зависит от расположения на карте задействованных генов. При неизвестном расположении генов рассчитать поправку на сцепление невозможно, но можно оценить ее наиболее вероятное значение, которое должно ожидаться при случайном расположении. Исходя из этого допущения, в данной работе выводятся несмещенные оценки для средней степени доминирования и числа основных локусов. В одних случаях эти оценки могут оказаться завышенными, в других — заниженными, но при массовом их применении следует ожидать, что частота случаев завышения и занижения будет примерно одинаковой.

СУЩЕСТВУЮЩИЕ ОЦЕНКИ СРЕДНЕЙ СТЕПЕНИ ДОМИНИРОВАНИЯ

Для отдельно взятой пары аллелей степень доминирования характеризует проявление количественного признака в гетерозиготе. Она равна нулю, когда количественный признак проявляется в гетерозиготе строго промежуточно, равна единице при полном доминировании и превышает единицу в случае сверхдоминирования. Математически она выражается как й/а, где й — доминантный эффект (превышение гетерозиготы над средним

гомозиготным значением), а — аддитивный эффект (полуразность между гомозиготами). Значения а по определению неотрицательны, в то время как значения й могут быть любого знака.

В случае гетерозиготности по многим локусам наиболее корректным выражением для средней степени доминирования было бы Ей/Еа. Но так как Еа не поддается оценке биометрическими методами, в классическом анализе за среднюю сте-

• D = Jzd2 / Еа2.

пень доминирования принимают

Оценить Ей2 и Еа2 в гибриде F1 можно разными способами, из них наименее трудоемкий, но вместе с тем и наименее точный — по дисперсиям F2 и беккроссов:

Ей2 = 4[а2(В) + а2(В2) - а2(Е2) - Е], (1.1)

Е а = 4

а2 (f2) - " ) + ( )•

(1.2)

где Е — средовая дисперсия, ее оценивают по дисперсии генетически однородного материала, на-

пример как E =

а2( Pi) + а2 (P2) + а2 (F)

[7].

Е d2 = 2 а2 (DIF) - 4E; Еа2 = 2а2(SUM) - 4E.

(2)

гомозиготами АА и аа. Обозначим к = -1— и за-

1 -1

пишем формулы для общего случая:

Еd2 = ка2(DIF) - 2kE; Еа2 = ка2(SUM) - 2kE.

(3)

Для F2 к = 2, для Fз к = 4/3, для популяции без гетерозигот, например для набора рекомбинант-ных инбредных линий (RIL) или удвоенных гаплоидов ^Н), к = 1.

Выражение для средней степени доминирования во всех случаях будет одинаковым:

D = Ы = а2 ( DIF) - 2E ЦЕа2 Ца2( SUM) - 2E'

(4)

Эти оценки чувствительны к точности определения средовой дисперсии, которая часто бывает сравнима с дисперсией F1 и беккроссов. Кроме того, в формулах фигурирует разность между ге-нотипическими дисперсиями, что приводит к значительным относительным ошибкам. Наконец, ошибки в итоге учетверяются.

Более точна оценка по схеме СК-3, когда оцениваются скрещивания F2 х P1 и F2 х P2 [8]. Для каждого растения F2 вычисляются статистики SUM = F2 х P1 + F2 х P2 и DIF = F2 х P1 - F2 х P2 (среднее значение признака в скрещивании обозначено для краткости символом самого скрещивания).

По дисперсиям этих статистик оцениваются суммы квадратов d и a:

Среди последних применений формулы (4) упомянем [1] и [2].

Все эти оценки искажаются сцеплением. Рассмотрим два локуса, которые располагаются настолько близко, что не разделяются кроссингове-ром. Они ведут себя как один ген с эффектами й и а, равными алгебраической сумме отдельных эффектов. При сцеплении в фазе притяжения наблю-

й1 + й2

даемая степень доминирования D

набл —

а1 + а

2

а при сцеплении

- = d i + d2

Dнабл —

отталкивания

в фазе . Сцепление в фазе отталкивания

й1 - й2

приводит, как видим, к завышению оценки. Другой источник искажения — разнонаправленное доминирование, когда й1 и й2 имеют разный знак. В этом случае линейная оценка Ей/Еа не искажается, но занижается квадратичная оценка

В этой схеме Ей2 и Еа2 оцениваются с одинаковой чувствительностью, а поправка Е равна среднему квадрату ошибки Е2 х Р, поэтому она существенно меньше, чем Е из формулы (1.1).

Схему СК-3 можно применять также к F3 [9] и другим гетерогенным популяциям, выведенным из F1. Основное условие применимости — симметрия частот: для любого локуса А гетерозиготный класс Аа имеет одну и ту же фиксированную частоту /, а остаток 1 — / делится пополам между

2/Еа . Наконец, сам переход от линейной оценки к квадратичной работает на завышение, особенно при разнонаправленном доминировании.

Таким образом, оценка по формуле (4) по сравнению с линейной оценкой может быть искажена только в сторону завышения. По сравнению же с квадратичной оценкой она может быть как завышенной, так и заниженной. Последнее тем вероятнее, чем ближе к нулю средняя степень доминирования и большее значение приобретает разнонаправленность доминантных эффектов.

Оценим возможные масштабы искажения. Если частота рекомбинации между локусами равна г, то в фазе отталкивания наблюдаемая степень

+ й2 + 2 (1 - 2 г ) й1 й2

доминирования D

набл =

\а2 + а2 - 2(1 - 2г)а1 а2

При a1 = a2 = a и d1 = d2 = d Днабл = d 1—-. Если

a^ r

частоту рекомбинации r переведем в расстояние s

через картирующую функцию r =

1 - e

-2s

-, то по-

лучим Д

d 1 + e

2s

набл =

-2s

типа. Исходной точкой будет среднеродительское значение MP.

aV 1 - e

Если два локуса разнесены по разным концам средней хромосомы кукурузы (расстояние 150 cM), то наблюдаемая степень доминирования будет завышена на 5%. При случайном расположении двух локусов на хромосоме среднеожидаемое расстояние между ними составит 50 сМ, и в этом случае наблюдаемая степень доминирования будет завышена на 47%. Таким образом, эффект сцепления может быть значительным и его необходимо учитывать.

Основной применяемый способ учета — размножение опытной популяции и повторное применение схемы СК-3. В ходе размножения часть генных пар разделяется кроссинговером, снижается частота случаев, когда гены сцеплены в фазе

отталкивания, Днабл снижается и становится ближе к истинному значению [10]. При этом истинное Д не оценивается, просто одна верхняя граница сменяется другой. Ниже мы попробуем оценить несмещенное значение Д, исходя из предположения, что гены случайно распределены по хромосомам.

ВЕРОЯТНОСТНАЯ ОЦЕНКА СРЕДНЕЙ СТЕПЕНИ ДОМИНИРОВАНИЯ

Рассмотрим применяемую в схеме СК-3 популяцию, состоящую из отдельных компонентов L (растений или однородных субпопуляций, таких как RIL или DH), в которой соблюдается симметрия частот (см. выше). Пренебрежем неаллель-ным взаимодействием и будем считать, что эффекты разных локусов складываются арифметически. Генотип родителей по локусу i будем характеризовать величиной 5,-. Если родитель P1 гомозиготен по плюс-аллелю локуса i (повышающему значение признака), а родитель P2 — по ми-нус-аллелю, то 5,- = 1, в противном случае 5,- = —1. Компоненты L будем характеризовать величинами s,-: &i = 1 означает гомозиготу по плюсс-аллелю, &i = —1 — гомозиготу по минус-аллелю, = 0 — ге-терозиготу.

Запишем теоретические значения признака у разных генотипов, а также функции SUM и DIF. Как и выше, символом генотипа будем для краткости обозначать значение признака у этого гено-

P1 = MP + 1,5 ¡at; P2 = MP - Z5tat; F1 = MP + Zdt;

L = MP + Zstat + Z( 1 - s2)d t; L x P1 = MP + Z—+5al + Z1 - 5t—i

L x P2 = MP + Z——— at + Z

2

1 +

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

научная статья по теме УЧЕТ СРЕДНЕОЖИДАЕМОГО СЦЕПЛЕНИЯ В БИОМЕТРИЧЕСКОМ АНАЛИЗЕ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ Биология

Текст научной статьи на тему «УЧЕТ СРЕДНЕОЖИДАЕМОГО СЦЕПЛЕНИЯ В БИОМЕТРИЧЕСКОМ АНАЛИЗЕ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ»