Sobre la Deriva Genética

Anuncio
Sobre la Deriva Genética
La evolución biológica consiste en el cambio de las caracterı́sticas hereditarias a través de las generaciones. Los fenómenos que m’as intervienen en el
proceso evolutivo son la selección natural y la deriva genética. En este trabajo
vamos a tratar de describir por medio de un sencillo modelo matemático, el
fenómeno conocido en genética de poblaciones por deriva (o también a veces
como consanguinidad), Cabrero et AL. (2002), Gale (1990), Drake et al (1998).
Consideremos una población de organismos diploides y cuyo tamaño poblacional, para simplificar, supondremos constante, N , de generación en generación.
También por simplicidad trataremos al tiempo como una variable discreta, cuantificado en término de generaciones. Supondremos apareamiento al azar (panmixia) y no consideraremos ni migración, ni mutación, ni selección.
Vamos a estudiar, para un locus autosómico determinado, con dos alelos
posibles, H y h, como cambian las frecuencias génicas y genotı́picas, especialmente la frecuencia de heterocigotos Hh, de generación en generación.
Sea Wj = (Xj , Yj , Zj ) un vector aleatorio que representa el número de individuos con genotipos HH, Hh y hh respectivamente, en la generación j. Observemos que Xj + Yj + Zj = N y como el total de alelos para este locus es
2N .
Como consecuencia de la hipótesis de panmixia, y en ausencia de mutación,
selección o migración, si en la j-ésima generación Xj = xj , Yj = yj y Zj = zj , al
formar un cigoto de la generación j + 1, tendremos las siguientes probabilidades
¡ aj ¢ 2
p = P (HH) =
,
2N
¡ aj ¢ ¡
a ¢
q = P (Hh) = 2 2N 1 − 2Nj ,
(1)
¡
¢
2
a
r = P (hh) = 1 − 2Nj
siendo aj = 2xj + yj , la frecuencia absoluta del alelo H en la generación j.
La distribución de Wj+1 = (Xj+1 , Yj+1 , Zj+1 ) condicionada a Wj = (Xj , Yj , Zj )
será una trinomial, i.e.:
P [Xj+1 = xj+1 , Yj+1 = yj+1 , Zj+1 = zj+1 |Xj = xj , Yj = yj , Zj = zj ] =
=
N!
pxj+1 q yj+1 rzj+1
xj+1 ! yj+1 ! zj+1 !
La función caracterı́stica de Wj+1 = (Xj+1 , Yj+1 , Zj+1 ), que nos servirá para
hallar la esperanza de Yj+1 , la podremos calcular mediante:
ΦWj+1 (t1 , t2 , t3 )
=
=
=
³
´
E ei(t1 Xj+1 +t2 Yj+1 +t3 Zj+1 )
³ ³
´´
E E ei(t1 Xj+1 +t2 Yj+1 +t3 Zj+1 ) |Wj+1
X
P (Xj = xj , Yj = yj , Zj = zj ) ΦWj+1 |Wj (t1 , t2 , t3 )
xj +yj +zj =N
=
X
xj +yj +zj =N
P (Xj = xj , Yj = yj , Zj = zj ) (peit1 + qeit2 + reit3 )N
Por tanto,
∂Φ
=i
∂t2
y como
resulta
X
P (Xj = xj , Yj = yj , Zj = zj )N (peit1 +qeit2 +reit3 )N −1 q eit2
xj +yj +zj =N
∂Φ
∂t2 (0, 0, 0)
iE(Yj+1 ) =
E(Yj+1 ) =
=
y
P
xj +yj +zj =N
E(Aj ) −
p + q + r = 1 , teniendo en cuenta (6),
¡
P (Xj = xj , Yj = yj , Zj = zj ) aj 1 −
aj ¢
2N
1
2
2N E(Aj )
donde Aj es la variable aleatoria número de alelos H presentes en la generación
j.
Alternativamente podemos escribir también:
E(Yj+1 ) = E(Aj ) −
1
(var(Aj ) + E 2 (Aj )).
2N
(2)
Vemos pues que E(Yj ) depende de la esperanza y varianza de Aj , por lo
que procederemos a calcularlas. La variable aleatoria Aj , el número de alelos
H en la generación j, puede tomar valores 0, 1, ..., 2N . Supongamos que en la
generación inicial el número de alelos H que hay en la población es c, conocido,
A0 = c. Vamos a calcular los momentos de la variable aleatoria Aj a partir de
la función caracterı́stica, como hemos hecho anteriormente.
¡
¢
¡ ¡
¢¢
ΦAj+1 (t) = E eitAj+1 = E E eitAj+1 | Aj
=
2N
X
P (Aj = k) ΦAj+1 |Aj =k (t)
k=0
donde ΦAj+1 |Aj =k (t) es la función caracterı́stica de Aj+1 condicionada a Aj = k.
La distribución de la variable aleatoria Aj+1 condicionada a Aj = k, como
consecuencia de la hipótesis de panmixia y en ausencia de mutación, selección o
k
migración, será una Binomial, B(2N, 2N
), por tanto
ΦAj+1 (t) =
2N
X
P (Aj = k)(
k=0
Φ0Aj+1 (t) = i
2N
X
P (Aj = k)2N (
k=0
k it
k 2N
e +1−
)
2N
2N
k it
k 2N −1 k it
e +1−
)
e
2N
2N
2N
y como iE(Aj+1 ) = Φ0Aj+1 (0), resulta:
E(Aj+1 ) =
2N
X
P (Aj = k) k = E(Aj )
k=0
lo que implica, por recurrencia, que
E(Aj+1 ) = E(Aj ) = ... = E(A0 ) = c.
Es decir que el valor medio de las frecuencias de los alelos H permanece
constante a lo largo de todas las generaciones.
Para obtener la varianza de Aj+1 , calcularemos primero E(A2j+1 ) a través de
la derivada segunda de la función caracterı́stica, ya que −E(A2j+1 ) = Φ00Aj+1 (0).
Φ00Aj+1 (t)
µ
k 2N −2 k 2 2it
k it
e +1
)
= −
P (Aj = k) 2N (2N − 1)(
e
2N
2N
4N 2
k=0
´
k 2N −1 k
k it
it
e + 1 − 2N
)
e
+ 2N ( 2N
2N
2N
X
por lo tanto
E(A2j+1 )
=
2N
X
µ
P (Aj = k)
k=0
³
1
2N
2N (2N − 1) 2
k +k
4N 2
¶
´
E(A2j ) − E(Aj )
³
´³
´
1
=
1 − 2N
var(Aj ) + E(Aj )2 − E(Aj )
³
´³
´
1
=
1 − 2N
var(Aj ) + c2 − c.
=
1−
y
³
³
³
1 ´
1 ´
c ´
var(Aj+1 ) = 1 −
(var(Aj ) + c2 ) + c − c2 = 1 −
var(Aj ) + c 1 −
2N
2N
2N
Reiterando el proceso, al ser A0 una constante, var(A0 ) = 0, tendremos
³
´
c
var(A1 ) = c 1 − 2N
³
´³
³
´´
c
1
var(A2 ) = c 1 − 2N
1 + 1 − 2N
´³
³
´ ³
´2 ´
³
1
1
c
var(A3 ) = c 1 − 2N
1 + 1 − 2N
+ 1 − 2N
............................................................
var(An )
............................................................
³
´³
c
1
1 2
= c 1 − 2N
1 + (1 − 2N
) + (1 − 2N
) + ... + (1 −
1 n−1
2N )
´
y teniendo en cuenta la fórmula de la suma de los n primeros términos de una
progresión geométrica, tendremos finalmente
µ
µ
¶n ¶
³
1
c ´
1− 1−
var(An ) = 2N c 1 −
2N
2N
Podemos observar, a partir de la anterior expresión, que, fijado el tamaño poblacional N , la varianza de la variable aleatoria, número de alelos H, aumenta de
generación en generación. Cuando el número de generaciones tiende a infinito,
la varianza será:
¶
µ
b
= 2N var(A1 )
(3)
lı́m var(An ) = 2N b 1 −
n−→∞
2N
Volviendo ahora a la expresión (2), tendremos finalmente
µ
¶j+1
³
c ´
1
E(Yj+1 ) = c 1 −
1−
2N
2N
Si suponemos que la población inicialmente ya estaba en equilibrio HardyWeinberg, las frecuencias relativas de los diferentes genotipos al inicio son:
fr (HH) =
³ c ´2
,
2N
fr (Hh) = 2
Por lo tanto
Y0 = 2N
y resulta finalmente a:
³ c ´³
³
c ´
c ´2
1−
, fr (hh) = 1 −
2N
2N
2N
³ c ´³
c ´
1−
2N
2N
¶n
µ
1
E(Yn ) = Y0 1 −
2N
lo que significa que la esperanza de la frecuencia del genotipo Hh en la generación n, depende de la cantidad inicial de heterocigotos y va disminuyendo a
medida que transcurren las generaciones. Si calculamos el lı́mite cuando n → ∞
tendremos:
µ
¶n
1
lı́m E(Yn ) = lı́m Y0 1 −
=0
n−→∞
n−→∞
2N
Lo que demuestra que, en las condiciones estudiadas, los heterocigotos se extinguen.
A continuación exponemos unas gráficas, en donde se pone de manifiestos
los resultados teóricos obtenidos anteriormente. En Figura 1 realizamos simulaciones con 1000 individuos y con 250 alelos H al inicio. Observamos que en la
generaciones, 216, 832, 1748 el alelo H ha desaparecido y que en la generación
1721, con las mismas condiciones iniciales, todos los alelos de la población, son
H. En la Figura 2, vemos que en las generaciones 299, 678, 1798 todos los alelos son H y que con las mismas condiciones experimentales, los alelos H han
desaparecido en la generación 1367. En general si el número de alelos inicial b,
está más próximo a cero que a 2N , es más fácil que se alcance el estado estacionario 0 que el 2N . Viceversa, si está más cerca de 2N es más fácil que acaben
siendo todos los alelos H. Además, en general, cuando más cerca esté el número
de alelos H del estado absorbente, 0 ó 2N , o más pequeño sea el tamaño de
la población, más rápido se alcanza esta situación. Ver en Figuras 3 que con
250 individuos y con el 50 % de alelos H al inicio, acaban siendo todos H en la
generación 578 y que con 1000 individuos y con el 50 % de alelos H al inicio,
acaban siendo todos H en la generación 1620.
Vamos a tratar el tema utilizando una cadena de Markov.
En una población de N individuos, en las mismas condiciones que las anteriormente descritas, con dos posibles alelos H y h, para un locus autosómico
determinado, tendremos los 2N + 1 estados {A0 , A1 , ..., A2N }, donde Ai es el
número de alelos H en el total de la población. En la genración k tendremos los
estados {Ak0 , Ak1 , ..., Ak2N }.
La probabilidad pij de pasar del estado Ai al estado Aj , al cambiar de la
genración k a la k + 1 será:
pij =
p(Ak+1
/Aki )
j
(2N )!
=
(2N − j)!j!
µ
i
2N
¶j µ
2N − i
2N
¶2N −j
La matriz de transición P = (pij ); i, j = 0, 1, ..., 2N es de la forma:


1 00 0


u P1 v 
P =


0 00 1
(4)
donde:
0 es el vector nulo de orden 2N − 1,
u0 =(p1 0 , p2 0 , ..., p2N −1 0 ), v0 =(p1 2N , p2 2N , ..., p2N −1 2N ), (p1 0 = p2N −1 2N , p2 0 =
p2N −1 2N , ..., p2N −1 0 = p1 2N ),
y P1 es una matriz de orden (2N − 1, 2N − 1) cuyos elementos son mayores que
cero e inferiores a la unidad.
Se puede demostrar fácilmente por inducción que


1
00
0


n
−1
n
−1
n

Pn = 
(5)
 (I − P1 ) (I − P1 ) u P1 (I − P1 ) (I − P1 ) v 
0
00
1
Cuando transcurre un número suficientemente grande de generaciones, la matriz
de transición que da como:


1
00
0


(I − P1 )−1 u Q(0) (I − P1 )−1 v 
lı́m P n = 
(6)


n−→∞
0
00
1
Q(0) es una matriz (2N − 1, 2N − 1) cuyos elementos son todos nulos.
El vector columna c = (I − P1 )−1 u, tiene por componentes cj =
j = 1, ..., 2N − 1 ya que el vector u = (I − P1 )c tiene por componentes:
³
´2N
−j
uj = pj0 = 2N
que cumplen
2N
uj = cj −
2N
−1
X
2N −j
2N ,
pjα cα
α=1
En efecto
µ
2N − j
2N
¶2N
=
µ
¶α µ
¶2N −α µ
¶
2N −1
2N !
j
2N − j
2N − α
2N − j X
−
=
2N
(2N − α)!α! 2N
2N
2N
α=1
2N − j
=
−
2N
ÃÃ
j
2N − 2N
2N
2N
!µ
2N − j
2N
!
¶2N
−0
=
2N − j
=
−
2N
Ã
2N − j
−
2N
µ
2N − j
2N
¶2N !
µ
=
2N − j
2N
¶2N
De manera similar puede demostrarse que el vector columna d = (I − P1 )−1 v,
j
tiene por componentes dj = 2N
, j = 1, ..., 2N − 1
Si en la poblacón inicial tenemos q alelos H, el vector estado inicial es q =
(0, ..., 1, ..., 0), es decir todas las componentes son cero excepto la que ocupa
el lugar q. Transcurrido un número suficientemente grande de generaciones,
tendremos un vector estado
f =(
2N − q
q
, 0, ..., 0,
)
2N
2N
es decir estarı́amos en el estado A0 (todos los genotipos de la población serı́an
−q
q
hh con probabilidad 2N
2N o todos serı́an HH con probabilidad 2N
Bibliografı́a
Cabrero, J., Camacho J.P. (2002). Fundamentos de Genética de Poblaciones.
En: Soler M. (Ed.) EVOLUCIÓN. La base de la Biologı́a, pp. 83-126. Proyecto
Sur de Ediciones, S.L.
Drake, J.W., Charlesworth, B., Charlesworth, D., Crow, J.F. (1998). Rates
of spontaneous mutation. Genetics 148:1667-1686.
Gale, J.S. (1990) Theoretical population genetics. Unwin Hyman Ltd. London.
Martı́n Rı́os.
Departamento de Estadı́stica.
Facultad de Biologı́a.
Universidad de Barcelona.
Número de Individuos: 1000
Frecuencia Inicial: 250
Número de alelos
2000
1500
1000
500
30
0
40
0
50
0
60
0
70
0
80
0
90
0
10
00
11
00
12
00
13
00
14
00
15
00
16
00
17
00
18
00
19
00
10
0
20
0
0
0
Generación
Figura 1:
Número de Individuos: 1000
Frecuencia Inicial: 1750
Número de alelos
2000
1500
1000
500
30
0
40
0
50
0
60
0
70
0
80
0
90
0
10
00
11
00
12
00
13
00
14
00
15
00
16
00
17
00
18
00
19
00
10
0
20
0
0
0
Generación
Figura 2:
Número de Individuos: 250/1000 Frecuencia Inicial: 250/1000
1500
1000
500
30
0
40
0
50
0
60
0
70
0
80
0
90
0
10
00
11
00
12
00
13
00
14
00
15
00
16
00
17
00
18
00
19
00
10
0
20
0
0
0
Número de alelos
2000
Generación
Figura 3:
Descargar