Cap´ıtulo 4
Endogamia
4.1.
Desviaciones de Panmixia
El equilibrio de Hardy-Weinberg supone una poblaci´on que se reproduce sin estructura de apareamiento. Supone una poblaci´on con panmixia donde los apa-reamientos ocurren de forma aleatoria entre todos los miembros de la poblaci´on. De igual forma supone que no existe ning´un tipo de apareamiento preferencial entre fenotipos o genotipos de ninguna ´ındole.
Los cruces entre individuos emparentados o apareamientos consangu´ıneos, se consideran una desviaci´on de panmixia. Los cruces endog´amicos son comu-nes en diferentes grupos biol´ogicos. En varias especies de plantas y en algunas de animales, la autofertilizaci´on es el m´etodo m´as frecuente de apareamiento. Tambi´en, existen sistemas de apareamiento que favorecen los apareamientos con-sangu´ıneos, de tal forma que la progenie est´e relacionada con todos los adultos y se mejores los sistemas de cooperaci´on; las abejas por ejemplo. Los apareamien-tos consangu´ıneos son m´as comunes cuando el tama˜no de poblaci´on es peque˜na, o en especies que colonizan nuevos h´abitats o peque˜nos fragmentos de bosque (Baker, 1955). Una de las preocupaciones actuales en gen´etica de conservaci´on es el aumento en la endogamia que existe en las poblaciones peque˜nas o de tama˜no reducido por la fragmentaci´on del h´abitat.
Los apareamientos consangu´ıneos o endog´amicos aumentan la probabilidad de heredar loci que son id´enticos por descendencia (IBD por sus siglas en ingl´es). Es decir, heredar la misma secuencia de ADN por dos v´ıas distintas, una ma-terna y otra pama-terna. En la Figura 4.1, se muestra c´omo dos primos hermanos comparten una segmento de un cromosoma, el cual es id´entico por descenden-cia del abuelo paterno. Si los primos producen progenie, ´esta podr´a heredar el mismo segmento cromos´omico de ambos padres. Esto s´olo puede ocurrir si los progenitores tienen un ancestro en com´un.
Figura 4.1: Pedigr´ı que muestra el apareamiento entre primos hermanos. Las barras de colores simbolizan cromosomas. Los primos hermanos comparten un segmento de cromosoma que es IBD proveniente del abuelo paterno. Modificado de Wikimedia.org
Figura 4.2: Los c´ırculos grandes simbolizan individuos diploides, los peque˜nos los alelos para un locus. Los individuos tiene 0, 1, 2 alelos IBD, que se simboliza por l´ıneas que los une a un ancestro com´un. Modificado de Wikimedia.org
id´enticos por descendencia (IBD) en un ´unico locus. En un locus, los alelos son id´enticos por descendencia si provienen de un ancestro com´un en el pasado reciente 1. Los individuos con alelos IBD, usualmente son homocigotos. Para distinguirlos de otros homocigotos, cuyos alelos no son IBD, se les denomina autocigotas. Un autocigota, es un homocigota cuyos dos alelos son id´enticos por descendencia.
4.2.
Endogamia en individuos
El coeficiente de endogamia (f) se define como la probabilidad de encontrar alelos id´enticos por descendencia en un individuo (Figura 4.2). En estos casos, los alelos en un individuo representan el mismo alelo que se hereda por dos v´ıas
1El pasado reciente no est´a definido claramente. Todos los individuos estamos relacionados
Figura 4.3: ´Arbol geneal´ogico que muestra el apareamiento entre medios her-manos. El genotipo de los individuos se muestra debajo de cada uno.
distintas a la misma persona. Para obtener alelos id´enticos por descendencia se requiere que los padres del individuo est´en relacionados, es decir, que tengan un ancestro en com´un.
El coeficiente de endogamia se calcula para un individuo espec´ıfico, tomando en cuenta la relaci´on que existe entre sus padres y la distancia que hay entre el individuo y el ancestro com´un m´as reciente. Cabe mencionar que si los padres no est´an relacionados, se asume quef = 0, es decir, no hay probabilidad de que los alelos de un individuo sean id´enticos por descendencia. Tambi´en, para que el c´alculo s´olo dependa de proporciones mendelianas, se asume que la selecci´on no afecta la probabilidad de herencia de los alelos.
La probabilidad de heredar dos alelos id´enticos por descendencia (IBD) de-pender´a de si tenemos un ancestro com´un y cu´antas generaciones atr´as. En la figura 4.3 podemos observar el apareamiento entre dos medios hermanos. Aqu´ı ambos medios hermanos tienen la madreB como ancestro com´un. La probabi-lidad de que el hijoF de los medios hermanos sea homocigota y autocigota, es decir que sus alelos seanIBD, depender´a de que el mismo alelo sea heredado de la madreB a sus hijosD yE simult´aneamente, y ´estos a su vez, lo hereden a su vez al nietoF.
En la Figura 4.3 la probabilidad de que la madre herede el aleloA1a su hijo
D es de 1
2 y que D herede nuevamente el alelo a F es de 1
probabilidad de heredar el aleloA1v´ıa paterna es de:
P(A1de D) = ✓ 1 2 ◆ ✓ 1 2 ◆ = 1 4
De igual forma, en el pedigr´ı de la figura 4.3 el aleloA1 puede heredarse de
la madre B a su hija E y al nieto F. En este caso las probabilidades son iguales,
1
2 de pasar el alelo de B a E y 1
2 para que el alelo pase de E a F. De esta forma:
P(A1 de E) = ✓1
2
◆ ✓1
2
◆
=1 4
La probabilidad de que el individuo F sea autocigota es:
P(F sea A1A1) =P(A1 de E)⇥P(A1 de D)
= 1 4⇥ 1 4 = 1 16
En el pedigr´ı de la figura 4.3 la probabilidad de que el individuo F sea homocigotoA1A1 y ambos alelos seanibd es de 161. No obstante, el individuo
F tambi´en puede ser autocigoto para el alelo A2. La probabilidad de producir
un individuo autocigoto pero para el alelo A2 es igual que para el otro alelo,
P(F sea A2A2) =161. Por esta raz´on, la probabilidad de que el individuo F tenga
alelos id´enticos por descendencia (f) es la probabilidad de que sea autocigota
A1A1o A2A2:
f =P(A1A1) +P(A2A2) =
1 16+ 1 16= 1 8
Esto nos indica que la probabilidad que el cruce entre dos medios hermanos produzcan un individuo con alelos id´enticos por descendencia es def = 18. Cabe mencionar que en este caso se asume que los individuos en la parte superior del ´arbol geneal´ogico no tienen endogamia. En el ´arbol de la figura 4.3 los individuos A, B y C tienenf = 0. El coeficiente de endogamia depender´a de la distancia que hay entre el individuo de inter´es y el ancestro com´un. Si el ancestro com´un entre dos padres se encuentran muchas generaciones en el pasado, la probabilidad de producir hijos con alelosibd es muy baja.
Existe la posibilidad que los dos alelos de un ancestro com´un, sean tambi´en id´enticos por descendencia. En estos casos la probabilidad de producir un hijo con alelosibd se compone de la probabilidad que los alelos sean iguales o que sean diferentes pero sean id´enticos por descendencia en el ancestro com´un (fB):
fF =
1 8+
1 8fB = 1
En la ecuaci´on anterior, el coeficiente de endogamia de F (fF) se interpreta
como que ambos alelos sean ibd (18) o que los alelos sean diferentes pero tengan la posibilidad de ser ibd porque hay endogamia en el ancestro B (18fB).
El coeficiente de endogamia de cualquier individuo puede ser calculado a par-tir de un pedigr´ı siguiendo el procedimiento descrito anteriormente. Sin embargo, en algunos casos, los pedigr´ıes pueden ser complejos y con varios apareamientos endog´amicos. Por ejemplo, cuando hay cruces entre individuos en cautiverio o se realizan cruces controlados para el mejoramiento gen´etico. En estos casos, el c´alculo de probabilidades, puede ser complejo y propenso a errores. Sewall Wright en 1922, determin´o un algoritmo para estimar el coeficiente de endoga-mia (f) a partir de pedigr´ıes o ´arboles geneal´ogicos, el cual permite incorporar estructuras de apareamiento complejas.
4.2.1.
Conteo de nodos
En esta t´ecnica el coeficiente de endogamia de alg´un individuo de inter´es o
propositusse estima determinando el n´umero de individuosNentre elpropositus
y el ancestro com´un. Para ello se cuentan todos los ancestros del individuo de inter´es subiendo en el ´arbol geneal´ogico por su padre hasta alcanzar el ancestro com´un. Luego se desciende por el ´arbol hasta alcanzar al propositus por la v´ıa materna. El coeficiente de endogamia se estima como:
f =
✓1
2
◆N
(4.1)
Por ejemplo, en el ´arbol de la figura 4.3 elpropositus ser´ıa el individuo F y el ancestro com´un el individuo B. Los ancestros se cuentan a partir del padre de F hasta el ancestro y regresando por la madre de F. Es decir D, B, E; tres ancestros, N = 3. En este caso particular el n´umero de individuos hasta el ancestro com´un esN = 3 por lo que el coeficiente de endogamia del individuo F esfF = 12
3
= 18 como se determin´o anteriormente.
En el caso de que existan varios apareamientos endog´amicos en la familia, existir´an diferentes l´ıneas descendientes o “linajes” que unen elpropositus con el ancestro com´un. En estos casos, se debe estimar el coeficiente de cada linaje usando la ecuaci´on 4.1. El coeficiente de endogamia final del individuo de inter´es, se obtiene al sumar los coeficientes de cada linaje:
f =
m
X
i=1 ✓1
2
◆Ni
(4.2)
Finalmente, si en alguno de los linajes, el ancestro com´un (CA) presenta endogamia; esta se debe incluir en el c´alculo del coeficiente de endogamia del individuo de inter´es.
f =
m
X
i=1 ✓1
2
◆Ni
donde fCA es el coeficiente de endogamia del ancestro com´un. Cuando el
ancestro com´un no tiene endogamia la ecuaci´on (4.3) se convierte en la ecuaci´on (4.2).
Existen ciertas reglas para hacer el c´alculo correctamente con la t´ecnica de conteo de nodos. Una cadena o linaje se define como todos los individuos ligados por herencia desde elpropositushasta el ancestro com´un. Se debe siempre iniciar el conteo con uno de los progenitores (e.g., padre) y finalizar el conteo con el otro padre (e.g., la madre). Se asciende en el ´arbol hasta el ancestro com´un y se desciende hasta alcanzar el otro padre. Una vez que se inicia el descenso en el ´arbol, no se puede volver a subir. No se puede contar el mismo individuo dos veces en una misma cadena, ya que ser´ıa padre y madre al mismo tiempo.
Usualmente, el algoritmo se inicia determinando cu´ales son los ancestros co-munes. Inmediatamente despu´es se determina si los ancestros comunes tienen endogamia o no. En este caso, se debe notar que se requiere utilizar la ecuaci´on 4.3. Luego se identifican todos los linajes entre los ancestros comunes y el pro-positus. Se cuentan los nodos en cada linaje y se utiliza la ecuaci´on (4.1) o (4.3) seg´un corresponda para calcular el coefiente de endogamia para cada uno de los linajes. Finalmente todos los coeficientes se suman usando la ecuaci´on (4.2).
4.3.
Coeficiente de endogamia
f
en poblaciones
En estudios poblacionales, interesa calcular la endogamia promedio de la po-blaci´on. Es decir, la probabilidad de encontrar alelos IBD en individuos dentro de la poblaci´on. En estos casos, no siempre se cuenta con el pedigr´ı o ´arbol ge-neal´ogico de todos los individuos de una poblaci´on. Aunque pudiera obtenerse, en la mayor´ıa de poblaciones no ser´ıa pr´actico calcular el coeficiente de endoga-mia de cada individuo, y ser´ıa probablemente muy costoso. Para ello, lo que se estudia es la probabilidad de encontrar al´elos id´enticos por descendencia en la poza g´enica de la poblaci´on en estudio. Este valor tambi´en es un coeficiente de endogamia y se simboliza porf.
Para un gen con dos alelos (A1,A2), la probabilidad de producir un individuo
homocigota para el primer alelo (A1A1), esta definida por la frecuencia del alelo
A1. La probabilidad de obtener un homocigoto, es la de obtener el mismo alelo
dos veces:p2. No obstante, si hay endogamia, existe la posibilidad que el mismo
alelo A1 se herede de un ancestro com´un. Es decir, el homocigoto es adem´as
autocigoto. Esto ocurre con probabilidadf. De esta manera, la probabilidad de producir un homocigoto est´a dada por:
G11=pf+p2(1 f)
=p2+pqf
sea id´entico por endogamiaf, o encontrar dos alelos que no sean id´enticos por descendenciap2(1 f). La simplificaci´on muestra que la endogamia incrementa la proporci´on de homocigotas por una fracci´onpqf.
Para un heterocigoto, los alelos son siempre diferentes, por lo que no pueden ser id´enticos por descendencia. En este caso, la frecuencia de heterocigotos est´a determinada por:
G12= 2pq(1 f)
= 2pq 2pqf
Al realizar el mismo ejercicio para el homocigoto A2A2, obtenemos que las
frecuencias genot´ıpicas en una poblaci´on con dos alelos y en la cual existe en-dogamia est´an dadas por:
G11=p2+pqf (4.4)
G12= 2pq 2pqf (4.5)
G22=q2+pqf (4.6)
En las ecuaciones anteriores podemos ver que cuando no hay endogamia en la poblaci´on (f = 0), las frecuencias genot´ıpicas son las esperadas por Hardy-Weinberg. De igual forma se puede probar que en casos donde f = 1 los he-terocigotas dejan de existir y las frecuencias de los homocigotos son iguales a las frecuencias al´elicas. Claramente se observa que la endogamia aumenta la frecuencia de los homocigotos, mientras que de forma proporcional, reduce la frecuencia de heterocigotos. Cuando hay endogamia, la endogamia reduce la proporci´on de heterocigotos en una fracci´on 2pqf. La endogamia tiene el efecto de reducir la diversidad gen´etica, al reducir la frecuencia de heterocigotos obser-vados. Sin embargo, como veremos m´as adelante, al no cambiar la frecuencias al´elicas, la diversidad gen´etica esperada no cambia con endogamia.
Utilizando las ecuaciones para las proporciones genot´ıpicas en poblaciones donde se tiene la hip´otesis de endogamia, podemos ver que en estas poblaciones lo que se espera es un d´eficit de heterocigotas. Esta reducci´on en la proporci´on de heterocigotos se puede cuantificar al comparar los heterocigotos observados (HO) en la poblaci´on y los esperado seg´un HWE. En equilibro, se esperar´ıa que
los heterocigotos observados deber´ıan ser los esperados por HWE (2pq) menos la reducci´on por endogamia (2pqf), entonces:
HO= 2pq 2pqf
HO= 2pq(1 f)
f = 1 HO 2pq
f = 1 HO
HE
La ecuaci´on (4.7) muestra que el coeficiente de endogamia puede ser esti-mado en una poblaci´on como la diferencia proporcional que existe entre los heterocigotas observados y la heterocigosidad esperada seg´un HWE. Cuando hay un d´eficit de heterocigotas, el valor del coeficiente de endogamia es positi-vo. En casos donde hay un exceso de heterocigotos, el coeficiente es negativo2. Si el n´umero de heterocigotos esperado y observado son iguales, el coeficiente es cero.
Existen diferentes m´etodos estad´ısticos para determinar si f difiere signifi-cativamente de cero. El m´as com´un se basa en generar l´ımites de confianza para el estad´ıstico f, mediante t´ecnicas de bootstrap. En ellas, se toman diferentes muestras de la poblaci´on con remplazo y se calcula el estad´ıstico en cada una de estas muestras. A partir de todos estos estad´ısticos, se estiman los l´ımites de confianza. Si estos traslapan con cero, se considera quef no difiere estad´ıstica-mente de cero y por ende, no hay endogamia.
4.4.
Frecuencias al´
elicas y endogamia
La endogamia no altera las frecuencias al´elicas entre generaciones. Es de-cir, aunque ocurran varias generaciones de apareamientos co-sangu´ıneos, las frecuencias al´elicas no cambiar´an. Esto puede probarse de la siguiente manera:
p0=G011+1 2G
0
12
= p2+pqf +1
2(2pq 2pqf) =p2+pqf+pq pqf
=p2+pq
=p
Como muestra la simplificaci´on anterior, no importa si hay endogamia (f >
0) o no (f = 0), las frecuencias al´elicas no cambian entre generaciones. Este tipo de an´alisis sugiere que la endogamia NO es una fuerza evolutiva, ya que no cambia las frecuencias al´elicas. Dicho de otra forma, la endogamia no altera el equilibrio Hardy-Weinberg. Sin embargo, la endogamia tiene la posibilidad de generar un aumento en el n´umero de homocigotos recesivos (ver ecuaci´on 4.6) por lo que se puede dar un aumento en la frecuencia de homocigotos re-cesivos. Estos homocigotos expresar´an rasgos delet´ereos o letales. La selecci´on natural (Ver cap´ıtulo 10) eliminar´a estos genotipos delet´ereos, lo cual lleva a una reducci´on en la frecuencia de los homocigotos recesivos, generando un cam-bio en las frecuencias al´elicas. Sin embargo, es importante notar que el camcam-bio en las frecuencias al´elicas se da porque la selecci´on natural elimina los genes
2Recordemos que el coeficiente de endogamia fue originalmente propuesto por Wright como
delet´ereos que se evidencian en forma homocigota por la endogamia. Dicho de otra forma, los alelos se agrupan en homocigotos por endogamia. Esto no altera las frecuencias al´elicas. Pero los homocigotos recesivos de genes delet´ereos son menos viables, y por ende, la selecci´on natural los elimina. Esto resulta en un cambio en las frecuencias al´elicas por selecci´on.
La reducci´on que se observa en la viabilidad de las poblaciones, producto de la endogamia, se conoce comodepresi´on endog´amica.
4.5.
Tractos de Homocigotas
Como se propuso anteriormente, la endogamia aumenta la homocigosidad a lo largo de todo el genoma. El coeficiente de endogamia estima el porcentaje del genoma que es autocigota. Con el advenimiento de t´ecnicas moleculares de alta densidad, se ha tratado de estimar la endogamia de los individuos analizando la homocigosidad en el genoma. Broman and Weber (1999), basados en el estudio de SNPs de alta densidad a lo largo del genoma, encontraron largos tractos de homocigosidad. Ellos sostienen que estas largas secciones cromos´omicas de ho-mocigosidad (Runs of Homozygosity (ROH)) representan autocigosidad y son el resultado de apareamientos consangu´ıneos. No obstante, estos ROHs se encuen-tran de forma com´un en el genoma. En un estudio de m´as de 2600 individuos McQuillan et al. (2008) determinan que ROHs de 4 Mb de largo son comunes en poblaciones exog´amicas con poca evidencia de endogamia reciente.
A pesar de que los ROH son comunes a lo largo del genoma, su longitud depender´a parcialmente de cu´antas generaciones han pasado desde el ´ultimo evento de endogamia. La progenie de apareamientos consangu´ıneos entre primos produce ROHs largos; mientras que los numerosos ROHs de corta longitud son el producto de ancestr´ıa com´un, varios cientos de generaciones atr´as. Esto sugiere que hay un continuo en la distribuci´on de longitudes de ROH’s en el genoma. El coeficiente de endogamia estimado a partir de la longitud de los ROH (FROH)
se correlaciona positiva y significativamente con el coeficiente de endogamia estimado por pedigr´ı (McQuillan et al., 2008). No obstante, es raro encontrar tractos de homocigosis mayores a los 4 Mb en individuos sin endogamia (Broman and Weber, 1999).
Un an´alisis reciente (Kirin et al., 2010) analiz´o la distribuci´on de ROH’s en diferentes poblaciones ind´ıgenas humanas. Ellos encuentran que las poblaciones americanas (Centro y Sudam´erica) tienen la mayor cantidad de ROH’s cortos y largos, lo cual atribuyen a recientes eventos de endogamia y posible endogamia ancestral. Las poblaciones de Ocean´ıa tienen un gran n´umero de ROHs cortos, lo cual atribuyen a aislamiento y tama˜nos efectivos de poblaci´on (Ne) bajos. Esto
de forma escalonada con la distancia de este continente. Este proceso lo expli-can por un proceso de migraci´on y sucesivos cuellos de botella que reducen el tama˜no poblacional, aumentando el desequilibrio de ligamiento (reduciendo la recombinaci´on); todos factores que reducen la diversidad. Tambi´en encuentran un mayor tama˜no de ROH’s en poblaciones donde existe evidencia cultural de apareamientos consangu´ıneos, como el sur asi´atico y en poblaciones con tama˜no de poblaci´on baja como en Sur Am´erica .
Existen otros m´etodos para estimar el nivel de endogamia en el genoma. Estos m´etodos generalmente tratan de estimar el nivel de homocigosidad a lo largo del genoma. Una revisi´on de varios de estos m´etodos (Polaˇsek et al., 2011) demuestra que todos son sensibles a diferentes problemas como desequilibrio de ligamiento (LD). Por ello, siempre se sugiere utilizar una combinaci´on de m´etodos.
Estimar endogamia a nivel individual puede tener aplicaciones importantes en estrategias de conservaci´on, e inclusive para el mejoramiento gen´etico de especies con potencial econ´omico.
Bibliograf´ıa
Baker, H. G. (1955). Self-compatibility and establishment after ’long-distance’ dispersal. Evolution, 9(3):347–349.
Broman, K. W. and Weber, J. L. (1999). Long homozygous chromosomal seg-ments in reference families from the centre d’´Etude du polymorphisme hu-main. American Journal of Human Genetics, 65(6):1493–1500.
Kirin, M., McQuillan, R., Franklin, C. S., Campbell, H., McKeigue, P. M., and Wilson, J. F. (2010). Genomic Runs of Homozygosity Record Population History and Consanguinity. PLoS ONE, 5(11):e13996.
McQuillan, R., Leutenegger, A.-L., Abdel-Rahman, R., Franklin, C. S., Pericic, M., Barac-Lauc, L., Smolej-Narancic, N., Janicijevic, B., Polasek, O., Tenesa, A., MacLeod, A. K., Farrington, S. M., Rudan, P., Hayward, C., Vitart, V., Rudan, I., Wild, S. H., Dunlop, M. G., Wright, A. F., Campbell, H., and Wilson, J. F. (2008). Runs of Homozygosity in European Populations. The American Journal of Human Genetics, 83(3):359–372.
Pemberton, T. J., Absher, D., Feldman, M. W., Myers, R. M., Rosenberg, N. A., and Li, J. Z. (2012). Genomic patterns of homozygosity in worldwide human populations. The American Journal of Human Genetics, 91(2):275–292.