• No se han encontrado resultados

Análisis y validación de inversiones en HuRef

1.4 Variación estructural intraespecífica humana

1.5.4 Inversiones detectadas entre los genomas de J Craig Venter y Referencia

1.5.4.3 Análisis y validación de inversiones en HuRef

Es importante conocer qué inversiones de este conjunto han sido validadas experimentalmente y para cuantas de ellas se tienen datos de su frecuencia y distribución poblacional. Las inversiones detectadas no son únicas de HuRef ni del genoma de Referencia de manera que pueden haber sido validadas en otros estudios y en otros individuos. Esto es lo que ocurre con un estudio que se realizó en el mismo año que se publicó el genoma HuRef y cuyo objetivo fue la detección de variación estructural mediante PEM [Korbel et al. 2007]. Se detectaron algunas inversiones que están presentes en HuRef y se validaron 12 de ellas por PCR (HsInv0024, HsInv0030, HsInv0031, HsInv0042, HsInv0045, HsInv0050, HsInv0061, HsInv0062, HsInv0064, HsInv0066, HsInv0073 y HsInv0074) y una por FISH (HsInv0002). Hemos querido referenciar estas inversiones con su código identificativo correspondiente a la base de datos InvFEST en lugar de sus coordenadas, y además coincide con su orden en la lista de inversiones reportadas en la comparación de ambos genomas [Levy et al. 2007]. En este estudio se genotiparon dos individuos que corresponden al proyecto HapMap, un individuo de origen Africano de código NA18505 y un individuo de origen no conocido NA15510, por lo que no se puede establecer ninguna distribución poblacional.

Por otra parte, en el año 2013 se publicó un estudio directamente relacionado con las variantes descubiertas en HuRef, co n el o b jetiv o d e estab lecer lo s mecan ismo s de formación en esas variantes y dar una idea de su impacto y características en el genoma humano [Pang et al. 2013]. Se analizaron experimentalmente 8 inversiones, de las cuales 7 habían sido detectadas por comparación genómica [Levy et al. 2007] y la inversión restante por PEM usando las secuencias generadas en el ensamblaje de HuRef [Pang et al. 2010]. De éstas, 6 inversiones fueron validadas experimentalmente mediante PCR (HsInv0004, HsInv0030, HsInv0031, HsInv0052, HsInv0063 y HsInv0095) y dos (HsInv0073 y HsInv0062) resultaron ser posibles errores en el genoma de Referencia, aunque no fue demostrado. En cuanto a la distribución poblacional, las inversiones se genotiparon por PCR en 10 individuos de origen Africano, 20 de origen Asiático, 11 de origen Europeo y 1 de origen no conocido, pertenecientes a poblaciones del proyecto HapMap y 1 chimpancé con el que se estableció la orientación ancestral. En 3 de ellas la inversión se genotipó también por SNPs marcador en 60 individuos Europeos, 88 individuos Asiáticos y 59 individuos Africanos. Además, a partir de las frecuencias imputadas de los SNPs marcador, se calculó la diferenciación genética entre poblaciones mediante el índice de estructura poblacional Fst (Tabla 1.5).

Tabla 1.5: Resultado de la genotipación experimental y mediante SNPs marcador de inversiones en HuRef. Tabla modificada a partir de Pang et al. 2013

Dos inversiones (HsInv0052 y HsInv0063) resultaron pertenecer a variantes complejas. La primera está relacionada con un CNV que fue validado por PCR cuantitativa, llegando a la conclusión de que la inversión y el CNV aparecieron a la vez (Figura 1.18), por lo que se consideró una variante multialélica y no se analizó su distribución poblacional.

Además no sólo hay una deleción asociada a la inversión sino que toda la región está afectada por una deleción mucho más grande que es independiente a la variante compleja.

Figura 1.18: Imagen del navegador genómico en la región de HsInv0052. En la parte superior, la inversión está representada por una barra de color verde, la deleción por una barra de color azul y la duplicación por una roja. En la parte inferior se pueden ver las entradas de variantes estructurales en DGV. Entremedio y de color verde pistacho podemos ver información relacionada con los ensamblajes de chimpancé y orangután. Las líneas negras discontinuas verticales representan ensayos de PCR cuantitativa realizados en el estudio. Imagen tomada de Pang et al. 2013.

En el caso de la inversión HsInv0063, se detectó una variante compleja que incluye inversión y deleción. Esta inversión tiene una frecuencia mayor en Europeos y Asiáticos en comparación con los individuos Africanos, y un valor Fst de 0.38 que indica una varianza mayor de lo normal entre poblaciones. En ausencia de elementos funcionales, los autores la atribuyen a un efecto fundador en la población Euroasiática sumado a la deriva genética.

Por otro lado la inversión HsInv0030 intercambia el exón 1 entre dos genes CTRB1 y CTRB2, que codifican para proteínas precursoras de quimotripsinógenos B (Figura

1.19A). Aunque los genes tienen una similitud del 97%, los primeros exones son un poco

más diferentes, con un 82% de similitud. El estado ancestral corresponde a la orientación invertida que tiene una frecuencia alta en la población. Además, se detectó una deleción adyacente a la inversión en algunos individuos Europeos y un individuo Asiático. Esta deleción afecta al exón 6 del gen CTRB2, y mediante el análisis de los genotipos de primates se postuló como un alelo derivado del haplotipo invertido. Para la inversión y la deleción se genotiparon por PCR 871 individuos del panel de diversidad del genoma humano HGDP-CEPH provenientes de 57 poblaciones. La orientación invertida resultó ser la mayoritaria y la deleción está ligada a ella. Las poblaciones con mayor frecuencia para el haplotipo conjunto de la inversión y la deleción son Surui (47.2%), Vasco Franceses (20.5%), Italianos del Norte (17.9%) y Drusos (15.4%), mientras que no se encontró en Yorubas, Yakut, Sindhi y Pigmeos Mbuti (Figura 1.19B). El ín dice d e estructuración de la población tiene un valor de 0.53, por lo que resultaron evidentes las diferencias de frecuencia entre poblaciones. Mediante el análisis de los transcritos se

llegó a la conclusión de que puede estar relacionada con adaptación a diferencias en la dieta a partir de la enzima digestiva quimotripsina.

Figura 1.19: Esquema y distribución poblacional de la inversión 16q23.1 y su deleción asociada. (A) Imagen del navegador genómico donde se muestra la inversión en verde, la deleción en azul, las duplicaciones segmentales en naranja y los genes afectados. (B) Distribución poblacional de los 3 haplotipos en 749 individuos de poblaciones HGDP-CEPH. Sólo se muestran las poblaciones con al menos 10 individuos genotipados. Imagen tomada de Pang et al. 2013.

Por último, dos inversiones (HsInv0001 y HsInv0042) fueron descartadas como errores en el ensamblaje del genoma de Referencia por el consorcio encargado de su revisión, GRC (del inglés Genome Reference Consortium). En total, 16 inversiones descubiertas por Levy y colaboradores en la comparación de HuRef y el genoma de Referencia han sido analizadas experimentalmente en dos estudios [Korbel et al. 2007] [Pang et al. 2013].

1.6 Objetivos

El objetivo principal de esta tesis es analizar bioinformática y experimentalmente las inversiones descubiertas por la comparación de los genomas de J. Craig Venter y de Referencia que han sido ensamblados de forma independiente. En concreto, la validación de las inversiones y el descarte de posibles falsos positivos contribuye a la construcción de un catálogo fiable y no redundante de inversiones en el genoma humano. Además, la genotipación de individuos de diferentes poblaciones humanas y otras especies también es un punto importante, ya que permite tanto analizar la distribución poblacional de las inveriones como entender mejor su origen. Con este estudio se espera aportar conocimiento sobre las características de sus puntos de rotura, mecanismos de formación, estado ancestral, origen, distribución, posibles efectos sobre genes y posibles efectos adaptativos en el genoma humano, para de este modo determinar el impacto funcional y evolutivo de las inversiones en el genoma humano.

Los objetivos concretos son los siguientes:

1. Análisis exhaustivo de las diferentes inversiones predichas para descartar falsos positivos y validación experimental de las verdaderas inversiones polimórficas.

2. Definición de los puntos de rotura con la máxima precisión posible y determinación del mecanismo de origen y el estado ancestral de las diferentes inversiones polimórficas identificadas.

3. Estudio de la frecuencia y distribución de las inversiones en distintas poblaciones humanas.

4. Análisis de la variación nucleotídica y haplotípica de las dos ordenaciones.

5. Identificación de las inversiones candidatas a tener efectos funcionales sobre genes así como de las que muestren patrones indicativos de selección positiva.