• No se han encontrado resultados

Implicaciones del origen recurrente de las inversiones

Validation and population analysis of inversions between independently assembled human genomes

SUPPORTING INFORMATION

4.3 Las características de los puntos de rotura dividen las inversiones cromosómicas

4.3.3 Implicaciones del origen recurrente de las inversiones

Tradicionalmente se ha considerado que las inversiones cromosómicas tienen un origen único o monofilético, es decir se forman una única vez [Krimbas y Powell 1992]. Sin embargo, nuestro estudio aporta ejemplos de inversiones que se han generado más de una vez en humanos usando los mismos puntos de rotura, lo que implica que la secuencia ha cambiado de orientación con cada evento. Se las denomina inversiones con origen recurrente o polifilético y también se pueden dar en especies diferentes. En nuestro estudio se analizó el origen de las inversiones basándonos en el desequilibrio de ligamiento entre los alelos de la inversión y los alelos de los SNPs localizados dentro de la región invertida. También se analizaron los haplotipos formados por ambos alelos para cada orientación y se genotiparon varios chimpancés y gorilas para analizar un posible polimorfismo entre especies como evidencia extra de recurrencia.

En el momento en que se genera una inversión cromosómica, la diferente orientación entre la secuencia no invertida y la invertida impide la recombinación en los individuos heterocigotos, de manera que la secuencia invertida actúa como un haplotipo independiente y captura una combinación de alelos de los SNPs localizados dentro, por lo que segregan siempre con la inversión y se genera un bloque de desequilibrio de ligamiento. Con el paso del tiempo, ambos haplotipos acumulan cambios y se diferencian entre sí. Esta huella en la variación nucleotídica y haplotípica caracteriza a las inversiones con origen único. En cambio, en las inversiones recurrentes se reinvierte la secuencia invertida o se invierte de forma independiente de manera que ambas secuencias vuelven a recombinar en su totalidad, por lo que se rompe el desequilibrio de ligamiento entre los alelos de los SNPs de la región anteriormente invertida. Es cierto que en las inversiones de gran tamaño se da cierta recombinación lejos de los puntos de rotura, pero el efecto de la recurrencia es mucho mayor porque se restablece la recombinación en toda la región. En estas inversiones no encontramos alelos de SNPs propios de cada haplotipo, sino que debido al cambio de orientación que ha sufrido la secuencia, los alelos son compartidos en ambos haplotipos.

En nuestro estudio se detectaron 3 inversiones con origen recurrente y junto con otros estudios en humanos [Antonacci et al. 2009] [Aguado et al. 2014], los resultados dan más importancia a este fenómeno. Por el momento sólo un estudio ha analizado este tipo de inversiones en más de una población humana y concluyó que 5 de las 6 inversiones analizadas con puntos de rotura en LCRs son recurrentes [Antonacci et al. 2009]. En el

estudio de Aguado y colaboradores [Aguado et al. 2014] se analizó su origen usando sólo individuos de población Europea y se determinó la recurrencia de 13 de las 17 inversiones analizadas. Al igual que en estos estudios, las 3 inversiones tienen puntos de rotura localizados en RIs, y se forman por recombinación entre ellas, mediante el mecanismo homólogo de NAHR [Aguado et al. 2014]. El análisis de la variación nucleotídica y haplotípica nos reveló que estas inversiones tienen características comunes. En primer lugar tienen SNPs compartidos entre ambas orientaciones, es decir, se encuentran los mismos alelos de varios SNPs en la secuencia con orientación estándar y en la secuencia de orientación invertida. Además no tienen SNPs fijados, es decir, SNPs en que un alelo segrega siempre junto al alelo estándar de la inversión y el otro alelo junto al alelo invertido. Por último, en el análisis de los haplotipos de este tipo de inversiones se han detectado grupos de haplotipos compartidos donde cromosomas portadores y no portadores de la inversión tienen los mismos cambios nucleotídicos en la región invertida. En nuestro caso, el menor tamaño de las inversiones provoca que el número de alelos de SNPs compartidos sea menor que en las inversiones analizadas en el estudio de Aguado y colaboradores.

Evidentemente la formación de una nueva inversión exactamente en el mismo lugar donde se formó la inversión anterior tendría las mismas consecuencias, pero la probabilidad de que se produzcan dos mutaciones independientes en el mismo lugar del genoma es muy baja. El único fenómeno que puede producir que se compartan los alelos de los SNPs entre ambas ordenaciones de la secuencia es que se copie la secuencia en los individuos heterocigotos y el mecanismo responsable sería la recombinación. No obstante uno de los efectos más conocidos de las inversiones es la inhibición de la recombinación en la región invertida entre ambas secuencias en los individuos heterocigotos. Aun así las inversiones de gran tamaño pueden formar un bucle o lazo mediante el que se podría dar recombinación en la región invertida lejos de los puntos de rotura por doble entrecruzamiento. En el caso de la inversión en el cromosoma 8p23, la inversión polimórfica más grande del genoma humano con un tamaño de unas 4.5 Mb, se especula con esa posibilidad [Salm et al. 2012]. Se han realizado estudios con espermatozoides humanos que revelan que la incidencia de la recombinación está relacionada con el tamaño de la región invertida. En estos estudios se ha visto que el tamaño mínimo de las inversiones que permiten que se dé recombinación lejos de sus puntos de rotura que afecta a los gametos es de 100 Mb y que es necesario que la inversión ocupe al menos un 50% del tamaño del cromosoma [Anton et al. 2005]. Por lo tanto podemos descartar la formación de entrecruzamientos dobles en nuestro conjunto de inversiones de tamaños muy inferiores.

Otra forma de copiar la secuencia entre ambas orientaciones podría ser la conversión génica. Se trata de una forma de recombinación en que se copia la información de un cromosoma a otro sin que el primero resulte alterado. En mamíferos se tiene constancia de este fenómeno que en general no copia secuencias de más de 1 Kb [Chen et al. 2007].

Por lo tanto, la conversión génica puede explicar la existencia de alelos de SNPs compartidos entre ambas ordenaciones sin necesidad de mediar recurrencia. De hecho en estudio realizado por Aguado y colaboradores en el año 2014 se detectaron alelos compartidos en inversiones que aparentemente tenían un origen único [Aguado et al. 2014]. No obstante, la conversión génica no puede explicar la ausencia de alelos fijados entre ambas orientaciones. Si tomamos como ejemplo una inversión de origen único que fija alelos en ambas orientaciones y suponemos que la conversión génica copiase algunos alelos de la secuencia de ordenación estándar a la secuencia de ordenación invertida, lo que obtendríamos sería una inversión con alelos fijados y alelos compartidos. Por lo tanto la conversión génica no puede explicar la ausencia de alelos fijados en las inversiones con alelos compartidos y eso demuestra que se trata de inversiones recurrentes. Para obtener el patrón de variación nucleotídica de las inversiones recurrentes la conversión génica tendría que copiar todos los alelos de los SNPs a lo largo de la región invertida, que en algunos casos se extiende varias kilo bases. Además existen otras evidencias de que se trata de eventos recurrentes, como por ejemplo los resultados del análisis haplotípico. Estas inversiones muestran grupos de haplotipos correspondientes a la orientación invertida que en vez de localizarse en los arboles de haplotipos junto al resto de haplotipos de su misma orientación, por la similitud de sus alelos con los haplotipos correspondientes a la otra orientación se encuentran agrupados junto a ellos. Podemos ver un ejemplo en la Figura 5 en el apartado de resultados. Todo esto sugiere que se trata de inversiones recurrentes.

Por último, una de las principales ventajas de este trabajo es que hemos podido comparar los patrones de variación nucleotídica y haplotípica de las inversiones con puntos de rotura localizados en RIs y de las inversiones con puntos de rotura no localizados en RIs, que debido a su mecanismo de formación no homólogo tienen un origen único. Ambos grupos de inversiones provienen del mismo método de detección y de la comparación de los mismos genomas. Los resultados contrastan claramente, ya que las inversiones formadas por mecanismos no homólogos no tienen alelos de SNPs compartidos dentro de la región invertida y tampoco tienen grupos de haplotipos compartidos entre ordenaciones. Los alelos de SNPs en sus regiones invertidas están fijados y los grupos de haplotipos de uno y otro alelo de la inversión claramente diferenciados en los arboles de haplotipos. Este hecho es una evidencia más de la recurrencia de las inversiones con puntos de rotura localizados en RIs. En comparación con el trabajo de Aguado y colaboradores, el tamaño de las inversiones analizadas en nuestro estudio es menor y provoca que el número de alelos de SNPs compartidos sea también menor.

Por otra parte, hay que mencionar que se han tomado precauciones antes de designar estas inversiones como recurrentes. En primer lugar nos aseguramos que no se trataba de errores de genotipación de las inversiones porque se repitieron los experimentos de PCR para aquellos individuos que indicaron recurrencia y se comprobó que ambos puntos de rotura indicasen el mismo genotipo. En segundo lugar, la identidad de los individuos fue

confirmada por microsatelites para asegurarnos que los genotipos de las inversiones y los SNPs provenían de la misma persona. En tercer lugar se repitió el análisis de la variación nucleotídica y haplotípica usando la información de SNPs de dos conjuntos de datos diferentes, los correspondientes al proyecto de los 1000 Genomas y los correspondientes al proyecto HapMap, obteniendo los mismos resultados. Finalmente, los resultados del análisis de la variación nucleotídica que se basan en los genotipos de los SNPs y los resultados del análisis de los haplotípos que se basan en datos faseados coinciden perfectamente. Además en el caso de los haplotipos construidos a partir de los datos HapMap se usó la información de los tríos familiares, que le dan más robustez al proceso de faseo de los datos. Al igual que en el estudio de Aguado y colaboradores [Aguado et al. 2014], se genotiparon 4 chimpancés y 2 gorilas para determinar si las inversiones también son polimórficas en otras especies o bien muestran diferentes orientaciones, ya que se trataría de otra evidencia de recurrencia porque es poco probable que se mantenga un polimorfismo entre especies distintas durante tanto tiempo. A diferencia del estudio de Aguado y colaboradores, nuestros resultados fueron negativos y no se detectó ninguna inversión polimórfica o con distintos alelos entre especies, lo que indica que los eventos de recurrencia se han producido en la especie humana. No obstante, el tamaño de la muestra es bastante limitado y habría que confirmar estos resultados con más individuos. Hay que tener en cuenta que el número de inversiones recurrentes podría ser mayor ya que han resultado ser recurrentes 3 de las 9 inversiones analizadas con puntos de rotura en RIs (HsInv0030, HsInv0055 y HsInv0069), pero debido a que sólo se usaron individuos europeos en su análisis, únicamente se han detectado los eventos de recurrencia ocurridos en esta población y esto constituye una limitación a la hora de concluir cuantas de estas 9 inversiones son recurrentes en humanos. En un estudio que se está realizando sobre la recurrencia de las inversiones polimórficas del genoma humano presentes en la base de datos InvFEST [Martínez-Fundichely et al. 2013], entre las cuales se encuentran algunas de las inversiones de nuestro estudio, se han obtenido genotipos para 7 poblaciones humanas de distintos continentes correspondientes al proyecto HapMap mediante una nueva técnica basada en el MLPA [S. Villatoro and M. Cáceres, resultados no publicados]. Por el momento se han detectado eventos de recurrencia de la inversión HsInv0072 en 3 poblaciones y se ha confirmado la recurrencia de las inversiones HsInv0030 y HsInv0055 en al menos 3 poblaciones distintas a la Europea [S.Villatoro y M. Cáceres, resultados no publicados], mientras que la inversión HsInv0069 no se ha podido analizar aún en estos individuos. En este sentido es necesario un análisis a mayor escala donde se incluyan individuos de todas las poblaciones posibles para poder conocer el impacto global de este tipo de inversiones a nivel del genoma humano.

En el apartado anterior hemos visto como en el genoma se reutilizan los puntos de rotura de las variantes estructurales o las zonas en que estos están ubicados. Siguiendo en la misma línea, las variantes formadas por NAHR entre RIs, en este caso inversiones, también reutilizan sus puntos de rotura aunque de forma diferente. Mientras las variantes

estructurales complejas usan un mismo punto de rotura para varias variantes estructurales, las variantes recurrentes los reutilizan para revertir y reaparecer. En cualquier caso, se generan pocos puntos de rotura en zonas nuevas.

Por otro lado, la recurrencia no solo implica que sea más difícil analizar la historia evolutiva de estas variantes, sino que la rotura del desequilibrio de ligamiento implica que no puedan ser genotipadas a partir de SNPs y que sea necesaria la genotipación experimental [Aguado et al. 2014]. Además esto conlleva que en los estudios de asociación a nivel de todo el genoma basados en genotipos de SNPs se pierden los efectos fenotípicos de las inversiones recurrentes. No solo eso, sino que puede tratarse de un porcentaje importante de las inversiones si tenemos en cuenta que las inversiones de mayor tamaño tienen sus puntos de rotura localizados en RIs y están formadas por NAHR, características que las hacen candidatas a ser recurrentes. Por lo tanto, pueden haberse obviado y se siguen obviando los efectos de la mayoría de inversiones de gran tamaño del genoma humano en este tipo de estudios de asociación.