Técnicas moleculares basadas en el análisis de ADN

1. INTRODUCCIÓN

1.1.2. Caracterización de variedades de vid

1.1.2.4. Técnicas moleculares basadas en el análisis de ADN

Las técnicas moleculares permiten estudiar polimorfismos en el ADN, origen de toda la variación genética, y constituyen por tanto una aproximación más fiable para determinar las diferencias entre variedades o especies. Además evitan problemas asociados con

influencias medioambientales, factores fisiológicos y expresión específica de tejido y desarrollo.

A partir de los años 70, aparecieron los llamados “marcadores moleculares”, que consisten en sistemas polimórficos basados en la detección de pequeñas diferencias existentes en las secuencias del ADN. Se trata por tanto de “polimorfismos moleculares” relativos a diferencias de bases nucleotídicas que se pueden detectar por una diversa gama de técnicas y que se pueden utilizar como alelos moleculares.

Aunque los primeros marcadores utilizados fueron los RFLP (Restriction Fragment Lenght Polymorphism), una técnica laboriosa y no fácilmente automatizable basada en la digestión de ADN mediante enzimas de restricción, en los últimos años ha sido ampliamente utilizada la reacción en cadena de la polimerasa (PCR). Esta técnica permite la amplificación de fragmentos específicos, hasta concentraciones muy elevadas, a partir de pequeñas cantidades de ADN molde. Para ello es necesario, además del ADN molde, una ADN polimerasa termoestable, nucleótidos y unos pequeños fragmentos monocatenarios de ADN que, por complementariedad de bases, se pueden unir al ADN molde y sirven de cebadores a la polimerasa. A partir de dos de estos cebadores que cumplan determinados requisitos, la polimerasa copia el fragmento contenido entre ellos. Este proceso se repite muchas veces, y, en cada nuevo ciclo, el fragmento recién sintetizado puede servir como molde; así el resultado es una amplificación exponencial de dicho fragmento.

Cuando no se analiza una secuencia determinada, se utilizan cebadores pequeños de secuencia arbitraria, lo que genera amplificación de múltiples regiones polimórficas, que se han denominado MAAP (Polimorfismo de “Amplicones” Múltiples Arbitrarios), marcadores entre los que se encuentran los RAPD (Random Amplified Polymorphic DNA) (Welsh y McClelland 1990; Williams et al. 1990). El análisis de RAPD ha sido ampliamente utilizado en la década pasada debido a sus enormes ventajas en cuanto a su facilidad de uso, rapidez, mínimo requerimiento de muestra de ADN, economía y disponibilidad de un número ilimitado de cebadores útiles para detectar variabilidad. Sin embargo, presenta el inconveniente de la falta de codominancia, es decir, no es posible descifrar la heterocigosidad de los loci observados y adolece de falta de repetitividad cuando varían las condiciones experimentales. Esto hace plantear dudas, cuando de lo que se trata es de identificar variedades de vid con facilidad. Debido a ello, se han desarrollado técnicas alternativas que pueden paliar en parte este problema.

Una de esas técnicas serían los AFLP (Amplified Fragment Length Polymorphism) (Vos

obtenidos en una digestión total de ADN genómico con enzimas de restricción. Presenta un grado de reproducibilidad mucho mayor que los RAPD y, al igual que estos, son de tipo multiloci, es decir, permite analizar un elevado número de marcadores al mismo tiempo. Aunque los AFLP, por su parte, también son unos marcadores de tipo dominante y su nivel de complejidad técnica es más alto que el de los RAPD, lo que representa una desventaja.

Frente a estos marcadores, los microsatélites presentan una serie de características, detalladas a continuación, que los convierten en unos marcadores moleculares idóneos para la caracterización de variedades de vid entre los disponibles en la actualidad.

Marcadores microsatélite

El análisis de microsatélites o STMS (Sequence -Tagged Microsatellite Sites), también denominados SSR (Short Sequence Repeat), es en la actualidad la estrategia de elección para estudios de diversidad y caracterización varietal en vid debido a que son marcadores altamente polimórficos, codominantes y presentan una elevada reproducibilidad (Thomas y Scott 1993; 1994). Además, permiten la transferencia de datos entre laboratorios, facilitando así la comparación de los resultados.

Los microsatélites son regiones hipervariables que consisten en la repetición en tándem de secuencias cortas de ADN, generalmente de 2 a 6 pares de bases (pb) de longitud. El número de repeticiones de sus motivos básicos es muy variable, pudiendo diferir entre individuos. El origen y función de estos fragmentos del genoma aún no están muy claros, pero son relativamente raros en regiones codificantes. Las estimaciones de su tasa de mutación comprenden un amplio rango cuando se comparan especies diferentes, y en vid se estima que es de 8,24 x 10-5_{(Crespan 2004). La mayoría de los cambios}

observados en los tamaños alélicos se atribuyen a la deleción o inserción de unidades de repetición (Straub 1993; Deka 1995). Se ha sugerido que los responsables de esta alta tasa de mutación pueden ser dos mecanismos mutacionales: el deslizamiento de hebra durante la replicación (Levinson y Gutman 1987; Strand 1993) y el sobrecruzamiento desigual durante la recombinación (Harding 1992). Aunque el primero parece ser predominante (Wolff et al. 1989), probablemente ambos contribuyen a la creación de variabilidad en los microsatélites (Ortiz 1998).

Además de estas mutaciones producidas por el aumento o disminución de repeticiones de la unidad básica, hay que tener en cuenta las mutaciones que producen alelos nulos

2000b). Los alelos nulos aparecen al producirse modificaciones en la secuencia diana de los cebadores, impidiendo la hibridación con el ADN molde. Por lo tanto, esas regiones no son amplificadas, con lo que no pueden ser observadas en el análisis. Este tipo de polimorfismo no es deseable, pues no es posible distinguir entre individuos heterocigóticos con un alelo nulo de los homocigóticos, y además, diferentes alelos nulos dan lugar al mismo fenotipo (ausencia de fragmento amplificado).

Una desventaja de los microsatélites es que para su estudio es necesario cierto conocimiento previo del genoma, aunque en el caso de la vid ya se ha publicado el genoma completo. Otro de sus inconvenientes radica en que son marcadores de tipo unilocus lo que ralentiza la obtención de resultados, es decir, a diferencia de lo que ocurre con otros marcadores como los RAPDs o AFLPs, cada análisis genera un resultado asociado a un solo locus. No obstante, la elevada variabilidad de los STMS hace que sean necesarios muy pocos para estudios de identificación y, además, mediante la técnica de PCR múltiple (combinación de diferentes loci en una sola reacción de PCR) puede conseguirse la detección de varios loci simultáneamente.

Desde el descubrimiento de este tipo de secuencias ya se intuyó la utilidad que podían tener como marcadores polimórficos (Tautz 1989). Thomas y Scott (1993) demostraron que las secuencias repetidas presentes en el genoma de la vid (microsatélites, minisatélites, genes en tándem y secuencias altamente repetidas), son especialmente útiles para la identificación de cultivares de esta especie. Además, observaron que las repeticiones de dinucleótidos (GA y GT) eran muy comunes y aparecían dispersas en el genoma, frente a repeticiones de tri o tetranucleótidos (CAC, GACA, GATA), que se encontraban en menor proporción. Hasta la actualidad se han publicado un gran número de trabajos en los que se han utilizado marcadores STMS para caracterizar variedades de vid (Meredith et al. 1996; Ibáñez 1998; Sefc et al. 1999; Ibáñez et al. 2003; Merdinoglu

et al. 2005). Actualmente, en el NCBI (http://www.ncbi.nlm.nih.gov) se cuenta con aproximadamente 650 loci microsatélite de libre disposición, a los que se suman otros de uso restringido para los miembros de un Consorcio Internacional de Vid.

Hoy en día, las aplicaciones del análisis de microsatélites en vid son numerosas, siendo ya una técnica generalizada para la caracterización de la variabilidad (Sefc et al. 1998b; Lopes et al. 1999; Maletic et al. 1999; Sefc et al. 2000), la protección legal de variedades (Ibáñez y Eeuwijk 2003), o la identificación varietal y resolución de sinonimias y homonimias (Lopes et al. 1999; Meredith et al. 1999; Borrego et al. 2002; Ibáñez et al.

2003), ya que, empleando unos pocos marcadores, dada la cantidad de alelos existentes por locus, es muy improbable que dos variedades diferentes compartan los mismos alelos

en todos sus loci. Igualmente, son de gran utilidad para la realización de estudios de pedigríes (Bowers y Meredith 1997; Sefc et al. 1997; Sefc et al. 1998c; Dettweiler et al.

2000) debido a su caracter codominante con herencia mendeliana. Los microsatélites, también pueden constituir una herramienta útil para la construcción de mapas genéticos (Lodhi et al. 1995) y para la detección de QTLs (Quantitative trait loci) (Doligez et al.

2002).

En la publicación de IPGRI et al. (1997), además de los “Descriptores para la Caracterización”, basados en el estudio de características morfológicas, estaban reflejados los “Descriptores para la Evaluación”, de menor importancia, los cuales incluían a los microsatélites entre los marcadores moleculares. La situación hoy en día ha cambiado considerablemente: muchos institutos de la vid utilizan los microsatélites como marcadores para identificar sus variedades, además de, o en vez de, las descripciones morfológicas.

El proyecto de la Unión Europea GENRES081 fue el principal intento internacional para armonizar un sistema basado en microsatélites para la identificación de variedades de vid. Se seleccionaron 6 microsatélites (VVS2, VVMD5, VVMD7, VVMD27, ssrVrZAG62 y ssrVrZAG79), y se analizaron en 10 laboratorios diferentes, idénticas muestras de ADN, pertenecientes siempre que fue posible, a variedades de vid bien conocidas y ampliamente distribuidas geográficamente (This et al. 2004). Cada uno de los alelos de cada marcador se designó mediante un código basado en el nombre del cultivar tomado como referencia que presentó ese alelo en particular. Con ello, se perseguía desarrollar una metodología común para el intercambio de datos microsatélite entre laboratorios. Con los resultados obtenidos, se elaboraron descriptores para los 6 loci microsatélite estudiados. Estos descriptores fueron aprobados por la OIV en la reunión celebrada en Junio del 2007 en Budapest (Hungría).

Los microsatélites cloroplásticos, a pesar de no ser eficaces para la identificación varietal dado su reducido polimorfismo en comparación con los nucleares, resultan de gran utilidad para estudios filogenéticos, debido a su herencia exclusivamente maternal (Arroyo-García et al. 2002). Algunos autores los han empleado con el fin de resolver las dudas existentes en cuanto al origen de la vid cultivada y su historia evolutiva (Arroyo- García et al. 2002; Imazio et al. 2005; Arroyo-García et al. 2006).

Por otro lado, dada su transmisión materna, estos marcadores pueden resultar también útiles en análisis de pedigríes. La identificación de los progenitores maternos de determinadas variedades con caracteres de interés podría ser de gran ayuda para los

carácter deseado y de recursos para efectuar cruzamientos dirigidos para la obtención del mismo.

1.2. ESTUDIOS DE ASOCIACIÓN

Una vez caracterizada la diversidad de una colección, sus aplicaciones son numerosas. Aportar información sobre los parentales de variedades con rasgos de interés mediante estudios de pedigríes, por ejemplo, puede ser de gran utilidad para los mejoradores, puesto que pueden emplear en nuevos cruzamientos el progenitor que transmite esos rasgos a la descendencia. Conocer la base genética de un determinado carácter así como su funcionamiento e interacción con otros factores es hoy en día uno de los objetivos principales de los estudios genéticos de especies cultivadas.

Los estudios de asociación consisten en la detección de correlaciones entre determinadas mutaciones puntuales, haplotipos, genes o regiones del genoma y determinados fenotipos o caracteres cuantitativos. Su finalidad es conocer, en el caso de las plantas, la base genética de la diversidad morfológica o fenológica y, especialmente en especies cultivadas, la de determinados rasgos interesantes agronómicamente y de cara al consumidor.

Históricamente, diversos tests de asociación han sido empleados en medicina con el fin de detectar polimorfismos o genes responsables de determinadas enfermedades. Dos métodos generalmente empleados para este fin han sido “caso-control” (CC) y “test de transmisión-desequilibrio” (TDT). El primero se basa en que los individuos enfermos (casos) presentarán la mutación supuestamente responsable de la enfermedad en una mayor frecuencia que los individuos sanos (controles). El segundo emplea muestras basadas en familias, usando los genotipos de los progenitores de los individuos afectados para asegurar que la asociación entre un alelo y un fenotipo es detectada sólo si el marcador está ligado al locus causante de la enfermedad, incluso en presencia de estructura poblacional (Spielman y Ewens 1993). Algunos métodos similares a éstos se han empleado en plantas, por ejemplo, Palaisa et al. (2003) empleó en maíz una metodología similar a la usada en estudios de caso-control, mientras que Kumar et al.

(2004) realizó un estudio con familias de pino radiata que podría equivaler a un estudio mediante TDT. Sin embargo, en general, la aplicación de estos tests en especies vegetales cultivadas resulta complicada.

En los tests CC, el principal problema consiste en la obtención de asociaciones espurias debidas a la existencia de una estructura poblacional (Lander y Schork 1994),

frecuentemente encontrada en plantas cultivadas. El motivo de esto es que las frecuencias del fenotipo y del polimorfismo pueden diferir entre poblaciones, de manera que si un fenotipo o enfermedad se encuentra en una alta frecuencia en una población, ese grupo estará sobreexpresado entre los casos, de manera que cualquier alelo que presenta una alta frecuencia en esa población, aunque no guarde ninguna relación con el fenotipo, resultará asociado con éste. Para evitar este problema, Pritchard et al. (2000b) desarrollaron un modelo tipo caso-control en el que tenían en cuenta la estructura poblacional. Thornsberry et al. (2001) modificaron ese test de manera que permitiera trabajar con caracteres cuantitativos, aplicándolo a la época de floración en maíz. En los TDT se evita el problema de la estructura, pero es una técnica que requiere elevados costes tanto económicos como de tiempo y requiere un amplio genotipado.

En vid, se han realizado diversos estudios de mapeo de QTLs (Quantitative Trait Loci), como, por ejemplo, para el carácter de la apirenia estenospermocárpica (Doligez et al.

2002; Cabezas et al. 2006), lo que supone generar una población segregante, construir un mapa de ligamiento obteniendo los genotipos de un grupo de individuos para un número alto de marcadores, describir los fenotipos para el carácter de interés y realizar un análisis de correlaciones entre el mapa, los genotipos y los fenotipos. Recientemente, se han detectado también QTLs para el peso de la baya y para los caracteres fenológicos de envero y maduración (Cabezas et al. 2006; Costantini et al. 2008). El mapeo de ligamiento resulta útil en la detección de QTLs, pero es sumamente limitado en la identificación del gen implicado en el carácter debido al pequeño tamaño de las poblaciones estudiadas y a su bajo grado de recombinación, aportando una resolución de entre 10 y 30 cM, lo que corresponde a millones de pares de bases y cientos de genes. El mapeo de asociación basado en el desequilibrio de ligamiento (DL) ofrece una alternativa al mapeo de QTLs, puesto que aunque este último es más útil para detectar QTLs a lo largo de todo el genoma, el primero aporta una localización más precisa de un QTL determinado.

Las aplicaciones actuales de los análisis de correlación entre un genotipo y un fenotipo permiten, por un lado, llevar a cabo búsquedas de QTLs a lo largo del genoma, como las anteriormente comentadas, y por otro, testar genes candidatos, lo que implica secuenciar un gen concreto supuestamente implicado en algún carácter de interés con el fin de identificar asociación entre marcadores de tipo SNP (Single Nucleotide Polymorphism) y un determinado fenotipo. El éxito de ambos métodos depende en gran medida del grado de DL a lo largo del genoma en la población, de manera que el mapeo de QTLs será más útil en especies con un extenso DL y el análisis de genes candidatos será más efectivo

en especies con un DL bajo. El poder estadístico de los análisis de genes candidatos también depende intensamente del número de individuos estudiados. Long y Langley (1999) sugirieron que un aumento del número de individuos aporta un mayor poder de detección de asociación que un aumento del número de polimorfismos y que son necesarios aproximadamente 500 individuos para detectar polimorfismos que tengan un efecto pequeño. Sin embargo, en diversos estudios se han empleado en torno a 100 individuos obteniéndose resultados significativos (Remington et al. 2001; Thornsberry et al. 2001; Wilson et al. 2004; Szalma et al. 2005; This et al. 2007).

Hasta la fecha, y desde que Pritchard et al. (2000b) desarrollaron un método para la corrección de la estructura poblacional, aplicado por Thornsberry et al. (2001) al uso de caracteres cuantitativos, se han publicado diversos estudios en plantas basados principalmente en la asociación de genes candidatos con caracteres de interés agronómico tales como:

- La época de floración en Arabidopsis (Hagenblad et al. 2004; Olsen et al.

2004; Shindo et al. 2005), Brassica nigra (Osterberg et al. 2002) y maíz (Remington et al. 2001; Thornsberry et al. 2001).

- La altura de la planta de maíz (Remington et al. 2001). - La composición del grano de maíz (Wilson et al. 2004).

- Diferentes propiedades de la madera en Pinus taeda (González-Martínez

et al. 2007).

En vid, se han realizado estudios de asociación entre el color de la baya y polimorfismos en el gen VvmybA1 tanto sin considerar (Lijavetzky et al. 2006) como considerando la estructura poblacional (This et al. 2007).

Además de las asociaciones espurias resultantes de la estructura poblacional, pueden obtenerse asociaciones de este tipo por otras causas tales como el análisis de un número insuficiente de individuos o una distribución no normal de las clases fenotípicas. Por otro lado, obtener una asociación significativa entre un SNP y un carácter no implica que ese polimorfismo sea el responsable de la variación, ya que ese resultado puede provenir de su ligamiento con el verdadero polimorfismo responsable. Además del ligamiento físico existente entre polimorfismos cercanos, en plantas cultivadas, la intensa selección artificial efectuada por el hombre a lo largo del tiempo puede dar lugar a ligamiento entre los loci seleccionados y otros loci alejados que no tienen nada que ver con el fenotipo en el que los primeros están implicados.

Un procedimiento estándar para llevar a cabo análisis de asociación en genes candidatos consiste en los siguientes pasos:

1. Elegir un carácter de interés objeto de estudio.

2. Seleccionar genes candidatos basándose en los recursos bibliográficos referentes a su posible función o usando QTLs existentes.

3. Elegir una colección de germoplasma que represente un alto porcentaje de la diversidad existente, caracterizarla y analizar su estructura genética.

4. Describir, para más de una campaña, los caracteres de interés. 5. Secuenciar los genes candidatos.

6. Alinear las secuencias de los diferentes individuos de la colección e identificar los polimorfismos.

7. Obtener estimas de diversidad y evaluar los patrones de selección y de desequilibrio de ligamiento.

8. Evaluar estadísticamente las asociaciones entre genotipos y fenotipos teniendo en cuenta la estructura genética.

9. Evaluar posibles variaciones en la estructura proteica consecuencia de algún polimorfismo implicado en alguna asociación significativa.

En resumen, un estudio de asociación SNP-fenotipo basado en genes candidatos no debe quedarse en realizar el análisis estadístico, sino que es muy importante conocer la estructura poblacional de la colección a analizar e incluirla en el modelo si es posible. Igualmente útil para corroborar o descartar el efecto de un polimorfismo es estudiar la extensión del DL en la región del gen candidato a evaluar, estudiar la historia evolutiva del gen y la posible existencia de selección sobre el mismo, y documentarse sobre la proteína a la que el gen da lugar con el fin de averiguar si los polimorfismos de reemplazamiento se encuentran en regiones neutrales o funcionales, o podrían estar dando lugar a cambios conformacionales que afectaran a la función proteica.

1.2.1. Genes candidatos

La selección del gen a analizar en un estudio de asociación debe realizarse en base a su posible implicación en el carácter cuya base genética desea conocerse. Para ello, es necesario recurrir a las fuentes bibliográficas existentes al respecto, y las bases de datos públicas especializadas en genómica constituyen una herramienta fundamental.

En la uva de mesa, los que se han considerado en las últimas décadas los principales caracteres de interés desde un punto de vista comercial son el sabor moscatel y la

In document Estudio de diversidad en variedades de uva de mesa ("Vitis vinifera" L ) y su aplicación al análisis de asociación para caracteres de calidad (página 33-51)