Curso 2017
Marcadores Moleculares
Esteban Hopp
Departamento de Fisiología, Biología Molecular y Celular Facultad de Ciencias Exactas y Naturales
Marcadores Morfológicos
Fenotipos que resultan de mutaciones en el ADN
¿Qué son los marcadores genéticos?
Gregor Mendel (Moravian Museum, Brno)
• El concepto de marcador surge con los trabajos de Mendel:
Utilizó los colores de las flores (y otros caracteres morfológicos) como marcadores que le permitieron
estudiar los patrones de la herencia
Jardín del monasterio donde Mendel realizaba sus experimentos con las arvejas
• Permiten establecer diferencias (polimorfismos) entre
dos individuos diferentes (genotipos) pertenecientes a la misma especie (o a especies emparentadas).
• Su herencia suele responder a las leyes de Mendel. • Los primeros marcadores utilizados fueron los de tipo
morfológico (fenotípicos), por ejemplo, color de la flor.
• Permiten la confección de mapas genéticos o de
ligamiento.
• Son puntos de referencia ubicados en los cromosomas.
¿Qué son los marcadores genéticos?
¿Puede un marcador genético ser fenotípico y genotípico?
Fenotípicos: los polimorfismos de los genes se detectan a través de sus productos
- Morfológicos: por ejemplo, color de flor
- Bioquímicos: básicamente perfiles electroforéticos de isoenzimas y de proteínas de reserva
Genotípicos o moleculares: Los polimorfismos de genes u otras secuencias no codificantes se detectan a nivel del ADN
- Restricción + hibridación molecular (ejemplo, RFLP)
- Amplificación por PCR (ejemplo, RAPD y microsatélites) - Restricción + PCR: (ejemplo, AFLP)
- (re)Secuenciación directa, indirecta o parcial (SNP/GBS)
Tipos de
marcadores genéticos
TIPOS DE MARCADORES
:
“Neutros” Random DNA Markers
(marcadores al azar)derivados de cualquier parte del genoma,
fenotípicamente neutros (teóricamente asumidos
como tales para los programas bioestadísticos)
“Funcionales” Functional Markers (marcadores
funcionales)
sitios polimórficos dentro de genes afectando
causalmente la variación del carácter fenotípico.
Surgen como marcadores moleculares de las
regiones transcriptas/expresadas del genoma
Pueden no ser genotípicos: por ej el período de
Para:
• Identificación (genotipificación) de hospe- dantes o de patógenos
• Mapeo de genes y QTLs de resistencia • Selección asistida por marcadores
• Clonado posicional de genes basado en mapa
• Estudios de variabilidad/diversidad genética en distintas
especies (plantas y fitopatógenos), germoplasma, identificación de genotipos indicadores, etc
¿Para qué queremos usar
MM?
Comparación entre marcadores morfológicos y moleculares Marcadores morfológicos
Influencia del ambiente Bajo número
Baja cobertura del genoma Bajo nivel de polimorfismo Menos informativos
(dominantes o recesivos) Caracteres de madurez
Entrenamiento y subjetividad
Sin influencia ambiental y neutros
Cantidad ilimitada
Amplia cobertura del genoma Alto nivel de polimorfismo Más informativos
(en general codominantes) Análisis en fases tempranas Sencillos, rápidos y objetivos Marcadores
moleculares
Sin embargo…. Hoy en día, a los morfológicos los empezamos a llamar fenómicos
Mapa genético de tomate basado en marcadores morfológicos
• Isoenzimas
Grupo de múltiples formas moleculares de una misma enzima presente en una misma especie, como resultado de la presencia de uno o más genes que codifican cada una de estas formas.
Las que son relevantes como marcadores genéticos son las aloenzimas (o alozimas) que son variantes alélicas del mismo gen (o locus) y que presentan una migración electroforética diferencial.
Marcadores bioquímicos: isoenzimas
Ejemplo:
detección de isoenzimas de maíz
F isomerasa
Identificación de variantes isoenzimáticas. Se observan genotipos homocigotas y heterocigotas para diferentes alelos en una población de maíz analizada para dos loci isoenzimáticos (MDH y F isomerasa), lo que
revela la existencia de polimorfismos dentro de la misma.
Malato deshidrogenasa (MDH)
Perfiles electroforéticos de proteínas de reserva de distintas variedades argentinas de avena.
Marcadores bioquímicos: Proteínas de reserva
¿Se siguen usando?
¡Sí! Para registro y protección de variedades comerciales Marcadores bioquímicos Aunque tienen algunos problemas con el sindicato de geles
Marcadores genotípicos o moleculares basados en la restricción enzimática
del ADN Marcadores moleculares RFLP
Restriction Fragment Length Polymorphism (polimorfismo de longitud de fragmentos
Mutaciones puntuales:
Ocurren en sitios de restricción.
Mutaciones estructurales:
Ocurren mediante inserciones, deleciones y rearreglos.
Origen del polimorfismo de los RFLPs
Análisis utilizando RFLPs de los bulks resistente (R) y susceptble (S) al virus PVX de Solanum commersonii empleando las enzimas de restricción HinfI, DdeI, HindIII, DraI, EcoRI, XbaI y StyI (1 al 7).
Autoradiografía de los perfiles de RFLP obtenidos empleanado la sonda s1+A/as1+T(584) marcada con radioactividad.
Perfiles de RFLPs de Solanum
• Presentan bajo nivel de polimorfismo (en comparación con otros marcadores
moleculares).
• Se requiere disponer de sondas específicas
para la especie en estudio.
• La utilización de radiactividad introduce altos
costos y problemas de bioseguridad.
• Requieren alta cantidad de DNA.
El procedimiento es laborioso y lento.
• ¡¡¡¡¡¡¡OBSOLETOS!!!!!!
Desventajas de los RFLPs
Marcadores moleculares basados en la amplificación arbitraria (o semi-arbitraria) del ADN
Random Amplified Polymorphic DNAs
(polimorfismo de ADN amplificado al azar)
RAPDs
Amplificación de ADN anónimo con iniciadores de secuencia arbitraria
No permiten distinguir el heterocigota del homocigota dominante
• La herencia es dominante (menor información
genotípica).
• Poseen problemas de
reproducibilidad.
• La interpretación de bandas presenta
dificultades.
• A medida que la distancia filogenética
aumenta, también aumenta la probabilidad de que dos fragmentos de ADN diferentes
comigren y se cometan errores de cómputo (no son confiables para comparación entre especies distintas).
• Sólo se puede computar presencia compartida
de bandas y no la ausencia.
Desventajas de los RAPDs
Amplified Fragment Length Polymorphism (polimorfismo de longitud de fragmentos
amplificados)
Marcadores moleculares AFLP Marcadores moleculares basados en la amplificación arbitraria (o semi-arbitraria) del ADN
Procedimiento para la
obtención de AFLPs
AFLP fluorescentes
Detección de AFLPs usando durante la última etapa de amplificación iniciadores fluorescentes,
resolviendo los fragmentos en un secuenciador ABI3130XL
• Herencia dominante.
• Bajo contenido de información
genética por locus.
• Procedimiento medianamente
laborioso.
• Costo medio.
• Tecnología patentada (no es de
libre utilización).
Desventajas de los
Microsatélites
Repeticiones en tándem de secuencias cortas de DNA de 1 a 10 pb de longitud Ejemplos: (GA)14 ...GAGAGAGAGAGAGAGAGAGAGAGAGAGA... (GAT)10 ...GATGATGATGATGATGATGATGATGATGAT... (CATC)8 ...CATCCATCCATCCATCCATCCATCCATCCATC.. Sinónimos: SSLP, SSRP, SSR o STMS
Microsatélites
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’ 3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
16 repeticiones
5’...TGACAGTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGCGA...3’ 3’...ACTGTCACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCGCT...5’
5’ GTGGGTCACGACTTGAGCCAGTCGTAGCTTGATGATGATGATGATGATGATGATGATGATGATGATGATGATGATGACTCAGTGTGACGCTAGTCGGGTAGTAGC 3’ 3’ CACCCAGTGCTGAACTCGGTCAGCATCGAACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTGAGTCACACTGCGATCAGCCCATCATCG 5’
105 pb
iniciador
CTGCGATCAGCCCATCATCG 5’
5’ GTGGGTCACGACTTGAGCCAG
iniciador
PCR con iniciadores específicos
Producto de amplificación obtenido
Electroforesis en gel de poliacrilamida desnaturalizante
Microsatélites en diploides
1
2
3
1 2
3
(+)
Ejemplo: variedades de soja (Glycine max) analizadas mediante SSR
Patrones obtenidos para 43 variedades de soja. Gel de poliacrilamida teñido con plata.
Métodos de separación / detección
Agarosa/bromuro de etidio Poliacrilamida / nitrato de plata
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Gentileza Lic. P. Talia y Dra. N. Paniego
Radiactividad
Gentileza Lic. V. Nishinakamasu y Dra. N. Paniego
Fluorescencia
Empleo de secuenciador automático Homocigota alelo 1 Pico 147-149 pb Homocigota alelo 2 Pico 153-155 pb Heterocigota: ambos alelos
Electroferogramas para 3 genotipos de sorgo Gentileza Téc. L. Fernández
• Polimorfismo muy elevado (multialélicos)
• Enorme número de loci
• Herencia mendeliana codominante
• Interpretación sencilla de los resultados
• Reproducibilidad muy alta
• Resultados transferibles entre laboratorios
• Automatización
Ventajas de los
• Se requiere conocer la secuencia nucleotídica
involucrada alto costo para desarrollar los primers (oligonucleótidos iniciadores)
- Inicialmente lentos - Inicialmente costosos
• Unilocus (aunque pueden hacerse multiplex)
• Alta tasa de mutación que puede afectar la
reproducibilidad en estudios genealógicos.
Desventajas de los
SNP +
(re)secuenciación (ej. GBS)
• Diversidad nucleotídica: 90% de la variación del genoma en cualquier organismo
• En general son bialélicos, aunque por definición puede haber 4 variantes
• Ubicuos: pueden estar en cualquier región del genoma
• Se encuentran cada 100 a 300 pb • Estables
• Pueden ser funcionales si están en regiones codificantes.
• Fáciles de procesar bioinformáticamente
SNPs Indels (Insertions/Deletions)
Caracterís-ticas de los SNPs
Ventajas y desventajas de los marcadores SNP • Ventajas:
- Baja tasa de mutación (mayor estabilidad que los SSR) - Muy abundantes
- Fáciles de analizar por métodos bioinformáticos
- Desarrollo continuo de nuevas metodologías analíticas para su detección
- Simplificación de los estudios comparativos cruzados.
• Desventajas:
- En la mayoría de los métodos, se requiere conocer la secuencia nucleotídica involucrada
- Costosos de aislar y caracterizar (secuenciación) - Bajo contenido de información para un único SNP
Técnicas para la detección de SNPs
Costo
Sensibilidad
Especificidad
Número de muestras a analizar
Posibilidad de automatización
Equipamiento necesario
Dificultad del ensayo
Intensa actividad comercial en este área
Detecciónde SNPs: métodos de análisis
Métodos para pocas muestras (diagnósticos) para uno o pocos loci
PCR de tiempo real
Secuenciación por Sanger
Métodos de análisis masivo de todo el genoma
Microarreglos de DNA Nanotecnología
Secuenciación en paralelo por NGS Detección
de SNPs: métodos de análisis
PCR en tiempo real: sistema TaqMan
Detección de SNPs: métodos de análisis
Detección de SNP empleando sondas TaqMan® para cada alelo
Química de la discriminación alélica
La sonda sólo hibrida con la secuencia blanco si existe complementariedad perfecta de bases. Así, la sonda marcada con FAM sólo reconoce al alelo 2 (AT)
y la sonda marcada con VIC sólo reconoce al alelo 1 (GC). Ambas sondas se colocan en la misma reacción de PCR y, de acuerdo con el alelo presente, se obtienen señales fluorescentes para uno u otro fluorocromo. En un individuo
Fig. 1 Example of intraspecies polymorphism of the ITS. The part of sequences of two different clones of
M. bovis (a, b) and Mycoplasma conjunctivae (c, d) are present.
Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic 16S-23S rRNA spacer (ITS) regionof
Métodos para pocas muestras (diagnósticos)
PCR de tiempo real
Secuenciación por Sanger
Métodos de análisis masivo
Microarreglos de DNA Nanotecnología
Secuenciación en paralelo por NGS Detección
de SNPs: métodos de análisis
Appl Microbiol Biotechnol (2006) 71: 680–698. Sequence of the intergenic 16S-23S rRNA spacer (ITS) regionof Mollicutes species and their
Unión de un clon a una microesfera
Análisis de fragmentos fluorescentes amplificados mediante una PCR alelo-específico
multiplexada.
Genotipificación Marcadores moleculares tradicionales de (SSR, RFLP, AFLP, etc):
- Bajo rendimiento o low- throughput: número de marcadores alrededor de 100.
- Desarrollo y descubrimiento es costoso y requiere de tiempo - SSRs son especie específicos.
- Baja capacidad de multiplexado.
“The ideal molecular approach for population genomics should uncover
hundreds of polymorphic markers that cover the entire genome in a single, simple and reliable experiment. Unfortunately, at present there is no
such approach.” Luikart et al 2003
(Davey et al, 2011)
SNP arrays de alto rendimiento
- High throughput: pero “solo” miles de marcadores
- La producción de una matriz de alta calidad requiere una inversión sustancial de los recursos.
- Conocimiento previo de secuencias.
- Específicos de la población con la que los desarrollaron. - Evaluación de uno o dos individuos a la vez.
NGS marker discovery and genotyping methods
- High throughput: miles a cientos de miles de marcadores - Descubrimiento o desarrollo de nuevos marcadores
- Secuenciación y genotipificación simultánea - Decenas o centenas de individuos
- Sin conocimiento previo de secuencias
En un sólo ensayo!
Cómo reducir costos secuenciando
solo lo necesario
Para estudios de poblaciones: Resecuenciación de genomas:
Especies con genoma de referencia:
• Secuenciación del genoma a baja profundidad (<30X) para descubrir
SNPs en muchos individuos es costosa e innecesaria.
Especies sin genoma de referencia:
• La secuenciación y ensamblado del genoma de un individuo de novo es un gran desafío, y costoso.
Genotipificar reduciendo la representación:
•Secuenciar sólo la región de interés de cada individuo: menor costo •Más sencillo el análisis bioinformático de datos
•Menor tiempo
Restriction site-associated DNA sequencing (RAD-Seq) (Baired et al., 2008)
Reduce Representation Libraries (RRLs)
Complexity reduction of polymorphic sequences (CRoPS) Restriction fragment sequencing (RESTseq)
Multiplexed shotgun genotyping (MSG) EzRAD
Sequence-Based Genotyping (SBG) 2b-RAD
Genotyping by Sequencing (GBS) (Elshire et al., 2011) Más populares:
Double digest Restriction site-associated DNA sequencing (ddRAD-Seq) (Peterson et al., 2012)
1. Digestión de ADN genómico de muchas muestras
2. Selección o reducción de los fragmento de PCR
resultantes
3. NGS del subconjunto de fragmentos (< a 1000pb)
Los polimorfismos de los fragmentos secuenciados se
utilizan como marcadores moleculares.
RADseq
Digestión Ligación adaptadores-index Pool Corte al azar Selección de tamaños Ligación adaptadores Y PCR Lectura SE (50pb)GBS
Digestión Ligación adaptadores-index Pool PCR Lectura SE 86pb (48 o 96plex en GA) RADSe q GBSTruong HT, et al. (2012) Sequence-Based Genotyping for Marker Discovery and Co-Dominant Scoring in Germplasm and Populations. PLoS ONE 7(5): e37565. doi:10.1371/journal.pone.0037565
dd RAD-Seq Digestión doble Ligación adaptadores-barcode Pool Selección de tamaños PCR-index Lectura PE 125pb
• Elimina el corte por azar
- Se reduce 5 veces el costo de preparación de libraries en comparación con RAD-Seq • Size Selection preciso
- Reduce duplicados de las regiones a secuenciar
- Profundidad de lectura similar entre individuos en cada región del genoma
GBS: bioinformática para la identificación y anotación de marcadores asociados
MEJORAMIENTO VEGETAL - TECNICAS CLÁSICAS
OBJETIVOS
a) Obtener un mayor rendimiento agronómico b) Mejorar la calidad del producto
c) Aumentar la seguridad de cosecha
CARACTERÍSTICAS GENERALES
a ) Acumulativo: las nuevas mejoras se suman a las anteriores
b) Continuo: debido a que siempre se exige más
– cambios de hábitat
– cambios en las técnicas de cultivo – cambios en los mercados compradores
– cambios en las poblaciones de fitopatógenos
c) Competitivo: las nuevas variedades deben superar a las ya difundidas (ensayos comparativos de rendimientos — ECR)
CONSIDERACIONES RESPECTO DE LA ESPECIE Y EL CARÁCTER A MEJORAR
a) Modo de reproducción (alogamia, autogamia o agamia). Biología floral, sistemas de autoincompatibilidad, etc. b) Cantidad de genes y momento de expresión.
c) Tiempo por generación
d) Número de cromosomas y nivel de ploidía
Genética cuantitativa clásica
Generación parentalProgenie
Ganancia Diferencial deF2
P2
F1 P1 x
Grandes poblaciones segregantes con miles de recombinantes
SELECCION FENOTÍPICA
Mejoramiento convencional
Resistencia a estrés hídrico Resistencia a enfermedades Deficiencia nutricional
Diapositiva del IRRI Tomado de Bert Collard & David Mackill
Los métodos de mejoramiento se
basan en los mismos fundamentos
conceptuales que los vistos en Genética I
F2
P2
F1 P1 x
Grandes poblaciones segregantes con miles de recombinantes
SELECCION FENOTÍPICA
¿Y qué es lo moderno?... Repasemos: mejoramiento convencional
Resistencia a estrés hídrico Resistencia a enfermedades Deficiencia nutricional
F2
P2
F1 P1 x
Grandes poblaciones segregantes con miles de recombinantes
Resistente
Susceptible
Selección asistida por Marcadores Moleculares (MAS)
Mejoramiento asistido por marcadores
En este esquema, la selección “fenotípica” se basa en marcadores moleculares
Diapositiva del IRRI Tomado de Bert Collard & David Mackill
Ventajas del MAS
• Método más sencillo
- comparado con la selección fenotípica si la
evaluación de la característica fenotípica es
laboriosa o compleja (recesiva, epistática,
compleja como contenido de proteínas)
• La selección se realiza a nivel de plántula
– Importante para características como calidad
del grano
• Aumenta la confiabilidad
– Se independiza de efectos ambientales
– Permite discriminar entre homcigotas y
heterocigotas y seleccionar plantas
individuales
Desventajas II
• Recursos
– Equipamiento, personal
calificado
• Costos!!!!
• Conocimiento de los
caracteres a seleccionar
(
posición en el mapa
genético:
disponer de
marcadores ligados)
¿Cómo hacemos para mapearlos?
Identificación de regiones genómicas asociadas a caracteres de interés
Diapositiva gentilmente cedida por Ing. Gabriela Pacheco
Mapeo de QTLs
Mapeo
de QTLs
Mapeo de Asociación y Genome-Wide
Association Studies (GWAS)
Diapositiva gentilmente cedida por Ing. Gabriela Pacheco
DL
• Desequilibrio de ligamiento
Mapeo por asociación
•Estrategia alternativa al mapeo de ligamiento.
•Ambos detectan asociaciones entre genotipos y fenotipos basados en la coheredabilidad de polimorfismos.
Mapeo de ligamiento Mapeo por asociación
Zhu 2008
•Parentales con fenotipo
contrastantes para el carácter •Número limitado de eventos de recombinación
•Baja resolución (pero mayor probabilidad de encontrar marcadores ligados)
•Población natural •Múltiples eventos de
recombinación debido a la historia de la población
•Alta resolución (pero menor probabilidad de encontrar marcadores ligados)
Mapeo por Asociación para la Podredumbre Húmeda del Capítulo en girasol
Evaluación fenotípica (Y)
• Se evaluó la incidencia de PHC en cada ensayo y se obtuvo la media ajustada para cada línea endocriada.
• Las LE se comportaron de manera diversa frente a la enfermedad.
• 52% de las líneas mostraron un comportamiento intermedio frente a PHC.
Analisis estadístico Alelos asociados Y = G + Q ó P/K + E 500 1000 In cid en ce
Candidate gene haplotypes
Un haplotipo de RhoBP_B mostró asociación
significativa con una
menor incidencia de PHC. •Las estructura del gen RhoBP_B
está caracterizada por 4 exones y 3 intrones.
•El genotipo 3:3 amplifica un
GWAS (Manhattan Plot)
Esclerosis sistémica en humanos