DEPARTAMENTO DE SILVOPASCICULTURA
ESCUELA TÉCNICA SUPERIOR DE INGENIEROS DE MONTES
UNIVERSIDAD POLITÉCNICA DE MADRID
ESTRUCTURA POBLACIONAL Y FLUJO GENÉTICO DE Pinus pinaster Alton
EN EL NOROESTE DE LA PENÍNSULA IBÉRICA
SANTIAGO CESAR GONZÁLEZ MARTÍNEZ
Ingeniero de Montes
DIRECTORES:
LUIS GIL SÁNCHEZ
Doctor Ingeniero de Montes
Tribunal nombrado por el Mgfco. y Excmo. Sr. Rector de la Universidad
Politécnica de Madrid, el día de de 20
Presidente D.
Vocal D.
Vocal D.
Vocal D.
Secretario D.
Realizado el acto de defensa y lectura de la Tesis el día
de de 20 en
Calificación:
EL PRESIDENTE LOS VOCALES
A mis padres, Isidoro y Concepción
"Well, in our country," said Alice, still
panting a little, "you'd generally get to
somewhere sise -if you ran very fast a
long time as we've been doing"
"A slow sort of country!" said tlie
Queen. "Now, here, you see, it tal<es all
tlie running you can do, to keep in tlie
same place. If you want to get
somewhere else, you must run at least
twice as fast as that!"
Through the Looking-Glass
El último paso en la elaboración de una tesis doctoral es, afortunadamente, uno de
los más agradables. Es el momento de reflexionar y pensar en todas aquellas
personas que gracias a su colaboración y amistad lian hecho de esta tesis doctoral, no
sólo un trabajo científico sino también una emotiva experiencia personal. Quiero
expresar mi agradecimiento más sincero:
A mis directores de tesis, los doctores Luis Gil y Ricardo Alia, por su apoyo
constante y su entusiasmo contagioso, que logró que cada avance en el conocimiento
de la variabilidad genética del pino negral se convirtiera en motivo de satisfacción.
Al Dr. Luis Felipe Valladares (Universidad de León) que, hace ya muchos años, me
introdujo con su ejemplo y dedicación en el mundo de la investigación. De igual modo,
gracias a Ana Aragonés (Instituto Vasco de Investigación y Desarrollo Agrario) con la
que di mis primeros pasos en el mundo de la genética molecular.
Al Servicio de Material Genético de la DGCN, que ha impulsado y financiado
parcialmente este proyecto. Personalmente, quiero agradecer su apoyo y amistad a
Sonia Martín, Salustiano Iglesias y Manuel de Tuero.
Al Dr. José Miguel Martínez Zapater, que me recibió amablemente en su laboratorio
del Centro Nacional de Biotecnología (CNB-CSIC). Mi más sincero agradecimiento a la
Dra. María Teresa Cervera, sin cuya ayuda todavía estaría tratando de optimizar los
protocolos de laboratorio. A José Antonio Cabezas, por su buen humor y
disponibilidad, que hacen siempre grato trabajar con él.
A Miguel Allué, del Servicio Territorial de Medio Ambiente de Segovia (Junta de
Castilla y León), por su ayuda en la localización y mantenimiento de los dispositivos
experimentales y la discusión, siempre interesante, de la relación entre genética y
práctica forestal.
A los doctores Antoine Kremer y Christophe Plomion que me acogieron en una
breve pero fructífera estancia en el Laboratoire dé Génetique et Amélioration des
arbres forestiers, en Burdeos (Francia). A la Dra. Sophie Gerber, por su ayuda con el
análisis de datos de parentesco y por numerosas sesiones de programación casera. A
la Dra. Stéphanie Mariette y a Grégoire Le Provost por su colaboración en los trabajos
de laboratorio.
Al Dr. Jaroslaw Burczyk por su acogida en la Universidad de Bydgoszcz (Polonia),
sus atenciones continuas y las interesantísimas discusiones sobre flujo genético y
modelización matemática.
Al Dr. W. Thomas Adams, director del Departamento de Ciencia Forestal de la
en el diseño de estrategias de muestreo y la discusión de algunos manuscritos, que
mejoraron notablemente. Al Dr. Kostya Krutovskii por sus enseñanzas en el laboratorio
y su amistad. A Nuria Kaya, siempre de buen humor, y dispuesta a trabajar "un poco
más". A todo el colectivo híspano en Corvallis, que hizo todo lo posible para que me
sintiera acogido y como en casa.
A Dolores Agúndez le debo un agradecimiento inmenso, ya que es una de las
principales artífices de mi tesis, al apoyarme en los comienzos y trasmitirme sus
conocimientos en el laboratorio. Ocupan un lugar especial en mis experiencias de
estos años las recogidas de semilla en Oña y Sierra Bermeja, realizadas con ella.
A la Dra. Maria M. Ribeiro, por las míticas discusiones sobre el pino negral en la
Península Ibérica, el intercambio incesante de correos electrónicos, las batallas
dialécticas y su capacidad de convertir Burdeos en un rincón de nuestra querida
Península.
Al Dr. Felipe Bravo de la ETSIIAA de Palencia (Universidad de Valladolid) por su
apoyo y amistad. A su familia, especialmente a Pilar que evitó que muriera de
inanición durante mi visita a Corvallis. Al resto de profesorado de la Escuela,
especialmente a la Dra. Rosario Sierra de Grado, que recibieron siempre mis visitas y
propuestas con entusiasmo.
A todos mis compañeros/as del CIFOR-INIA, que son numerosos y que asocio a
cada uno de ellos con una imagen particular: a Carmen García y Miguel Ángel
Cogolludo pertenecientes al tiempo del picador de hielo y la casita, a Pilar Jiménez,
Wubaiem Tadesse y Nikos Nanos doctorandos con los que he compartido las lágrimas
y alegrías de la elaboración de una tesis doctoral, a Ana Álvarez asociada para
siempre (lo siento) con las extracciones de ADN y los morteros, y a Fernando del Caño
y Alfonso Pinera por tantos y tantos viajes a Coca.
Al resto de los compañeros/as del CIFOR-INIA y de la unidad de Anatomía de la
ETSI de Montes de Madrid: Regina, Nuria, Isidoro, Maite, Puri, Diana, Zaida, Camen,
Clara, Alex, José Antonio, Juanjo, Alvaro, Pablo, Luis, Paco, Arancha Gómez, Chechu,
José, Arancha Prada, Sven y, aunque parezca mentira, ¡aún se me olvidan algunos!
A mis ex-compañeros de LINEA S.L. (y allegados/as), excelentes amigos, siempre
dispuestos a un fin de semana en el monte y a escuchar mi siempre demasiado
extensa descripción de la tesis.
ÍNDICE
RESUMEN i
SUMMARY ii
1. INTRODUCCIÓN 3
1.1. VARIACIÓN Y ESTRUCTURA GENÉTICA A ESCALAS REGIONAL Y LOCAL 3
1.2. S I S T E M A S DE REPRODUCCIÓN Y FLUJO GENÉTICO 5 1.3. L A ESPECIE OBJETO DE ESTUDIO: EL PINO NEGRAL O RODENO {PlNUS
PINASTER A\J.) 7
2. OBJETIVOS 13
3. MATERIAL Y MÉTODOS 17
3.1.
MATERIALVEGETAL 17
3.1.1. Variación, estructura y flujo genético a escala regional 17
3.1.2. Variación, estructura y flujo genético a escala local 19
3.2.
CARACTERESCUANTITATIVOS 20
3.3. MARCADORES MOLECULARES 22
3.3.1. Isoenzimas 22
3.3.2. Microsatélites nucleares {nSSRs) 24
3.4. MÉTODOS DE ANÁLISIS : 25
3.4.1. Variación, estructura y flujo genético a escala regional 25
3.4.1.1. Distribución geográfica de la diversidad genética 25
Marcadores isoenzimáticos 25
Caracteres cuantitativos 26
Correlación entre caracteres cuantitativos y marcadores 27
3.4.1.2. Estructura y flujo genético regionales 29
Estructura genética regional 29
Flujo genético regional. 31
3.4.2. Variación, estructura y flujo genético a escala local 32
3.4.2.1. Estructura genética intrapoblacional 32
Autocorrelación espacial de alelos 32
Endogamia y estructura familiar 33
Exclusión simple 34 Análisis de parentesco 34 Modelo de dispersión basado en vecindarios 36
4. RESULTADOS 41 4 . 1 . VARIACIÓN, ESTRUCTURA Y FLUJO GENÉTICO A ESCALA REGIONAL 41
4.1.1. Distribución geográfica de la diversidad genética 41
Marcadores isoenzimáticos 41 Caracteres cuantitativos 45 Correlación entre caracteres cuantitativos y marcadores 47
4.1.2. Estructura y flujo genético regionales 49
Estructura genética regional 49 Flujo genético regional 52 4.2. VARIACIÓN, ESTRUCTURA Y FLUJO GENÉTICO A ESCALA LOCAL 53
4.2.1. Estructura genética intrapoblacional 53
Autocorrelación espacial de alelos 53 Endogamia y estructura familiar 53
4.2.2. Sistema de reproducción y flujo genético local 54
Exclusión simple 54 Análisis de parentesco 55 Modelo de dispersión basado en vecindarios 56
5. DISCUSIÓN 61
5.1. VARIACIÓN, ESTRUCTURA Y FLUJO GENÉTICO A ESCALA REGIONAL 61 Variación y estructura genética molecular: origen y causas 61 Correlación entre varíabilidad genética molecular y adaptativa: la
importancia de la selección natural 64
Flujo genético regional 67 5.2. VARIACIÓN, ESTRUCTURA Y FLUJO GENÉTICO A ESCALA LOCAL 67
Estructura genética intrapoblacional 67 Sistema de reproducción y flujo genético local 71
8. ANEXO PUBLICACIONES 99
El trabajo de investigación realizado en la presente tesis doctoral se ha reflejado
en las publicaciones y manuscritos referidos en este anexo y a los que se cita en
el texto por el correspondiente número entre corchetes.
[11 González Martínez, S.C., Alia, R., y L. Gil. Genetic diversity estimates
of Pinus pinaster A\i. using allozymes and quantitative traits. Manuscrito.
[2] González Martínez, S.C, Salvador, L., Agúndez, D., Alia, R., y L. Gil.
2001. Geographical variation of gene diversity of Pinus pinaster A\t in the
iberian Península. En: Genetic response of forest systems to changing
environmental conditions (ed. Müller-Starck G), en prensa. Kluwer
Academic Press, Dordrecht.
[3] González Martínez, S.C, Alia, R., y L. Gil. Population structure in a
Mediterranean pine {Pinus pinaster A\t.): a comparison of allozyme markers
and quantitative traits. Manuscrito.
[4] González Martínez, S.C, Miguel, I., Allué-Andrade, M., Alia, R., y L. Gil.
2001. Estructura poblacional y flujo genético en un regenerado natural de
Pinus pinaster Alt (Coca, Segovia). Cuadernos de la SECF, en prensa.
[5] González Martínez, S.C, Gerber, S., Cervera, M.T., Martínez Zapater,
J.M., Gil, L., y R. Alia. Mating system in Pinus pinaster A\t. using nuclear
SSRs markers: a comparison with allozymes and exclusión analysis.
Manuscrito.
[6] González Martínez, S.C, Gerber, S., Cervera, M.T., Martínez Zapater,
J.M., Gil, L., y R. Alia. 2001. Detecting reliable parent-offspring matches in
parentage analysis: a case study. En: Modeliing and experimental researct)
on genetic processes in tropical and températe forests (ed. Degen B), en
prensa.
[7] González Martínez, S.C, Gerber, S., Cervera, M.T., Martínez Zapater,
J.M., Gil, L., y R. Alia. Seed dispersal and parentage of saplings in a
Mediterranean pine {Pinus pinaster Ait.) using nuclear microsatellite
markers. Manuscrito.
RESUMEN
El pino negral {Pinus pinaster A\t.) es una importante especie forestal en el suroeste de Europa. En España ocupa más de 1.000.000 de ha, siendo un 40% de las masas de origen natural. La distribución geográfica de esta especie en la Península Ibérica, con poblaciones centrales de gran tamaño, y otras aisladas y con bajo número efectivo poblacional, hacen al pino negral una especie arbórea idónea para estudios fitogeográficos y evolutivos. En este trabajo se analiza la distribución geográfica de la diversidad genética tanto a escala molecular (isoenzimas) como cuantitativa (altura total, forma del fuste y supervivencia), con especial referencia al ámbito noroccidental de la especie. Además de los análisis clásicos en genética de poblaciones, se han utilizado técnicas geoestadísticas para profundizar en las causas y estructura de la variación genética. Por otra parte, se ha estudiado la estructura genética local (autocorrelación de alelos, endogamía y estructura familiar) y el flujo genético en un rodal de la especie situado en la parte segoviana de la Meseta Castellana. A escala regional, se distinguen tres grupos de poblaciones claramente diferenciados: grupo Noroeste, grupo Sureste y grupo Este, concentrándose la mayor parte de la diversidad y riqueza alélica en los dos últimos. Existe una mayor diversidad genética en las poblaciones cercanas a la costa Mediterránea, reduciéndose la misma según nos aproximamos al noroeste Peninsular. Dicha estructura puede explicarse mediante la existencia de refugios glaciares de la especie en zonas, próximas a la costa, hoy ocupadas por poblaciones marginales de gran singularidad y riqueza alélica. Por otra parte, existe un importante efecto aleatorio que distorsiona el patrón de diversidad regional y que podría estar relacionado con la existencia de estructura genética local, según el modelo de
aislamiento por distancia de Wright. La variación genética cuantitativa está relacionada de
forma muy débil con la variación molecular, indicando la gran importancia de la selección natural en el proceso de diferenciación y adaptación de esta especie a la gran variación ecológica de las estaciones que ocupa. Esta conclusión se ve apoyada no sólo por la comparación de caracteres moleculares y cuantitativos sino también por la evaluación de la interacción genotipo-ambiente en ensayos de campo. Con respecto al análisis de la estructura genética local se ha encontrado una autocorrelación positiva de los alelos en el regenerado en clases de distancia menores de 15 m y que puede ser explicada por una dispersión restringida de la semilla. Dicha correlación no se mantiene en la población adulta, a pesar de presentar ésta una estructura familiar similar a la del regenerado. El pino negral presenta un sistema reproductor con una elevada tasa de polinización cruzada, próxima al 100%, y un elevado flujo genético tanto regional (Nem = 5,36) como local (flujo genético por semilla: 56 ± 8%; flujo genético por polen: 85 ± 13%). Además, existe una relación positiva entre el éxito reproductor individual y el perímetro del tronco a 1,30 m de los parentales femeninos. La existencia de flujo genético local condiciona las estrategias de conservación y mejora de recursos genéticos de P.
pinaster. Con respecto a la primera, el elevado flujo genético detectado en la especie indica la
SUMMARY
Introducción
1. INTRODUCCIÓN.
1.1. VARIACIÓN Y ESTRUCTURA GENÉTICA A ESCALAS REGIONAL Y LOCAL.
El conocimiento de ia variación y estructura genética a escala regional es fundamental en la optimización de las estrategias de conservación y mejora de los recursos genéticos forestales. El estudio de la variabilidad genética dentro y entre poblaciones y de los niveles de flujo genético histórico puede proporcionar información útil sobre la incidencia de las actuaciones humanas en ios procesos genéticos y asesorar la toma de decisiones en la gestión, conservación y mejora de los recursos genéticos forestales (Boshier 2000). En este sentido, se ha estudiado el impacto de la contaminación polínica en áreas de conservación genética in situ (Adams y Burczyk 2000), el efecto de la selvicultura sobre la dinámica genética del rodal y la diversidad genética del regenerado (Thomas et al. 1999; Adams eí al. 1997; Nason y Hamrick 1997; Murawski eí al. 1994) o el diseño óptimo de los muéstreos incluidos en las estrategias de conservación (Savolainen 2000; Balfourier eí al. 1998; Eriksson eí al.
1993).
Numerosos autores proponen el uso de marcadores moleculares para la definición de estrategias de conservación (ver, por ejemplo, Petit eí al. 1998). La aplicación, sin otra información, de marcadores moleculares en conservación tiene serias limitaciones (Lynch 1995). Un muestreo óptimo de la variabilidad genética debería considerar no sólo la variación neutral o casi-neutral ofrecida por los marcadores moleculares sino también la variabilidad en caracteres cuantitativos y los complejos genómicos co-adaptados. Waldmann y Andersson (1998) señalan tres inconvenientes principales cuando se usan marcadores moleculares neutrales para estimar la variación genética cuantitativa: (1) la mayor tasa de mutación de los caracteres cuantitativos sugiere una recuperación más rápida tras una reducción acusada del número efectivo poblacional
{cuello de botella), (2) cuando la varianza no aditiva es alta, la reducción de la varíanza
Introducción
estrategia adecuada para profundizar en las causas que condicionan los patrones de
diferenciación y variación genética. En concreto, la mayor parte de los marcadores
moleculares utilizados hasta el momento en genética de poblaciones se consideran
neutrales o casi-neutrales y pueden proporcionar una base empírica para construir una
hipótesis nula que permita investigar el efecto de la selección natural como
determinante de la evolución de los caracteres cuantitativos (Lynch eí al. 1999; Ritland
2000;Petiteía/. 2001).
Existen numerosos estudios que describen la estructura geográfica de la variación
genética de especies forestales con importancia económica y/o ecológica, ya sea
mediante métodos multivariantes {Pinus contorta ssp latifolia, Yeh eí al. 1985; Picea
abies, Lagerkrantz y Ryman 1990; Quercus súber, Toumi y Lumaret 1998; Jiménez et
al. 1999), técnicas de correlación entre variables genéticas y geográficas {Quercus
petraea, Zanetto y Kremer 1995; Castanea sativa, Villani etal. 1999; Pinus halepensis,
Agúndez eí al. 1999; Pinus pinaster, Salvador eí al. 2000) o geoestadística {Fagus
sylvatica, Degen y Scholz 1998; Gómóry eí al. 1998; Quercus petraea, Le Corre eí al.
1998; Picea abies, Bucci y Vendramin 2000). Esta última aproximación se desarrolló
por primera vez en el campo de la geología y ha demostrado su utilidad para detectar
patrones complejos de variación genética (Monestiez etal. 1994). La ventaja principal
de este método frente a los tradicionales es que no supone la independencia
estadística de las muestras que componen el análisis (Le Corre eí al. 1998). Una
descripción completa de las técnicas usadas en geoestadística puede encontrarse en
Journel y Huijbregts (1978) y Cressie (1993).
La estructura genética a escala regional se puede ver distorsionada por la
existencia de una estructura genética local (Monestiez eí al. 1994). Los modelos
teóricos clásicos, como el de aislamiento por distancia de Wright (IBD, Isolation By
Distance), muestran que un flujo genético limitado y el apareamiento preferencial con
Introducción
1974; Schnabel et al. 1998). En aquellas especies parcialmente autofértiles, la estructura intrapoblacional afecta, también, la frecuencia de equilibrio de genes letales (Hedrick et al. 1999), teniendo este factor consecuencias evolutivas notables (Charlesworth y Charlesworth 1987).
La estructura genética a escala local en especies arbóreas se produce, generalmente, cuando hay una dispersión limitada de semilla. Esta asociación entre flujo de semilla restringido y estructura genética intrapoblacional se ha comprobado en numerosas especies tanto de zonas templadas (Schnabel eif al. 1991; Dow y Ashley 1996; Ledig 1998) como tropicales (Hamrick eí al. 1993; Boshier et al. 1995). En especial, este factor tiene importancia en especies donde existe una gran diferencia de masa entre semilla y polen, e importantes adaptaciones para la dispersión por viento (Ennos 1994). Tradicionalmente se ha estimado el flujo genético producido por la dispersión de semilla mediante el uso de dispositivos de muestreo indirectos como las trampas de captura (ver, por ejemplo, Clark eí al. 1998), habiéndose desarrollado en los últimos años métodos directos basados en resultados directamente observables mediante el uso de marcadores moleculares (Meagher y Thompson 1987; Schnabel y Hamrick 1995; Dow y Ashley 1996; Gerber eí al. 2000; Yazdani eí al. 1989).
1.2. SISTEMAS DE REPRODUCCIÓN Y FLUJO GENÉTICO.
El sistema de reproducción y el flujo genético, tanto regional como local, en una especie están estrechamente relacionados con la estructura genética que presenta. El sistema reproductor determina la distribución de los genotipos dentro de una población y condiciona el grado de diferenciación entre poblaciones (Charlesworth y
Charlesworth 1995). Además, la existencia de un flujo genético moderado evita el desarrollo de estructura genética a escala local (Levin y Kerster 1974; Adams 1992) y es suficiente para mantener genes no adaptados a las condiciones locales en una población (ver Adams y Burczyk 2000 para una simulación con un 5% de migrantes,
m, procedentes de una población donde dichos genes están fijados). Por otra parte, el
sistema de reproducción y el flujo genético también tienen importantes implicaciones prácticas. El grado de endogamia de una población, por ejemplo, influye en la estrategia de muestreo para la conservación genética ex situ, la selección de árboles
Introducción
un serio problema en huertos semilleros y reservas genéticas (Pakkanen y Pulkkinen 1991;Savolainen 1991).
En especies vegetales, el estudio del sistema reproductor puede realizarse a partir de la morfología floral, cruces controlados o la observación de polinizadores. Este tipo de estudios no proporciona información cuantitativa (como, por ejemplo, la tasa de polinización cruzada), por lo que suelen utilizarse análisis basados en marcadores moleculares. En muchos casos, los análisis que tienen como base los marcadores moleculares realizan estimaciones conjuntas de sistema de reproducción y flujo genético (Schnabel 1998). Tradicionalmente, se han utilizado tres tipos de métodos (Adams 1992): (1) basados en aleles raros, es decir el seguimiento de la pista del polen o de las semillas de árboles individuales mediante el estudio de aleles raros presentes en uno o más progenitores, (2) análisis familiar, que realiza estimaciones de flujo genético analizando las relaciones familiares entre los árboles padre potenciales y la progenie mediante el uso de probabilidades de exclusión (EP), es decir, la probabilidad de excluir a los posibles progenitores sobre la base de la incompatibilidad genética con las semillas o el regenerado y (3) modelos globales, que tratan de estimar parámetros del sistema reproductor mediante el ajuste de modelos probabilísticos que, a su vez, pueden incorporar información relativa al éxito reproductivo individual en función de variables como la posición espacial, el tamaño de la copa, etc. Dentro de este último campo, destaca el modelo de vecindarios
(Neighbourhood model) de Adams y Birkes (1989; 1991). Este modelo es de gran
interés en especies forestales (Burczyk et al. 1996; Burczyk y Prat 1997; Burczyk 1998), ya que no exige la existencia de poblaciones aisladas para su aplicación (Adams 1992).
La mayor parte de los estudios, independientemente del tipo de análisis, han utilizado progenies obtenidas de madres individuales de genotipo conocido {análisis de
paternidad). A pesar de ello, algunos autores indican que el éxito de un gameto en la
polinización no quiere decir que ese gameto vaya a formar parte de la generación futura y proponen el análisis del flujo genético basándose en progenie ya establecida
{análisis de parentesco; Dow y Ashley 1996; Schnabel y Hamrick 1995). El análisis
Introducción
utilizados en análisis de parentesco incluyen la exclusión simple (Yazdani etal. 1989; Dow y Ashley 1996), la asignación de la plántula al padre potencial más probable (Meagher y Thompson 1987; Gerber et al. 2000) y la asignación fraccional de la paternidad de la plántula entre todos los padres con genotipo compatible (Devlin et al. 1988). Para este tipo de análisis, los mejores resultados se obtienen con el uso de marcadores de herencia codominante y altamente polimórficos como los microsatélites nucleares (Dow y Ashley 1996; Gerber eí al. 2000; Taylor eí al. 2000).
1.3. L A ESPECIE OBJETO DE ESTUDIO: EL PINO NEGRAL O RODENO {PINUSPINASTERAIT.).
El pino negral o rodeno {Pinus pinaster Ait.) tiene una amplia distribución en la cuenca Mediterránea occidental (Figura 1.1.). La discontinuidad y gran altitud de las cadenas montañosas en el suroeste de Europa contribuyen al aislamiento geográfico de poblaciones relativamente cercanas. Este hecho, junto con el impacto humano histórico explica la distribución fuertemente fragmentada de la especie.
Adoptaele» coriDqtérico: <*. DE MKIttfL
Figura 1.1. Área de distribución natural del pino negral o rodeno {Pinus pinaster).
Introducción
60 años debido, principalmente, a plantaciones con material vegetal de origen desconocido (Devy-Vareta 1993; Ribeiro etal. 2001a). El pino negral habita estaciones muy diversas, incluyendo suelos arenosos y calizos, y presenta una gran amplitud fitoclimática, viviendo sobre 14 de los 20 fitoclimas definidos por Allué (1990) en el territorio español. En consecuencia, el pino negral presenta numerosas adaptaciones locales en crecimiento y supervivencia (Alia eí al. 1995; 1997). En España se han delimitado 27 regiones de procedencia (Figura 1.2.), incluyendo siete de área restringida (Alia etal. 1996).
-•--'••C.
.-5o--¿.../''^----Figura 1.2. Reglones de procedencia de Pinus pinaster en España (Alia eí al. 1996).
Introducción
superar los 100 m (Miguel 2001). En cambio, en la relativamente próxima Sierra del
Teleno, con una acusada incidencia de los incendios forestales, la producción de
conos serótinos alcanza el 100 %, existiendo un banco aéreo mayor de 1.000.000 de
semillas/ha (Tapias 2000).
Los estudios de variación genética en esta especie han mostrado grandes
diferencias entre poblaciones tanto con marcadores moleculares (Baradat y Marpeau
1988; Petit etal. 1995; Aliona etal. 1996; Vendramin etal. 1998; Salvador etal. 2000;
Ribeiro etal. 2001 a,b) como con caracteres cuantitativos. Respecto a estos últimos, se
ha encontrado gran variación genética en supervivencia, adaptación a diferentes
condiciones climáticas, crecimiento, fenología del crecimiento, resistencia a plagas y
tolerancia a la sequía estival (Matziris 1982; Guyon y Kremer 1982; Kremer y Roussel
1986; Alia et al. 1995; 1997; Harfouche et al. 1995; Fernández eí al. 1996). La
variación genética molecular (terpenos) se ha descrito como geográficamente
estructurada en 18 razas, incluidas en tres grupos principales: Atlántico (suroeste de
Francia, Portugal y noroeste de España, incluyendo la Meseta Castellana),
Mediterráneo (este de la Península Ibérica, sureste de Francia, Córcega e Italia, con la
excepción de la Isla de Pantellería) y Magrebí, que incluye las poblaciones africanas
de la especie y la Isla de Pantellería (Baradat y Marpeau 1988). Usando marcadores
de herencia materna (ADN mitocondrial), Ch. Burban (com. per.) distingue tres
grandes grupos: Occidental (Península Ibérica, excepto Las Gabarras en Cataluña, y
suroeste de Francia), Marroquí (Rif y Atlas) y Oriental, que incluye Córcega, Italia,
Túnez, Argelia, sureste de Francia y Las Gabarras en Cataluña. Por otra parte, los
análisis con microsatélites del cloroplasto (SSRs) muestran dos zonas de alta
diversidad haplotípica: Landas, en el suroeste de Francia, y la Isla de Pantellería
(Vendramin et al. 1998), y permiten diferenciar claramente las poblaciones
portuguesas de las del suroeste francés (Ribeiro et al. 2001b).
Introducción
situados en cadenas montañosas cercanas a la costa Mediterránea (Salvador et al.
2000), (2) la existencia de una alta tasa de flujo genético en esta especie y (3) la
modificación de la estructura genética poblacional debida a la acción humana (Ribeiro
eí al. 2001a; Mariette et al. 2001b). En concreto, en el suroeste de Francia, las
plantaciones con pino negral comenzaron en el siglo XVIII, logrando a partir de
escasamente 10.000 ha extender la especie hasta alcanzar más de un 1.000.000 ha
(Scott 1962). La gran diversidad haplotípica encontrada en esta región por Vendramin
et al. (1998) en su estudio de diversidad con microsatélites del cloroplasto podría
haberse originado en la mezcla de diferentes procedencias de pino negral durante el
proceso de extensión artificial de la especie (Ribeiro 2001). Por otra parte, en Portugal
existe evidencia de grandes movimientos de semilla entre diferentes regiones del país
(Ribeiro eí a/. 2001a).
La Península Ibérica se considera un refugio glaciar para numerosas especies
vegetales y animales (Hewitt 1996; Comes y Kadereit 1998) y una de las áreas de
distribución natural más importantes de P. pinaster. La gran variabilidad tanto
molecular como cuantitativa del pino negral, la diferente situación demográfica y
ecológica de sus poblaciones -algunas cubriendo miles de hectáreas y otras reducidas
a un par de millares de árboles adultos- y su particular situación en una importante
zona de refugio glaciar han sido determinantes para la elección de esta especie como
objeto de estudio.
Objetivos
2. OBJETIVOS.
Los objetivos del presente trabajo de investigación son los siguientes:
• Analizar y caracterizar la distribución geográfica de la variabilidad genética,
tanto molecular como cuantitativa, de P. plnaster, con especial referencia a las
poblaciones del noroeste de la Península Ibérica (en sentido amplio). Además
de aportar nuevos datos para la interpretación de la distribución geográfica
actual de la variabilidad, se pretende profundizar en las causas que explican
dichos patrones de distribución.
• Estudiar la estructura genética dentro de poblaciones de un rodal natural de P.
p/naster situado en una región de procedencia central de la especie, la Meseta
Castellana, considerando la correlación espacial de aleios y aspectos
relacionados con la estructura familiar del rodal.
Material y métodos
3. MATERIAL Y MÉTODOS.
3.1. MATERIAL VEGETAL.
3.1.1. Variación, estructura y flujo genético a escala regional.
Se han analizado un total de 35 poblaciones, de las cuales 24 pertenecen a regiones de procedencia españolas centrales (13 poblaciones en el noroeste peninsular), siete a procedencias españolas de área restringida (Alia etal. 1996), una a Portugal (Leiria) y tres a regiones que bordean la Península Ibérica (Aquitania, Atlas Medio y Córcega). La Figura 3.1. y las Tablas 3.1. y 3.2. muestran las poblaciones utilizadas en el análisis de la variación genética a escala regional y el tipo de datos disponibles para cada una de ellas.
* Poblaciones analizadas • Ensayos de campo
Material y métodos
Tabla 3.1. Poblaciones de Pinus pinaster incluidas en este trabajo y tipo de datos obtenidos para cada una de ellas: regiones de procedencia españolas centrales y Portugal.
Población San Cipriano de Ribaterme Leí ha El Saúgo Talayueia Arenas de San Pedro Guadarrama Coca Quintana Redonda Iscar Tabuyo del Monte Oña San Leonardo Codos Mazarete Almódovar del Pinar Soniches Viilamalur Peñagoíosa Gea de Albarracín Cortes de Pallas Riopar Cazorla Estepona La Peza Competa Id. Po Lr Sa Ce Av M sg So1 Va Le Bu So2 Z Gu Cu1 Cu2 Cs3 Cs2 Te V1 Ab J Ma1 Gr Ma3 Región de procedencia/País
1 b. Noroeste interior
Portugal
4. S. de Gata-Las Hurdes 5. Bajo Tietar
6. Sierra de Credos
7. Sierra de Guadarrama 8. Meseta Castellana
8. Meseta Castellana
8. Meseta Castellana
2. Sierra del Teleno
3. Sierra de Oña
9. Montaña Soria-Burgos 10. Sistema Ibérico Central 11. Rodenales de Molina
12. Serranía de Cuenca
12. Serranía de Cuenca 15. Sierra de Espadan 14. Maestrazgo
13. Albarracín
16. Levante
17. S. de Segura-Alcaraz 17. S. de Segura-Alcaraz 20. Sierra Bermeja 19. Sien^a Almijara-Nevada 19. Sierra almijara-Nevada
Latitud
42° 07' 06" N
40° 00' 00" N 40° 22'15" N 40° 00' 55" N
40° 11'19" N
40° 40' 27" N 41° 13'52" N
41° 35'56" N
41° 20'05" N
42° 18' 13" N
42° 45' 04" N
41 ° 50'39" N 41° 17'35" N 40° 55' 35" N
39° 40' 44" N
39° 59'18" N 39° 57' 5 1 " N 40° 15' 04" N
40° 23' 05" N
39° 10' 48" N
38° 28' 05" N 37° 55' 05" N 36° 31' 05" N 37° 16'26" N 36° 51'44" N
Longitud
8° 21'52" W
8° 45' 00" W 6° 33'10" W 5° 33' 19" W
5° 07'13" W
4° 03" 3 1 " W 4° 3 0 ' 1 1 " W
2° 35' 56" W
4° 3 1 ' 1 1 " W
6° 13'25" W
3° 31'10" W 3° 05'10" W r 2 5 ' 1 1 " W 2° 10'30" W
1 ° 5 2 ' 5 4 " W
1 ° 3 9 ' 0 3 " W 0° 25" 25" W 0 ° 2 1 ' 11" W
1 ° 2 4 ' 1 0 " W
0 ° 5 6 ' 4 1 " W
2° 2 7 ' 3 1 " W 2° 5 5 ' 1 1 " W 5 ° 0 7 ' 1 1 " W 3° 22'10" W 3° 53' 33" W
Altitud (m) 300 200 850 260 1000 1350 795 1050 760 1050 700 1100 1150 1100 1000 1075 850 1400 1350 900 1200 1150 500 1400 1250 1
u
•/ • / ^ ^ V V V V -/ / v' ^ ^/' V - / V • / ^ ^ y v" ^ -/ Y Datos^ M -/ V V V V y -/ •/ ^ • / 1 Q / Y •/ V V • / y V V •/ -/ V - /v'
•/ • / •/' U: Isoenzimas unilocus; M: Isoenzimas multilocus; Q: Caracteres cuantitativos.
Material y métodos
Tabla 3.2. Poblaciones de Pinus pinaster incluidas en este trabajo y tipo de datos obtenidos para cada una de ellas: regiones de procedencia españolas de área restringida y poblaciones no ibéricas.
Población Id. . Región de procedencia/País
Poblaciones españolas de área restringida
Las Gabarras S. del Pradell Benlcasim La Safor Oria Gaucín Fuencaliente G T Cs1 V2 Al Ma2 Cr
C. Litoral Catalán B. Sierra del Pradell A. Benicasim D. La Safor F. Oria
G. Serranía de Ronda E. Fuencaliente Poblaciones no ibéricas
Tamjout Medoc Zonza Tmj Ld cg
Medio Atlas, Marruecos Aqultania, Francia Córcega
Latitud
41° 54'51" N 41° 10'00" N 40° 05' 04" N 38° 58' 42" N 37° 30" 49" N 36° 32'10" N 38° 25" 05" N
33° 52'15" N 45° 17'30" N 41° 44'15" N
Longitud
3° 03' 02" E 0° 54' 00" E 0° 00' 46" E 0°21'26"W 2°20'11"W 5° 17'56" W 4° 11'53" W
4° 02' 40" W 0° 52' 30" W 9° 10'35" E
Altitud (m) 200 650 325 450 1300 600 900 1600 100 760
u
v' V ^ Y •/ ^ y • / • • ' Datos^ M >/" • ' ^ • Q y y^ U: Isoenzimas unilocus; M: Isoenzimas multilocus; Q: Caracteres cuantitativos.
3.1.2. Variación, estructura y flujo genético a escala local.
En la región de procedencia central Meseta Castellana (región 8) se ha establecido un rodal de estudio intensivo {Intensive Sampling Plot; en adelante ISP). Dicho rodal se localiza en el tranzón 1 de la Sección 2^ del Cuartel A del Monte de Utilidad Pública n° 105, propiedad de la Comunidad de Villa y Tierra de Coca (Segovia). El clima es Mediterráneo seco, con una precipitación anual de 432 mm (72 mm en verano) y una temperatura media de 12,3°C. Los suelos son arenosoles eútricos, ácidos (pH entre 5 y 6) y de baja fertilidad (contenido en materia orgánica inferior al 0,5%). El pinar de pino negral (P. pinaster) se caracteriza en la zona de estudio por la presencia de gran número de herbáceas mediterráneas {Corynephorus
canescens (L.) P. Beauv. y Stipa spp.), manchas arbustivas {Retama sphaerocarpa
Material y métodos
parcela de estudio tiene 50 m de radio y una superficie de 0,78 ha, estando cubierta por abundante regeneración natural (Figura 3.2.). En ella se han determinado las edades, alturas y circunferencias normales de todos ios árboles adultos (76), las alturas y edades -por conteo de verticilos- del regenerado de altura superior a 20 cm presente en una subparcela concéntrica de la anterior de 25 m de radio (132 individuos), y las coordenadas espaciales de cada individuo con respecto al centro de ambas parcelas. Además se recogió material vegetal (acículas) para la extracción de ADN y el posterior análisis mediante microsatélites nucleares (ver Apdo. 3.3.2.). El rodal fue seleccionado por no haber sido afectado por intervenciones selvícolas, con la excepción de la corta y retirada de árboles secos, por lo que representa a la especie en condiciones naturales.
1 1 \ r m 0,00 10,00 20,00 30,00
Figura 3.2. Rodal de estudio intensivo de Coca (Segovia). Los círculos indican árboles maduros y las cruces plántulas y juveniles mayores de 20 cm de altura.
3.2. CARACTERES CUANTITATIVOS.
En 1967 se instalaron seis ensayos de campo de P. pinaster con el objetivo de evaluar el comportamiento de las procedencias de esta especie (ver Alia et al. 1995;
Material y métodos
Alia y Moro 1996; Alia et al. 1997, para una revisión completa del experimento). El diseño fue en bloques completos al azar con 4 repeticiones y unidades experimentales
Material y métodos
de 16 árboles. Tres de los seis ensayos de campo (S1: Espinoso; S2: Riofrfo; y S3:
Cabañeros) se han seleccionado para este trabajo por presentar una baja interacción
genotipo-ambiente y diseños más equilibrados. Se han realizado mediciones a los 32
años de edad de tres caracteres cuantitativos (altura total, supervivencia y forma del
fuste). La supervivencia se ha calculado en porcentaje respecto a la unidad
experimental, realizándose una transformación angular para mejorar sus propiedades
estadísticas (y* = arcoseno (y)^'^). La forma del fuste se ha medido usando una escala
subjetiva de 1 (fustes rectos) a 6 (fustes torcidos).
3.3. MARCADORES MOLECULARES.
3.3.1. Isoenzimas.
En cada población incluida en el análisis a escala regional se han recogido 2-3
pinas de 80 árboles separados entre sí al menos 50 m. Se han analizado, o bien 70-80
megagametófitos por población (21 poblaciones) o megagametófitos y embriones de
35-40 semillas (14 poblaciones). En el primer caso se obtiene exclusivamente
información unilocus, mientras que en el segundo también es posible realizar análisis
multilocus de la variación. En algunas poblaciones (Tmj, Ld y Cg) la recogida
individualizada de semilla no fue posible y se procedió al análisis de una muestra
aleatoria a partir de lotes de semilla proporcionados por el Laboratoire de génétique et
amélioration des arbres forestiers (INRA, Francia). Las semillas se humedecían
durante 24 h a temperatura ambiente, germinándose posteriormente en cámara (20*'C,
8 horas de oscuridad). La extracción de isoenzimas se ha realizado con semilla
germinada (3-4 mm de radícula) siguiendo el protocolo de Conkle etal. 1982. Se han
analizado los siguientes sistemas enzimáticos (16 loci) mediante electroforesis en
geles de almidón: 6-fosfogluconato deshidrogenasa {6Pgd-1 y 6Pgd-2; EC 1.1.1.44),
isocitrato deshidrogenasa {Idh; EC 1.1.1.42), malato deshidrogenasa {Mdh-1, Mdh-2,
Mdh-3 y Mdh-4; EC 1.1.1.37), fosfoglucosa isomerasa {Pgi-1 y Pgi-2; EC 5.3.1.9),
fosfatasa acida (Acph; EC 3.1.3.2), glutamato deshidrogenasa {Gdh; EC 1.4.1.3),
catalasa {Caí; EC 1.11.1.6), glutámico-oxalacético transaminasa {Got-1 y Gof-2; EC
2.6.1.1), fosfoglucomutasa {Pgm; EC 2.7.5.1) y leucin-aminopeptidasa {Lap; EC
3.4.11.1). La interpretación genética de los sistemas enzimáticos y los métodos de
análisis en laboratorio están descritos en Castro (1989) y Salvador (1997), mientras
Material y métodos
que ia variación alélica se presenta en la Figura 3.3. Todos los loci analizados son neutrales según el test de neutralidad de Ewens-Watterson (Manly 1985).
-c:>
6Pgd-1
105 100 91
E B 6Pgd-2 115
s
100s
86s
Mdh-1 100 iga 80 @@ Mdh-2100 80
-Mdh-3
123
-100 l O O n
Mdh-4 IOS CT8I 100 fiiW Pgi-1
100 85
Pgi-2 135 EJgR 100 B ^ 67 wa 43 l8gS Idh 118 -100 -Acph
110 100
Gdh 115 -100 @a Caí Goí-Í 100 85
Got-2
135
-106 100
Pgm
104 100 96
Lap
104
CZB3
100 100n 95 Leyenda
100 Alelo más común •••••-• Alelo nulo S Alelo con dos bandas r_"i Zona sin interpretación
Material y métodos
3.3.2. Microsatélites nucleares {nSSRs).
La extracción de ADN genómico se ha realizado a partir de acículas recogidas en el ISP de Coca (Segovia), utilizando un protocolo modificado de Dellaporta et al. (1983). De los tres pares de cebadores analizados, uno de ellos se ha obtenido por transferencia de P. halepensis Mili., mientras que los otros dos fueron desarrollados específicamente para P. pinaster por Mariette et al. (2001a). El locus Frpp94 se analizó mediante un secuenciador automático Li-Cor 4000 (Li-Cor Inc., Nebraska, USA) siguiendo el protocolo descrito en Mariette et al. (2001a). Los otros dos loci
{ltpt}4516y Frpp91; ver Figura 3.4.) se analizaron como sigue: la amplificación se llevó
a cabo en un termociclador Perkin Elmer GeneAmp 9600, utilizando 0,5 U de polimerasa Taq (Boehringer), y 20 ng de ADN en un volumen total de 10 mi. La reacción contenía, además, 0,2 mM de cada dNTP, 2 mM de cada cebador y 5% DMSO. Las concentraciones de MgCla variaban entre 1,5 mM para Itph4516 y 2 mM para Frpp91. Los cebadores directos se marcaron con ^^^P-ATP. El ciclo de la PCR consistía en una desnaturalización inicial de 5' a 9 4 X , seguida por 20 ciclos con temperatura de hibridación variable: 30" de desnaturalización (94°C), 30" de hibridación (desde 63''C a 61 °C con un descenso de 0,1°C en cada ciclo) y 45" de elongación (72°C), y 15 ciclos con temperatura constante de hibridación: 30" de desnaturalización (94X), 30" de hibridación ( 6 r C ) y 45" de elongación (72X), y una extensión final de 5' a 72°C. Los fragmentos amplificados se mezclaban con 20 mi de una solución de formamida (98% formamida, 10 mM EDTA pH 8,0, 0,05% azul de bromofenol y 0,05% cianol de xileno). Antes de la electroforesis, los fragmentos se calentaban durante 3' a 94''C. Las muestras se cargaban (1,5 mi) en un gel que contenía 6% de acrilamida/bisacrilamida (19:1), 7,5 M de urea y I X TBE. La electroforesis se realizada a 95 W y 50°C durante aproximadamente 3 h 30'. Una vez terminada la electroforesis, los geles se secaban y eran expuestos en un film sensible a la radioactividad durante 2-5 días. El tamaño de los aleles se determinaba por comparación con secuencias de tamaño conocido y utilizando un marcador estándar de 100 pb (Gibco BRL). De forma complementaria, en cada gel se corrían cuatro muestras previamente analizadas para asegurar la consistencia entre los mismos. Los tres nSSRs analizados se localizan en diferentes grupos de ligamiento según el mapa genético de Costa et al. (2000).
Material y métodos
wSfe
«>««&<.
jme^
'
,A«-rtíi^íBW>
..Jime<.-aS>0k-.rfíí^ v,»?*r
Figura 3.4. Gel de acrilamida/bisacrilamida (19:1) mostrando los loci Itph4516 (arriba) y Frpp91 (abajo) en P. pinaster.
3.4. MÉTODOS DE ANÁLISIS.
3.4.1. Variación, estructura y flujo genético a escala regional.
3.4.1.1. Distribución geográfica de la diversidad genética.
Marcadores isoenzimáticos
Material y métodos
Pons y Petit {hk, Pons y Petit 1995) y la riqueza alélica. El estimador de Pons y Petit
(1995) considera un muestreo aleatorio estratificado (poblaciones e individuos dentro
de poblaciones) en el muestreo de la diversidad, mientras que Nei considera las
poblaciones factores fijos. La formulación insesgada de estos parámetros se presenta
en [1]. La riqueza alélica es más sensible que la diversidad genética ante cambios en
el número efectivo poblacional (Nei et al. 1975; Cornuet y Luikart 1996). Por este
motivo, su uso en el estudio de los procesos que afectan la estructura genética de las
poblaciones es de gran utilidad (Marshali y Brown 1975; Petit et al. 1998), aunque
conlleva la utilización de factores de corrección cuando el tamaño de muestra no es
homogéneo. En este caso (n=72-80), se ha utilizado el método de rarefacción de
Hurlbert (1971). Por otra parte, Petit et al. (1998) sugieren que la contribución de una
determinada población a la diversidad global de la especie puede calcularse mediante
la diferencia entre la diversidad total poblacional y la diversidad poblacional cuando no
se incluye la población en cuestión. Esta contribución a la diversidad puede
subdividirse en un componente de diversidad en sentido estricto y otro relacionado con
su divergencia respecto al resto de las poblaciones. Un razonamiento similar puede
aplicarse ai cálculo de las contribuciones a la riqueza alélica.
Se han calculado seis medidas multilocus basadas en datos diploides ordenados:
el coeficiente de diferenciación de Wright {Fsf, Wright 1965), el coeficiente de
endogamia (/; Weir 1990), la diversidad genotípica ( i / ; Gregorious 1978), que
representa el número efectivo de genotipos en una población, la diferenciación
poblacional total {Sf, Gregorius 1987), la uniformidad de la distribución (e), y la
diferenciación de las subpoblaciones (Dy), es decir, la proporción de genotipos de una
población por la cual ésta se diferencia de las restantes.
Caracteres cuantitativos
La distribución regional de la diversidad de tres caracteres cuantitativos (altura
total, supervivencia y forma del fuste) se ha estudiado utilizando la serie de ensayos
de procedencia descrita en Alia et al. 1995; Alia y Moro 1996; Alia eí al. 1997. Las
poblaciones incluidas se consideran equivalentes a las analizadas con isoenzimas, ya
que ambas son una muestra aleatoria recogida en la misma zona (Yang et al. 1996).
Todos los análisis realizados han utilizado como datos base la estimación de los
efectos de las procedencias a edad 32 años según un análisis combinado del conjunto
Material y métodos
de los sitios de ensayo (ver [1]). La diversidad cuantitativa de una determinada procedencia se lia medido mediante el cociente de variación genética (Cv) (Kremer 1994). De forma análoga al estudio con marcadores moleculares, se ha determinado la contribución de cada población a la variabilidad genética total, evaluada ésta como la suma de cuadrados total en los ensayos analizados.
Correlación entre caracteres cuantitativos y marcadores moleculares.
El análisis de correlación entre diversidad genética molecular y cuantitativa calculada en los apartados anteriores se ha realizado mediante el cálculo del estadístico r de Kendall, que no presupone una distribución determinada de las variables. Por otra parte, numerosos autores sugieren que las isoenzimas, dado su carácter neutral o casi-neutral, pueden servir como hipótesis nula para estimar el efecto de procesos selectivos que afectan a caracteres cuantitativos, siendo éstos la principal causa de variación adaptativa (ver Lynch eí al. 1999 para una revisión reciente, y Cuadro 1: Relación entre diferenciación molecular y diferenciación
cuantitativa). En este trabajo, se ha comparado la diferenciación molecular con la
cuantitativa mediante un test de diferencias basado en intervalos de confianza calculados mediante re-muestreo {bootstrap re-sampling; Manly 1997).
Los niveles de diferenciación molecular y cuantitativo se han estimado mediante el estadístico Fsrde Wright (Wright 1965), que en el caso de caracteres cuantitativos se denomina QST (según Spitze 1993). La diferenciación cuantitativa {QST) se ha calculado para tres caracteres con significación evolutiva (altura total, supervivencia y forma del fuste) en los ensayos de campo analizados. Las hipótesis básicas y la formulación de este estadístico pueden encontrarse en [3]. Dado que no existen estimaciones de heredabilidad en sentido estricto (h^ para Pinus pinaster en España, y que esta medida es necesaria para el cálculo del QST, se ha utilizado un valor inicial de h^=0,2 (Costa y Durel 1996; Kusnandar eí a/. 1998), evaluándose posteriormente mediante una simulación, el efecto de diferentes valores de heredabilidad (rango 0-1) en la estimación del parámetro. El cálculo de los intervalos de confianza se ha realizado mediante un procedimiento de re-muestreo de individuos dentro de bloques
{bootstrap re-sampling; Manly 1997). Los niveles de diferenciación poblacional
Material y métodos
Cuadro 1: Relación entre diferenciación molecular y
diferenciación cuantitativa
En los últimos años se han presentado gran número de trabajos científicos que calculan de forma conjunta parámetros de diferenciación molecular {Fsj o GST) y cuantitativa {QST)^ utilizándose, en este último caso, variables con significación adaptativa relacionadas con el tamaño y el ciclo vital de las especies. Se han estudiado gran número de organismos (herbáceas anuales, árboles, y numerosas especies de invertebrados), habiéndose comprobado la existencia de una característica común en el patrón de diferenciación, lo que sugiere una generalización de los resultados obtenidos. Con la sola excepción de Centaurea corymbosa y Brassica insularis, dos herbáceas endémicas de la cuenca Mediterránea, los estudios realizados hasta el momento muestran una correlación, en ocasiones débil, entre los parámetros utilizados para la estimación de la diferenciación molecular y cuantitativa, y que la diferenciación cuantitativa es siempre igual o mayor que la diferenciación molecular (ver figura adjunta para una revisión de estimaciones conjuntas de FST y QST en especies arbóreas).
m 3 O
O
o
S
c •o o
(D Ü
c
b
0 , 1
-
0,01-Pinus halepensis , - ' "Popuius alba
, » ' • Pinus fxnaster , - ' Pinus sylvestris
Pinus contorta
Quarcus petraea
0,01 0,1 1
Diferenciación cuantitativa (QST)
Dichos resultados generales sugieren que la diferenciación molecular es, generalmente, el umbral inferior de la diferenciación cuantitativa. Este patrón de diferenciación se espera que se produzca si los marcadores moleculares tienden a ser neutrales o casi-neutrales, de manera que su dinámica evolutiva está mayormente influida por procesos genéticos como la mutación, la deriva genética y la migración entre poblaciones. En cambio, además de los procesos genéticos anteriores la diferenciación cuantitativa estaría fuertemente condicionada, al menos en las especies con Qsr > FST, por la adaptación a las condiciones ecológicas locales.
Material y métodos
comparación de pares de poblaciones mediante un modelo lineal que mide la falta de
proporcionalidad entre las estimaciones de diferenciación molecular (FST) y
diferenciación cuantitativa
{QST)-El modelo ajustado para pares de poblaciones se
describe en [3], habiéndose utilizado siete poblaciones situadas a lo largo de una dina
en dirección sur-norte desde Tamjout, Marruecos (Latitud 33° 52' N) a Oña, norte de
España (Latitud 42" 45' N).
3.4.1.2. Estructura y flujo genético regionales.
Estructura genética regional
Una primera aproximación a la estructura geográfica molecular de las poblaciones
se ha obtenido mediante un árbol filogenético basado en la distancia insesgada de Nei
(1978), usando el método UPGMA {Unweighted Pair-Group Mettiod using an
aríthmetic Average). Además se ha realizado el test de Mantel, que mide la asociación
entre los elementos de dos matrices, en este caso una matriz de distancias
geográficas y otra de distancias genéticas, basándose en métodos de análisis
aleatorizados (ver [2]; Manly 1997). Un análisis más detallado de los patrones de
variación molecular y de las causas que originan dicha de variación se obtiene
mediante la aplicación de técnicas de geoestadística a las frecuencias aléiicas
poblacionales (Monestiez et al. 1994; Degen y Scholz 1998; Gómóry et al. 1998; Le
Corre et al. 1998; Bucci y Vendramin 2000). La descripción de los patrones de
variación geográfica se ha realizado mediante el cálculo de variogramas, que
representan la semivarianza de la diferencia entre puntos separados una determinada
distancia, en función de la distancia geográfica. En este caso se han utilizado 8 clases
de distancia en el rango 0-500 km (ver [2] y Cuadro 2: Interpretación genética de un
variograma). Se han construido tanto variogramas totales como en las principales
direcciones cardinales. Para evitar sesgos debidos a errores de muestreo, solamente
se ha utilizado la frecuencia del alelo más común de los loci polimórficos al 95% {Idh,
Mdh-2, Mdh-3, Pgi-2, Lap, Got-2 y Acph; Le Corre et al. 1998). Una aproximación
multivariante, que resume la información obtenida de todos los loci estudiados, se ha
obtenido mediante el cálculo de variogramas para los dos primeros factores de un
Análisis de Componentes Principales (37,69% y 34,58% de varianza explicada,
Material y métodos
Cuadro 2: Interpretación genética de un variograma
Los variogramas, ampliamente utilizados en geología y minería, se han empleado en los últimos años para estudiar la estructura genética a escala geográfica de numerosas especies vegetales. La utilización de este método de análisis espacial es de gran interés ya que permite una interpretación genética de los resultados obtenidos. Un variograma con sólo efecto nugget (A), es decir sin correlación espacial entre poblaciones situadas a diferentes clases de distancia, indica una falta de estructura genética, que puede ser debida a diversos factores como la existencia de estructura espacial a escata Inferior a la analizada o a errores de muestreo.
Por otra parte, en caso de existencia de estructura genética poblacional, los variogramas facilitan su Interpretación. Como ejemplo, se presentan dos variogramas {B y C) en donde existe una estructura genética acusada. El caso representado en B indica una Clase de distancia estructura clinal de la variación
genética. Es decir, las poblaciones más próximas entre sí presentan mayores similitudes genéticas (menor semivarianza de las frecuencias alélicas) que aquellas más alejadas.
(0 ^ m > É 0) w • • •
A
• • mP
n > 0) 0) • • ^ - ^ ^B
• ^ %^„,,-^ • • •I
0)Clase de distancia Clase de distancia
El variograma representado en C se denomina estacionario, ya que tras una fase donde existe una correlación espacial, se llega a un umbral a partir del cual las observaciones (frecuencias alélicas) son espacialmente independientes, es decir, a partir de este punto no hay correlación entre distancia geográfica y similitud genética. Este modelo espacial se asocia, generalmente, con el modelo genético de aislamiento por distancia (IBD, Isolation By Distance) descrito por primera vez por Sewail Wright en 1943.
Material y métodos
Se considera, generalmente, que la variación geográfica molecular de P. pinaster
responde a motivos históricos relacionados con las rutas migratorias postglaciares de
la especie (Salvador eí al. 2000; Ribeiro et al. 2001a), mientras que la variación en
caracteres adaptativos suele estar relacionada con procesos selectivos (Lynch 1995;
Lynch et al. 1999). A pesar de ello, algunos autores encuentran una importante
correlación entre variación molecular y cuantitativa (ver, por ejemplo, Lagerkrantz y
Ryman 1990 en Picea abies). Con el objetivo de determinar si los grupos de
procedencias definidos mediante el análisis isoenzimático tienen significación
adaptativa, se ha realizado un Análisis Canónico Discriminante (ACD) utilizando el
alelo más común en cada loci (codificado como 100 en la Figura 3.3.) y se ha
comparado con un ACD, utilizando la misma agrupación regional, que incluye las tres
variables cuantitativas consideradas.
Flujo genético regional
A partir del coeficiente de diferenciación de Wright, FST, calculado mediante
marcadores moleculares, se puede obtener una estimación del flujo genético entre
poblaciones, A/e/n, donde Ne representa el tamaño efectivo de la subpoblación y m es
la proporción de migrantes por generación:
N^m = 1 ( 1
v'^r — 1
Si el intercambio de genes entre poblaciones se ajusta a un modelo de
aislamiento por distancia (IBD, Isolation By Distancé), entonces el flujo genético entre
Material y métodos
3.4.2. Variación, estructura y flujo genético a escala local.
3.4.2.1. Estructura genética intrapoblacional.
Autocorrelación espacial de aleles
Con el objetivo de analizar la estructura genética intrapoblacional en Pinus
pinaster se han utilizado técnicas de correlación espacial tanto en los árboles adultos
como en el regenerado del rodal de estudio intensivo (ISP) de Coca (Segovia). En
concreto, se ha utilizado el índice de Moran aplicado al caso de genotipos diploides
multilocus sin ordenar (unordered alíeles). Este tipo de análisis es más sensible en la
detección de estructura espacial usando microsatélites nucleares que otras técnicas
comunes de análisis (Streiff eí al. 1998). Se han seleccionado clases de distancia {k)
con un intervalo de 5 m, desde la clase 2,5 (0-5 m) a 47,5 (45-50 m) en el regenerado
y desde la clase 2,5 (0-5 m) a 97,5 (95-100) en los árboles adultos. Para evitar sesgos
producidos por la distribución de aleles raros dentro de la parcela se ha reducido el
análisis a aquellos alelos con frecuencia superior al 5%. El índice de Moran, 1^, se ha
calculado según la siguiente expresión:
nÍílWi¡(x¡-x)(Xj~x) „ „
i=^ ¡*i
/=1
Donde n es el número total de individuos; Wj es igual a 1 si los individuos /' y j
están en la misma clase espacial k, siendo igual a O en otro caso; X/toma el valor de 1
o 0,5 dependiendo de si el árbol / es homocigoto o heterocigoto para ese alelo,
respectivamente, siendo igual a O en otro caso y x es la media general de x,. La
autocorrelación de todos los loci en conjunto se ha obtenido sumando el numerador y
denominador de la primera ecuación de cada uno de los alelos (Streiff eí ai. 1998).
Para determinar la significación del índice, los valores de k para cada clase espacial k
se han comparado con una distribución aleatoria obtenida de 1.000 permutaciones de
las coordenadas espaciales de los árboles.
Material y métodos
Endogamia y estructura familiar
La estructura familiar en el ISP de Coca se ha estudiado mediante el cálculo de las relaciones de parentesco entre los individuos presentes (hermanos completos, medio-hermanos o sin relación familiar). Para ello, se han utilizado cocientes de verosimilitud (LOD-scores) a partir de la formulación de C. H. Brenner (Brenner 1997; ver también http://dna-view.com/sibfmla.htm). Para cada par de árboles, A y B, de genotipo conocido en N loci, los cocientes de verosimilitud para las relaciones de parentesco de primer orden son:
LOD-score(AyBson medio-hermanos)- ^ log^ P(A y B son medio - iiermanos) P(A ySno están emparentados)
i ^ o / / I D u / x i v ^ i P(A y B son hermanos completos)
LODscore (A y B son hermanos completos)= > log.—— -10^=1 P(A y Bno están emparentados)
Donde P(R) es la verosimilitud de una relación de parentesco de tipo R.
0,6
0,5
0,4
0,3
0,2
0,1
0,0
O 2 Medio-hermanos
- 4 - 2 0 2 Hermanos completos
Figura 3.5. Distribución de cocientes de verosimilitud (LOD-scores) en poblaciones simuladas. Línea continua: sin relación de parentesco; discontinua: medio-hermanos; punteada: hermanos completos.
Material y métodos
asociarse con una determinada relación de parentesco (Figura 3.5.; Blouin etal. 1996; S. Gerber com. per.). El procedimiento de cálculo empleado fue contrastado en poblaciones simuladas de composición familiar conocida produciendo un acierto en las asignaciones de parentesco de un 70%.
3.4.2.2. Sistema de reproducción y flujo genético local.
Exclusión simple
En una primera aproximación, se han estimado parámetros relacionados con el sistema reproductor de la especie utilizando un análisis de exclusión simple (ver Schnabel 1998 para una revisión reciente). El análisis de exclusión simple utiliza la caracterización genotípica multilocus de cada individuo para determinar la compatibilidad entre un determinado parental potencial y una plántula. A partir de esta identificación y asumiendo que si sólo se encuentra un parental dentro de la parcela, éste es el árbol madre (Dow y Ashley 1996), puede estimarse el flujo genético mediante polen mínimo como el porcentaje de regenerado con todas las combinaciones de pares de padres excluidas. De forma similar, se puede obtener una estimación de la tasa de polinización cruzada mínima considerando el porcentaje de regenerado con genotipos que no pueden generarse a partir de autopolinizaciones de los árboles que se encuentran en el interior de la parcela.
Análisis de parentesco
Posteriormente, y dado que los marcadores utilizados no permitían la identificación inequívoca de las relaciones de parentesco entre árboles adultos y regenerado, se procedió a un análisis basado en los genotipos de cada árbol utilizando cocientes de verosimilitud {LOD-scores). La expresión matemática de los LOD-scores para padres individuales (a) y parejas (b) es la siguiente (Meagher y Thompson 1986):
(a) LOD-score(C parental deB) = log, '''^^B/9C)P(.9C) ^ j^g^ Tigjg^)
P{9B)P{QC) PÍ9B)
(b) LOD - score (C, D parentales de B) = log, T'^^l^^i^
Material y métodos
Donde C y D son dos parentales potenciales; B es una plántula dada; ge, QD y ge son los genotipos de C, D y B, respectivamente; P es la frecuencia poblacional de un genotipo dado; y Tes la probabilidad de transición de B para cada caso ensayado, es decir, la probabilidad de obtener el genotipo de la plántula B a partir del genotipo del parental C o parentales C y D potenciales. Una vez calculados los LOD-scores de todos los parentales potenciales con cada plántula se seleccionaron aquellos con mayor cociente de verosimilitud, utilizando poblaciones simuladas para el cálculo de la probabilidad de cada asignación (Gerber et al. 2000). Una descripción del procedimiento utilizado para asignar probabilidades puede encontrase en [7] mientras que la fíabilidad de la realización de estimaciones siguiendo este método se discute en [6]. Los resultados del análisis de parentesco se han utilizado para estimar el flujo genético local, definido como el porcentaje de regenerado con al menos uno de los parentales fuera de la parcela.