ENTREGA 8. Aplicación del PROTOCOLO II de modelización de distribución de especies en el presente el Parque Nacional Izta Popo (México)

Texto completo

(1)

1

ENTREGA 8

Aplicación del PROTOCOLO II de modelización de distribución de especies en el presente el Parque Nacional Izta – Popo (México)

Elena Moreno-Amat

Universidad Politécnica de Madrid, Escuela Técnica Superior de Ingenieros de Montes, Departamento de Silvopascicultura, Madrid.

Palabras clave: Pinus hartwegii, Modelos de distribución de especies, MDE, presencias, variables ambientales, calibración, evaluación, proyección, validación, Maxent.

APLICACIÓN del PROTOCOLO II (Entrega 4) sobre dos territorios de la red CLIMIFORAD. Modelización de distribución de especies a presente, a partir de datos de presencia y ausencia de las especies y datos ambientales.

• Generación (Calibración y validación) de los modelos de distribución de especies (MDE) para el presente e interpretación de resultados para las especies seleccionadas en la Entrega 7.

• Se presentan los mapas de distribución potencial (modelos de idoneidad del hábitat para la especie a presente) para la especie seleccionada en la Entrega 7.

F

UENTE

: T

ÉRMINOS DE REFERENCIA PARA LA CONTRATACIÓN DE CONSULTOR

“D

ESARROLLO DE MODELOS DE DISTRIBUCIÓN DE ESPECIES VALIDADOS PALEOECOLÓGICAMENTE Y MEDIANTE IMÁGENES DE SATÉLITE Y EVALUACIÓN DE LA VULNERABILIDAD DE LOS ECOSISTEMAS DE BOSQUE NATURAL

,

EN TERRITORIOS

SELECCIONADOS POR

CLIMIFORAD,

BAJO LOS IMPACTOS POTENCIALES DEL CAMBIO CLIMÁTICO

”. D

ICIEMBRE

2012.

(2)

2

Índice

1. RESUMEN ... 3

2. INTRODUCCIÓN ... 4

3. MATERIAL Y MÉTODOS ... 5

1.1 Área de estudio ... 5

1.2 Especie de estudio ... 5

1.3 Preparación de presencias de la especie ... 6

1.4 Preparación del background de la especie ... 8

1.5 Preparación variables climáticas. ... 9

1.6 Calibración y evaluación de los modelos ... 10

4. RESULTADOS ... 11

5. CONCLUSIONES ... 14

6. BIBLIOGRAFÍA ... 15

(3)

3

1. RESUMEN

Los modelos de distribución de especies (MDE) son modelos que predicen la idoneidad de un territorio de albergar una especie en función de parámetros ambientales. Estos modelos son muy usados para describir patrones y especialmente para hacer predicciones de la distribución de una especie para estudiar los impactos derivados del cambio climático en un territorio o ecosistema. Sin embargo, se ha observado que existen grandes diferencias entre los resultados de los modelos al proyectarlos bajo escenarios futuros de cambio climático. Estas diferencias son en gran parte debidas a las incertidumbres de los algoritmos de modelización, a los modelos generales de circulación atmosférica y a las suposiciones teóricas de los modelos.

Para estudiar con mayor precisión los impactos del cambio climático en las especies y los territorios es necesario generar modelos de distribución de especies a futuro con la menor incertidumbre. De esta forma se puede controlar el rango de variabilidad en los resultados debido al proceso de modelización y diferenciarlo del efecto del clima futuro. Esta entrega sirve de ejemplo para la generación de modelos de distribución de especies en el presente en dos territorios diferentes del Proyecto CLIMIFORAD a partir de datos de presencias de la especie de diversas fuentes y de datos climáticos de bases de datos globales.

Este documento constituye la octava entrega de la consultoría “EVALUACIÓN DE LA VULNERABILIDAD DE LOS ECOSISTEMAS EN TERRITORIOS SELECCIONADOS POR CLIMIFORAD BAJO LOS IMPACTOS POTENCIALES DEL CAMBIO CLIMÁTICO MEDIANTE MODELOS DE DISTRIBUCIÓN DE ESPECIES VALIDADOS PALEOECOLÓGICAMENTE Y A PARTIR DE IMÁGENES DE SATÉLITE”. Esta consultoría está integrada dentro de las actividades propuestas en la Componente III del Proyecto CLIMIFORAD (Impactos Potenciales del Cambio Climático en Ecosistemas Forestales en Cordilleras Latinoamericanas y Herramientas para la Adaptación de la Gestión).

Los modelos obtenidos para la distribución actual de Pinus hartwegii Lindl. presentan unos

valores de AUC (capacidad predictiva) muy altos (>0.98) y con poca variabilidad entre los

modelos generados con diferentes parámetros y datos de partida. A pesar de que los 24

modelos presentan valores de AUC muy similares, el modelo número 5 es el modelo con la

mejor combinación de parámetros y datos de partida ya que es el modelo con el mejor balance

entre complejidad y bondad de ajuste del modelo a los datos. Además este modelo incorpora

más información del rango ambiental de la especie porque cuenta con la información aportada

por las presencias de Honduras y Guatemala.

(4)

4

2. INTRODUCCIÓN

El cambio climático afectará de manera importante los ecosistemas Latinoamericanos (IPCC, 2007; IPCC, 2013) por ello es necesario tratar de cuantificar las variaciones que se esperan en estos ecosistemas. Para ello, se cuenta con una herramienta que ha progresado rápidamente en los últimos años: los modelos de distribución de especies -MDE- (ver revisiones de: Guisan

& Zimmermann, 2000; Elith et al., 2006; Elith & Leathwick 2009; Franklin, 2010). Estos algoritmos establecen una relación estadística o matemática entre los puntos conocidos de la distribución de una especie y diferentes variables que describen las condiciones ambientales, extrapolando esta relación al resto del área de estudio, obteniendo como resultado un mapa que nos indica la idoneidad de la especie en el área de estudio. Estos modelos nos permiten ver cómo varía la distribución de las especies en el espacio y en el tiempo al variar las condiciones climáticas, por ejemplo, al proyectar los modelos a los escenarios futuros de cambio climático (IPCC, 2013).

Actualmente existe una gran variedad de algoritmos para generar las predicciones de distribución de especies (Elith & Leathwick 2009), que pueden dar resultados muy diferentes.

Estas diferencias son debidas en gran medida al tipo de algoritmo de modelización, y a otras variables que afectan a las diferentes etapas del proceso de modelización (Elith et al., 2006;

Dorman et al., 2008; Elith et al., 2009; Buisson et al., 2010). En particular se ha demostrado que un exceso de complejidad de los modelos (definido por el número de parámetros incluidos en el modelo) puede reducir su capacidad predictora, como resultado de estar sobreajustado a los datos de calibración (Warren y Seifert, 2011). Los modelos excesivamente complejos pueden conducir a una sobre- o infra-predicción de la distribución de la especie (Cao et al., 2013) y reducir la transferibilidad de los modelos en el tiempo (Warren & Seifert, 2011) que afectaría a las proyecciones de los modelos en el futuro. Existen varios estudios recientes que evalúan el efecto de la complejidad en la capacidad predictiva de los modelos (Warren &

Seifert, 2011; Cao et al, 2013; Radosavljevic & Anderson, 2013; Shcheglovitova & Anderson, 2013; Syfert et al, 2013; Warren et al., 2013). Además, Warren et al., (2013) exploran los efectos de la complejidad en el modelo proyectado en el tiempo bajo clima futuro.

Uno de los problemas de la validación de los modelos de distribución de especies es la falta de datos realmente independientes para su validación, especialmente en los modelos proyectados a condiciones climáticas futuras como son los diferentes escenarios de emisiones de gases de efecto invernadero propuestos por el 5º informe del IPCC (IPCC, 2013). En cambio, sí es posible realizar esta validación con datos independientes en otros periodos temporales, como el pasado, mediante la comparación con datos paleobotánicos o con datos de otros inventarios o imágenes de satélite. En el presente los modelos pueden validarse con datos actuales diferentes a los utilizados para calibrar el modelo (Araújo et al., 2005) como son por ejemplo, los que proceden de otros muestreos diferentes e independientes (Eskildsen et al., 2013).

Como no se dispone de datos paleobotánicos suficientes para validar los modelos, en este

trabajo se plantea la validación la capacidad predictiva de los modelos actuales de la especie

mediante la división de los datos de presencia en dos set de datos, uno para calibrar el modelo

y otro para validarlo. Este proceso se llama validación cruzada (cross-validation) y la división de

los datos puede ser aleatoria (al azar) o una división espacial (Morueta-Holme et al., 2010). En

la siguiente entrega (entrega 9) se validarán esos modelos con imágenes satélite.

(5)

5

La técnica de modelización recomendada en este trabajo es MaxEnt (Phillips et al., 2006), considerada como una técnica discriminante ya que necesita presencias y ausencias que sin embargo permite generar modelos solo con datos de presencia ya que es capaz de generar sus propias ausencias denominadas “background” (Phillips et al., 2006).

Esta técnica se ha elegido principalmente por estos motivos: 1) muestra buenos resultados en las comparaciones con otros métodos de modelización ecológica especialmente con pocas presencias (Elith et al., 2006); 2) no necesita datos de ausencia (Phillips et al., 2006); 3) permite la interpretación biológica de los resultados; y 4) es gratuito y se puede descargar de internet.

3. MATERIAL Y MÉTODOS

1.1 Área de estudio

El área de estudio considerada para este estudio es la formada por los paises que contienen la distribución natural de Pinus hartwegii, es decir México Guatemala y Honduras (Critchfield &

Little, 1966; Farjon, 2013; Farjon & Filer, 2013).

1.2 Especie de estudio

Pinus hartwegii (en rojo en Fig.1) es una especie con una distribución discontinua en las cumbres más altas de Honduras, Guatemala llegando hasta el noreste de México (Farjon, 1996). Vive entre los (2,200)2,500 y los 4,000(4,300) metros de altitud. A menudo forma masas monoespecíficas (especialmente en México Guatemala) y constituye el límite de la vegetación arbórea en altitud en volcanes y cumbres (Earle, 2013).

F IG 1. DISTRIBUCIÓN DE P INUS HARTWEGII (C RITCHFIELD & L ITTLE , 1966)

En México y Guatemala forma bosques abiertos con sotobosque de herbáceas y en altitudes menos elevadas se mezcla con otras especies como son Pinus montezumae, P. pseudostrobus, P. ayacahuite, Abies religiosa y Cupressus lusitanica, siendo México donde las masas de P.

hartwegii presentan su mayor extensión. En Honduras presenta una extensión limitada y

(6)

6

generalmente se encuentra con Abies guatemalensis, Cupressus lusitanica, Juniperus standleyi, Quercus spp., Dendropanax lempirianus y Drymis granadensis en bosque nublado de montaña generalmente entre 2,700 y 2,850 metros en las cumbres de las montañas. P. hartwegii habita en zonas con suelos volcánicos y graníticos a menudo pobres en nutrientes (Earle, 2013).

Climáticamente, Pinus hartwegii es capaz de resistir heladas y períodos de varios meses con presencia de nieve además de estar expuesto al estrés hídrico por sufrir un período de sequía.

A pesar de estar etiquetada como "preocupación menor (LC)" en la Lista roja de especies amenazadas de la UICN (Unión Internacional para la Conservación de la Naturaleza), al estar en el límite arbóreo, el crecimiento de esta especie puede verse afectado por las temperaturas y precipitación anuales. Por ello, esta especie puede verse afectada por los incrementos de temperatura esperados como consecuencia del cambio climático (Farjon, 2013).

1.3 Preparación de presencias de la especie

Las presencias actuales de la especie se obtuvieron de las parcelas permanentes PPM instaladas en el Parque Nacional Izta-Popó y de las parcelas incluidas en el inventario forestal nacional mexicano. Para completar la distribución natural actual de Pinus hartwegii en Guatemala y Honduras, se usó la distribución de los pinos del mundo (Critchfield & Little, 1966) además del Atlas de Coniferas (Farjon & Filer, 2013) (Tabla 1).

T ABLA 1. PRESENCIAS DISPONIBLES PARA P INUS HARTWEGII EN SU DISTRIBUCIÓN NATURAL .

Territorio

Origen de los datos de la distribución de la

vegetación actual

Número de presencias

México Inventario Forestal

Nacional 100

México

Farjon & Filer. 2013.

An Atlas of the World's Conifers

93

Guatemala

Farjon & Filer. 2013.

An Atlas of the World's Conifers

34

Honduras

Farjon & Filer. 2013.

An Atlas of the World's Conifers

9

Como las presencias procedentes del inventario forestal mexicano están basadas en un

muestreo de parcelas, tienen mayor precisión en las coordenadas y una mayor uniformidad en

la toma de datos que los datos procedentes del Atlas de Coníferas que están basados en

criterio de experto. Por tanto para generar los modelos se usarán las 100 presencias del

inventario forestal mexicano y las 43 de Guatemala y Honduras del Atlas de coniferas del

mundo (Farjon & Filer, 2013) (Fig. 2).

(7)

7

F IG 2. P RESENCIAS DE P INUS HARTWEGII USADAS PARA GENERAR LOS MODELOS . E N VERDE LAS PRESENCIAS PROCEDENTES DEL INVENTARIO FORESTAL MEXICANO Y EN AMARILLO LAS PROCEDENTES DEL ATLAS DE

CONIFERAS DEL MUNDO (F ARJON & F ILER , 2013).

Se eliminaron presencias duplicadas con lo que de 143 se quedaron en 134 presencias.

Además las presencias fueron estudiadas ecológicamente para eliminar posibles outliers

debidos a los datos climáticos o a una mala georreferenciación. Como se observa en la figura,

algunos de los puntos están muy separados del resto de puntos de la nube (Fig. 3-A). Al hacer

los boxplots (Fig. 3-B), se ve confirma que estos puntos constituyen valores anómalos o

outliers.

(8)

8

F IG 3-A D ISPERSIÓN DE LAS PRESENCIAS EN EL ESPACIO ECOLÓGICO Y POSIBLES OUTLIERS . 3-B B OXPLOT PARA LA PRECIPITACIÓN DEL TRIMESTRE MÁS CÁLIDO EN EL QUE SE OBSERVA UN OUTLIER .

Estos puntos deben estudiarse con cuidado puesto que podrían ser valores extremos de una población con ecología singular. Como los datos de clima provienen de una base de datos a nivel global que se ha interpolado en el territorio, se puede observar que estos valores son anómalos al comparar los valores que ofrece worldclim en ese pixel con los de alrededor.

Asimismo, los outliers pueden deberse a una baja precisión en la georreferenciación de las presencias procedentes del Atlas. En total se eliminaron 13 outliers, 3 de ellos mexicanos que se pueden deber valores erróneos de worldclim y 10 en Guatemala y Honduras que pueden ser debidos a la georreferenciación.

Para valorar la ganancia o pérdida de información climática en el modelo al incluir toda la distribución natural de la especie, se consideraron dos tipos de presencias para calibrar los modelos, 1) con toda la distribución natural de la especie (121 puntos) y 2) solo con las presencias mexicanas (97 puntos).

1.4 Preparación del background de la especie

El background (Fig. 4) es una muestra de puntos seleccionada al azar que permite representar el espacio ecológico donde la especie está presente y ausente, y es necesaria para la calibración de los modelos. Si no se dispone de datos de ausencias verdaderas, al realizar el modelo, el algoritmo necesitará o generará su propio set de puntos (generados para simular ausencias) para poder hacer la clasificación de presencias y ausencias (Hanberry et al., 2012).

Maxent es capaz de generar su propio background de puntos eligiendo una muestra de puntos al azar en el área de distribución de la especie. Los puntos de background deben ser usados con cuidado ya que no informan sobre verdaderas ausencias. Para poder tener más control sobre el background, reducir el tiempo de procesamiento y asegurar que siempre se usan los mismos puntos de background, se pueden generar los puntos de background (con su información ambiental) e introducirlos en Maxent para que calibre el modelo.

En este trabajo el background fue de 10.000 puntos elegidos al azar en la zona de estudio.

Como se usaron dos sets de presencias se generaron dos background: 1) 10.000 puntos al azar dentro de México, Guatemala y Honduras y 2) 10.000 puntos al azar dentro de México.

F IG 4- PRESENCIAS DE P INUS HARTWEGII USADAS PARA GENERAR LOS MODELOS : A) PRESENCIAS ( PUNTOS NEGROS ) Y BACKGROUND ( PUNTOS GRISES ) PARA M ÉXICO , G UATEMALA Y H ONDURAS Y B) PRESENCIAS

( PUNTOS NEGROS ) Y BACKGROUND ( PUNTOS GRISES ) PARA M ÉXICO .

(9)

9

1.5 Preparación variables climáticas.

Las variables derivadas para el presente se pueden obtener en la base de datos de Worldclim:

http://www.worldclim.org/current. Estas variables tienen una resolución espacial de 1km y su formato es tipo ráster (.asc o grid) y están referenciadas en el sistema de coordenadas geográficas (latitud/longitud). Esta base de datos consta de 19 variables bioclimáticas derivadas de la temperatura y precipitaciones mensuales para el periodo 1950‐2000 obtenidas mediante la interpolación de datos climáticos de estaciones meteorológicas. Estas variables (Tabla 2) tienen gran sentido biológico como factores limitantes a la hora de explicar la distribución de los organismos ya que no sólo muestran tendencias mensuales sino que también incluyen tendencias trimestrales importantes para la vegetación (Hijmans et al., 2005).

T ABLA 2. V ARIABLES BIOCLIMÁTICAS DISPONIBLES EN LA BASE DE DATOS WORLDCLIM (H IJMANS ET AL ., 2005)

Código Descripción

BIO 01 Temperatura media anual

BIO 02 Rango diurno de temperaturas (media mensual (max temp - min temp))

BIO 03 Isotermalidad: Relación entre el rango de temperaturas entre el día y la noche y entre el verano e invierno (BIO02/BIO07) (* 100)

BIO 04 Estacionalidad en la temperatura (desviación estándar*100)

BIO 05 Temperatura máxima del mes más cálido

BIO 06 Temperatura mínima del mes más frío

BIO 07 Rango de temperatura anual (BIO05-BIO06)

BIO 08 Temperatura media del trimestre más húmedo

BIO 09 Temperatura media del trimestre más seco

BIO 10 Temperatura media del trimestre más cálido

BIO 11 Temperatura media del trimestre más frío

BIO 12 Precipitación anual

BIO 13 Precipitación del mes más húmedo

BIO 14 Precipitación del mes más seco

BIO 15 Estacionalidad en la precipitación (Coeficiente de variación)

BIO 16 Precipitación del trimestre más húmedo

BIO 17 Precipitación del trimestre más seco

BIO 18 Precipitación del trimestre más cálido

BIO 19 Precipitación del trimestre más frío

La elección de las variables ambientales es una parte importante y compleja del proceso de

generación de los modelos ya que modelos realizados con diferentes variables tienen

diferentes resultados cuando se proyectan al futuro (Harris et al., 2013). Asimismo es

necesario analizar la correlación existente entre las variables para evitar incluir variables

(10)

10

correlacionadas en el mismo modelo que solo aportan información redundante y pueden afectar al resultado de los modelos. Para ello se eligieron las variables teniendo en cuenta la ecología de la especie y mediante un análisis de correlación (correlación de Pearson aceptada

< 0.75) de forma que se descarta la variable con menor sentido biológico y con menor correlación con el resto de variables (Morueta-Holme et al., 2010). Se realizó un cluster (Fig. 5) de variables para ver la correlación existente entre las mismas. Cuanto más cerca estén dos variables en las ramas, mayor correlación existe entre ellas.

F IG 5. C ORRELACIÓN ENTRE LAS VARIABLES CLIMÁTICAS PARA EL ÁREA DE ESTUDIO . L A LÍNEA ROJA MARCA LA ZONA DONDE LAS VARIABLES QUE ESTÁN EN LA MISMA RAMA ( Y UNIDAS EN UNA DIVISIÓN ) TIENEN UNA CORRELACIÓN SUPERIOR A 0.75.

Asimismo se realizó un análisis de factor de inflación de varianza (variance inflation factor) de las variables climáticas para eliminar variables correlacionadas y que diesen problemas de multicolinealidad. Esto se realizó en R con el comando vif y se descartaba una variable cuando presentaba un valor de factor de inflación de varianza >5.

1.6 Calibración y evaluación de los modelos

Los modelos actuales se calibraron para el área de estudio con el 70% de las presencias

divididas al azar (sin reposición) y se generaron modelos con diferentes niveles de

complejidad. La selección del nivel apropiado de complejidad en los modelos de Maxent está

relacionada con el número de variables ambientales, las transformaciones permitidas de las

variables (llamadas features en Maxent) y el parámetro de regularización (β-multiplier)

seleccionado en el modelo. Se eligieron 2 tipos de presencias de la especie (sólo México y

México más Guatemala y Honduras) y 2 grupos con diferentes números de variables

ambientales (6 y 7), dos tipos de transformaciones de las variables (Autofeatures y sólo

transformaciones lineales, productos y cuadráticas) y 3 diferentes regularizaciones (0, 1 y 5)

con lo que se dispone de 24 modelos para la especie. El formato de salida recomendado es el

logístico, generado por defecto y que expresa la probabilidad de encontrar condiciones

idóneas para la especie en cada punto con un rango de valores de 0 a 1. Asimismo se

generaron los mapas con salida raw para poder calcular el estadístico AIC.

(11)

11

Los resultados de los diferentes MDE deben ser evaluados estadísticamente. Es decir, es necesario contrastar la predicción de los modelos con respecto a la distribución de la especie mediante la comparación de valores predichos con valores observados. Para tener una evaluación robusta se requieren datos independientes para ver la capacidad del modelo de clasificar adecuadamente los nuevos datos de forma que los casos de presencias/ausencias observadas de los datos de test se comparan con las presencias/ausencias predichas por el modelo.

En este caso no se contaba con ausencias reales así que para evaluar los modelos y estudiar así los efectos de la complejidad de los modelos de Maxent, se realizó una validación cruzada (no independiente) por medio del estadístico AUC (área bajo la curva ROC) con el 30% de las presencias no utilizadas en la calibración. El AUC indica la capacidad discriminativa de un modelo, es decir, la capacidad del modelo de distinguir entre presencias y ausencias. El valor de AUC varía entre 0 y 1, siendo 0.5 el valor que muestra que el modelo no clasifica los casos mejor que una clasificación al azar y 1 el valor que indica que todos los casos se han clasificado correctamente. El AUC puede ser usado para comparar cualquier método pero se ve influido por la extensión total de los modelos (Lobo et al., 2008).

También se evaluaron los modelos mediante el estadístico AIC (criterio de información de Akaike), que establece un equilibrio entre la bondad de ajuste del modelo a los datos y la complejidad (número de parámetros) del modelo (Johnson & Omland, 2004). A igualdad de ajuste a los datos, el AIC penaliza los modelos que tengan mayor complejidad. Es un estadístico muy usado para la selección de modelos (Warren & Seifert, 2011).

4. RESULTADOS

Los resultados obtenidos indican que tanto los tipos de presencia usados como la complejidad afectan de forma importante a la capacidad predictiva del modelo, influyendo en la capacidad predictiva del modelo, así como en la idoneidad y el rango climático predicho por el modelo.

Por tanto, estas variaciones en los resultados deben ser contempladas a la hora de proyectar los modelos hacia diferentes periodos temporales y especialmente bajo escenarios futuros de cambio climático.

En la T

ABLA

3 se describen los datos de presencia, variables y parámetros usados para generar los

modelos y los resultados obtenidos en los estadísticos usados AUC y AIC para validar los

modelos.

(12)

12

T

ABLA

3. D

ESCRIPCIÓN DE LOS DATOS USADOS PARA GENERAR LOS MODELOS Y LOS RESULTADOS OBTENIDOS PARA LOS ESTADÍSTICOS

AUC

Y

AIC. E

N ROJO ESTÁN LOS MEJORES MODELOS PARA CADA ESTADÍSTICO

.

Todos los modelos generados tienen una capacidad predictiva muy alta (>0.98) por lo que discriminan muy bien entre presencias y ausencias para el pino en la actualidad. Además presentan una elevada idoneidad en la zona de estudio (México, Guatemala y Honduras).

Los modelos generados con 97 presencias solo de México presentan mayores AUC y, por tanto, mayor capacidad predictiva que los generados con 121 presencias procedentes de México, Guatemala y Honduras. De todas formas, las variaciones del AUC dentro de cada uno de los grupos de presencias son muy pequeñas, el valor medio del AUC de las presencias de México es de 0.98671 con una desviación estándar de 0.00295 mientras que el valor medio del AUC de toda la distribución de la especie es de 0.99298 con una desviación estándar de 0.00081.

Los modelos generados sólo con presencias mexicanas además de presentar mayor AUC predicen mayor idoneidad que los generados con presencias procedentes de México, Guatemala y Honduras. El AUC obtenido en los modelos generados con las presencias mexicanas es menor que el realizado con toda la distribución de la especie (incluyendo Honduras y Guatemala). Esto es porque la extensión total de los modelos influye de forma importante en este estadístico (Lobo et al., 2008), de forma que los valores del AUC tienden a ser altos en especies cuya distribución geográfica es restringida (pequeña), en relación con el área de estudio descrita por los datos ambientales.

Sin embargo los modelos generados sólo con presencias mexicanas predicen como idónea una menor superficie geográfica (aunque la diferencia es pequeña). Es decir, al generar el modelo con todas las presencias naturales de la especie, el rango geográfico predicho por los modelos es mayor que si usamos sólo la presencia en México. Esto puede ser debido a que las presencias de Guatemala y Honduras y también el cambio en el background amplían la información climática en la que puede vivir la especie. (Fig. 6).

código modelo

presencias

usadas

presencias incluidas

variables

usadas

variables usadas

(Worlclim) Features utilizadas

b- multiplier

usado

AUC AIC

parámetros

modelo 1 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 0 0.9805108 x 159

modelo 2 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 1 0.9859058 3274.540296 33 modelo 3 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 5 0.9861951 2908.327804 14 modelo 4 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 0 0.9884353 2846.661826 12 modelo 5 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 1 0.9884166

2839.502329

10 modelo 6 121 México, Guatemala y Honduras 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 5 0.9879219 2858.538808 8

modelo 13 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 0 0.9809121 x 140

modelo 14 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 1 0.9878192 2960.424011 28 modelo 15 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 5 0.9884819 2868.964895 9 modelo 16 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 0 0.9884726 2867.293272 12 modelo 17 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 1 0.9886313 2861.544603 7 modelo 18 121 México, Guatemala y Honduras 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 5

0.9888366

2868.027261 6

modelo 7 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 0 0.9939155 3071.026135 79

modelo 8 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 1

0.9942162

2369.41959 18

modelo 9 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Autofeatures 5 0.9935569

2257.976747

11

modelo 10 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 0 0.9938229 2276.603963 14

modelo 11 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 1 0.9934991 2322.879989 9

modelo 12 97 México 7 bio: 5, 6, 8, 9, 12, 15 y 18 Linear, quadratic y product 5 0.9932446 2279.899614 8

modelo 19 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 0 0.9919374 2688.56772 69

modelo 20 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 1 0.9923192 2282.713345 18

modelo 21 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Autofeatures 5 0.9921457 2279.011773 8

modelo 22 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 0 0.9925737 2284.948139 11

modelo 23 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 1 0.9924695 2313.134733 9

modelo 24 97 México 6 bio: 1, 5, 9, 12, 15 y 17 Linear, quadratic y product 5 0.9920878 2333.27838 5

(13)

13

F IG 6. M ODELOS DE DISTRIBUCIÓN POTENCIAL QUE MUESTRAN LA IDONEIDAD ACTUAL DE HÁBITAT PARA

P INUS HARTWEGII . A) M ODELO 5 ( TODAS LAS PRESENCIAS ) B) M ODELO 11 ( SOLO PRESENCIAS DE M ÉXICO ).

Los modelos 1 y 13 no pudieron ser estudiados con el AIC porque tienen más parámetros que presencias lo que incumple los supuestos del cálculo de este estadístico.

Los modelos no coinciden en cuanto a los dos estadísticos de evaluación, el AUC y AIC para los dos grupos de modelos generados con los dos tipos de presencia (1-México, Guatemala y Honduras y sólo 2-México). El mejor modelo según el AUC (mayor capacidad predictiva) de entre aquellos realizados con toda la distribución de la especie es el modelo 18 (6 variables, solo usando features lineales, cuadráticas y productos y β-multiplier =5) que es el modelo menos complejo (sólo tiene 6 parámetros). En cambio, desde el punto de vista del AIC que tiene en cuenta un equilibrio entre la complejidad del modelo y cómo se ajusta ese modelo a los datos, el mejor modelo sería el modelo 5 (generado con 7 variables, features lineales, cuadráticas y productos y β-multiplier =1), también con un número bajo de parámetros, en este caso de 10 (Fig. 7).

En el caso de los modelos generados solo con presencias mexicanas, el modelo seleccionado

por el AUC es el modelo 8 (7 variables, Autofeatures y β-multiplier =1) que y según el AIC el

modelo 9 (7 variables, Autofeatures y β-multiplier =5), con 18 y 11 parámetros

respectivamente (Fig. 7).

(14)

14

F IG 7. M ODELOS DE DISTRIBUCIÓN POTENCIAL QUE MUESTRAN LA IDONEIDAD DE HÁBITAT PARA P INUS HARTWEGII EN LA ACTUALIDAD EN EL ÁREA DE ESTUDIO . L OS VALORES DE IDONEIDAD VARÍAN ENTRE 0 Y 1

SIENDO 1 EL VALOR MÁS ALTO Y REPRESENTADO GRÁFICAMENTE CON COLOR ROJO Y EL CERO EL VALOR DE IDONEIDAD MÁS BAJA Y REPRESENTADO DE COLOR AZUL . A) MEJOR MODELO SEGÚN EL AUC B) MEJOR MODELO SEGÚN EL AIC PARA PRESENCIAS DE M ÉXICO , G UATEMALA Y H ONDURAS Y C) MEJOR MODELO SEGÚN EL AUC D) MEJOR MODELO SEGÚN EL AIC PARA PRESENCIAS DE M ÉXICO .

5. CONCLUSIONES

Los modelos presentan unos valores de AUC (capacidad predictiva) muy altos (0.98 y 0.99) y con poca variabilidad entre los modelos generados con diferentes parámetros y datos de partida. Además, los valores de idoneidad en el Parque Nacional de Izta-Popó son también elevados.

A pesar de que los modelos presentan valores de AUC muy similares, el modelo 5 es el modelo

con la mejor combinación de parámetros y datos de partida. Asimismo es el modelo con el

mejor balance entre complejidad y bondad de ajuste del modelo a lo datos y por ello fue

seleccionado según el AIC. Además el modelo 5 fue realizado con toda la distribución

geográfica de la especie y a pesar de que el AUC es un poco menor del modelo equivalente

(modelo 11) realizado solo con presencias mexicanas, esas con lo que captan la variabilidad

climática en la que vive la especie, lo que será fundamental al ser proyectado bajo escenarios

de cambio climático futuro.

(15)

15

6. BIBLIOGRAFÍA

Araujo M.B., Pearson R.G., Thuiller W., Erhard M. 2005. Validation of species-climate impact models under climate change. Global Change Biology. 11: 1504-1513.

Buisson L., Thuiller W., Casajus N., Lek S., Grenouillet G. 2010. Uncertainty in ensemble forecasting of species distribution. Global Change Biology, 16(4), 1145-1157.

Cao Y., De Wal R.E., Robinson J.L., Tweddale T., Hinz L., Pessino M. 2013. Using Maxent to model the historic distributions of stonefly species in Illinois streams: The effects of regularization and threshold selections. Ecological Modelling, 259, 30-39.

Critchfield W.B., Little E.L. 1966. Geographic distribution of the pines of the world (Vol. 991).

US Department of Agriculture, Forest Service.

Dormann C. F., Purschke O., Márquez J. R. G., Lautenbach S., Schröder B. 2008. Components of uncertainty in species distribution analysis: a case study of the great grey shrike.

Ecology, 89(12), 3371-3386.

Elith J., Graham C.H., Anderson R.P., Dudík M., Ferrier S., Guisan A., Hijmans R.J., Huettmann F., Leathwick J.R., Lehmann A., Li J., Lohmann L.G., Loiselle B.A., Manion G., Moritz C., Nakamura M., Nakazawa Y., Overton J.M., Peterson A.T., Phillips S.J., Richardson K., Scachetti-Pereira R., Schapire R.E., Soberón J., Williams S., Wisz M.S., Zimmermann N.E. 2006. Novel methods improve prediction of species' distributions from occurrence data. Ecography. 29: 129-151.

Elith J., Leathwick J.R. 2009. Species distribution models: ecological explanation and prediction across space and time. Annual Review of Ecology, Evolution and Systematic. 40: 677- 697.

Elith J., Leathwick J.R., Hastie T. 2009. A working guide to boosted regression trees. Journal of Animal Ecology 77: 802-81.

Eskildsen A., le Roux P.C., Heikkinen R.K., Høye T.T., Kissling W.D., Pöyry J., Wisz M.S., Luoto M.

2013. Testing species distribution models across space and time: high latitude butterflies and recent warming. Global Ecology and Biogeography, 22: 1293–1303.

Farjon A., Filer D. 2013. An Atlas of the World's Conifers: An Analysis of their Distribution, Biogeography, Diversity and Conservation Status. Brill.

Franklin J. 2010. Mapping species distribution: spatial inference and prediction. Cambridge University Press, Cambridge.

Guisan A., Zimmermann N.E. 2000. Predictive habitat distribution models in ecology. Ecological

Modelling. 135: 147–186.

(16)

16

Hijmans R.J., Cameron S.E., Parra J.L., Jones P.G., Jarvis A. 2005. Very high resolution interpolated climate surfaces for global land areas. International Journal of Climatology 25: 1965-1978.

Hijmans R.J., Elith J. 2013. Species distribution modeling with R. manual disponible online:

http://cran.r-project.org/web/packages/dismo/vignettes/sdm.pdf

IPCC, 2013: Climate Change 2013: The Physical Science Basis. Contribution of Working Group I to the Fifth Assessment Report of the Intergovernmental Panel on Climate Change [Stocker, T.F., D. Qin, G.-K. Plattner, M. Tignor, S.K. Allen, J. Boschung, A. Nauels, Y.

Xia, V. Bex and P.M. Midgley (eds.)]. Cambridge University Press, Cambridge, United Kingdom and New York, NY, USA, 1535 pp.

Johnson J.B., Omland K.S. 2004. Model selection in ecology and evolution. Trends in ecology &

evolution. 19; 2, 101-108.

Lobo J.M., Jiménez-Valverde A., Real R. 2008. AUC: A misleading measure of the performance of predictive distribution models. Global Ecology and Biogeography. 17: 145-151.

Morueta-Holme N., Fløjgaard C., Svenning J.C. 2010. Climate change risks and conservation implications for a threatened small range mammal species. Plos One. 5:4.

Radosavljevic A., Anderson R.P. 2013. Making better Maxent models of species distributions:

complexity, overfitting and evaluation. Journal of Biogeography.

Shcheglovitova M., Anderson R.P. 2013. Estimating optimal complexity for ecological niche models: A jackknife approach for species with small sample sizes. Ecological Modelling, 269, 9-17.

Syfert M.M., Smith M.J., Coomes D.A. 2013. The effects of sampling bias and model complexity on the predictive performance of MaxEnt species distribution models. PloS one. 8(2).

Warren D.L., Seifert S.N. 2011. Ecological niche modeling in Maxent: the importance of model complexity and the performance of model selection criteria. Ecological Applications.

21; 2, 335-342.

Warren D.L., Wright A.N., Seifert S.N., Shaffer H.B. 2013. Incorporating model complexity and

spatial sampling bias into ecological niche models of climate change risks faced by 90

California vertebrate species of concern. Diversity and Distributions.

Figure

Actualización...

Related subjects :