La dependencia espacial importa. Modelos de regresión espacial

Capítulo 2. Metodología

2.5 Métodos espaciales

2.5.3 La dependencia espacial importa. Modelos de regresión espacial

2) Baja-baja

4) Alta-baja 1) Alta-alta

3) Baja-alta y

FUENTE: Construcción propia

Figura 2.4 Diagrama de dispersión de Moran.

Existen métodos de econometría espacial, cuyos modelos incorporan el componente de los patrones de distribución espacial, ya sea en términos de distancia o de adyacencia, en otras palabras la vecindad es un concepto clave, asociado a las matrices de pesos que anteriormente mencionamos.

La validación empírica de los nuevos conceptos y modelos «espaciales» requieren una metodología estadística y econométrica que tome en cuenta la localización y la interacción espacial (Anselin, 1988, 1999, 2000). En otras palabras, la econometría espacial incorpora explícita- mente la dependencia y heterogeneidad espacial, así como extensiones al dominio del espacio- tiempo.³

En nuestro caso, debido a su interpretación análoga a la regresión estándar utilizaremos modelos autoregresivos simultáneos, una particularidad de ellos, como del cálculo de la I de Moran, es que subyace el supuesto de estacionalidad en la incorporación de la matriz de pesos, este hecho puede no cumplirse sobre todo dependiendo de la extensión del área de estudio.

Dentro de esta familia de modelos espaciales se encuentran dos tipos, el modelo de errores espaciales y el de retraso espacial.

La figura 2.5 representa la suposición de que la dependencia espacial se encuentra en los residuales

Figura 2.5 Dependencia espacial en el término de error.

3. Según Dorman et al (2007), dentro de la literatura de métodos econométricos espaciales hay una variedad amplia de modelos, que se agrupan en tres categorías:

1) Regresión de autocovarible y mapeo de eigenvectores. Buscan capturar la configuración espacial en covariables adicionales, que se incorporan en un modelo lineal generalizado.

2) Mínimos cuadrados generalizados. Este método ajusta una matriz de varianza-covarianza basada en la no inde- pendencia de las observaciones espaciales. Los modelos autoregresivos simultáneos (SAR por sus siglas en inglés) y los modelos autoregresivos condicionales (CAR por sus siglas en inglés) pertenecen a esta familia aunque tienen ciertas particularidades que abordaremos más tarde, el hecho que se debe enfatizar es que los modelos SAR se han privilegiado en la econometría espacial y la demografía espacial (Chi y Zhu. 2008: 32) porque la interpreta- ción del coeficiente de autocorrelación espacial es igual al de la regresión lineal estándar por lo que perece más natural. Asimismo los modelos generalizados mezclados modifican el supuesto básico de normalidad, su caso es una forma particular de MCG. Los modelos clásicos que dependen de la naturaleza de los datos, regresión logística, Poisson, multinomial se han adaptado con éxito para incorporar la dependencia espacial, aunque su uso es menos común que la regresión lineal.

3) Ecuaciones de Estimación General, en este método los datos se ordenan en conglomerados antes de modelar la relación en la matriz de varianza-covarianza.

Y

j Xj

ε_i ε_j

FUENTE: Adaptado de SOC, 2005, 261.

Y

j Xj

ε_i ε_j Xi

Y

ε_i ε_j

FUENTE: Adaptado de SOC, 2005, 261.

El valor de nuestra variable independiente Y, dependería del vector de covariables explicativas y de un término de error filtrado espacialmente que incorpora la estructura espacial al modelo, en leguaje formal el modelo se expresa:

Y = X_iβ_i + ε; donde ε = λWε + υ

Donde además de los elementos clásicos, el término de error se descompone en el coeficiente autoregresivo de los errores λ + los residuales υ.

Wε es el término de error filtrado espacialmente por la matriz de pesos W e incorporado al vector de variables explicativas.

Este modelo se llama Modelo de Error Espacial, cuando el coeficiente lamda es significativo indica que existe autocorrelación espacial en los errores, situación que se debe a que covariables explicativas importantes no están presentes en la especificación del modelo.

Otras dos formas en que la dependencia espacial está presente se ilustran en la figura 2.6.

Figura 2.6 Dependencia espacial de las variables dependiente e independientes.

El esquema de la izquierda de la figura 2.6 plantearía que además de la dependencia espacial de error, el valor de Y dependería tanto del vector de covariables como del valor ponderado de la variable dependiente, es decir es una propiedad inherente de la variable de respuesta:

Aquí, además de los coeficientes de regresión β_i, el parámetro ρ se debe estimar, y es el coeficiente autoregresivo de la variable dependiente.

Finalmente, en la situación planteada en el esquema de la derecha de la figura 2.7, Y depen- de del vector de covariables, de un término de retraso espacial (autoregresivo) de la variable dependiente y además de otro vector de coeficientes autoregresivos de las variables explicativas:

En este último caso ρ₁ es el coeficiente autoregresivo de Y y ρ₂ es el coeficiente autoregresivo del vector de variables de retraso espacial explicativas.

La dependencia espacial se incorpora explícitamente en el proceso mismo, asumiendo que el valor de Y en cualquier locación está determinado por sus valores en locaciones cercanas, además de por las otras variables sustantivas. A estos modelos autoregresivos se les llama de retraso espacial.

Cuando los coeficientes autoregresivos son significativos indican una fuerte dependencia espacial, pero también es posible un desfase entre escalas entre el fenómeno de estudio y la forma en que se tomaron las mediciones, el problema de las unidades de área modificables.

Al ser modelos de efectos principales los coeficientes se interpretan como la dirección e intensidad de la variable, manteniendo constantes a las demás, esto es en su valor medio.

Ahora bien, por qué modelo hay que optar, en principio la literatura sugiere que sean los preceptos teóricos los que guíen la decisión, pero también es importante tomar en cuenta la naturaleza de los datos.

En el esquema de la figura 2.7 se ilustra el algoritmo de decisión para optar por uno u otro modelo

En primer lugar se debe correr el modelo clásico de mínimos cuadrados ordinales, cuyo archivo de salida reportará estadísticos que indican la presencia de autocorrelación espacial. Las pruebas se orientan a identificar la presencia de autocorrelación en lo errores (LM-Error) o en la variable independiente autoregresiva (LM-Lag). En el caso de que ninguna de las pruebas resulte estadísticamente significativa, se opta por mantener el enfoque clásico (Mínimos Cuadrados Ordinales). Si sólo una de las pruebas estadísticas resulta significativa se debe optar por aquél modelo que resultó significativo.

La tercera opción es si ambas pruebas son significativas. En este caso se deberá optar por la prueba cuyo coeficiente de significancia sea mayor.

Los estadísticos de bondad de ajuste clásicos pierden robustez al incorporar los términos autoregresivos, por lo tanto, se deben tomar en cuenta otros estadísticos:

Log likelihood, estadístico de verosimilitud, el mejor modelo es en el que este tome el valor mayor.

Correr modelo de Error espacial

Correr regresión clásica

Alto Mantener modelo

clásico

Correr modelo de retraso espacial

Correr modelo de retraso espacial Diagnísticos de multiplicadores

de Lagrange:

LM-error LM-Lag

Ninguno Uno

Ambos significativos

LM-Error Significativo?

Diagnísticos robustos Robust LM-Error

Robust LM-Lag

Significativo?

LM-Lag

Robust LM-Error Robust LM-Lag

Correr regresión clásica

FUENTE: Anselin, 2005,199

Figura 2.7 Diagrama del proceso de decisión para el modelado espacial

Akaike info criterion y Schwarz criterion, los valores menores en este estadístico indican mejor ajuste del modelo.

En el caso del modelo de regresión espacial, queremos ver la relación de las mismas dimensiones que con los modelos de regresión logística, pero asociadas con los efectos negativos de la segre- gación. Algunos estudios sugieren que entornos empobrecidos y homogéneos se asocian con el crimen, desempleo y embarazos juveniles; por ello en este trabajo construimos una serie de variables que dan cuenta de estos fenómenos y las incorporaremos en el vector de variables explicativas, se esperaría que en las áreas con grupos sociales más segregados se observen valores altos de dichas variables.

En el caso de los modelos de regresión espacial las unidades de análisis no son exactamen- te los hogares, sino las unidades espaciales con el agregado de las características de los hogares, que en nuestro caso serán las manzanas que conforman la mancha urbana continua de las ciudades de estudio. Esta aclaración se hace porque la cartografía disponible sólo incluye pobla- ciones de más de 2,500 habitantes y porque el elemento de vecindad se relaciona estrechamente con la contigüidad.

Otro elemento a probar es el efecto de la vecindad, para ello se correrán los modelos con diferentes vecindades, todas ellas de Von Neuman pero con orden 1 y 2.

In document 17-2009-Tesis-Caudillo Cos, Camilo-Maestro en Geomática.pdf (página 65-70)