Capítulo 2. Metodología
2.5 Métodos espaciales
2.5.3 La dependencia espacial importa. Modelos de regresión espacial
2) Baja-baja
4) Alta-baja 1) Alta-alta
3) Baja-alta y
Wy
FUENTE: Construcción propia
Figura 2.4 Diagrama de dispersión de Moran.
Existen métodos de econometría espacial, cuyos modelos incorporan el componente de los patrones de distribución espacial, ya sea en términos de distancia o de adyacencia, en otras palabras la vecindad es un concepto clave, asociado a las matrices de pesos que anteriormente mencionamos.
La validación empírica de los nuevos conceptos y modelos «espaciales» requieren una metodología estadística y econométrica que tome en cuenta la localización y la interacción espa- cial (Anselin, 1988, 1999, 2000). En otras palabras, la econometría espacial incorpora explícita- mente la dependencia y heterogeneidad espacial, así como extensiones al dominio del espacio- tiempo.3
En nuestro caso, debido a su interpretación análoga a la regresión estándar utilizaremos modelos autoregresivos simultáneos, una particularidad de ellos, como del cálculo de la I de Moran, es que subyace el supuesto de estacionalidad en la incorporación de la matriz de pesos, este hecho puede no cumplirse sobre todo dependiendo de la extensión del área de estudio.
Dentro de esta familia de modelos espaciales se encuentran dos tipos, el modelo de errores espaciales y el de retraso espacial.
La figura 2.5 representa la suposición de que la dependencia espacial se encuentra en los residuales
Figura 2.5 Dependencia espacial en el término de error.
3. Según Dorman et al (2007), dentro de la literatura de métodos econométricos espaciales hay una variedad amplia de modelos, que se agrupan en tres categorías:
1) Regresión de autocovarible y mapeo de eigenvectores. Buscan capturar la configuración espacial en covariables adicionales, que se incorporan en un modelo lineal generalizado.
2) Mínimos cuadrados generalizados. Este método ajusta una matriz de varianza-covarianza basada en la no inde- pendencia de las observaciones espaciales. Los modelos autoregresivos simultáneos (SAR por sus siglas en inglés) y los modelos autoregresivos condicionales (CAR por sus siglas en inglés) pertenecen a esta familia aunque tienen ciertas particularidades que abordaremos más tarde, el hecho que se debe enfatizar es que los modelos SAR se han privilegiado en la econometría espacial y la demografía espacial (Chi y Zhu. 2008: 32) porque la interpreta- ción del coeficiente de autocorrelación espacial es igual al de la regresión lineal estándar por lo que perece más natural. Asimismo los modelos generalizados mezclados modifican el supuesto básico de normalidad, su caso es una forma particular de MCG. Los modelos clásicos que dependen de la naturaleza de los datos, regresión logística, Poisson, multinomial se han adaptado con éxito para incorporar la dependencia espacial, aunque su uso es menos común que la regresión lineal.
3) Ecuaciones de Estimación General, en este método los datos se ordenan en conglomerados antes de modelar la relación en la matriz de varianza-covarianza.
Xi
Y
iY
j Xjεi εj
FUENTE: Adaptado de SOC, 2005, 261.
Xi
Y
iY
j Xjεi εj Xi
Y
iY
jXj
εi εj
FUENTE: Adaptado de SOC, 2005, 261.
El valor de nuestra variable independiente Y, dependería del vector de covariables explicativas y de un término de error filtrado espacialmente que incorpora la estructura espacial al modelo, en leguaje formal el modelo se expresa:
Y = Xiβi + ε; donde ε = λWε + υ
Donde además de los elementos clásicos, el término de error se descompone en el coefi- ciente autoregresivo de los errores λ + los residuales υ.
Wε es el término de error filtrado espacialmente por la matriz de pesos W e incorporado al vector de variables explicativas.
Este modelo se llama Modelo de Error Espacial, cuando el coeficiente lamda es significativo indica que existe autocorrelación espacial en los errores, situación que se debe a que covariables explicativas importantes no están presentes en la especificación del modelo.
Otras dos formas en que la dependencia espacial está presente se ilustran en la figura 2.6.
Figura 2.6 Dependencia espacial de las variables dependiente e independientes.
El esquema de la izquierda de la figura 2.6 plantearía que además de la dependencia espacial de error, el valor de Y dependería tanto del vector de covariables como del valor ponderado de la variable dependiente, es decir es una propiedad inherente de la variable de respuesta:
Aquí, además de los coeficientes de regresión βi, el parámetro ρ se debe estimar, y es el coeficiente autoregresivo de la variable dependiente.
Finalmente, en la situación planteada en el esquema de la derecha de la figura 2.7, Y depen- de del vector de covariables, de un término de retraso espacial (autoregresivo) de la variable dependiente y además de otro vector de coeficientes autoregresivos de las variables explicati- vas:
En este último caso ρ1 es el coeficiente autoregresivo de Y y ρ2 es el coeficiente autoregresivo del vector de variables de retraso espacial explicativas.
La dependencia espacial se incorpora explícitamente en el proceso mismo, asumiendo que el valor de Y en cualquier locación está determinado por sus valores en locaciones cercanas, además de por las otras variables sustantivas. A estos modelos autoregresivos se les llama de retraso espacial.
Cuando los coeficientes autoregresivos son significativos indican una fuerte dependencia espacial, pero también es posible un desfase entre escalas entre el fenómeno de estudio y la forma en que se tomaron las mediciones, el problema de las unidades de área modificables.
Al ser modelos de efectos principales los coeficientes se interpretan como la dirección e intensidad de la variable, manteniendo constantes a las demás, esto es en su valor medio.
Ahora bien, por qué modelo hay que optar, en principio la literatura sugiere que sean los preceptos teóricos los que guíen la decisión, pero también es importante tomar en cuenta la naturaleza de los datos.
En el esquema de la figura 2.7 se ilustra el algoritmo de decisión para optar por uno u otro modelo
En primer lugar se debe correr el modelo clásico de mínimos cuadrados ordinales, cuyo archivo de salida reportará estadísticos que indican la presencia de autocorrelación espacial. Las pruebas se orientan a identificar la presencia de autocorrelación en lo errores (LM-Error) o en la variable independiente autoregresiva (LM-Lag). En el caso de que ninguna de las pruebas resulte estadísticamente significativa, se opta por mantener el enfoque clásico (Mínimos Cuadrados Ordinales). Si sólo una de las pruebas estadísticas resulta significativa se debe optar por aquél modelo que resultó significativo.
La tercera opción es si ambas pruebas son significativas. En este caso se deberá optar por la prueba cuyo coeficiente de significancia sea mayor.
Los estadísticos de bondad de ajuste clásicos pierden robustez al incorporar los términos autoregresivos, por lo tanto, se deben tomar en cuenta otros estadísticos:
Log likelihood, estadístico de verosimilitud, el mejor modelo es en el que este tome el valor mayor.
Correr modelo de Error espacial
Correr modelo de Error espacial
Correr regresión clásica
Alto Mantener modelo
clásico
Correr modelo de retraso espacial
Correr modelo de retraso espacial Diagnísticos de multiplicadores
de Lagrange:
LM-error LM-Lag
Ninguno Uno
Ambos significativos
LM-Error Significativo?
Diagnísticos robustos Robust LM-Error
Robust LM-Lag
Significativo?
LM-Lag
Robust LM-Error Robust LM-Lag
Correr regresión clásica
FUENTE: Anselin, 2005,199
Figura 2.7 Diagrama del proceso de decisión para el modelado espacial
Akaike info criterion y Schwarz criterion, los valores menores en este estadístico indican mejor ajuste del modelo.
En el caso del modelo de regresión espacial, queremos ver la relación de las mismas dimensiones que con los modelos de regresión logística, pero asociadas con los efectos negativos de la segre- gación. Algunos estudios sugieren que entornos empobrecidos y homogéneos se asocian con el crimen, desempleo y embarazos juveniles; por ello en este trabajo construimos una serie de variables que dan cuenta de estos fenómenos y las incorporaremos en el vector de variables explicativas, se esperaría que en las áreas con grupos sociales más segregados se observen valores altos de dichas variables.
En el caso de los modelos de regresión espacial las unidades de análisis no son exactamen- te los hogares, sino las unidades espaciales con el agregado de las características de los hoga- res, que en nuestro caso serán las manzanas que conforman la mancha urbana continua de las ciudades de estudio. Esta aclaración se hace porque la cartografía disponible sólo incluye pobla- ciones de más de 2,500 habitantes y porque el elemento de vecindad se relaciona estrechamente con la contigüidad.
Otro elemento a probar es el efecto de la vecindad, para ello se correrán los modelos con diferentes vecindades, todas ellas de Von Neuman pero con orden 1 y 2.