FEDEA D.T por Esther Vayá y Rosina Moreno 1

Texto completo

(1)La Utilidad de la Econometría Espacial en el Ámbito de la Ciencia Regional* por Esther Vayá Valcarce** Rosina Moreno Serrano** DOCUMENTO DE TRABAJO 2000-13. Mayo, 2000. *. **. El presente documento es un resumen de un trabajo más amplio titulado "Técnicas econométricas en el tratamiento de datos espaciales: La Econometría Espacial" (Ediciones Universidad de Barcelona). Las autoras agradecen a Enrique López-Bazo el esfuerzo compartido en la utilización y difusión de la econometría espacial en el ámbito de la ciencia regional y que ha dado lugar a diversos trabajos conjuntos. Asimismo, agradecen a todos los miembros del Grupo de Investigación AQR sus útiles comentarios y sugerencias. Este trabajo forma parte del proyecto de la DGICYT SEC99-0700 y del Plan Nacional 2FD97-1004-C03-01. Rosina Moreno agradece la hospitalidad del Regional Research Institute de la West Virginia University y especialmente de Luc Anselin durante su estancia pre-doctoral en dicha institución. Grupo de Investigación “Anàlisi Quantitativa Regional” (AQR). Dpt. de Econometría, Estadística y Economía Española, Universidad de Barcelona. Av. Diagonal 690, 08034 Barcelona. Tel: 93-4024320; Fax: 93-4021821. e-mail: [email protected], [email protected].. Los Documentos de trabajo se distribuyen gratuitamente a las Universidades e Instituciones de Investigación que lo solicitan. No obstante están disponibles en texto completo a través de Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo These Working Documents are distributed free of charge to University Department and other Research Centres. They are also available through Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo.

(2) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 1. "En. muchas circunstancias la asunción más cuestionable...es que las unidades de corte transversal son mutuamente independientes. Por ejemplo, cuando las unidades corte transversal son regiones geográficas con fronteras dibujadas arbitrariamente -tales como los estados de Estados Unidos- no deberíamos esperar que esta asunción sea satisfecha" (Kmenta, 1971). "La primera ley de la Geografía es: cualquier cosa está relacionada con cualquier otra pero las cosas más cercanas están más relacionadas que las más distantes" (Tobler, 1970).. 1. Introducción La economía regional y urbana ha experimentado un notable desarrollo metodológico en los últimos cuarenta años potenciando la necesidad de trabajar con la especial naturaleza de los datos de corte transversal. En este sentido, cuando se utiliza este tipo de datos suelen aparecer los denominados efectos espaciales: la heterogeneidad y la dependencia espacial. El primer efecto, la heterogeneidad espacial, surge cuando se utilizan datos de unidades espaciales muy distintas para explicar un mismo fenómeno. En tal caso, aparecen problemas como la heteroscedasticidad o la inestabilidad estructural, los cuales pueden ser resueltos mediante las técnicas econométricas ya existentes para series temporales. La dependencia o autocorrelación espacial surge cuando el valor de una variable en un lugar del espacio está relacionado con su valor en otro u otros lugares del espacio. No obstante, y a diferencia de lo ocurrido con la heterogeneidad espacial, la dependencia espacial no puede ser tratada por la econometría estándar, requiriendo un tratamiento específico. Ello es debido a la multidireccionalidad que domina las relaciones de interdependencia entre unidades espaciales. Con el objetivo de resolver los problemas que supone la presencia de efectos espaciales, especialmente el segundo de ellos, surgió la econometría espacial como subdisciplina de la econometría general, proporcionando las técnicas de contrastación y de estimación necesarias para trabajar con datos que presentan problemas de heterogeneidad y/o dependencia espacial. Si bien el conocimiento de los problemas causados por la estructura y la dependencia espacial y sus efectos en la validez de los métodos estadísticos tradicionales puede remontarse a Student (1914), los comienzos en el desarrollo de un campo separado de la estadística espacial se atribuyen a la obtención de los primeros índices formales.

(3) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 2. para detectar la presencia de autocorrelación espacial en los trabajos de Moran (1948) y Geary (1954). Tras esta fase inicial de reconocimiento del problema, es en la década de los setenta cuando surge el término econometría espacial, acuñado por Paelinck y Klaassen (1979) y originariamente referido a los esfuerzos realizados para abordar la autocorrelación espacial en el término de perturbación de un modelo de regresión. En Anselin (1988a), la econometría espacial se define más concretamente como la colección de técnicas que tratan las peculiaridades causadas por el espacio en el análisis estadístico de los modelos de ciencia regional. Según Anselin y Bera (1998), en esta ultima definición se estarían incorporando específicamente las regiones, la localización y la interacción espacial, formando la base de los trabajos empíricos en economía regional y urbana. El gran desarrollo de la econometría espacial se ha dado en las décadas de los ochenta y noventa. Así, los trabajos de Cliff y Ord (1981), Blommestein (1983) y Anselin (1980, 1988a, b) son los primeros en los que se analiza de manera general los aspectos metodológicos más importantes. Posteriormente han ido apareciendo en las revistas de economía regional contribuciones concretas en el campo de la econometría espacial. De esta forma, la importancia y relevancia de los métodos que analizan los efectos espaciales en los modelos econométricos está incrementando de forma notable. Como mencionan Anselin y Florax (1995a), ello es debido, entre otros aspectos, al renovado interés por el papel del espacio, de la interacción espacial y de las externalidades en la teoría de la ciencia social, la creciente disponibilidad de extensas bases de datos socioeconómicos para datos geo-referenciados y, por último, por el desarrollo de una tecnología eficiente y poco costosa para tratar con datos referenciados espacialmente, tanto en forma de Sistemas de Información Geográfica como de software útil para el análisis de datos espaciales. Con relación a este último aspecto cabe destacar que en 1992 Anselin puso a disposición de los economistas aplicados el programa SpaceStat, en el que se hallan implementados bajo el entorno Gauss los diferentes contrastes de detección de autocorrelación espacial en los modelos de regresión así como los métodos de estimación que incorporan dicha problemática. Habida cuenta de la inexistencia previa de un software específicamente dedicado al tratamiento de los efectos espaciales, la aparición de este paquete econométrico ha facilitado la aplicación de dichos métodos, favoreciendo así el surgimiento de trabajos aplicados que analizan la problemática de los datos transversales en el ámbito de la economía regional y urbana. No obstante, a pesar de esta aparente mayor difusión de la econometría espacial, la distancia que la separa, en términos de su conocimiento y difusión,.

(4) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 3. de la econometría clásica todavía es notable. Así, tal y como exponen Anselin y Florax (1995a), “...a pesar de los importantes desarrollos metodológicos, sería excesivo sugerir que la econometría espacial se ha convertido en una práctica aceptada en la investigación empírica en la ciencia regional y en la economía regional”. Por el contrario, la mayor parte de la literatura publicada en los últimos quince años sobre econometría espacial ha tenido poca difusión entre la mayoría de los analistas de economía empírica. A modo de ejemplo, en el cuadro 1 se recogen la mayor parte de los artículos publicados en revistas de perfil económico que aplican parte de las herramientas de especificación, constrastación y/o estimación del principal efecto espacial analizado en el presente libro: la dependencia espacial. Cuadro 1. Principales aplicaciones empíricas en el campo de la Econometría Espacial Autores. Año. Revista. Ámbito temático. Nagaraj, R. et al. 1999. López-Bazo, E. et al Rey, S. y B.D. Montouri Mencken, F.C.. 1999 1999 1998. Annales d’Economie et de Statistique Annals of Regional Science Regional Studies Growth and Change. Crecimiento económico y externalidades espaciales Dinámica regional y convergencia Crecimiento y convergencia regional Crecimiento económico y disparidades regionales Estudio de mercados rurales y GIS Red de infraestructuras en regiones frontera Precio de transacción de viviendas. Vandeveer, L. et al 1998 Rietveld,P. y Wintershoven, P. 1998 Basu, S. y Thibodeau, T. 1998 Macedo, P.B.R. 1998. Review of Agricultural Economics Papers in Regional Science Journal of Real Estate Finance and Economics Revista Brasileira de Economia. Varga, A. Moreno, R.. 1998 1998. Tesis Doctoral Tesis Doctoral. Vayá, E.. 1998. Tesis Doctoral. Moreno, R. et al. 1997. Bivand, R. y Szymanski, S. Ashworth, J. y Parker, S.C.. 1997 1997. Aten, B.. 1997. Can, A. y Megbolugbe, I.. 1997. Kelejian, H. y Robinson, D.. 1997. International Journal of Development Planning Literature Economic Letters Scottish Journal of Political Economy International Regional Science Review Journal of Real Estate Finance and Economics Papers in Regional Science. Anselin, L. et al O’Loughlin, J. y Anselin, L. Bernat, G. Aten, B.. 1997 1996 1996 1996. Journal of Urban Economics Economic Geography Journal of Regional Science Review of Income and Wealth. Lyson, T. y Tolbert, C.. 1996. Environment and Planning (A). Meen, G.. 1996. Housing Studies. Determinantes del precio de viviendas y externalidades Efectos regionales de la I+D universitaria Crecimiento económico, externalidades e infraestructuras Crecimiento económico y externalidades regionales Crecimiento y capital público Competencia local y externalidades Determinantes del precio de las viviendas Precios y comercio internacional Índice de Precios de Viviendas Estudio de la productividad regional e infraestructuras públicas Spillovers Tecnológicos Comercio Internacional Estudio del crecimiento regional Precios y comercio internacional. Tamaño de las empresas y bienestar de la comunidad local Precios de viviendas en mercado nacional y.

(5) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. Barkley, D. et al. 1995. Papers in Regional Science. Molho, I.. 1995. Journal of Regional Science. Benirschka, M. y Brinkley, J.K. 1994 Holtz-Eakin, D.. American Journal of Agricultural Economics 1994 Review of Economics and Statistics. Case, A. C., et al Murdoch, J. et al LeSage, J. P.. 1993 1993 1993. Case, A.C.. 1992. Florax, R.. 1992. Dubin, R.A.. 1992. Heikkila, E. y Kantiotou, C.. 1992. Congdon, P.. 1990. Regional Science and Urban Economics Regional Science and Urban Economics Urban Studies. Can, A.. 1990. Economic Geography. Journal of Public Economics Public Finance Quarterly American Journal of Agricultural Economics Regional Science and Urban Economics Tesis Doctoral. 4 sub-nacionales Efectos spread y backwash. Desempleo y externalidades en los ajustes ante shocks locales Estudio del valor de la tierra agrícola Estudio de potenciales spillovers procedentes de infraestructuras públicas Spillovers fiscales Gasto público Precios en los mercados agrícolas Estudio del proceso de adopción de nuevas tecnologías en la agricultura Impacto económico de las Universidades como productoras de conocimiento Calidad del vecindario y precios de las viviendas Impacto fiscal de un cambio en los usos de la tierra Estudio de la variación de las tasas de mortalidad a través del tiempo y del espacio Determinación de los precios de las viviendas desde una perspectiva geográfica. Tras observar el cuadro 1, la principal conclusión que cabe extraer es el escaso número de referencias existentes, muy especialmente en el ámbito español, haciendo evidente el esfuerzo necesario para acercar las técnicas econométricas espaciales a los investigadores que trabajan en el ámbito regional y urbano. Teniendo todo ello en cuenta, el propósito del presente trabajo es contribuir a la difusión en nuestro país de las técnicas de econometría espacial, ofreciendo una breve recopilación de las principales aportaciones teóricas llevadas a cabo en el ámbito de la econometría espacial y que han ido aparececiendo en los últimos años en forma de monográficos y artículos dispersos en revistas especializadas. Con ello se pretende acercar su conocimiento a la comunidad investigadora usuaria de bases de datos referenciados geográficamente. Asimismo, cabe resaltar que el trabajo se centra en la problemática existente en torno a la dependencia espacial ya que, como comentamos anteriormente y a diferencia de lo ocurrido con la heterogeneidad espacial, la autocorrelación espacial requiere de un tratamiento específico no presente en la econometría clásica. El presente documento se estructura de la siguiente forma. En el apartado 2 se define el concepto de dependencia espacial, analizando a su vez la utilidad de la matriz de pesos como instrumento básico para formalizar las interdependencias entre unidades espaciales. En el apartado 3 se describen los.

(6) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 5. principales estadísticos presentes a nivel univariante válidos para contrastar la existencia de dependencia espacial en la distribución de una variable en el espacio. El apartado 4 se centra en la presencia de dependencia espacial en un modelo de regresión, analizando las diferentes vías de especificación, contrastación y estimación de la misma. Asimismo, se discuten las diferentes estrategias existentes en la literatura para la selección final del modelo espacial más adecuado. Por último, en el apartado 5 se lleva a cabo un breve comentario acerca del tratamiento de la dependencia espacial cuando se dispone de un panel de datos. 2. Dependencia Espacial y la matriz de pesos 2.1. Definición de autocorrelación o dependencia espacial La dependencia o autocorrelación espacial,1 objetivo principal de la econometría espacial ya desde sus comienzos, aparece como consecuencia de la existencia de una relación funcional entre lo que ocurre en un punto determinado del espacio y lo que ocurre en otro lugar (Cliff y Ord, 1973; Paelink y Klaassen, 1979; Anselin, 1988a). Es decir, el valor que toma una variable en una región no viene explicado únicamente por condicionantes internos sino también por el valor de las observaciones de esa misma variable en otras regiones vecinas 2, incumpliéndose por tanto el supuesto de independencia entre las observaciones muestrales.3 De esta forma, la existencia de dependencia espacial no hace posible cambiar la localización de los valores de una variable sin afectar a la información contenida en la muestra. La autocorrelación espacial puede ser positiva o negativa. Si la presencia de un fenómeno determinado en una región lleva a que se extienda ese mismo fenómeno hacia el resto de regiones que la rodean, favoreciendo así la concentración del mismo, nos hallaremos ante un caso de autocorrelación positiva. De esta forma si, por ejemplo, la variable crecimiento de la productividad mostrase un esquema de dependencia espacial positiva, las regiones vecinas a i se verían contagiadas de una buena evolución de la productividad en dicha región. Por el contrario, existirá autocorrelación negativa cuando la presencia de un fenómeno en una región impida o dificulte su aparición 1. En un sentido estricto, los conceptos de dependencia y autocorrelación espacial no son sinónimos, siendo la autocorrelación espacial una expresión más débil de la dependencia espacial, relativa únicamente a los primeros momentos de la distribución conjunta de una variable. Sin embargo, en lo que sigue, ambos conceptos serán utilizados indistintamente. 2 En el texto se utilizará el concepto de región como unidad espacial genérica. Asimismo, el concepto de vecindad debe ser entendido en sentido amplio y no exclusivamente vinculado a la proximidad geográfica. 3 La existencia de autocorrelación espacial implica que la muestra contiene menos información que la presente en otra muestra cuyas observaciones son independientes (Anselin y Rey, 1997). Este hecho deberá ser tenido en cuenta explícitamente durante el proceso de contrastación y estimación..

(7) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 6. en las regiones circundantes o contiguas a ella, es decir, cuando unidades geográficas cercanas sean netamente más disímiles entre ellas que entre regiones alejadas en el espacio. Esta situación sería compatible con la existencia de jerarquías, por ejemplo, de tipo centro-periferia, donde una favorable evolución del centro podría verse acompañada de un empeoramiento de las regiones periféricas próximas. Por último, cuando la variable analizada se distribuya de forma aleatoria, no existirá autocorrelación espacial. Dos son las principales causas que pueden inducir a la aparición de dependencia espacial: la existencia de errores de medida y de fenómenos de interacción espacial. Los errores de medida pueden surgir, entre otros aspectos, como consecuencia de una escasa correspondencia entre la extensión espacial del fenómeno bajo estudio y las unidades espaciales de observación.4 Son muchas las ocasiones en las que, en el ámbito de los trabajos aplicados de economía regional y urbana, dichos errores de medida pueden llegar a estar presentes. Por ejemplo, podría ocurrir que el fenómeno bajo estudio requiriese de información relativa a mercados de trabajo locales para los cuales es posible que no se disponga de información estadística, habiendo de utilizar en su lugar datos relativos a unidades muy desagregadas como municipios o unidades con un mayor nivel de agregación como es el regional. En este caso, la variable observada podrá mostrar un esquema de autocorrelación espacial bien porque los municipios colindantes que formen parte de un único mercado de trabajo local se encuentren correlacionados o bien porque un mismo mercado local forme parte de dos regiones contiguas. Por otro lado, la existencia de fenómenos de interacción espacial, de efectos desbordamiento y de jerarquías espaciales también tienen como consecuencia la aparición de un esquema de autocorrelación espacial. 2.2. Matriz de pesos como instrumento para recoger las interdependencias Tras la definición anterior, es posible detectar una cierta similitud entre los conceptos de autocorrelación espacial y temporal en la medida en que, en ambos casos, se produce un incumplimiento de la hipótesis de independencia entre las observaciones muestrales, se hallen éstas referidas a unidades de corte transversal o a series temporales. Sin embargo, una importante diferencia aparece entre ellas: la dependencia temporal es únicamente unidireccional (el pasado explica el presente), mientras que la dependencia espacial es multidireccional (una región puede estar afectada no sólo por otra región contigua a ella sino por otras muchas que la rodean, al igual que ella puede influir sobre aquéllas)5. Este hecho 4. Ver Haining (1995) para una discusión acerca de los problemas que pueden surgir con los datos en la modelización econométrica espacial. 5 Uno de los problemas que surge en el contexto espacial es el llamado efecto frontera, el cual aparece como consecuencia de que la dependencia espacial no se limita a las regiones incluidas dentro de la muestra sino que se extiende a unidades espaciales para las cuales no se dispone de información (Griffith 1985, Anselin 1988a). Tal y como señala Florax (1992), no existe una solución única y comúnmente aceptada para dicho problema..

(8) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 7. imposibilita la utilización del operador de retardos L, Lpx = xt-p, presente en el contexto temporal, el cual recoge únicamente una relación unidireccional. En este caso, la solución al problema de la multidireccionalidad en el contexto espacial pasa por la definición de la denominada matriz W de pesos espaciales, de retardos o de contactos: (1). una matriz cuadrada no estocástica cuyos elementos wij reflejan la intensidad de la interdependencia existente entre cada par de regiones i y j. Respecto a como construir la matriz W, cabe destacar que no existe una definición de W unánimemente aceptada, si bien se ha de cumplir que sus pesos sean no negativos y finitos (Anselin, 1980). A pesar de ello, de forma habitual se recurre al concepto de contigüidad física de primer orden, utilizado inicialmente por Moran (1948) y Geary (1954), donde wij es igual a 1 si las regiones i y j son físicamente adyacentes o a 0 en caso contrario6 (se asume por definición que wii=0).7 Si bien dicha matriz de contigüidad es habitualmente utilizada por su simplicidad, ciertamente presenta algunas limitaciones importantes que la hacen ser excesivamente restrictiva como, por ejemplo, su carácter simétrico (no es posible incorporar influencias no recíprocas) o la consideración de la adyacencia física como único determinante de las interdependencias regionales (descuidando con ello, por ejemplo, posibles influencias mutuas entre regiones que, aun estando alejadas, mantienen estrechas relaciones comerciales). Siguiendo el criterio de la proximidad física, diversos autores han propuesto definiciones de la matriz W basadas en la utilización de la distancia entre regiones (Cliff y Ord, 1973, 1981; Bodson y Peeters, 1975), de manera que la intensidad de la interdependencia entre dos regiones disminuye conforme aumenta la distancia que separa sus respectivos centros. En este sentido, se recurre de forma habitual a la matriz inversa de distancias al cuadrado sugerida por Anselin (1980). Por último, cabe destacar que en los últimos años han sido propuestas matrices de pesos alternativas que tratan de huir del concepto de 6. En el caso de que las unidades espaciales sean puntos (por ejemplo, ciudades), la contigüidad puede consistir en la noción del camino más corto. Así, dos puntos son contiguos si la distancia que los separa es inferior a un valor δ determinado. 7 Respecto a la adyacencia física y suponiendo la existencia de una cuadrícula regular, existen dos criterios básicos para la identificación de los vecinos: el llamado criterio torre o rook (se considerarán vecinos aquéllos que comparten estrictamente algún lado de manera que cada cuadrado tendrá 4 vecinos en total) y el criterio reina o queen (cada cuadrado tendrá 8 vecinos al incluir también a aquéllos con los que comparte sus vértices)..

(9) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 8. contigüidad o proximidad física para acercarse más al objeto de estudio analizado en cada caso. Así, cabe mencionar los trabajos de Case et al (1993) donde se define una matriz W basada en un concepto de distancia económica entre regiones o de Vayá et al (1998a) y López-Bazo et al (1999), donde los pesos de W recogen el grado de intercambio comercial entre las regiones analizadas. En cualquier caso es preciso remarcar que, en el proceso de contrastación y estimación, la matriz de pesos ha de ser considerada exógena, de manera que se deberá asegurar la exogeneidad de W cuando se recurra a indicadores socioeconómicos para definir sus elementos (salvo que se considere explícitamente la endogeneidad de W en la especificación del modelo). Por último, cabe destacar que de forma habitual se recurre a la estandarización de la matriz W, dividiendo cada elemento wij por la suma total de la fila a la que pertenece, haciendo que la suma de cada fila sea igual a la unidad. Si bien no existe una razón contundente que justifique este hecho, la posibilidad de ponderar por igual la influencia total que recibe cada región de sus vecinos, con independencia del número total de vecinos de cada una de ellas, explicaría dicha transformación.8 Asimismo, dicha estandarización facilita la interpretación de los coeficientes autorregresivos del modelo estimado al asimilarlos a un coeficiente de correlación,9 asegurando además que los parámetros espaciales estimados sean comparables entre los distintos modelos propuestos. Evidentemente, tras la estandarización de W la matriz resultante será asimétrica (siempre que Σj.wij ≠ Σi.wji), complicando los cálculos de algunos estadísticos y estimadores.. 8. No obstante, tal y como expone Anselin (1988a), la estandarización de W no siempre es adecuada, especialmente cuando ésta se basa en un concepto de distancia dado que, en este caso, la matriz estandarizada carecería de significado. 9 Ello está relacionado, como se verá posteriormente, con las restricciones impuestas en el marco de la estimación máximo-verosímil..

(10) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 9. 3 . Dependencia espacial a nivel univariante Como hemos mencionado anteriormente, la dependencia espacial positiva (negativa) se caracteriza por la existencia de una concentración en el espacio de valores similares (disímiles) de una determinada variable. En este sentido, ciertamente la visión de un mapa en el que se represente dicha variable puede ofrecernos una primera idea de la posible presencia o no de una cierta asociación espacial en la distribución de la variable en el territorio seleccionado. Para comprobarlo, observemos la figura 1 donde se encuentra representada la distribución espacial del logaritmo de la variable valor añadido bruto por ocupado para las regiones europeas en 1992. A partir de la figura 1 cabe concluir en la existencia de una tendencia hacia la concentración en el espacio de valores similares del VAB por ocupado, alejándose así la posibilidad de una distribución aleatoria de dicha variable. No obstante, si bien esta conclusión parece razonable, es preciso remarcar que los resultados que puedan deducirse de la inspección de un mapa son altamente sensibles, entre otros aspectos, al número de intervalos definidos para representar la variable bajo estudio. De esta forma, es preciso llevar a cabo un estudio exhaustivo que nos permita contrastar la existencia de un esquema de dependencia espacial estadísticamente significativo en la distribución espacial de una variable. Para ello, existen en la literatura una batería de tests de autocorrelación o dependencia espacial, los cuales pueden dividirse en dos grupos: contrastes globales y contrastes locales de autocorrelación espacial..

(11) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 10. Figura 1. Distribución espacial del LnVAB por ocupado 1992, regiones europeas. 3.1. Estadísticos globales de dependencia espacial Para contrastar si se cumple la hipótesis de que una variable se encuentra distribuida de forma totalmente aleatoria en el espacio o, por el contrario, existe una asociación significativa de valores similares o disímiles entre regiones vecinas, han sido propuestos un conjunto de estadísticos de dependencia espacial, entre los que merece destacar la I de Moran y la G(d) de Getis y Ord.10 El contraste I de Moran (Moran, 1948) presenta la siguiente expresión: (2). 10. Ver Geary (1954) y Dacey (1968) como ejemplo de otros estadísticos globales de dependencia espacial..

(12) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 11. donde xi refleja el valor de la variable cuantitativa11 x en la región i, es su media muestral, wij son los pesos de la matriz W, N es el tamaño muestral y . Respecto a la distribución del estadístico, según Cliff y Ord (1981) cuando el tamaño muestral es suficientemente grande, la I de Moran estandarizada, Z(I), sigue una distribución asintótica normal estándar. En este caso, un valor no significativo de Z(I) llevará a no rechazar la hipótesis nula de no autocorrelación espacial, mientras que un valor significativo positivo (negativo) del mismo informará acerca de la presencia de un esquema de autocorrelación espacial positivo (negativo). Las expresiones de los momentos de primer y segundo orden de la I de Moran (EA(I) y EA(I2) respectivamente) bajo la hipótesis de muestreo aleatorio12 de x son: (3) (4). donde. , y. ,. ,. .. El estadístico G(d), definido por Getis y Ord (1992) como una medida de la concentración espacial de una variable x, presenta la siguiente expresión: (5). donde dos pares de regiones i y j son consideradas vecinas siempre que se encuentren dentro de una distancia d determinada, tomando, en este caso, wij(d) un valor igual a 1, o 0 en caso contrario. 11. Para un análisis detallado sobre la problemática espacial en torno a las variables cualitativas ver Cliff y Ord (1973, 1981), Anselin (1988a), McMillen (1992, 1995), Dubin (1995) o Ferguson y Kanaroglou (1995). 12 Cliff y Ord (1981) definen asimismo los momentos de primer y segundo orden de I bajo el supuesto de distribución normal de la variable analizada. Sin embargo, dado que es habitual que dicha hipótesis no sea satisfecha, se ha optado por no incluir dichas expresiones..

(13) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 12. Tras la estandarización de la G(d), ésta se distribuye a nivel asintótico según una normal N(0,1). Siguiendo una hipótesis de muestreo aleatorio, los momentos de primer y segundo orden de dicho estadístico son respectivamente: (6) (7) siendo. y donde. (8). En este caso, la hipótesis nula asociada al estadístico Z(G) es la ausencia de asociación espacial, mientras que un valor positivo (negativo) y significativo indica la existencia de una tendencia a la concentración de valores elevados (bajos) de x en el espacio analizado. De esta forma, el cálculo de la I de Moran no excluye el cálculo de la G(d) dado que ambos estadísticos suministran informaciones complementarias. Con relación a los estadísticos comentados cabe resaltar cuatro aspectos importantes. En primer lugar, destacar que otro instrumento útil en el análisis del grado de dependencia espacial de una variable y que suministra información similar a la obtenida con el cómputo del estadístico I de Moran es la observación del denominado Scatterplot de Moran. Este tipo de gráfico representa en el eje de abcisas las observaciones de la variable x normalizada y en el de ordenadas el retardo espacial de dicha variable también normalizado (obtenido tras multiplicar la matriz W por la variable x). De este modo, los cuatro cuadrantes reproducen diferentes tipos de dependencia espacial. Si la nube de puntos está dispersa en los cuatro cuadrantes es indicio de ausencia de correlación espacial. Si, por el contrario, los valores se encuentran concentrados sobre la diagonal que cruza los cuadrantes I (derecha superior) y III (izquierda inferior), existe una elevada correlación espacial positiva de la variable, de forma que su pendiente es igual al valor obtenido para el contraste de la I de Moran. La dependencia será negativa si los valores se concentran en los dos cuadrantes restantes..

(14) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 13. En segundo lugar, cabe mencionar que para el cómputo de los contrastes de autocorrelación se puede utilizar cualquier definición de la matriz de pesos W, siendo habitual proceder previamente a la estandarización de la misma. Sin embargo, los resultados obtenidos por los diferentes contrastes pueden variar, a veces dramáticamente, en función de la matriz W especificada. Asimismo, en caso de utilizar una matriz de contigüidad física, es habitual replicar el cálculo del estadístico I de Moran para matrices de contigüidad de órdenes superiores,13 con tal de contrastar si el esquema de autocorrelación espacial detectado entre regiones vecinas es extensible a regiones alejadas en el espacio.14 En tercer lugar, se ha de notar que los estadísticos anteriores son sensibles a las transformaciones realizadas sobre la variable original, especialmente en el caso del contraste G(d), el cual únicamente es aplicable al caso de variables positivas y naturales (no aplicable, por tanto, al caso de los residuos de una regresión). Asimismo, mencionar que las medidas de autocorrelación espacial se ven afectadas por el denominado problema de la unidad aérea modificable, asociado con la forma en la que se encuentran organizadas las unidades espaciales y, especialmente, con el nivel de agregación escogido.15 En concreto, para el caso de la I de Moran, Chou (1991) demuestra como dicho estadístico se ve influido por los denominados efectos escala asociados con cambios tanto en el tamaño del área de estudio como en el nivel de resolución del mapa. Con relación a este último aspecto, Chou muestra como a medida que incrementa el nivel de desagregación de las unidades espaciales, comienza a dominar un esquema de autocorrelación espacial positiva. Finalmente, cabe destacar que si bien los dos estadísticos antes comentados son los más habitualmente utilizados, Brett y Pinkse (1997) han propuesto un nuevo test de dependencia espacial desde una perspectiva semiparamétrica basado en el uso de una función característica, derivando formalmente las propiedades del citado estadístico. Pese a que los propios autores aconsejan su cálculo juntamente con otros estadísticos de autocorrelación espacial como la I de Moran, el contraste de Brett y Pinkse presenta una ventaja adicional: está especialmente indicado para detectar estructuras de asociación espacial no lineales que no son detectadas por los tests de autocorrelación espacial habituales.. 13. Diremos que las regiones i y j son contiguas de segundo orden si ambas están separadas por una tercera región h que es contigua de primer orden a ambas. La misma idea es extensible para órdenes de contigüidad superiores. 14 Los denominados correlogramas espaciales consisten en la representación del valor de la I de Moran estandarizada para matrices de diferentes órdenes de contigüidad. 15 Dicho problema surge como consecuencia de la no homogeneidad del proceso espacial estudiado..

(15) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 14. 3.2. Estadísticos locales de dependencia espacial Uno de los rasgos que caracterizan a los estadísticos de asociación anteriormente descritos es que son válidos para contrastar la presencia de un esquema de autocorrelación espacial global, dado que analizan todas las regiones de la muestra de forma conjunta. Por ello, dichos estadísticos no son sensibles a situaciones donde predomina una importante inestabilidad en la distribución espacial de la variable objeto de estudio (procesos no estacionarios espacialmente16), existiendo por ejemplo clusters o agrupaciones de regiones localizados en áreas específicas del territorio que concentran valores más elevados o bajos de lo que cabría esperar en caso de encontrarnos ante una distribución homogénea, mientras que la aleatoriedad domina en el resto del territorio. Es decir, no contemplan la posibilidad de que el esquema de dependencia detectado a nivel global (por ejemplo, ausencia de autocorrelación espacial) pueda no mantenerse en todas las unidades del espacio analizado. Dicha limitación es fácilmente superable por medio del cálculo de los denominados contrastes locales de asociación espacial entre los que se encuentran el estadístico local de Moran, Ii, basado en el test tradicional de la I de Moran, y la Gi(d) de Ord y Getis (1995). En este caso, como se verá a continuación, se obtendrá un valor de dichos estadísticos para cada región de la muestra, pudiendo así analizar la situación de cada unidad espacial por separado. Con relación al primer estadístico de autocorrelación espacial local mencionado, la Ii de Moran (Anselin, 1995), éste presenta la siguiente expresión: (9). donde zi es el valor correspondiente a la región i de la variable ya normalizada y Ji el conjunto de regiones vecinas a i. Siguiendo una hipótesis de distribución aleatoria, la esperanza del citado estadístico es: (10). 16. La estacionariedad de un proceso espacial implica que sus propiedades estadísticas no cambian a través del espacio. En sentido estricto, un proceso espacial es estacionario cuando cualquier distribución conjunta de variables aleatorias sobre un subconjunto de puntos en el espacio depende únicamente de la posición relativa de las diferentes localizaciones, la cual se encuentra determinada por su orientación relativa (ángulo) y las distancias respectivas (Anselin ,1988a)..

(16) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 15. donde Wi es la suma de todos los elementos de la fila de la matriz W correspondiente a la región i, Asimismo: (11). donde. .. De forma similar a los estadísticos anteriores, se puede asumir la hipótesis de que la Ii estandarizada se distribuye según una normal N(0,1).17 Tras su estandarización, un valor positivo (negativo) del contraste Ii indicará la existencia de un cluster de valores similares (disímiles) de la variable analizada alrededor de la región i. La expresión del segundo estadístico de asociación espacial local, Gi(d) de Ord y Getis (1995) ya estandarizada, es la siguiente: (12). donde Dicho estadístico se distribuye asintóticamente según una normal N(0,1).18 En este sentido, un valor significativo y positivo (negativo) de la Gi(d) indicará la existencia de un cluster alrededor de la región i de valores similares elevados (bajos) de la variable x. De nuevo, es necesario resaltar el interés del cálculo simultáneo del estadístico Ii y de la Gi(d) en la medida en que ambos contrastes suministran información complementaria derivada del diferente significado de sus signos.. 17. Si bien es habitual asumir una distribución asintótica normal para el estadístico, Anselin (1995) cuestiona dicha distribución en la medida en que no siempre la aproximación asintótica es válida y, segundo, porque los momentos de primer y segundo orden utilizados para la estandarización del estadístico son obtenidos bajo una hipótesis nula de no autocorrelación espacial que no siempre se cumple. Por ello, Anselin propone la obtención de unos pseudo-niveles de significación obtenidos de una distribución empírica derivada siguiendo un criterio de aleatoriedad condicional o de permutación. 18 Nuevamente, al igual que en el caso del estadístico Local de Moran, en lugar de asumir a priori una distribución normal para el contraste Gi(d) cabría la posibilidad de derivar unos pseudo-niveles de significación a partir de una distribución empírica del citado contraste..

(17) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 16. Por último, cabe destacar dos aspectos relevantes en relación a los anteriores contrastes de autocorrelación local. Primero, tal como se ha comentado anteriormente, el estadístico Gi(d) informa acerca de si los clusters de valores similares detectados por el estadístico Ii concentran valores elevados o bajos de la variable analizada. Sin embargo, no son útiles para conocer si las agrupaciones detectadas de valores disímiles (signo negativo de la Ii estandarizada) se hallan ocasionadas por un esquema donde la región i muestra valores significativamente elevados de x mientras que sus regiones vecinas presentan valores significativamente bajos de la misma. O si, por el contrario, son las regiones vecinas a i las que muestran valores muy elevados en comparación al observado en i. Una posible solución a dicho problema se encuentra en la representación del Scatterplot de Moran comentado anteriormente. En este sentido, los puntos que se localicen en el cuadrante II (IV) representarán valores bajos (elevados) de la variable x en la región i frente a valores elevados (bajos) de dicha variable en sus regiones vecinas. En segundo y último lugar, cabe destacar que a partir de la Ii es posible conocer la contribución exacta que presenta cada región al valor del estadístico global de dependencia I de Moran, pudiendo de esta forma detectar observaciones outliers, es decir, observaciones con una contribución excepcional al mismo.19 Ello la convierte, a diferencia de lo ocurrido con la Gi(d), en un indicador LISA (Local Indicator of Spacial Association).20 4. Dependencia espacial a nivel multivariante con datos de corte transversal 4.1. Dependencia espacial en un modelo de regresión: dependencia sustantiva y residual En el apartado anterior se han analizado los estadísticos espaciales habitualmente utilizados para contrastar la presencia de dependencia espacial a nivel univariante. No obstante, de igual modo, es posible que el citado efecto espacial esté presente en el contexto de un modelo de regresión, ya sea como consecuencia de la existencia de variables sistemáticas (endógena y/o exógenas) correlacionadas espacialmente o como consecuencia de la existencia de un esquema de dependencia espacial en el término de perturbación. 19. Ello es posible porque, a diferencia de la G(d), la I de Moran puede ser expresada como la suma de las diferentes Ii multiplicadas por un factor de proporcionalidad γ: 20. Para que un estadístico sea considerado como un LISA se deberá de cumplir que, primero, el valor del estadístico obtenido para cada observación suministre información acerca de la relevancia de una agrupación espacial de valores similares alrededor de la misma y, segundo, siempre que la suma del valor del estadístico para todas las observaciones sea proporcional a un indicador global de asociación espacial..

(18) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 17. En cualquiera de los dos casos apuntados, para la inclusión de dicha autocorrelación espacial en un modelo de regresión es necesario recurrir a la matriz de pesos o de contactos W, la cual permite incorporar fácilmente las influencias mutuas presentes entre las unidades espaciales de la muestra. Así, por ejemplo, en caso de que la variable endógena de un modelo de regresión esté correlacionada espacialmente, la solución pasa por especificar el siguiente modelo, denominado modelo mixto regresivo espacial autorregresivo o también llamado modelo del retardo espacial: (13). donde y es un vector (Nx1), Wy el retardo espacial de la variable y, X una matriz de K variables exógenas, u un término ruido blanco, N el número de observaciones y, por último, ρ el parámetro autorregresivo que recoge la intensidad de las interdependencias entre las observaciones muestrales de la variable endógena.21 De igual forma, la autocorrelación espacial podría estar únicamente presente en el término de perturbación, dando lugar al denominado modelo de regresión lineal con perturbaciones espaciales autorregresivas o también llamado modelo del error espacial: (14). donde u es un término ruido blanco y λ el parámetro autorregresivo que refleja la intensidad de las interdependencias en el término de perturbación. A partir de la expresión (13) es fácil observar como, en caso de omitir de forma errónea un retardo espacial de la variable endógena (y/o exógenas), la dependencia espacial se trasladaría directamente al término de perturbación, el cual pasaría a estar correlacionado espacialmente. Este tipo de autocorrelación 21. De igual forma, es posible incluir únicamente retardos espaciales de las variables exógenas, dando lugar al modelo mixto regresivo espacial cruzado-regresivo:. donde las variables incluidas en R pueden coincidir o no con las variables incluidas en X..

(19) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 18. espacial es conocida con el nombre de autocorrelación espacial sustantiva y su solución pasa por la inclusión en el modelo de un retardo espacial de la variable sistemática omitida correlacionada espacialmente. Por el contrario, cuando la dependencia espacial residual no esté causada por la omisión errónea de un retardo de alguna de las variables sistemáticas, nos hallaremos ante un caso de autocorrelación espacial residual como nuisance o perturbación.22 Dicha situación podría verse explicada por la omisión de variables no cruciales que se hallen correlacionadas espacialmente o por la existencia de errores de medida derivados, como comentamos en el apartado 2.1, de una escasa correspondencia entre el ámbito espacial del fenómeno bajo estudio y las unidades espaciales de observación. En este caso, la solución supondría la consideración explícita de una esquema de dependencia espacial en el término de error. A partir de las sencillas especificaciones esbozadas en las expresiones (13) y (14), cabe destacar que la especificación más general para un modelo espacial se corresponde con el modelo mixto regresivo espacial regresivo con perturbaciones autorregresivas y heteroscedásticas (Anselin 1988b, Florax y Folmer 1992): (15) donde y es el vector (Nx1) correspondiente a la variable endógena, X una matriz (NxK1) de variables exógenas y R una matriz (NxK2) de variables exógenas que son retardadas espacialmente (las cuales pueden coincidir o no con las incluidas en la matriz X). Por otra parte, ε incorpora una estructura de dependencia espacial autorregresiva especificada mediante un esquema de Markov de primer orden. A su vez, se ha considerado u como un vector distribuido normalmente, con una matriz de varianzas y covarianzas diagonal, pero heteroscedástico (los elementos de su diagonal principal estarán en función de P+1 variables exógenas Z). Por último, ρ es el coeficiente de la variable dependiente retardada espacialmente, λ el coeficiente en la estructura autorregresiva espacial de ε, β1 y β2 los vectores de dimensiones (K1x1) y (K2x1) asociados a las variables exógenas y exógenas retardadas respectivamente, mientras que a es el vector Px1 asociado con los términos no constantes de Z.23. 22. En adelante, se asimilará el concepto de autocorrelación espacial residual como nuisance con el de autocorrelación espacial residual simplemente. 23 Con relación a la expresión (15), cabe decir que si W1=W3 los parámetros ρ y λ estarán identificados únicamente cuando la matriz X contenga al menos una variable exógena (además de la constante) y cuando se impongan las restricciones no lineales correspondientes..

(20) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 19. Respecto a los diferentes subíndices incorporados para las matrices de contacto, nuevamente no existe consenso en torno a la especificación más adecuada para cada una de ellas. En este sentido, Arora y Brown (1977) al igual que Hordijk (1979), proponen utilizar una matriz neutral, de contigüidad binaria, para el término de perturbación. En cambio, cuando la matriz de contactos debe ser incluida en la especificación funcional del modelo econométrico espacial, como ocurre con W1 y W2, tanto Hordijk (1979) como Anselin (1980) señalan la necesidad de utilizar una matriz más relacionada con el concepto de accesibilidad propio de la teoría de la interacción espacial, evitando así conclusiones falsas o espurias. Esta restricción puede relajarse cuando la matriz W ha de utilizarse en la construcción de hipótesis (Anselin, 1988a) ya que, en este caso, se está contrastando únicamente la escasez de independencia entre los términos de perturbación y no un tipo particular de dependencia, si bien para maximizar el poder del test debería escogerse una W relacionada con la hipótesis alternativa propuesta. En cualquier caso, es preciso tener en cuenta que una especificación errónea de W puede tener importantes consecuencias sobre el modelo de regresión estimado (para un estudio de las consecuencias derivadas de una sub o sobre-especificación de la matriz de contactos, ver Florax y Rey, 1995). Por último, cabe decir que en las especificaciones anteriores la dependencia espacial ha sido incorporada en el término de perturbación a través de una estructura autorregresiva de primer orden. Si bien dicha estructura es la más utilizada a nivel tanto teórico como empírico, es posible modelizar el término de perturbación de forma diferente. Así, Cliff y Ord (1981) sugieren utilizar un proceso de medias móviles espacial, SMA(1): (16). donde θ es el coeficiente de medias móviles espacial y u es el término de perturbación incorrelacionado. Esto nos lleva a poder definir un modelo mixto regresivo espacial autorregresivo con perturbaciones espaciales que incorporan un esquema de dependencia espacial media móvil, es decir, un modelo SARMA(1,1): (17). En este modelo, y a diferencia de lo ocurrido cuando un esquema autorregresivo está presente en el término de error, los parámetros ρ y θ estarán siempre identificados aun cuando W1=W2=W..

(21) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 20. No obstante, respecto a las estructuras autorregresivas y medias móviles, cabe decir que si bien la mayoría de los resultados de las estimaciones y contrastes derivados de una estructura media móvil pueden obtenerse también a partir de una estructura autorregresiva, es importante notar que las estructuras de dependencia espacial derivadas de un esquema autorregresivo y de un media móvil difieren notablemente (Anselin y Bera, 1998; Mur, 1999). Así, partamos de una especificación sencilla de un SMA(1) para el error como la mostrada en (16), la cual puede reescribirse como: (18) A partir de la expresión (18), es posible derivar la matriz de varianzas y covarianzas de y: (19) Como se puede observar en (19), la matriz obtenida no es una matriz completa, de manera que, en el caso de un SMA(1), los shocks que recibe una variable y serán de tipo local y únicamente tendrán repercusiones sobre la región afectada y sus respectivas vecinas de primer y segundo orden.24 Supongamos ahora que el modelo incorpora una estructura autorregresiva en el error, de manera que: (20) En este caso, la matriz de varianzas y covarianzas de y tiene la siguiente expresión: (21) una matriz completa a partir de la cual se puede observar como, aunque el shock afecte inicialmente sólo a una región, dicho efecto cruzará las fronteras de las demás regiones, teniendo por tanto un carácter global.25 En este último caso, la interacción derivada es mucho mayor que en el caso de una estructura media. 24. Obviamente, bajo el supuesto que W sea una matriz de contigüidad de primer orden. Esta explicación se hace extensiva al caso de dependencia espacial sustantiva dado que la matriz de varianzas y covarianzas de y dada en (21) coincide con la expresión de dicha matriz cuando está presente un retardo espacial de la variable endógena. 25.

(22) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 21. móvil, con una intensidad decreciente a medida que la distancia que separa a cada par de regiones incrementa. Por último, cabe destacar que Kelejian y Robinson (1993, 1995) hacen una evaluación crítica de la estructura espacial autorregresiva del error, sugiriendo en su lugar el denominado modelo de componentes del error espacial. Éste consiste en un término de error correspondiente a cada región que está integrado por dos vectores: uno, que recoge un shock específico regional y, el otro, que es el resultado de una combinación lineal de shocks generados en otras regiones que afectan a una región i concreta (spillovers espaciales), la cual vendrá determinada por la matriz de pesos W especificada. Es decir, ε = Wυ+ ψ. (22). donde ψ y υ son dos vectores estocásticos independientes (no necesariamente distribuidos según una normal), siendo ψ el vector que recoge los shocks específicos de cada región. De esta forma, si consideramos que: (23). tendremos que: (24) donde. y. . En este caso, siempre que. los elementos de ε no. estarán correlacionados, mientras que si al menos algunos elementos del 26 término de error ε sí lo estarán (siempre que WW’ no sea diagonal). 4.3. Contrastación de la dependencia espacial Recuperando la distinción efectuada en el apartado 4.2 entre autocorrelación espacial sustantiva y autocorrelación espacial residual como nuisance, seguidamente se presenta una amplia batería de estadísticos espaciales existentes para contrastar las anteriores estructuras. 26. Kelejian y Robinson (1995) derivan la expresión para el coeficiente de correlación para cada par de elementos i y j de ε. En este sentido, muestran como dicho coeficiente de correlación decrece a medida que incrementa el ratio. , es decir, a medida que el shock específico regional tiene una mayor importancia en relación con. los shocks procedentes de otras regiones..

(23) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 22. 4.3.1. Contrastación de la existencia de dependencia espacial residual Partiendo del siguiente modelo de regresión lineal (25) la existencia de autocorrelación espacial residual es habitualmente contrastada mediante alguno de los cuatro estadísticos siguientes: la I de Moran, el test de KR y los contrastes basados en el principio de los multiplicadores de Lagrange, LM-ERR y LM-EL.27 1) El test I de Moran (Cliff y Ord, 1972, 1973) presenta la siguiente expresión: (26) donde e es el vector de residuos mínimo cuadrático ordinarios (MCO) de un modelo de regresión lineal como el especificado en (25), N el tamaño muestral y S la suma de todos los elementos wij de la matriz de pesos. En un contexto asintótico y bajo el supuesto de residuos incorrelacionados, el estadístico I de Moran, debidamente estandarizado, se distribuye según la normal estándar. Con relación a los momentos de primer y segundo orden, éstos pueden obtenerse a partir de las expresiones siguientes: (27) (28) donde M es una matriz idempotente, M= I - X(X'X)-1 X'. ii) El test K-R (Kelejian y Robinson, 1992) se deriva de una regresión auxiliar en la que se usan los productos cruzados de los residuos de las observaciones que están potencialmente correlacionadas espacialmente (según el esquema de la matriz de pesos) y los productos cruzados de las. 27. Tras sopesar las ventajas e inconvenientes de utilizar la denominación española o anglosajona de los contrastes basados en el principio de multiplicadores de Lagrange, hemos preferido utilizar esta última con la finalidad de facilitar la identificación de los mismos. De esta forma, hablaremos de los tests LM..

(24) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 23. variables explicativas correspondientes a dichas observaciones. De forma concreta, la variable dependiente en la regresión auxiliar es: (29) donde h es un índice para cada producto cruzado, e es el término residual, mientras que i y j son las observaciones contiguas. Las variables explicativas en la regresión auxiliar, Zh, están formadas por los productos cruzados de Xi y Xj. Considerando γ el vector de coeficientes obtenido de la estimación MCO en una regresión de C en Z, y α el vector asociado de residuos, el estadístico de K-R resultante tiene la siguiente expresión: (30) donde hR es el número de observaciones en el vector auxiliar. El estadístico se distribuye como una χ2 con K grados de libertad, donde K es el número de variables explicativas en Z. iii) El test LM-ERR (Burridge, 1980) se obtiene a partir de la siguiente expresión: (31) donde e es nuevamente el vector de residuos MCO de la regresión (25), T1=traza(W’W+W2) y s2 la estimación de la varianza residual de dicho modelo. En concreto, y a diferencia del anterior contraste, el test LM-ERR se distribuye según una χ2 con un grado de libertad. iv) El test LM-EL (Bera y Yoon, 1992) se calcula como: (32). donde M es la matriz idempotente ya definida y RJρ2 -1 β=[T1+(WXβ)’M(WXβ)/s ] . De igual forma que en el caso anterior, el test LM-EL se distribuye según una χ2 con un grado de libertad. En concreto, si bien el estadístico LM-EL es similar al definido en (31), éste.

(25) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 24. presenta la ventaja adicional de ser robusto ante posibles especificaciones erróneas locales como la presencia de una variable endógena retardada espacialmente. Con relación a los cuatro estadísticos analizados, cabe destacar que todos ellos comparten una misma hipótesis nula, la ausencia de dependencia espacial en el término de perturbación. Sin embargo, si bien los estadísticos LM-ERR y LMEL presentan una hipótesis alternativa específica, esto es, la existencia de un esquema autorregresivo/media móvil de primer orden en el término de perturbación (expresión 14), no ocurre lo mismo con los estadísticos I de Moran y K-R, los cuales no tienen una hipótesis alternativa claramente definida. Esto lleva a que ambos estadísticos presenten un escaso poder para discriminar entre la existencia de un esquema de autocorrelación espacial residual o sustantiva. Asimismo, se ha de hacer notar que los tests LM-ERR y LM-EL están basados en el principio de los multiplicadores de Lagrange y son obtenidos a partir de la estimación del modelo bajo la hipótesis nula correspondiente. En este sentido, si bien podrían derivarse de forma similar contrastes de autocorrelación espacial basados en los tests de Wald o de razón de verosimilitud (Cliff y Ord, 1973 y 1981; Brandsman y Ketellapper, 1979; Anselin, 1980; Upton y Flingleton, 1985), el requerimiento en estos últimos de la compleja estimación del modelo bajo la hipótesis alternativa dota a los contrastes LM de una importante ventaja, quedando justificada así su mayor utilización. Por otra parte, es preciso destacar que, a excepción del test K-R, tanto la I de Moran como los contrastes basados en el principio de multiplicadores de Lagrange requieren la normalidad del término de perturbación así como de la linealidad del modelo de regresión.28 Asimismo, cabe mencionar que el hecho de que la expresión del test LM-ERR sea igualmente válida para contrastar la existencia de una estructura autorregresiva o media móvil en el término de error (de manera que es localmente óptimo para ambas hipótesis alternativas) imposibilita utilizar dicho contraste para discriminar entre ambas hipótesis alternativas (Anselin y Bera, 1998).29 Por último, cabe señalar que únicamente se han mostrado los tests válidos para contrastar la existencia de autocorrelación espacial bajo el supuesto de 28. No obstante, la expresión derivada para el contraste LM-ERR no variaría aun bajo el supuesto de no linealidad del modelo. En cualquier caso, cabe destacar la escasa atención que se ha prestado al estudio del comportamiento de los contrastes de autocorrelación espacial en el caso de que los modelos no sean lineales, así como a la construcción de contrastes de autocorrelación especialmente diseñados para dichas situaciones (ver Graaff et al, 1998). 29 Habida cuenta de la no disponibilidad de métodos que permitan discriminar claramente entre la existencia de una estructura autorregresiva o media móvil, Mur (1999) propone una estrategia de identificación, basada en el cálculo de contrastes de mutiplicadores de Lagrange, que permite detectar la estructura de dependencia correcta..

(26) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 25. errores homoscedásticos y ausencia de regresores endógenos. De esta forma, el incumplimiento de dichos supuestos resta validez a los anteriores contrastes. En este sentido, Anselin (1988b) propone un test de multiplicadores de Lagrange para contrastar la dependencia espacial residual cuando está presente un retardo espacial de la variable endógena, mientras que Anselin y Kelejian (1997) proponen un contraste LM-ERR válido ante regresores endógenos diferentes del retardo espacial de la variable endógena. De igual forma, en Anselin (1988a) se muestra el contraste de multiplicadores de Lagrange para el error en el caso de existencia de un término de perturbación heteroscedástico.30 Por último, Anselin (1988b, 1994) propone un test SARMA basado en el principio de multiplicadores de Lagrange para contrastar la presencia simultánea de un retardo espacial de la variable endógena y de una estructura media móvil espacial en el término de error. 4.3.2. Contrastación de la existencia de dependencia espacial sustantiva Partiendo del mismo modelo de regresión lineal especificado en (25), la omisión errónea de un retardo espacial de la variable endógena puede ser contrastada por medio de los tests basados en el principio de multiplicadores de Lagrange, el test LM-LAG y el LM-LE. i) El test LM-LAG (Anselin, 1988b) presenta la siguiente expresión: (33) donde nuevamente e es el vector de residuos MCO del modelo (25), manteniéndose el significado en el resto de elementos. El test LM-LAG se distribuye según una χ2 con un grado de libertad.31 30. Kelejian y Robinson (1998) sugieren la utilización de un nuevo estadístico, denominado KR-SPHET, válido para contrastar la ausencia de autocorrelación espacial y/o heteroscedasticidad en el término de error. Tras un ejercicio de simulación concluyen en el mayor poder de dicho contraste sobre estadísticos como la I de Moran y aquéllos basados en el principio de multiplicadores de Lagrange cuando la heteroscedasticidad es importante y la dependencia espacial es leve. 31 A diferencia de lo que ocurre con el test LM-ERR, si bajo la hipótesis nula el modelo no fuera lineal el test LM-LAG dado en (33) no sería correcto, habiendo de ser substituido por la siguiente expresión (Moreno et al, 1998):. donde e*=. es el vector de residuos de la estimación no lineal bajo la hipótesis nula y ,. con. es la matriz (NxK) de pseudo-regresores y .. y el estimador no lineal.. ,. donde.

(27) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 26. ii) El test LM-LE (Bera y Yoon, 1992) se puede calcular como: (34) manteniéndose el mismo significado en los elementos que el definido para los estadísticos anteriores. Dicho contraste se distribuye según una χ2 con un grado de libertad. Asimismo, y de forma similar a lo ocurrido en el caso del contraste LM-EL, el test LM-LE presenta la ventaja adicional respecto el test LM-LAG de ser robusto ante posibles especificaciones erróneas locales, como la existencia de un término de perturbación correlacionado espacialmente.32 En ambos casos, la hipótesis alternativa corresponde al modelo definido en (13):. es decir, HA: ρ≠0, frente a la hipótesis nula de H0: ρ=0. De igual forma que en el caso de los estadísticos LM-ERR y LM-EL, los tests LM-LAG y LM-LE están basados en el principio de multiplicadores de Lagrange, mostrando por tanto propiedades asintóticas y requiriendo la normalidad del término de perturbación. 4.3.3. Comportamiento de los contrastes de autocorrelación espacial en un contexto finito Tras analizar la batería de tests presentes en la literatura válidos para contrastar la presencia de dependencia espacial, es preciso destacar que uno de los aspectos que caracteriza a dichos estadísticos es que todos ellos se basan en propiedades asintóticas, de manera que su traslación a un contexto finito puede conllevar problemas. Asimismo, a excepción del test de K-R, el resto de contrastes se basan en la normalidad del término de perturbación, pudiendo no comportase correctamente cuando dicha asunción no se cumple. Teniendo ello en cuenta, han sido algunos los trabajos en los que, a partir de ejercicios de simulación de Monte Carlo, han tratado de analizar el poder y tamaño de los citados contrastes en muestras finitas, así como las consecuencias que sobre ellos puede tener una alteración de la distribución normal del término de 32. En este sentido, Anselin y Bera (1998) proponen un contraste de multiplicadores de Lagrange para detectar un retardo espacial de la variable endógena en presencia de un término de error autocorrelacionado espacialmente..

(28) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 27. perturbación o una especificación errónea de la matriz de contactos utilizada. Así, cabría destacar los trabajos de Mur (1990, 1992), Anselin y Rey (1991), Florax y Folmer (1992, 1994), Anselin y Florax (1995b), Anselin et al (1996) y Florax y Rey (1995). De forma muy breve, las principales conclusiones que se extraen de dichos estudios pueden resumirse en los siguientes puntos: • Las propiedades de los contrastes son sensibles a la elección de la matriz de contactos. Así, tanto la distribución bajo la hipótesis nula de dichos contrastes como la frecuencia de rechazo de la hipótesis nula en presencia de dependencia espacial varían notablemente en función de la matriz de pesos elegida. • Elevado poder de la I de Moran contra cualquier hipótesis formulada de dependencia espacial, si bien esta circunstancia disminuye su utilidad para discriminar entre diferentes hipótesis alternativas (dependencia espacial residual y sustantiva). Por ello, los tests basados en el principio de los multiplicadores de Lagrange aparecen como mejores para elegir entre un tipo de autocorrelación u otro. A su vez, para cualquier tamaño muestral, salvo para muestras pequeñas, el test LM-LAG utilizado para contrastar la presencia de un retardo espacial de la variable endógena presenta un poder más elevado que los tests I de Moran y LM-ERR utilizados para detectar una estructura espacial del error. Este resultado es importante dado que las consecuencias para la estimación MCO de obviar erróneamente un retardo espacial de la variable endógena (sesgadez e inconsistencia) son más graves que las que aparecen tras obviar una estructura de dependencia en el error (ineficiencia). • La alteración de la distribución normal del error tiene escasas consecuencias sobre el poder de los tests, si bien los contrastes del error se ven más afectados por dicha alteración que los tests de la endógena retardada (subrechazando la hipótesis nula). En general, los tests analizados presentan mayor poder contra alternativas autorregresivas que contra estructuras medias móviles, sobre todo en muestras pequeñas. • Escaso poder del test K-R, explicado por los reducidos tamaños muestrales analizados que no le permiten alcanzar sus propiedades asintóticas. • Buen comportamiento de los tests robustos LM-EL y LM-LE, en especial de este último, resultando escasamente penalizados cuando su utilización es innecesaria y mostrando un poder prácticamente indistinguible entre ellos y sus tests análogos no robustos para tamaños muestrales elevados..

(29) FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno. 28. A su vez, la utilidad de estos tests robustos aumenta cuando se combinan con los tests LM-ERR y LM-LAG. 4.4. Estimación en presencia de dependencia espacial Tras analizar los estadísticos válidos para contrastar la existencia de autocorrelación espacial en un modelo de regresión y antes de analizar los métodos de estimación adecuados en presencia de dicha dependencia espacial, cabe mencionar brevemente las consecuencias derivadas de la autocorrelación espacial en la estimación habitual por MCO. Para ello, es preciso discernir si la dependencia espacial presente es sustantiva o residual. Por lo que hace referencia a las consecuencias de la presencia de residuos correlacionados espacialmente en la estimación MCO, éstas son similares a las conocidas en el contexto temporal (Hordijk, 1979; Cliff y Ord, 1981; Kramer y Donninger, 1987; Anselin y Griffith, 1988). Así, si bien las estimaciones de los parámetros seguirán siendo insesgadas, sin embargo serán ineficientes dado que la matriz de varianzas y covarianzas del término de perturbación será no esférica: E[εε’] = σ2Ω=σ2 (I-λW)-1 (I-λW)’-1 =σ2[(I-λW)’ (I-λW)]-1. (35). Esto llevará a que la varianza de las estimaciones MCO de β se encuentre sobrestimada en comparación con la obtenida tras aplicar Mínimos Cuadrados Generalizados (MCG) a la expresión (14) (conocido el valor de λ A su vez, la varianza residual será sesgada y estará subestimada (sobre todo en presencia de autocorrelación positiva), siendo las predicciones MCO ineficientes. Todo ello llevará a que la inferencia basada en los tests de significación de la t-student y en el coeficiente de determinación R2 sea sesgada. Asimismo, esto afectará a la validación de un número importante de contrastes utilizados para detectar especificaciones erróneas como, por ejemplo, los tests de inestabilidad estructural como el test de Chow, o los tests de heteroscedasticidad.33 Si bien las consecuencias de la presencia de residuos autocorrelacionados espacialmente no difieren de forma importante de lo que ocurre en el contexto temporal, no ocurre lo mismo cuando el problema de la autocorrelación espacial 33. Anselin (1987) demuestra como el incumplimiento de la hipótesis de independencia en el término de perturbación lleva a que la frecuencia de rechazo empírica del test de Glesjer y el de Breusch y Pagan sobrepase de forma importante sus correspondientes niveles de significación nominales, al contrario de lo que ocurre con el test de White. Resultados similares son obtenidos por Anselin (1990) para el test de Chow. Ver Anselin (1988a, 1988b y 1990), para una adaptación de los test de Chow y de Breusch-Pagan en presencia de dependencia espacial residual..