ANEXO 1. ANÁLISIS DE FACTORES EXPLICATIVOS DEL
2. ÁREA DE ESTUDIO Y DATOS
La Comunidad de Madrid se localiza en el centro de España y limita con las provincias de Guadalajara, Cuenca, Toledo, Ávila y Segovia (Figura 1). Se encuentra conformada por 179 municipios en una extensión territorial de 8.025 km2. Su población estimada es de aproximadamente 6 millones de habitantes, gran parte de la cual se concentra en el área metropolitana, aunque a partir de la década de 1990 se evidenciaron fuertes procesos de descentralización hacia algunos municipios del oeste, norte y sureste de la región.
En este contexto la Comunidad de Madrid se consolida como uno de los territorios de mayor dinamismo del arco mediterráneo, con un crecimiento de las superficies artificiales aproximado del 48 % durante la década de los 90, muy por encima del 25% de crecimiento medio registrado en el territorio nacional y del 5,4% de la Unión Europea (EEA, 2006; OSE, 2006). En este sentido las zonas urbanas han aumentado en 14.310 ha, de las cuales el 80 % corresponde al tejido urbano discontinuo.
Figura 1. Crecimiento urbano en la Comunidad Autónoma de Madrid (1990-2000) Fuente. Elaboración propia a partir del CLC1990 y 2000. Instituto Geográfico Nacional, España La elección de las variables o factores explicativos de este fenómeno de expansión urbana se realizó tomando en consideración la literatura existente sobre este tipo de análisis y la disponibilidad de información de la región para llevarlo a cabo. De este modo, como variables explicativas, y tomando como referencia el año 1990, se recopiló información de hasta 31 variables diferentes de tipo socioeconómico, político, de planificación, proximidad/accesibilidad y de tipo biofísico (Tabla 1).
Las unidades de observación empleadas en este trabajo son los municipios madrileños. Las razones para utilizar este tipo de unidad de observación son las siguientes:
La dinámica de la ocupación del suelo (y más en concreto el crecimiento urbano) se puede suponer que responde, como mínimo, a dos tipos de influencias: en primer lugar las características físicas del terreno: seguramente, en un terreno muy elevado y con mucha pendiente, no es adecuado ni demasiado rentable la construcción de nuevas zonas residenciales. Este tipo de influencias se deben medir a un nivel de mucho detalle espacial ya que estas características pueden variar rápidamente en el territorio. Por ello, en la literatura sobre el tema es muy habitual encontrar estudios que emplean como unidad de observación el píxel, normalmente de un tamaño muy reducido y, por lo tanto, adecuado para observar estas variables explicativas.
Tabla 1. Descripción de las variables dependientes e independientes utilizadas en el ajuste del modelo. Todas las variables que miden crecimientos o cambios se refieren al periodo 1990-2000. Las variables que muestran un valor se refieren al
año 1990. Tipo de Variable Nombre de la variable Descripción
GEUL Crecimiento de la categoría estructura urbana laxa (%)
GUEA Crecimiento de la categoría urbanizaciones exentas y/o ajardinadas (%) GZIC Crecimiento de la categoría zonas industriales y comerciales (%) GZC Crecimiento de la categoría zonas en construcción entre (%) Crecimiento
de zonas Urbanas
G4 Crecimiento de la categoría 4 categorías anteriores (%) DensPob Densidad de población (1990)
CrecPob Incremento Población
CrecEmp Incremento Empleos
PIncrViv Incremento de número de viviendas (%) PIncrRenBruta Incremento de renta bruta (%)
DensCar Densidad de carreteras (todas) Socio-
económicas
Denscarnaco Densidad de carreteras Nacionales y regionales Purbaniza Porcentaje de superficie urbanizable
Planificación
Pcom Porcentaje de suelo no urbanizable común
Pvotoizq Porcentaje de votos obtenidos por los partidos de izquierda en 19951 Políticas
Ayunizq Ayuntamientos potencialmente gobernados por partidos de izquierda2 DMCar Distancia Media a Carreteras
DMcarnaco Distancia media a carreteras Nacionales y regionales DMHosp Distancia Media a Hospitales de referencia
DMCom Distancia Media a grandes superficies comerciales DMUniv Distancia Media Universidades
DMInstND Distancia Media Instalaciones no deseables
DMBosq Distancia Media a Bosque
DMHid Distancia Media a hidrografía
DMANaturs Distancia Media a áreas naturales protegidas Proximidad/
Accesibilidad
DistCentNeg Distancia media al CBD de Madrid PPCVBosq % de píxeles en la cuenca visual de bosques PPCVHum % de píxeles en la cuenca visual de humedales PPANatur % de píxeles de espacios naturales protegidos
PPCVANatur % de píxeles en la cuenca visual de espacios naturales protegidos PPOSur % de píxeles con orientación Sur-suroeste
PPCPMe3 % de píxeles con pendiente < 3% PPCPe3y6 % de píxeles con pendiente entre 3 – 6% PPCAMe800 % de píxeles con altitud entre 0 – 800 metros. PPCAe801y1000 % de píxeles con altitud entre 801 - 1000 metros. Biofísicas
PPCAMa1201 % de píxeles con altitud entre 1001- 1200 metros.
1
Porcentaje de votos a Izquierda Unida y PSOE 2
Ayuntamientos en los que la suma de los votos a Izquierda Unida y PSOE supera el 45%.
Un segundo tipo de influencias sobre el crecimiento urbano son las características sociales y económicas y, también, los hechos legales y administrativos que inciden en donde es más rentable construir y donde es posible hacerlo desde el punto de vista legal. ¿En qué tipo de unidades espaciales es mas adecuado medir este tipo de influencias explicativas del crecimiento urbano?, seguramente es razonable contestar que, en España, en los municipios. Estas divisiones administrativas tienen una dinámica económica peculiar y particular derivada de la existencia de un gobierno municipal que, con diversos procedimientos puede impulsar, en mayor o menor grado, el crecimiento económico y la construcción más o menos importante de nuevas zonas residenciales. En este trabajo vamos a emplear este segundo tipo de unidades espaciales, de observaciones, pero, como se verá, en ellas vamos a medir no solo las variables sociales y legales que consideramos pertinentes, sino también las variables físicas, aunque estas últimas se miden de un modo bastante aproximado mediante valores promedio de todo el territorio municipal.
3. METODOLOGÍA
3.1. Regresión lineal múltiple
Se establecieron un total de 5 variables dependientes (las cuatro categorías mencionadas en el apartado anterior, ver figura 1, y una quinta resultado de sumar todas ellas, G4), expresadas como porcentaje de crecimiento respecto a la superficie total de cada municipio. Analizadas estas variables, se procedió a su normalización a través de una transformación logarítmica de la forma (Menard, 2002, p. 77; Montgomery et al, 2005, p. 156), debido a que una gran cantidad de municipios no presentaba valores de crecimiento urbano lo cual ocasionaba problemas de no normalidad de la distribución de frecuencias.
) 1 (y
Ln i
Una vez recopiladas todas las variables independientes se realizó un análisis de correlación, omitiendo una de cada dos que presentaban correlaciones bivariadas mayores de 0,8, con el fin de disminuir posibles problemas de multicolinealidad (Cheng y Masser, 2003; Bocco et al, 2000).
A continuación, se procedió al ajuste de 5 modelos de regresión lineal múltiple (uno para cada variable dependiente), introduciendo en cada uno de ellos un número de casos igual al total de municipios (N = 179). La presencia de multicolinealidad se certificó a través del índice de tolerancia y del factor de inflación de la varianza (FIV)3 y la autocorrelación con el estadístico de Durbin-Watson (DW)4.
Los modelos lineales de regresión múltiple tienen la siguiente forma: u X X Y 0 1 1...n n Los coeficientes1,...n n X . ...
muestran la magnitud del efecto que las variables explicativasX1 tienen sobre la variable explicada Y. El coeficiente 0 es el término constante del modelo y u el término del error del modelo.
Como medida de calidad de ajuste del modelo se utilizó el coeficiente de determinación corregido R2, de tal forma que cuanto mayor sea el coeficiente de determinación, mejor será el modelo.
3.2. Regresión por mínimos cuadrados parciales
Para salvar los inconvenientes que plantea el uso del RLM, se han desarrollado metodologías basadas en la eliminación de variables independientes (métodos de selección de variables), o basadas en la reducción de la dimensionalidad de las variables a través de factores o componentes principales.
Estas metodologías tienen problemas: las primeras podrían eliminar variables fundamentales para la explicación del cambio, mientras que en las segundas es posible que los componentes o factores seleccionados expliquen sustancialmente la variabilidad de las variables independientes X, pero eso no garantiza que sean relevantes al explicar la variable dependiente Y .
3
Índices de Tolerancia menores que 0,2 y FIV mayores a 5 son indicios de problemas de multicolineali- dad; un Índices de Tolerancia menores a 0,1 y FIV mayores a 10 se manejan como posibles causas de multicolinealidad (Menard, 2002, p. 77).
4
Para detectar problemas de autocorrelación se puede adoptar la regla, no demasiado rigurosa, de que si DW = 0 hay autocorrelación perfecta positiva; si DW se aproxima a 2 no hay autocorrelación y si DW se aproxima a 4 hay autocorrelación perfecta negativa
La metodología PLS, busca un conjunto de factores o variables latentes que ajusten una descomposición simultanea de X y Y bajo la condición de que éstos expliquen tanto como sea posible la covarianza entre X y Y y que dicha descomposición sea eficaz para ajustar a Y (Alciaturi et al, 2005; Aguilera Aguilera y Garrido Frenich, 2001; Wold et al, 2001; Yang et al, 2007).
Básicamente, el modelo PLS se establece como una representación de la matriz X en términos de los factores T mediante la siguiente expresión:
e P T
X T
Siendo PT la matriz transpuesta de P (pesos de los factores).
Y la relación entre las variables dependientes Y y los factores T se establece por: f
b T
Y
Consecuentemente la matriz de variables independientes X queda expresada por la matriz de factores T con un error (e) determinado en función del número de factores seleccionados. No obstante, si el modelo incluye todos los factores resultantes de las combinaciones lineales el error sería cero (e = 0).
Asimismo los coeficientes de los factores b son obtenidos de modo que se minimice el error f.
Existen diferentes procedimientos, basados en procesos iterativos, para determinar la relación entre los factores T y la variable respuesta Y. Con ellos es posible obtener los coeficientes PLS a través del siguiente modelo de regresión lineal múltiple:
e B X Y PLS . Donde: T T PLS P B C B ( )1
Por consiguiente si se toman en cuenta todos los factores al obtener los coeficientes
PLS
, éstos pueden ser comparados con los coeficientes derivados del modelo de regresión lineal múltipleRLM. Es posible determinar la cantidad total de varianza
explicada por los modelos a través del coeficiente R2.