• No se han encontrado resultados

Estudio pormenorizado de las variables mejor correlacionadas

Del estudio completo de las relaciones de los valores de los distintos contaminantes con las variables características de la escala local, cabe concluir que el contaminante que parece presentar una variabilidad local mejor correlacionada es el NO2. Los valores medios de NO2 correlacionan bien (p-valor

menor que 0,05) con 7 de las 10 variables seleccionadas. Los valores máximos de NO2 correlacionan bien con 8 de estas variables.

De entre todas las variables características de la escala local, los mejores resultados para el NO2 se han obtenido con la consideración de los patrones de

uso del suelo en la misma escala local (Indicador β), siendo la correlación lineal de 0,89 para los dos valores de NO2 considerados. También arroja bastante

buenos resultados la variable 4, logaritmo en base 10 del promedio de las emisiones de un área de influencia de 2 Km de radio con centro en la estación de monitorización, con una correlación lineal de 0,71 con la concentración promedio diaria de NO2 y de 0,77 con la concentración promedio de los valores

máximos horarios de NO2.

Si se realiza un estudio estadístico en profundidad de la correlación de la concentración promedio diaria de NO2 con ambas variables (4 y 5) se observa que

los mejores resultados se obtienen con la variable 5 (indicador β) y con modelos no lineales.

Regresión simple lineal (Y = a + b*X)

Variable dependiente (Y): Media NO2 2005-2011

Variable independiente (X): LOG10 (Emisiones

promedio buffer 2 Km)

Variable dependiente (Y): Media NO2 2005-

2011

Variable independiente (X): Beta

Gráfico del Modelo Ajustado

Media NO2 2005_2011 = -118,933 + 27,5237*LOG10(Emisiones promedio buffer 2Km)

4 4,4 4,8 5,2 5,6 6 6,4 LOG10(Emisiones promedio buffer 2Km) 0 20 40 60 80 Me d ia N O 2 20 05 _2 01 1

Gráfico del Modelo Ajustado Media NO2 2005_2011 = 5,70427 + 147,945*Beta

0 0,1 0,2 0,3 0,4 Beta 0 20 40 60 80 Me d ia N O 2 20 05 _2 01 1 p-valor = 0,0000 Coeficiente de Correlación = 0,714229 R-cuadrado = 51,0123 %

R-cuadrado (ajustado para g.l.) = 49,5715 % Error estándar del estimado = 11,4353

Error absoluto medio = 9,0743

Estadístico Durbin-Watson = 1,18802 (P=0,0050)

p-valor = 0,0000

Coeficiente de Correlación = 0,885175

R-cuadrado = 78,3535 %

R-cuadrado (ajustado para g.l.) = 77,7169 % Error estándar del estimado = 7,60147

Error absoluto medio = 5,89123

Estadístico Durbin-Watson = 1,80429 (P=0,2467)

En las figuras se muestran los resultados de ajustar un modelo lineal para describir la relación entre la concentración promedio de la media diaria de NO2

del periodo 2005-2011 y las variables 4 (logaritmo de las emisiones de un área de influencia de 2 Km alrededor de la estación de monitorización) y 5 (indicador de uso del suelo β).

En ambos casos, el p-valor es menor que 0,05, luego existe una relación estadísticamente significativa entre variables, con un nivel de confianza del 95,0%. El coeficiente de correlación indica también una relación moderadamente fuerte entre las variables en ambos casos, aunque mejor con la variable 5 (0,88). El estadístico R-Cuadrado (R2) indica que el modelo ajustado explica en un 51%, en el primer caso, y en un 78%, en el segundo, la variabilidad en la concentración promedio de la media diaria de NO2.

El error estándar del estimado indica que la desviación estándar de los residuos es 11,4353 y 7,60147, para las variables 4 y 5 respectivamente.

El error absoluto medio (MAE) es el valor promedio de los residuos en valor absoluto y el estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay dependencia significativa entre ellos. Si el p-valor es menor que 0,05, hay indicación de una posible correlación serial con un nivel de

confianza del 95,0%. Para ver si hay algún patrón que pueda detectarse, se han representado gráficamente los residuos versus el número de fila, como se muestra a continuación.

Gráfico de Residuos

Media NO2 2005_2011 = -118,933 + 27,5237*LOG10(Emisiones promedio buffer 2Km)

0 10 20 30 40 número de fila -2,5 -1,5 -0,5 0,5 1,5 2,5 Re d id u o E st u d en ti za d o Gráfico de Residuos

Media NO2 2005_2011 = 5,70427 + 147,945*Beta

0 10 20 30 40 número de fila -3 -2 -1 0 1 2 3 Re d id u o E s tu d e n ti za d o

Fila Residuos Estudentizados

2 2,28

36 -2,23

Fila Residuos Estudentizados

7 -2,88

25 2,35

La tabla de residuos atípicos enlista todas las observaciones que tienen residuos Estudentizados mayores que 2, en valor absoluto. Los residuos Estudentizados miden cuántas desviaciones estándar se desvía cada valor observado de Media NO2 2005-2011 del modelo ajustado, utilizando todos los datos excepto esa

observación. En ambos casos, hay 2 residuos Estudentizados mayores que 2, pero ninguno mayor que 3. Los residuos corresponden a las estaciones 2UT (2), estación urbana situada en el municipio de Madrid, 7SF (7), estación suburbana del municipio de Madrid, 25UT (25), estación urbana de tráfico situada al sur del área metropolitana de Madrid, y 36RF (36), estación rural situada en el sureste de la Comunidad de Madrid. Por último, mencionar que los gráficos de residuos mostrados no permiten detectar heterocedasticidad en este modelo, por lo que cabe esperar que la varianza residual sea constante (homocedasticidad).

Como se observa en el análisis, el modelo lineal es bastante buen descriptor de la relación entre la concentración promedio diaria de NO2 y las variables 4 y 5,

principalmente con el indicador β (variable 5). No obstante, se han analizado también otros modelos no lineales para describir la relación entre la concentración promedio diaria de NO2 y las variables 4 y 5, con los que se

obtienen mejores correlaciones, aunque con mayor número de residuos atípicos, alguno de ellos con valores Estudentizados mayores que 3. A continuación se muestran los resultados de dos de los modelos no lineales estudiados (Inversa-Y Log-X y Exponencial).

Regresión simple no lineal (Inversa-Y Log-X: Y = 1/(a + b*ln(X)))

Variable dependiente (Y): Media NO2 2005-2011

Variable independiente (X): LOG10 (Emisiones

promedio buffer 2 Km)

Variable dependiente (Y): Media NO2 2005-

2011

Variable independiente (X): Beta

Gráfico del Modelo Ajustado

Media NO2 2005_2011 = 1/(0,818454 - 0,451021*ln(LOG10(Emisiones promedio buffer 2Km)))

4 4,4 4,8 5,2 5,6 6 6,4 LOG10(Emisiones promedio buffer 2Km) 0 20 40 60 80 Me d ia N O 2 20 05 _2 01 1

Gráfico del Modelo Ajustado

Media NO2 2005_2011 = exp(1,6947 + 4,05384*sqrt(Beta))

0 0,1 0,2 0,3 0,4 Beta 0 20 40 60 80 Me d ia N O 2 2 0 0 5 _ 2 0 1 1 p-valor = 0,0000 Coeficiente de Correlación = -0,856737 R-cuadrado = 73,3998 porciento

R-cuadrado (ajustado para g.l.) = 72,6174 % Error estándar del est. = 0,0225114

Error absoluto medio = 0,0151906

Estadístico Durbin-Watson = 2,27148 (P=0,7981)

p-valor = 0,0000

Coeficiente de Correlación = 0,926559

R-cuadrado = 85,8512 porciento

R-cuadrado (ajustado para g.l.) = 85,4351 % Error estándar del est. = 0,251412

Error absoluto medio = 0,195197

Estadístico Durbin-Watson = 1,90421 (P=0,3629)

Gráfico de Residuos

Media NO2 2005_2011 = 1/(0,818454 - 0,451021*ln(LOG10(Emisiones promedio buffer 2Km)))

4 4,4 4,8 5,2 5,6 6 6,4 LOG10(Emisiones promedio buffer 2Km) -4 -2 0 2 4 Re d id u o E st u d en ti za d o Gráfico de Residuos

Media NO2 2005_2011 = exp(1,6947 + 4,05384*sqrt(Beta))

0 0,1 0,2 0,3 0,4 Beta -3 -2 -1 0 1 2 3 Re d id u o E st u d en ti za d o

Fila Residuos Estudentizados 17 -2,41

30 3,81 32 2,68

Fila Residuos Estudentizados 7 -2,08

25 2,24 30 -2,02 35 2,57

Regresión simple no lineal (Exponencial: Y = exp(a + b*X))

Variable dependiente (Y): Media NO2 2005-2011

Variable independiente (X): LOG10 (Emisiones

promedio buffer 2 Km)

Variable dependiente (Y): Media NO2 2005-

2011

Variable independiente (X): Beta

Gráfico del Modelo Ajustado

Media NO2 2005_2011 = exp(-3,85133 + 1,29647*LOG10(Emisiones promedio buffer 2Km))

4 4,4 4,8 5,2 5,6 6 6,4 LOG10(Emisiones promedio buffer 2Km) 0 20 40 60 80 Me d ia N O 2 2 00 5_ 20 11

Gráfico del Modelo Ajustado Media NO2 2005_2011 = exp(2,17164 + 6,19297*Beta)

0 0,1 0,2 0,3 0,4 Beta 0 20 40 60 80 Me d ia N O 2 20 05 _2 01 1 p-valor = 0,0000 Coeficiente de Correlación = 0,822377 R-cuadrado = 67,6305 %

R-cuadrado (ajustado para g.l.) = 66,6784 % Error estándar del est. = 0,380273

Error absoluto medio = 0,297223

Estadístico Durbin-Watson = 1,68597 (P=0,1700)

p-valor = 0,0000

Coeficiente de Correlación = 0,905741

R-cuadrado = 82,0367 %

R-cuadrado (ajustado para g.l.) = 81,5083 %

Error estándar del est. = 0,283283

Error absoluto medio = 0,198975

Estadístico Durbin-Watson = 2,18724 (P=0,6877)

Gráfico de Residuos

Media NO2 2005_2011 = exp(-3,85133 + 1,29647*LOG10(Emisiones promedio buffer 2Km))

4 4,4 4,8 5,2 5,6 6 6,4 LOG10(Emisiones promedio buffer 2Km) -3 -2 -1 0 1 2 3 Re di duo E s tude nt iz a do Gráfico de Residuos

Media NO2 2005_2011 = exp(1,6947 + 4,05384*sqrt(Beta))

0 0,1 0,2 0,3 0,4 Beta -3 -2 -1 0 1 2 3 Re d id u o E st u d en ti za d o

Fila Residuos Estudentizados 30 -2,09

32 -2,80 36 -2,46

Fila Residuos Estudentizados 7 -2,34

8 2,03 20 -2,39 25 2,68 30 -2,03

Se observa que ambos modelos se ajustan al comportamiento de la calidad del aire y muestran correlaciones más altas que el modelo lineal, aunque existe un mayor número de residuos atípicos. Los residuos corresponden a las estaciones 7SF (7), 8UF (8), 17SF (17), 20RF (20), 25UT (25), 30RF (30), 26RF (32), 35RF (35)

y 36RF (36). En todos los casos, el p-valor asociado al estadístico Durbin-Watson es mayor que 0,05, por lo que no hay indicación de una autocorrelación entre los residuos con un nivel de confianza del 95,0%. En ambos casos, los gráficos de residuos mostrados permiten detectar heterocedasticidad en estos modelos. Del estudio estadístico realizado, cabe concluir que las variables que presentan una mejor correlación son los valores de NO2, tanto las concentraciones medias

como las máximas, con el indicador de uso del suelo β. Por ello, se ha seleccionado este indicador para la eliminación del carácter local de las medidas, de forma previa a su interpolación, en el modelo que se desarrolla en esta tesis.

Cabe citar que se han realizado también algunas pruebas para combinar el indicador β, con el que se tiene en cuenta el uso del suelo y la emisión esperable en los alrededores del punto de muestreo de la calidad del aire, con la altitud. Se ha probado la relación de los valores medios de concentración de NO2 del

periodo 2005 a 2011 como función de β y la altitud de las estaciones de monitorización (función de regresión múltiple). Las correlaciones obtenidas con estas aproximaciones son menores que si se considera únicamente el indicador β, probablemente porque no existen estaciones de monitorización en altura y las variaciones de altitud entre las 36 estaciones consideradas son pequeñas.

También se han realizado pruebas para considerar la dirección predominante y la velocidad media del viento en el cálculo del indicador β de los puntos de muestreo (estaciones de monitorización). Dado que se dispone de datos de velocidad media del viento y de rosas de los vientos del periodo 2005 a 2011 para cada estación de monitorización, se han realizado pruebas variando las formas del área de influencia (buffer) que se utiliza para el cálculo de β (ver apartado 5.5.1). En lugar de trazar un círculo regular de 2 km de radio con centro en el punto donde se sitúa la estación de monitorización, se ha probado a deformar ese círculo en la dirección del viento predominante una distancia proporcional a la velocidad media del viento registrada en dicha estación. A continuación se muestra, como ejemplo, la rosa de los vientos de la estación 25UT y el área de influencia de esta estación considerando la dirección predominante del viento desde el 1 de enero de 2005 hasta el 31 de diciembre de 2011, así como la velocidad media del viento en el mismo periodo temporal.

Figura 48. Rosa de los vientos en la estación 25UT durante el periodo 2005-2011. Fuente: Comunidad de Madrid.

La rosa de los vientos de la estación 25UT muestra, en %, el numero de horas que el viento ha soplado en una dirección determinada a lo largo del periodo comprendido entre el 1 de enero de 2005 hasta el 31 de diciembre de 2011. Se consideran 16 direcciones, resultado de dividir los 360º en partes iguales. También se muestra, en colores, la velocidad media del viento (en m/sg) en cada una de estas direcciones. Se observa que, en esta estación, predomina el viento de componente sureste, luego es posible que las emisiones de las fuentes situadas en el cuadrante noroeste de los alrededores del área de influencia tengan mayor repercusión en las concentraciones de contaminantes registradas en esta estación que las situadas en el resto del área.

Por otra parte, las velocidades medias del viento registradas en las estaciones de monitorización del territorio de estudio, la Comunidad de Madrid, varían entre 1,70 y 3,81 m/sg en el periodo 2005-2011. En la estación 25UT, la velocidad media del viento en dicho periodo es de 2,71 m/sg. Si se amplia en dirección noroeste el área de influencia para el cálculo del indicador β correspondiente a esta estación, de forma proporcional a la velocidad media registrada, se obtiene una nueva zona de influencia, tal como se muestra en el siguiente esquema.

Figura 49. Área de influencia de la estación 25UT (en gris) para el cálculo del indicador β teniendo en cuenta la velocidad media y la dirección predominante del viento.

Fuente: elaboración propia.

En la figura se aprecia que, deformando las áreas de influencia para el cálculo del indicador β, se da un mayor peso a las emisiones que provienen de usos del suelo situados a favor de la dirección predominante del viento. A priori, parece lógico pensar que esta consideración puede mejorar la correlación entre los valores de concentración de contaminantes registrados en la estación y dicho indicador. Sin embargo, las correlaciones obtenidas en las pruebas realizadas son iguales o menores que considerando áreas regulares de 2 Km para todas las estaciones.

En base a estos resultados, se ha optado por considerar únicamente el parámetro β para la eliminación del carácter local de los datos, ya que este indicador por si solo explica suficientemente las variaciones de las series muestrales de datos y la información adicional considerada complica los cálculos sin aportar ninguna mejora significativa.

6

Desarrollo inicial del modelo

Del estudio estadístico realizado en el Capítulo 5, cabe concluir que el indicador β es una variable indicativa del carácter local de las medidas muestrales que parece adecuada para su aplicación en la Comunidad de Madrid, por lo que se utilizará en este estudio para la eliminación del carácter local de las medidas, de forma previa a la realización de la interpolación de los valores de calidad del aire de las estaciones de monitorización.

Como punto de partida, se ha comenzado por desarrollar un modelo con los valores promedio de la media diaria de NO2. Posteriormente, una vez ajustado

este modelo y comprobada su validez para la predicción de los valores medios de NO2 (apartados 8.1 y 8.2), se utiliza éste para la predicción de valores máximos

de este contaminante (apartado 8.4).

A continuación se describen las distintas etapas seguidas para el desarrollo inicial del modelo geoestadístico para la predicción de valores medios de NO2 en

un territorio, a partir de los valores registrados en las estaciones fijas de monitorización existentes en el mismo.