1
Universidad de los Andes
Predicción de contaminación por PM
10
en
las estaciones de Kennedy y Carvajal
Lina Marcela Quiñones Sánchez
Asesor: Jorge Alexander Bonilla
Mayo 13 de mayo de 2015
Resumen
Este trabajo busca generar un modelo de series de tiempo que permita predecir la contaminación por PM101 en dos estaciones de monitoreo de la localidad de Kennedy en Bogotá. Esto se hace mediante el desarrollo de modelos ARIMA, ARDL y la combinación de pronósticos con el fin de obtener un modelo adecuado para la predicción. Adicionalmente, se evalúa el efecto de este contaminante en la incidencia de enfermedades respiratorias agudas en menores de cinco años en la localidad. Finalmente, se calcula el beneficio económico que se tendría si se cumplieran las normas de calidad del aire estipuladas en la legislación colombiana y el costo si por el contrario se excede la norma. El beneficio calculado varía entre $6,800,000 y $12,200,000 semanales dependiendo de la concentración objetivo que se use, mientras que el costo de exceder la norma todos los días de una semana es de 54 millones de pesos (cifras en pesos colombianos de 2015).
1 Material particulado de diámetro aerodinámico menor a diez micras. El material particulado es um
2
1.
Introducción
El objetivo de esta memoria de grado es generar un modelo de series de tiempo que logre predecir adecuadamente el nivel de concentración diario de PM10 en las estaciones de Kennedy y Carvajal, pertenecientes a la Red de Monitoreo de Calidad del Aire de Bogotá, pues a pesar de que ésta cuenta con gran cantidad de datos de concentración de contaminantes, en la ciudad no existe un sistema que permita predecir el nivel de contaminación con antelación. La motivación del proyecto es el grave problema de contaminación del aire, específicamente por PM10 que presenta la ciudad de Bogotá y en particular la localidad de Kennedy, en la cual se encuentran las dos estaciones analizadas. El PM10 tiene múltiples efectos sobre la salud de las personas que se encuentran expuestas a éste, incluyendo enfermedades y muerte prematura por condiciones cardíacas y respiratorias. Se utilizaron los datos de la Red de Monitoreo con el fin de obtener promedios diarios y se aplicaron varios modelos de series de tiempo, con el objetivo de encontrar uno que permita predecir adecuadamente el promedio de concentración de PM10 con uno o varios días de anticipación. Esto es de gran importancia, teniendo en cuenta que este tipo de predicción no existe en la ciudad y al predecir la concentración de PM10 se podrían implementar acciones preventivas que disminuyan la exposición de las personas, especialmente aquellas más vulnerables a episodios de alta contaminación. Este estudio busca proveer un instrumento que permita realizar esta predicción, puesto que actualmente no se hace ningún tipo de predicción en la ciudad y específicamente concentrarse en la zona con más altas concentraciones de PM10 dado que es la que requiere más urgentemente este tipo de acciones. También se quiere analizar el efecto de las altas concentraciones de PM10 sobre la salud respiratoria de los niños menores de cinco años en la localidad y determinar de esta manera qué costo tiene para la localidad de Kennedy la contaminación por PM10.
2.
Revisión de Literatura
El problema de la calidad del aire en Bogotá ha sido ampliamente estudiado y gracias a la Red de
Monitoreo de Calidad del Aire de
Bogotá (PDDAB) se cuenta
con excelente informaci ón acerca de su distribución espacial y las concentraciones promedio de los contaminantes. En este sentido, se han hecho estudios muy completos como es el caso del Plan Decenal de Descontaminación de Bogotá (Secretaría Distrital de Ambiente, 2010), el cual no sólo describe de
Figura 1. Porcentajes de excedencias (Secretaría Distrital de Ambiente, 2010)
Figura 2. Distribución espacial de la concentración de PM10 (Secretaría Distrital de Ambiente, 2010)
3 manera detallada la situación actual de calidad del aire en la ciudad, sino que por medio de una simulación, estima cómo se comportará ésta por un período de diez años y de qué manera mejorarán las condiciones de calidad del aire si se implementa el plan. Adicionalmente también realiza estimaciones de costos de contaminación a largo plazo según los efectos en salud del material particulado (PM10). De este estudio se concluye que en la actualidad, el problema más grave para la calidad del aire de la ciudad de Bogotá es el material particulado (Figura 1) y que la zona más crítica es el sur-occidente de la ciudad, específicamente la localidad de Kennedy (Figura 2). Es por esto que las predicciones propuestas aquí se centran en este contaminante y en las dos estaciones de la Red que se encuentran en la zona.
Además del PDDAB se han realizado otros estudios que permiten analizar el comportamiento de los contaminantes en varias zonas de la ciudad y los efectos de éstos sobre la salud de los habitantes de Bogotá. En 1998 Nancy Lozano realizó un estudio que mide el impacto de la concentración de tres contaminantes, incluyendo material particulado, sobre admisiones hospitalarias diarias en Bogotá y realizó una estimación de costos basándose en estimaciones de disponibilidad a pagar (WTP) para Estados Unidos y ajustando los valores para Colombia, y obtuvo que depende de la estimación utilizada el valor de una admisión hospitalaria puede ser de US$410 o US$629 para el año 1995 (Lozano, 2004).
Por otra parte, se han hecho estudios para intentar predecir la contaminación en ciertas zonas de Bogotá, aunque no se han aplicado a la localidad de Kennedy, la cual es la que tiene mayor concentración de PM10 en la ciudad. Westerlund et al. (2014) desarrollaron una metodología para combinar predicciones de regresiones lineales de manera que sean más exactas y aplicaron el método a la estación de Parque Simón Bolívar. Adicionalmente, un estudio de la Universidad Distrital también propuso un modelo de Sistema Difuso Evolutivo para predecir la contaminación por PM10 en la localidad de Puente Aranda (Riveros et al., 2012). Este artículo busca contribuir al estudio de la contaminación del aire de la ciudad de Bogotá mediante la construcción de un modelo que permita predecir con un día de anticipación la concentración de PM10 en la zona más crítica de la ciudad, es decir las estaciones de Kennedy y Carvajal, sobre las cuales no se han hecho estudios para predicción. Esto permitiría saber con antelación si los niveles de PM10 van a estar por encima de los niveles aceptables y por lo tanto implementar acciones para evitar que se exceda el nivel aceptable o al menos para reducir la exposición de la población a estos niveles. Adicionalmente se busca construir un modelo de dosis-respuesta2 que permita evaluar qué impacto tienen los niveles de PM10 sobre la salud respiratoria de los niños a nivel local y de esta manera calcular el costo que tiene la contaminación por PM10 específicamente para la localidad de Kennedy, pues los estudios existentes estiman estos costos para la ciudad en general.
2 Un modelo de dosis-respuesta busca evaluar la incidencia de cierta condición de salud dependiendo de la
4
3.
Datos
Se cuenta con datos de la Red de Monitoreo de Calidad del Aire de Bogotá, que incluyen variables meteorológicas tales como precipitación, velocidad y dirección del viento a distintas alturas, presión barométrica, humedad, radiación solar y temperatura a distintas alturas. También se tiene información sobre el nivel de concentración de distintos contaminantes, específicamente NO, NO2, NOx, SO2, O3, CO, PM10, TSP, PM2.5 y CO2. (Ver Anexo 1). Estas variables fueron registradas en 22 estaciones, aunque cabe resaltar que no en todas las estaciones se miden todas las variables. Concretamente para la variable de interés, la cual es la concentración de material particulado de diámetro aerodinámico menor a 10µm (PM10), se tienen datos para doce estaciones.
Estos datos son registrados con frecuencia horaria y la muestra utilizada es desde el 17 de noviembre de 2005 hasta el 31 de agosto de 2014. Cabe mencionar que la Organización Mundial de la Salud considera que no se debe superar una concentración de PM10 de 50 µg/m3 como promedio en 24 horas (OMS, 2014) mientras que la norma colombiana para este mismo periodo de tiempo es de 100 µg/m3 (Ministerio de Ambiente, Vivienda y Desarrollo Territorial, 2010). Para este análisis se utilizará como referencia la norma colombiana pues es la que se debe cumplir por ley en la ciudad de Bogotá.
Tabla 1. Estadísticas descriptivas de concentración de PM10
Kennedy Carvajal
Total datos 77040 77040
Datos faltantes 9560 6312
Promedio 85.309 μg/m3 81.77 μg/m3
Desv. Estándar 42.651 μg/m3 42.853 μg/m3
Mín 6 μg/m3 2 μg/m3
5 En la Tabla 1 se muestran las estadísticas descriptivas de los datos y se observa que, dado que son datos horarios, existe una gran variación entre éstos. Adicionalmente cabe resaltar que falta el 12.41% de los datos en la estación de Kennedy y el 8.19% en Carvajal, lo cual puede deberse a fallas en los equipos, mediciones incorrectas, fallas en la calibración o cortes de luz. Esto implica que es necesario imputar los datos antes de realizar cualquier análisis y dado que el porcentaje de datos faltantes es menor al 25%, el cual es el porcentaje sugerido por la literatura como máximo para que los datos sean imputables, es posible realizar la imputación sin afectar la validez de los datos.
La concentración promedio por semana del año para la estación de Kennedy refleja el comportamiento típico de la contaminación atmosférica en Bogotá. Inicia el año con valores altos, llegando a un pico en febrero y luego disminuye, alcanzando el punto más bajo entre julio y agosto. En el segundo semestre del año la concentración de material particulado aumenta nuevamente. En el caso de la estación de Carvajal el comportamiento es diferente, pues no hay una disminución a mitad de año y el punto más bajo es en las primeras semanas. Esto puede
60 70 80 90 100 110 120
0 10 20 30 40 50
C o nce ntra ci ó n (μ g/m 3) Semana
Concentración promedio por semana para Kennedy
60 70 80 90 100
0 10 20 30 40 50
C o nce ntra ci ó n (μ g/m 3) Semana
Concentración promedio por semana para Carvajal
Gráfica 1. Concentración promedio por semana para Kennedy6 deberse a que la contaminación medida por esta estación tiene un componente importante de fuentes fijas o industriales (Secretaría Distrital de Ambiente, 2013)
En el caso del perfil diario de contaminación, ambas estaciones presentan comportamientos similares y acordes con el de la ciudad en general. La contaminación por PM10 llega a un pico a las ocho de la mañana y luego desciende, manteniéndose relativamente estable luego de las diez de la mañana. Esto es debido a varias características de esta hora del día, que incluyen hora pico en tráfico y actividad industrial así como el fenómeno de inversión térmica que implica que la atmósfera es más estable y por lo tanto es más difícil que los contaminantes se disipen. También en ambos casos hay un mínimo antes de las cinco de la mañana aunque este es más pronunciado en la estación de Carvajal, probablemente debido a que la concentración de PM10 allí depende en mayor medida de la actividad industrial.
40 60 80 100 120 140
0 5 10 15 20 25
C o nce ntra ci ó n (μ g/m 3) Hora
Perfil diario de contaminación para Carvajal
50 70 90 110 130 150
0 5 10 15 20 25
C o nce ntra ci ó n (μ g/m 3) Hora
Perfil diario de contaminación para Kennedy
Gráfica 4. Perfil diario de contaminación para Kennedy
7 En cuanto al comportamiento de la concentración de PM10 por día de la semana las dos estaciones siguen el mismo patrón, aunque las diferencias entre los días de fin de semana y el resto son más marcadas en la estación de Carvajal, nuevamente es probable que esto se deba al fuerte componente industrial de esta estación. En general la concentración del contaminante aumenta entre semana, llegando a un pico el viernes y el fin de semana disminuye, siendo el domingo el día de menor concentración.
40 50 60 70 80 90 100
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
C
o
nce
ntra
ci
ó
n
(μ
g/m
3
)
Promedio por día de la semana para Carvajal
40 50 60 70 80 90 100
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
Con
ce
n
tra
ción
(
μ
g/m
3)
Promedio por día de la semana para Kennedy
Gráfica 5. Promedio de concentración por día de la semana para Kennedy
8 Además de los datos de contaminación y meteorología medidos por la RMCAB también se cuenta con datos del número de casos atendidos en salas ERA en la localidad de Kennedy, en la que se encuentran ambas estaciones. Las salas ERA son áreas en las unidades de atención primaria o en las instituciones de salud que están específicamente destinadas a atender pacientes menores de cinco años con enfermedades respiratorias agudas (Sanitas). En la localidad de Kennedy estas salas son manejadas por el Hospital del Sur. Los datos con los que se cuenta son el número de casos atendidos cada semana desde la primera semana del año 2011 hasta la última semana del 2014, exceptuando las últimas nueve semanas del año 2011. Los datos incluyen el total de casos y también separados por tres grupos: Casos de 0 a 2 meses, de 2 a 11 meses y de 1 a 5 años.
Casos Atendidos en Salas ERA en Kennedy
0 a 2 meses 2 a 11 meses 1 a 5 años Total
Total datos 209 209 209 209
Datos faltantes 9 9 9 9
Promedio 0.575 7.465 9.485 17.525
Desv. Estándar 1.238 5.478 7.386 12.478
Mín 0 0 0 0
Máx 9 33 35 74
Tabla 2. Estadísticas descriptivas de casos atendidos en salas ERA
9
4.
Metodología
4.1.
Pronósticos de concentración
Debido a que faltaba el 12.41% de los datos de PM10 en la estación de Kennedy, y el 8.19% en la estación de Carvajal, fue necesario imputar estos datos. Esto se hizo mediante el método SDEM (Plaia & Bondi, 2006), que tiene en cuenta el promedio de concentración de la contaminación en la semana del año, el día de la semana y la hora. Así mismo también considera la diferencia entre el sitio analizado y el promedio de las demás estaciones. La imputación de los datos faltantes se hace con la siguiente ecuación:
𝑥̂𝑠𝑤𝑑ℎ = 𝑥̅∙𝑤𝑑ℎ +12(𝑥̅𝑠𝑤∙∙− ∑𝑆𝑠=1𝑥̅𝑠𝑤∙∙𝑆 ) +12(𝑥̅𝑠∙𝑑∙− ∑𝑆𝑠=1𝑥̅𝑠∙𝑑∙𝑆 ) +12(𝑥̅𝑠∙∙ℎ− ∑𝑆𝑠=1𝑥̅𝑠∙∙ℎ𝑆 ). (1)
Los datos que no pudieron ser imputados por este método se imputaron mediante el método de cicloestacionariedad, que consiste en reemplazar el dato faltante por el promedio de los datos correspondientes a la misma hora, día de la semana, semana y trimestre de la estación analizada. La validez de las imputaciones se corroboró mediante gráficas de densidad de Kernell, verificando que la distribución de los datos para cada hora del día no cambiara luego de la imputación (Ver Anexo 2). Este método de imputación también se utilizó para los datos meteorológicos que eran imputables, en el caso de Kennedy se imputaron datos para precipitación (21.13% faltante) y velocidad del viento (9.65%), no se utilizó la variable temperatura pues más del 25% de los datos faltaban. En el caso de Carvajal se hizo la imputación para las tres variables meteorológicas pues el porcentaje de datos faltantes era bajo para las tres, siendo 9.15% para la velocidad del viento, 8.22% para precipitación y 6.56% para temperatura. Se buscó también incluir la concentración diaria de otros contaminantes que pueden estar relacionados con el PM10, específicamente la concentración de óxidos de nitrógeno (NOx) pero no fue posible puesto que el registro de concentración de este contaminante para las estaciones analizadas es extremadamente bajo siendo alrededor del 15% en Carvajal y menor del 3% en Kennedy.
Una vez se tuvieron los datos completos, se generaron datos de promedios de concentración de 24 horas. Es decir, datos diarios en lugar de los datos horarios que se tenían. Posteriormente se procedió al análisis de estacionariedad y correlogramas (ver Anexo 4) y mediante el test de Dickey-Fuller se comprobó que todas las series eran estacionarias, tanto las de contaminación como las de meteorología. Luego se desarrollaron cuatro modelos auto-regresivos individuales incluyendo uno, dos, tres y cuatro rezagos y también se desarrollaron dos modelos combinados, uno que en el que se calculaba el promedio de las otras cuatro estimaciones y un modelo de Granger y Ramanathan, que consiste en hacer una regresión de Mínimos Cuadrados Ordinarios (MCO) con el valor observado como variable dependiente y las estimaciones como variables independientes. Después de analizar estos modelos iniciales se construyeron otros incluyendo variables de control de meteorología y dicótomas para indicar mes del año y día de la semana, con el objetivo de controlar por efectos estacionales. Estos modelos se hicieron incluyendo distintos rezagos para todas las variables desde un solo rezago hasta siete. Cabe resaltar que aunque se
10 realizaron imputaciones de datos para la variable temperatura en la estación de Carvajal, ésta no se utilizó debido a que la serie presentaba un comportamiento extraño.
Todos los modelos se construyeron asumiendo las últimas 500 observaciones como desconocidas, es decir que el número de observaciones fue de 2711 en lugar de las 3211 que se tenían en total. Esto se hizo para lograr comparar los modelos con los datos observados. Los últimos datos también se dividieron en dos grupos para la estimación de los modelos conjuntos, con las primeras 300 observaciones se calcularon los pesos para cada modelo individual y las últimas 200 se utilizaron para comparación y calibración.
Una vez se tuvieron todos los modelos, se procedió a la comparación entre estos para determinar cuál sería el más adecuado. Para esto en las últimas doscientas observaciones se utilizó el criterio del RSME (Root-Mean square error) que determina el error de predicción utilizando la Ecuación 2.
√∑ (𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖ó𝑛𝑖−𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑖)2 (𝑁−𝑘−1)
𝑁
𝑖=1 (2)
Empleando este criterio se eligió para cada estación el modelo que presentara menor RMSE y que cumpliera con las características requeridas, básicamente que todas las variables estuvieran rezagadas para que fuera útil para realizar pronósticos.
Después de realizar el pronóstico con el modelo elegido se calculó la probabilidad de que se presentara una excedencia, es decir una concentración mayor a 100µg/m3, según el valor reportado por el pronóstico. Con estos valores se realizó una curva de probabilidad y se ajustó a una ecuación polinómica para determinar de manera más adecuada la probabilidad de excedencia según el valor predicho por el modelo. Para calcular estas probabilidades los valores se dividieron en varios rangos, aproximándolos a la siguiente decena y dándole el valor de 140 a todo valor mayor de 130. Este valor se eligió porque es en ese punto cuando la probabilidad de excedencia es de 1.
4.2.
Análisis de dosis-respuesta
En la serie de datos de casos atendidos en salas ERA en la localidad de Kennedy, faltaban nueve semanas del año 2011, correspondientes al 4% del total de datos. Estos valores se imputaron mediante cicloestacionariedad, es decir, se obtuvo el promedio de los otros tres años para esas mismas semanas y se asignó ese valor redondeado al entero más próximo. Sólo se realizó la imputación para el total de casos pues esta era la variable que se buscaba analizar.
Una vez se tuvo completa la serie se calcularon promedios semanales de concentración de PM10, precipitación, velocidad del viento y temperatura para las estaciones de Kennedy y Carvajal y se emparejaron con los datos disponibles de casos atendidos. Se realizaron análisis de correlación y significancia y se determinó que únicamente los datos de la estación de Carvajal eran relevantes para este análisis.
11 Para este casos se estimaron varios modelos utilizando datos de la misma semana o rezagados y ecuaciones lineales o semi-logarítmicas. Además de los datos de contaminación y meteorología también se incluyeron dicótomas para cada mes con el fin de controlar por efectos estacionales.
4.3.
Análisis de costos evitados
Para hacer una estimación de los costos de la contaminación o más exactamente de los costos evitados si se cumpliera la norma se usó el valor de US$410 reportado por Lozano, el cual se convirtió a pesos colombianos de 1995 y luego se multiplicó por el IPC para obtener un valor para el año 2015. Este valor fue de $1.449.331 por caso atendido en sala ERA. Cabe resaltar que, a diferencia del estudio de Lozano, en este caso sólo se están analizando admisiones hospitalarias de niños menores de cinco años y por lo tanto el valor real podría variar. Para el cálculo de costos se analizaron varios escenarios: en primer lugar si cada semana se cumpliera la norma anual colombiana de 50µg/m3, en segundo lugar se consideró el escenario en que todos los días de la semana se cumple la norma diaria y finalmente se calculó el costo en caso de que se superara la norma con probabilidad uno todos los días de una semana. Dado que no existe una norma semanal, para el segundo escenario se calculó el promedio de concentración de todas las semanas en las que todos los días cumplieron la norma diaria y este fue el valor de referencia utilizado.
5.
Resultados
Al calcular los promedios de concentración diarios se obtuvieron dos series de 3211 observaciones, ambas estacionarias (Ver Anexo 4), como se muestra en las Gráficas 8 y 9.
12
5.1.
Pronósticos de concentración
Para la estación de Carvajal se eligió un modelo ARDL(7) que incluía variables meteorológicas cuadráticas, puesto que era el que menor RMSE tenía de los calculados (Ver Anexo 3). Los resultados de este modelo se muestran en la Tabla 3 de manera reducida. Aunque todos los controles también incluían rezagos del uno al siete en la tabla solo se muestran aquellos que fueron significativos o marginalmente significativos. Como se puede ver, se incluyeron controles por velocidad del viento, precipitación, velocidad del viento al cuadrado, precipitación al cuadrado, mes del año y día de la semana.
(1)
VARIABLES promedio_diario
L.promedio_diario 0.586***
(0.0271)
L2.promedio_diario 0.00337
(0.0300)
L3.promedio_diario 0.00869
(0.0279)
L4.promedio_diario 0.0421
(0.0276)
L5.promedio_diario 0.0338
(0.0271)
L6.promedio_diario 0.0525**
(0.0234)
L7.promedio_diario 0.0616***
(0.0219) L4.prom_velviento_diario 5.778*
(3.468) L2.prom_Precipitacion_diario 9.016**
13
(3.989) L6.prom_Precipitacion_diario 10.82***
(3.810) L7.prom_Precipitacion_diario 8.239**
(3.861)
L4.velViento2 -1.257*
(0.762)
L6.precipitacion2 -8.613***
(2.921)
L7.precipitacion2 -6.873**
(2.909)
Controles por meses SI
Controles por día de semana SI
Constant 18.97***
(4.719)
Observations 2,704
R-squared 0.543
Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
Tabla 3. Resultados modelo Carvajal
Se observa que solo los rezagos uno, seis y siete son significativos, lo cual refleja no solo la importancia de la contaminación del día anterior sino también la importancia del día de la semana en el comportamiento del material particulado. En cuanto a las variables meteorológicas, sorprendentemente fueron más significativos los valores de precipitación que los de velocidad del viento, tanto en el caso lineal como cuadrático. Los signos de los rezagos de la variable estudiada son los esperados, pues la concentración de días anteriores debe tener una relación directa del día analizado. En cuanto a los controles los signos obtenidos no corresponden a lo esperado pues la precipitación debería tener un signo negativo. La comparación entre el modelo ajustado y los datos observados se muestra en la Gráfica 10.
14 Los pronósticos del modelo se ajustaron a una ecuación de probabilidad de la forma
𝑦 = 0.0314𝑐𝑒 − 0.00114𝑐𝑒2+ 1.303𝑥10−5 𝑐𝑒3 − 4.402𝑥10−08 𝑐𝑒4. (3)
Donde ce es el rango en el que se encuentra el valor predicho por el modelo. La probabilidad de excedencia según el rango se muestra en la Gráfica 11. En la Gráfica también se muestra una línea vertical que indica la concentración máxima permitida por la norma colombiana y una horizontal que indica una probabilidad de excedencia de 0.5. Se observa que esta probabilidad se obtiene cuando el modelo reporta concentraciones entre 100µg/m3 110µg/m3 y que cuando se reportan valores mayores de 130µg/m3 la probabilidad de excedencia es muy cercana a uno.
15 Para el caso de la estación de Kennedy el mejor modelo fue uno de combinación de predicciones. Este fue un modelo de Granger y Ramanathan usando como variables independientes los pronósticos de otros cuatro modelos: ARDL(7) sin variables cuadráticas, ARDL(7) con variables cuadráticas, ARDL incluyendo solo los rezagos 1 y 7 para todas las variables y éste mismo incluyendo también variables cuadráticas. Estos cuatro modelos se eligieron para la combinación por ser los que menor RMSE presentaban de todos los calculados (Ver Anexo 4). En la tabla se muestran solo los rezagos de variables de control que son significativos para alguno de los modelos.
(1) (2) (3) (4)
VARIABLES promedio_diario promedio_diario promedio_diario promedio_diario
L.promedio_diario 0.524*** 0.509*** 0.570*** 0.561***
(0.0203) (0.0221) (0.0172) (0.0173)
L2.promedio_diario 0.0367 0.0402 (0.0229) (0.0245) L3.promedio_diario 0.0449* 0.0396
(0.0229) (0.0242) L4.promedio_diario 0.0501** 0.0505**
(0.0229) (0.0238) L5.promedio_diario 0.0117 0.0103
(0.0228) (0.0240)
16
L6.promedio_diario 0.0318 0.0341 (0.0228) (0.0237)
L7.promedio_diario 0.0531*** 0.0536*** 0.106*** 0.102***
(0.0199) (0.0205) (0.0171) (0.0170)
L.prom_velviento_diario -3.021*** -6.194 -2.294*** -8.502***
(0.886) (3.891) (0.694) (3.140)
L2.prom_velviento_diario 2.498** 3.571 (1.035) (4.217)
L7.prom_velviento_diario 0.132 -2.738 -0.712 -6.493**
(0.884) (3.697) (0.643) (2.819)
L.prom_Precipitacion_diario -10.35*** -29.25*** -7.646*** -22.58***
(2.165) (4.687) (2.188) (4.529)
L2.prom_Precipitacion_diario 7.603*** 9.301* (2.213) (4.834) L3.prom_Precipitacion_diario 6.618*** 1.329
(2.224) (4.524)
L.velViento2 0.626 1.330**
(0.769) (0.639)
L7.velViento2 0.693 1.335**
(0.715) (0.550)
L.precipitacion2 22.68*** 18.16***
(4.973) (4.863)
Controles por meses SI SI SI SI
Controles por día de semana SI SI SI SI
Constant 23.79*** 38.00*** 33.52*** 46.84***
(3.346) (4.927) (3.026) (4.288)
Observations 2,704 2,704 2,704 2,704
R-squared 0.525 0.533 0.511 0.517
Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
Tabla 4. Modelos utilizados en la combinación para la estación de Kennedy
En el caso de Kennedy los rezagos 1 y 7 también son altamente significativos pero a diferencia de Carvajal, el rezago 4 también lo es mientras que el 6 no. En este caso en tres de los cuatro modelos el primer rezago del promedio de la velocidad del viento es significativo y en el Modelo 1 también el segundo rezago, mientras que en el Modelo 4 es el séptimo. En todos los modelos es significativo el primer rezago de la precipitación y en el Modelo 1 también el segundo y tercero. En los modelos que incluyeron variables cuadráticas se observa que el primer rezago de la precipitación al cuadrado es siempre significativo, mientras que el de la velocidad del viento al cuadrado es sólo significativo en el Modelo 4. Los signos de las variables corresponden a lo esperado pues los rezagos de contaminación son de signo positivo mientras que los de precipitación y velocidad del viento, al menos en el primer rezago, son negativos.
17
(1)
VARIABLES promedio_diario
Modelo (4) 1.074
(0.698)
Modelo (3) -0.538
(0.724)
Modelo (2) 0.257
(0.610)
Modelo (1) 0.270
(0.669)
Constant -7.630*
(4.298)
Observations 300
R-squared 0.560
Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
Tabla 5. Modelo de pronóstico combinado
En el modelo de Granger y Ramanathan ninguno de los coeficientes es significativo. Sin embargo se puede observar que el Modelo 4 es el que tiene mayor coeficiente de los cuatro y por lo tanto el más relevante para la predicción. La comparación entre la predicción y los datos observados se muestra en la Gráfica 12.
18 Este modelo se ajustó a un polinomio de grado nueve para obtener la curva de probabilidad
𝑦 =
− 0.0163𝑐𝑒2+ 3.436𝑥10−5𝑐𝑒4 − 1.120𝑥10−6𝑐𝑒5+ 1.619𝑥10−8𝑐𝑒6 − 1.230𝑥10−10𝑐𝑒7 +
4.799𝑥10−13𝑐𝑒8 − 7.605𝑥10−16𝑐𝑒9 . (4)
Nuevamente la probabilidad de 0.5 se encuentra entre 100µg/m3 y 110 µg/m3 aunque en este caso la pendiente en esta sección de la curva es mucho más alta y en el rango de 110 µg/m3 la probabilidad de excedencia llega a 0.8 y luego de 130 µg/m3 es 1.
19
5.2.
Análisis de dosis-respuesta
Para el análisis de dosis-respuesta de PM10 y enfermedades respiratorias agudas se eligió un modelo log-lin que incluía tanto el promedio semanal de concentración de PM10 en la estación de Carvajal como algunas variables meteorológicas.
(1)
VARIABLES logCasosTotal
promedio_semanal_Carvajal 0.0149*** (0.00393) prom_semanal_PrecipCarvajal 1.182**
(0.552)
velViento2 0.0249
(0.0332) prom_semanal_TempCarvajal -0.195**
(0.0910)
Controles por mes SI
Constant 3.390***
(1.262)
Observations 178
R-squared 0.537
Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
Tabla 6. Modelo de dosis-respuesta de ERA
En el modelo de casos de enfermedades respiratorias agudas son significativos los coeficientes para promedio semanal de concentración de PM10, promedio semanal de precipitación y promedio semanal de temperatura. Los signos de los coeficientes corresponden a lo esperado pues un aumento en la concentración de PM10 llevaría a un aumento en los casos de ERA al igual que el aumento en la precipitación, mientras que el aumento en temperatura reduciría el número de casos.
5.3.
Análisis de costos evitados
Siguiendo el modelo de dosis-respuesta se calculó que en una semana promedio se disminuirían en un 48% los casos si se cumpliera la norma de 50µg/m3, lo cual, comparado con el promedio de 17 casos semanales implicaría 8 casos evitados. Esto según el WTP calculado se vería reflejado en un ahorro de $12,205,355 semanales para la localidad de Kennedy, que en un año sería equivalente a $634,678,452. En el segundo escenario se utiliza un valor objetivo de 65µg/m3, que corresponde al promedio de concentración en las semanas en las que no hay excedencias. Si se cumple esta norma se reducirían en 27.159% los casos, es decir alrededor de cinco casos semanales que se traducirían en $6,817,676 por semana. Finalmente se analizó el caso en que la probabilidad de excedencia es igual a uno y por lo tanto la concentración predicha por el modelo es de 144.608µg/m3. Si esta concentración se repitiera por todos los días de una semana, el
20 número de casos de ERA sería de 37, más del doble del promedio actual, lo cual tendría un costo de $54,088,909 en esa semana para la localidad.
6.
Conclusiones
Se obtuvieron dos modelos de predicción adecuados, que además se pudieron ajustar a curvas de probabilidad para determinar con mayor exactitud la probabilidad de que se presente una excedencia con un día de anticipación en cada una de estas estaciones. Esto implicaría que se podrían predecir eventos de alta contaminación y por consiguiente implementar acciones para prevenirlos o para reducir la exposición de la población a estos. Específicamente podrían implementarse las medidas estipuladas en al Artículo 3 del Decreto 979 de 2006 en el que se indica que en caso de superarse la norma diaria por un tiempo que la autoridad ambiental considere necesario debe prohibirse la operación de incineradores y la quema controlada, además de restringir la circulación de vehículos diésel de modelos anteriores a cinco años y la operación de calderas industriales (Presidencia de la República, 2006).
Por otra parte también se calculó un modelo de dosis-respuesta específico para la localidad de Kennedy, en el cual se determina qué tanto influye la alta concentración de PM10 en esta localidad sobre los casos de enfermedades respiratorias agudas en menores de cinco años. Se determinó que esta relación es bastante alta, pues los casos aumentan en 1% por cada microgramo en que aumente el promedio de la concentración semanal. Así mismo se determinaron varios escenarios en los que se podrían reducir de cinco a ocho casos por semana si se cumplieran las normas estipuladas por la ley colombiana. Finalmente se calcularon los beneficios en caso de que se cumplieran estos escenarios y el costo en caso de que en una semana se excediera todos los días la norma diaria con probabilidad igual a uno. Los beneficios de reducción por semana van desde $6,817,676 en el caso en que se cumple la norma diaria todos los días a $12,205,355 cuando se está en la situación ideal, es decir, cuando la semana cumple con la norma anual. Los costos de exceder la norma todos los días de una semana serían de $54,088,909 sólo para esta localidad.
21
7.
Bibliografía
Lozano, N. (2004). Air Pollution in Bogotá, Colombia: A Concentration-Response Approach.
Desarrollo y Sociedad, 133-177.
Ministerio de Ambiente, Vivienda y Desarrollo Territorial. (24 de Marzo de 2010). RESOLUCIÓN 0610 DE 2010. Obtenido de
http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=39330#2
OMS. (Marzo de 2014). Calidad del aire (exterior) y salud. Obtenido de Organización Mundial de la Salud: http://www.who.int/mediacentre/factsheets/fs313/es/
Plaia, A., & Bondi, A. (2006). Single imputation method of missing values in environmental pollution data sets. Atmospheric Environment, 7316-7330.
Presidencia de la República. (03 de Abril de 2006). Decreto 979 de 2006. Obtenido de http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=19973
Riveros, C., Melgarejo, M., Riveros, A., & Alvarado, L. (2012). Sistema Difuso Evolutivo para la Predicción del Nivel de Contaminación del Aire por Material Particulado: Caso Puente Aranda (Bogotá). Ingeniería, 55-62.
Sanitas. (s.f.). Las Salas ERA. Obtenido de http://portal.colsanitas.com/portal/web/eps-sanitas/salas-era
Secretaría Distrital de Ambiente. (2010). Plan Decenal de Descontaminación de Bogotá. Bogotá D.C.
Secretaría Distrital de Ambiente. (2013). Características generales de las estaciones de la Red de Monitoreo de Calidad del Aire de Bogotá y parámetros medidos en cada una de ellas a 2013. Obtenido de Secretaría Distrital de Ambiente:
http://ambientebogota.gov.co/estaciones-rmcab
Westerlund, J., Urbain, J.-P., & Bonilla, J. (2014). Application of air quality combination forecasting to Bogota. Atmospheric Environment, 22-28.
22
Anexos
Anexo 1. Variables medidas en las estaciones de la RMCAB
Fecha Estación
NO
NO2
NOX
Velocidad del viento Dirección del viento Precipitación
SO2
O3
CO
Temperatura a dos metros
Temperatura a ocho metros Temperatura a veinte metros Humedad
Presión barométrica Radiación solar Temperatura
Velocidad del viento a diez metros Dirección del viento a diez metros PM10
TSP
PM2.5
CO2
Anexo 2. Distribuciones kernell de las imputaciones
23
Anexo 3. Comparación de modelos
Carvajal
Modelo RMSE
Modelo ARDL(7) con cuadráticas
21.044405
Modelo (4) 21.04611
Modelo (3) 21.07927
Modelo Combinado GR 21.082832
Modelo ARDL(7) 21.104424
Modelo ARDL (6) con cuadráticas
21.162897
Modelo ARDL (6) 21.203894
Modelo AR(7) 21.24807
Modelo AR(6) 21.309361
Modelo ARDL(1) 21.435548
Tabla 7. Comparación de modelos para Carvajal
Kennedy
Modelo RMSE
Modelo Combinado GR 16.827579
Modelo (4) 17.152602
Modelo (3) 17.223049
Modelo (1) 17.349243
Modelo (2) 17.359272
Modelo ARDL (1) con cuadráticas
17.422472 Modelo ARDL (1) con
cuadráticas
17.440777
Modelo ARDL (6) 17.488279
Modelo AR(7) 17.49433
Modelo ARDL (6) con cuadráticas
17.504417
Tabla 8. Comparación de modelos para Kennedy Gráfica 13. Densidad de kernell para Kennedy
24
Anexo 4. Análisis de estacionariedad
Augmented Dickey-Fuller test for unit root Number of obs = 3182 Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value
Z(t) -4.995 -3.430 -2.860 -2.570
MacKinnon approximate p-value for Z(t) = 0.0000 Tabla 9. Test de Dickey-Fuller para Carvajal
.
40 0.1462 0.0037 7598 0.0000 39 0.1402 0.0170 7528.4 0.0000 38 0.1354 0.0111 7464.5 0.0000 37 0.1510 0.0117 7404.9 0.0000 36 0.2455 -0.0563 7330.8 0.0000 35 0.3561 0.0960 7134.9 0.0000 34 0.2374 0.0713 6723 0.0000 33 0.1315 0.0003 6540 0.0000 32 0.1212 0.0183 6483.9 0.0000 31 0.1168 -0.0127 6436.2 0.0000 30 0.1434 -0.0089 6391.9 0.0000 29 0.2458 -0.0730 6325.2 0.0000 28 0.3630 0.1134 6129.2 0.0000 27 0.2442 0.0687 5702.1 0.0000 26 0.1474 0.0190 5508.9 0.0000 25 0.1352 -0.0057 5438.5 0.0000 24 0.1406 0.0223 5379.3 0.0000 23 0.1535 0.0022 5315.3 0.0000 22 0.2573 -0.1015 5239 0.0000 21 0.3844 0.1504 5024.9 0.0000 20 0.2653 0.0959 4546.9 0.0000 19 0.1678 0.0411 4319.3 0.0000 18 0.1461 0.0188 4228.3 0.0000 17 0.1414 0.0389 4159.3 0.0000 16 0.1486 -0.0203 4094.7 0.0000 15 0.2506 -0.0739 4023.4 0.0000 14 0.3580 0.1269 3820.6 0.0000 13 0.2602 0.1144 3407 0.0000 12 0.1661 0.0435 3188.6 0.0000 11 0.1544 0.0085 3099.6 0.0000 10 0.1620 0.0543 3022.6 0.0000 9 0.1759 0.0120 2938.1 0.0000 8 0.2782 -0.1237 2838.3 0.0000 7 0.4052 0.2089 2589.1 0.0000 6 0.2931 0.2133 2060.5 0.0000 5 0.1894 0.0721 1783.9 0.0000 4 0.1844 0.0655 1668.5 0.0000 3 0.2100 0.0670 1559.2 0.0000 2 0.3136 -0.0439 1417.3 0.0000 1 0.5853 0.5854 1101.1 0.0000 LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] -1 0 1 -1 0 1
25 Figura 2. Correlograma de promedio diario de concentración de PM10 para Kennedy
Tabla 10. Test de Dickey-Fuller para Kennedy .
40 0.2577 0.0215 14887 0.0000 39 0.2482 -0.0061 14671 0.0000 38 0.2578 0.0137 14470 0.0000 37 0.2690 -0.0073 14254 0.0000 36 0.3052 -0.0145 14019 0.0000 35 0.3286 0.0525 13716 0.0000 34 0.2939 0.0662 13366 0.0000 33 0.2509 0.0084 13085 0.0000 32 0.2474 0.0033 12881 0.0000 31 0.2536 -0.0107 12682 0.0000 30 0.2767 0.0064 12474 0.0000 29 0.3131 -0.0391 12225 0.0000 28 0.3503 0.0601 11908 0.0000 27 0.3127 0.0672 11510 0.0000 26 0.2742 0.0295 11193 0.0000 25 0.2642 -0.0126 10949 0.0000 24 0.2703 0.0381 10723 0.0000 23 0.2767 -0.0515 10487 0.0000 22 0.3411 -0.0351 10239 0.0000 21 0.3776 0.0954 9862.5 0.0000 20 0.3387 0.0707 9401.4 0.0000 19 0.3097 0.0398 9030.4 0.0000 18 0.2992 0.0342 8720.3 0.0000 17 0.2957 0.0232 8431.1 0.0000 16 0.3060 0.0109 8148.6 0.0000 15 0.3326 -0.0039 7846.3 0.0000 14 0.3574 0.0491 7489.2 0.0000 13 0.3454 0.0592 7077 0.0000 12 0.3284 0.0534 6692.2 0.0000 11 0.3230 0.0278 6344.5 0.0000 10 0.3342 0.0397 6008.1 0.0000 9 0.3547 0.0115 5648 0.0000 8 0.4004 0.0271 5242.7 0.0000 7 0.4254 0.1271 4726.2 0.0000 6 0.3952 0.1458 4143.4 0.0000 5 0.3674 0.0855 3640.8 0.0000 4 0.3800 0.1049 3206.5 0.0000 3 0.4056 0.1173 2742 0.0000 2 0.4817 0.0460 2213 0.0000 1 0.6756 0.6767 1467 0.0000 LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] -1 0 1 -1 0 1
Augmented Dickey-Fuller test for unit root Number of obs = 3182 Interpolated Dickey-Fuller
Test 1% Critical 5% Critical 10% Critical
Statistic Value Value Value
Z(t) -4.697 -3.430 -2.860 -2.570