SISTEMA PROTOTIPO PARA EL
PRONÓSTICO DEL COMPORTAMIENTO DE MATERIAL PARTICULADO EN LA
CIUDAD DE VALLEDUPAR USANDO TÉCNICAS DE APRENDIZAJE
COMPUTACIONAL
• Uno de los contaminantes más peligrosos es
el material particulado que tiene un diámetro promedio menor de 10 micras
(PM10), otro es el material particulado con diámetro menor de 2.5 micras (PM2.5).
También existe otro contaminante llamado Material Particular Total(TPM)
Ing. Jhon Jairo Anaya Díaz
ANTECEDENTES
http://www.ec.gc.ca/inrp-npri/default.asp?
El pequeño tamaño del PM10 y del PM2.5,
les permite entrar
fácilmente a los
alveolos pulmonares,
donde se pueden
situar causando
efectos adversos sobre la salud.
ANTECEDENTES
Otros contaminantes atmosféricos estudiados en las referencias son:
•Monóxido de Carbono (CO): es un gas incoloro e
inoloro que al reaccionar con la hemoglobina de la sangre forma carboxihemoglobina la cual interfiere con la oxigenación de los diferentes órganos y tejidos del cuerpo.
Ing. Jhon Jairo Anaya Díaz
ANTECEDENTES
• Ozono (O3): Un nivel elevado de O3 troposférico es un peligro potencial para la salud humana, los cultivos y la vegetación.
Se logra visualizar tres escuelas
•En los Métodos Determinísticos se
ordenan todos los que usan modelos de
transporte químico, aplicando
fundamentalmente principios de
simulación física y química.
•Los Métodos Empíricos usan modelos estadísticos o técnicas numéricas.
•Los Hibridos: Combinación de los
anteriores
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
01/01/2000 01/06/2012
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
PM10: Material Particulado menor a 10 Micras PM2.5: Material Particulado menor a 2.5 Micras PST: Partículas Suspendidas Totales
CO: Monóxido de Carbono SOx: Óxidos de Azufre NOx: Óxidos de Nitrógeno O3: Ozono
RS: Radiación Solar ML: Machine Learning NL: Numérico Lineal NNL: Numérico No Líneal SP: Simple Prediction
MLE: Modelo Lineal Estadístico E: Estadístico
MANL: Modelo Adaptativo No Lineal H: Híbrido
HSMM: Semi-Markov Oculto SE: Software Especializado
2001 Empírico PST ML-NL 2000 Empírico PM2.5 ML-SP 2002 Empírico PM10 ML-NL 2003
Empírico y Determinístico NO2, PM10 ML-MLE 2003 Empírico NOx ML-NL 2004 Empírico CO ML 2006 Empírico PM10 ML-NL 2005 Empírico PM10 ML 2005 Empírico NO2 ML 2005 Empírico PM2.5 ML 2005 Empírico PM10, O3 ML 2005 Híbrido NO2, PM2.5 ML/E 2006 Empírico PM10 ML 2006 Empírico PM10 H 2006 Empírico PM10 MANL 2007 Empírico NO2, CO,SO2 ML 2008 Empírico e Híbrido
PM10 ML-NL y NL/NNL
2008 Empírico NO2, O3,SO2, CO
ML 2008 Empírico PM10 ML 2009 Empírico CO,SO2 ML 2009 Empírico PM10,CO,NO2, O3 ML 2009 Empírico PM2.5 HSMM 2010 Empírico RS ML 2009 Empírico PM10,CO,NO2 H 2010 Empírico PM2.5 NNL 2010 Empírico PM10, CO, SO2
ML
2010 Empírico NO2, CO, SO2, O3
ML 2011 Híbrido PM10 ML/E 2011 Empírico PM10 ML 2011 Híbrido PM10, PM2.5 ML/NNL 2012 Empírico PM10 H 2012 Empírico PM10 ML 2012 Híbrido CO ML/NNL 2012
Empírico y Determinístico PM10
ML-SE
2008 Empírico PM10, NO2, O3,SO2, CO
ML
Año
Escuela
Contaminante
ANTECEDENTES
Representación de los Clases
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
Diagrama Circular de la Clase Empírica
Los contaminantes del aire ejercen una amplia gama de impactos biológicos y físicos sobre los ecosistemas. Sus efectos sobre la salud humana son
motivo de especial preocupación* y
amplio estudio en los países en vía desarrollo.
PROBLEMÁTICA
CICLO DE LA CALIDA DEL AIRE
Ing. Jhon Jairo Anaya Díaz
http://imageshack.us/photo/my-images/27/dibujouut.jpg/
Según la World Health Organization (WHO, 2011), la contaminación del aire debido a los contaminantes de estudio se
estima que causa alrededor de 2
millones de muertes prematuras en su mayoría en los países en desarrollo. Casi la mitad de estas muertes se deben a la neumonía en niños menores de 5 años de edad
Otro aspecto importante es el modelo para el pronóstico, el cual resulta ambicioso ya que mezcla técnicas de
Minería de Datos, basadas en
Aprendizaje de Máquinas, las cuales buscan pronosticar el comportamiento de material Particulado.
Ing. Jhon Jairo Anaya Díaz
La calidad del aire ha emergido como el mayor factor de contribución a la calidad de Vida en las zonas urbanas,
y especialmente en las áreas
densamente pobladas e
industrializadas*
JUSTIFICACIÓN
Desarrollar un estudio de este estilo en una zona de gran influencia a este tipo de contaminantes como la ciudad de Valledupar, propensa a desarrollar problemas en la salud pública, es muy ventajoso ya que la investigación sería pionera en este ámbito.
Ing. Jhon Jairo Anaya Díaz
Predicción de la Calidad del Aire
EMPÍRICO ANÁLISIS NUMÉRICO ESTADÍSTICOS Machine Learning Hibrido Métodos Lineales Data Mining Predictor Simple Modelo Lineal Regresión No Lineal DETERMINÍSTICO HIBRIDO Métodos Estadísticos Métodos Estocásticos Sistema de Modelamiento Determístico Software Especializado MLP SVM RBF ELMA
SEMI - MARKOV OCULTO (HSMM) TRANSFORMADA DE WAVELET MÚLTIPLE REGRESIÓN LINEAL ARIMA LRA CART PCA PERSISTENCIA NLR BACK-TRAYECTORY MACHINE LEARNING/ ESTADÍSTICO LINEAL / NO LINEAL
MACHINE LEARNING / T WAVALET
MACHINE LEARNING / REGRESIÓN NO LINEA
Mapa Mental de la Metodología del Estado del Arte
DELIMITACIÓN
Ing. Jhon Jairo Anaya Díaz
Las predicciones de la calidad del aire sirven como base para la adopción de múltiples decisiones en el ámbito de salud pública de la región, gestión del riesgo, agricultura, entre otras y mas para nuestra región explotadora de recursos energéticos.
Para este estudio se investiga la utilidad de las técnicas de aprendizaje de máquinas para la predicción de material particulado y de técnicas de Minería de Datos para la escogencia de los
DELIMITACIÓN
Además se precisan datos de
OBJETIVOS
DESARROLLAR UN SISTEMA PROTOTIPO PARA EL PRONÓSTICO DEL COMPORTAMIENTO DE MATERIAL PARTICULADO EN LA CIUDAD DE VALLEDUPAR USANDO TÉCNICAS DE APRENDIZAJE COMPUTACIONAL
Ing. Jhon Jairo Anaya Díaz
• Construir un conjunto de datos de meteorología apropiado para el entrenamiento y validación de modelos descriptivos y predictivos de aprendizaje computacional.
• Diseñar, implementar y evaluar un modelo descriptivo de datos de meteorología, basado en técnicas de aprendizaje computacional.
• Diseñar, implementar y evaluar un modelo predictivo, basado en técnicas de aprendizaje computacional, para la estimación de niveles de material particulado.
METODOLOGÍA
La metodología que se va a usar es la propia para proyectos de esta envergadura, usada para desarrollas trabajos donde se estudien los Métodos de Minería de Datos,
como es el Modelo CRISP-DM)*.
Ing. Jhon Jairo Anaya Díaz
METODOLOGÍA
Dentro de estos niveles del modelo CRISP-DM1.0, se encuentra el ciclo de vida de un proyecto de minería de datos, los cuales se dividen en seis fases o etapas; el movimiento hacia adelante y hacia atrás entre fases diferentes es siempre requerido, para aportar nuevas ideas en el proceso.
Ing. Jhon Jairo Anaya Díaz
Fases de la metodología del modelo CRISP-DM1.0*