Ing. Jhon Jairo Anaya Díaz
SISTEMA PROTOTIPO PARA LA
ESTIMACIÓN DEL COMPORTAMIENTO
DEL ÍNDICE DE CALIDAD DEL AIRE
EN LA CIUDAD DE VALLEDUPAR
USANDO TÉCNICAS DE APRENDIZAJE
COMPUTACIONAL
•
Uno de los contaminantes más peligrosos es
el material particulado que tiene un
diámetro promedio menor de 10 micras
(PM10),
otro es el material particulado con
diámetro menor de 2.5 micras
(PM2.5).
También existe otro contaminante llamado
Material Particular Total
(TPM)
Ing. Jhon Jairo Anaya Díaz
ANTECEDENTES
http://www.ec.gc.ca/inrp-npri/default.asp?
El pequeño tamaño
del PM10 y del PM2.5,
les
permite
entrar
fácilmente
a
los
alveolos pulmonares,
donde
se
pueden
situar
causando
efectos adversos sobre
la salud.
Ing. Jhon Jairo Anaya Díaz
ANTECEDENTES
Otros contaminantes atmosféricos estudiados en las referencias son:
•Monóxido de Carbono (CO): es un gas incoloro e
inoloro que al reaccionar con la hemoglobina de la sangre forma carboxihemoglobina la cual interfiere con la oxigenación de los diferentes órganos y tejidos del cuerpo.
Ing. Jhon Jairo Anaya Díaz
ANTECEDENTES
• Ozono (O3): Un nivel elevado de O3 troposférico es un peligro potencial para la salud humana, los cultivos y la vegetación.
Se logra enmarcar tres escuelas
•
En los
Métodos Determinísticos
se
ordenan todos los que usan modelos de
transporte
químico,
aplicando
fundamentalmente
principios
de
simulación física y química.
•
Los
Métodos Empíricos
usan modelos
estadísticos o técnicas numéricas.
•
Los
Híbridos:
Combinación de los
anteriores
Ing. Jhon Jairo Anaya Díaz
Ing. Jhon Jairo Anaya Díaz
Predicción de la Calidad del Aire
EMPÍRICO ANÁLISIS NUMÉRICO ESTADÍSTICOS Machine Learning Hibrido Métodos Lineales Data Mining Predictor Simple Modelo Lineal Regresión No Lineal DETERMINÍSTICO HIBRIDO Métodos Estadísticos Métodos Estocásticos Sistema de Modelamiento Determístico Software Especializado MLP SVM RBF ELMA
SEMI - MARKOV OCULTO (HSMM) TRANSFORMADA DE WAVELET MÚLTIPLE REGRESIÓN LINEAL ARIMA LRA CART PCA PERSISTENCIA NLR BACK-TRAYECTORY MACHINE LEARNING/ ESTADÍSTICO LINEAL / NO LINEAL
MACHINE LEARNING / T WAVALET
MACHINE LEARNING / REGRESIÓN NO LINEA
Mapa Mental de la Metodología del Estado del Arte
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
01/01/2000 01/06/2012
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
PM10: Material Particulado menor a 10 Micras PM2.5: Material Particulado menor a 2.5 Micras PST: Partículas Suspendidas Totales
CO: Monóxido de Carbono SOx: Óxidos de Azufre NOx: Óxidos de Nitrógeno O3: Ozono
RS: Radiación Solar ML: Machine Learning NL: Numérico Lineal NNL: Numérico No Líneal SP: Simple Prediction
MLE: Modelo Lineal Estadístico E: Estadístico
MANL: Modelo Adaptativo No Lineal H: Híbrido
HSMM: Semi-Markov Oculto SE: Software Especializado
2001 Empírico PST ML-NL 2000 Empírico PM2.5 ML-SP 2002 Empírico PM10 ML-NL 2003
Empírico y Determinístico NO2, PM10 ML-MLE 2003 Empírico NOx ML-NL 2004 Empírico CO ML 2006 Empírico PM10 ML-NL 2005 Empírico PM10 ML 2005 Empírico NO2 ML 2005 Empírico PM2.5 ML 2005 Empírico PM10, O3 ML 2005 Híbrido NO2, PM2.5 ML/E 2006 Empírico PM10 ML 2006 Empírico PM10 H 2006 Empírico PM10 MANL 2007 Empírico NO2, CO,SO2 ML 2008 Empírico e Híbrido
PM10 ML-NL y NL/NNL
2008 Empírico NO2, O3,SO2, CO
ML 2008 Empírico PM10 ML 2009 Empírico CO,SO2 ML 2009 Empírico PM10,CO,NO2, O3 ML 2009 Empírico PM2.5 HSMM 2010 Empírico RS ML 2009 Empírico PM10,CO,NO2 H 2010 Empírico PM2.5 NNL 2010 Empírico PM10, CO, SO2
ML
2010 Empírico NO2, CO, SO2, O3
ML 2011 Híbrido PM10 ML/E 2011 Empírico PM10 ML 2011 Híbrido PM10, PM2.5 ML/NNL 2012 Empírico PM10 H 2012 Empírico PM10 ML 2012 Híbrido CO ML/NNL 2012
Empírico y Determinístico PM10
ML-SE
2008 Empírico PM10, NO2, O3,SO2, CO
ML
Año
Escuela
Contaminante
Método
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
Representación de los Clases
Se observa el dominio de la Clase Empírica sobre las Determinísticas y las Híbridas; el 82% de las referencias estudiadas en el estado del arte recomiendan, evalúan y utilizan en el pronóstico de la calidad del aire, de acuerdo con sus investigaciones, una Red Neuronal o cualquier otro empírico
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
Diagrama Circular de la Clase
Empírica
ANTECEDENTES
Ing. Jhon Jairo Anaya Díaz
Contaminantes Estudiados en el estado del arte de la investigación
Los contaminantes del aire ejercen una
amplia gama de impactos biológicos y
físicos sobre los ecosistemas. Sus
efectos sobre la salud humana son
motivo de especial preocupación
*y
amplio estudio en los países en vía
desarrollo.
Ing. Jhon Jairo Anaya Díaz
PROBLEMÁTICA
Otro aspecto importante es el problema del modelo para la estimación, desde el punto de vista computacional, el cual resulta ambicioso ya que mezcla técnicas de Minería de Datos, basadas en Aprendizaje de Máquinas y la meteorología propia de Valledupar para estimar el comportamiento del índice de calidad de Aire (ICA)
Ing. Jhon Jairo Anaya Díaz
PROBLEMÁTICA
CICLO DE LA CALIDA DEL AIRE
Ing. Jhon Jairo Anaya Díaz
http://imageshack.us/photo/my-images/27/dibujouut.jpg/
La calidad del aire ha emergido como
el mayor factor de contribución a la
calidad de Vida en las zonas urbanas,
y
especialmente
en
las
áreas
densamente
pobladas
e
industrializadas
*Ing. Jhon Jairo Anaya Díaz
JUSTIFICACIÓN
Desarrollar un estudio de este estilo en
una zona de gran influencia a este
tipo de contaminantes como la ciudad
de Valledupar, propensa a desarrollar
problemas en la salud pública, es muy
ventajoso ya que la investigación sería
pionera en este ámbito en la región.
Ing. Jhon Jairo Anaya Díaz
DELIMITACIÓN
Ing. Jhon Jairo Anaya Díaz
Las predicciones de la calidad del aire sirven como base para la adopción de múltiples decisiones en el ámbito de salud pública de la región, gestión del riesgos, agricultura, entre otras y mas para nuestra región explotadora de recursos energéticos.
Para este estudio se investiga la utilidad de las técnicas de aprendizaje de máquinas para la estimación del ICA y de técnicas de Minería de Datos para la descripción de los mejores datos de
DELIMITACIÓN
Ing. Jhon Jairo Anaya Díaz
Además se precisan datos de
meteorología de una zona especial
de la región minera del Cesar
como lo es el municipio de
Valledupar
y
de
su
ICA
monitoreado
por
máquinas
OBJETIVOS
DESARROLLAR UN SISTEMA PROTOTIPO PARA LA ESTIMACIÓN DEL COMPORTAMIENTO DEL ÍNDICE DE CALIDAD DEL AIRE EN LA CIUDAD DE VALLEDUPAR USANDO TÉCNICAS DE APRENDIZAJE COMPUTACIONAL
Ing. Jhon Jairo Anaya Díaz
Construir un conjunto de datos de meteorología e índice de calidad del aire apropiado para el entrenamiento y validación de
modelos descriptivos y predictivos de aprendizaje computacional.
Diseñar, implementar y evaluar un modelo descriptivo de datos de meteorología e índice de calidad del aire, basado en técnicas de aprendizaje computacional.
Diseñar, implementar y evaluar un modelo predictivo, basado en técnicas de aprendizaje computacional, para la estimación del índice de calidad del aire.
METODOLOGÍA
La metodología que se va a usar es la
propia para proyectos de esta envergadura,
usada para desarrollas trabajos donde se
estudien los Métodos de Minería de Datos,
como es el Modelo CRISP-DM)
*.
Ing. Jhon Jairo Anaya Díaz
Niveles de Abstracción CRISP-DM 1.0**
*CRoss-Industry Standard Process for Data Mining
METODOLOGÍA
Dentro de estos niveles del modelo CRISP-DM1.0, se encuentra el ciclo de vida de un proyecto de minería de datos, los cuales se dividen en seis fases o etapas; el movimiento hacia adelante y hacia atrás entre fases diferentes es siempre requerido, para aportar nuevas ideas en el proceso.
Ing. Jhon Jairo Anaya Díaz
Fases de la metodología del modelo CRISP-DM1.0*