TECNOLOGÍAS INTELIGENTES
PARA EXPLOTACIÓN DE INFORMACIÓN
PROCESOS Y CASOS DE ESTUDIO
Dr. Ramón García-Martínez
CURSO DE DOCTORADO
PROCESOS EI
CORRESPONDENCIA ENTRE PROCESOS DE
EXPLOTACION DE INFORMACION, TECNOLOGIAS INTELIGENTES E INTELIGENCIA DE NEGOCIO
Predicción Agrupamiento
Ponderación Inducción
Agrupamiento + Inducción Inducción
+ Ponderación Agrupamiento + Ponderación
Redes BP Redes SOM
Redes Bayesianas Algoritmos TDIDT
SOM + TDIDT TDIDT + Redes Bayesianas
SOM + Redes Bayesianas
TECNOLOGIAS PROCESO EXPLOTACION DE INFO PARA INTELIGENCIA DE NEGOCIO
Descubrimiento de reglas de comportamiento
Descubrimiento de grupos
Ponderación de interdependencia de atributos
Descubrimiento de reglas de pertenencia a grupos
Ponderación de atributos relevantes en reglas de comportamiento
Ponderación de atributos relevantes en cada grupo descubierto
Predicción de valores de atributos
Aplica cuando en un patrón <atributos de entrada, atributos de salida>
se requiere predecir el valor de los atributos de salida para unos atributos de entrada dados.
Predicción de flujo de ventas
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Ejemplos de problemas que requieren este proceso:
Predicción de flujo de demanda
Predicción del variables geofisicas en prospección
petrolera.
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Identificación de atributos de entrada y
de salida
Archivos con atributos
de entrada y salida identificados (patrones)
Entrenamiento de Red BP para el reconocimiento de correspondencia de atributos de salida con los de entrada
Red BP entrenada
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Inferir anomalías y variaciones de velocidades en capas con espesores muy por debajo de la resolución sísmica a partir de la sección sísmica y datos de pozo. Utilizando la predicción de
datos faltantes.
Cersosimo, S., Ravazzoli, C., García-Martínez, R., 2006.
Identification of Velocity Variations in a Seismic Cube Using Neural Networks. IFIP Series, 218: 11-19.
CASO:
REFERENCIAS:
Aplica cuando se requiere identificar una partición en la masa de información disponible sobre el dominio de problema.
Identificación de segmentos de clientes para bancos y financieras
PROCESO: DESCUBRIMENTO DE GRUPOS
Ejemplos de problemas que requieren este proceso:
identificación de tipos de llamadas de clientes para empresas de telecomunicación
identificación de grupos sociales con las mismas características
identificación de grupos de estudiantes con características homogéneas
Gentileza: M.Ing. Paola Britos
PROCESO: DESCUBRIMENTO DE GRUPOS
Gentileza: M.Ing. Paola Britos
SOM
Generación de archivos de grupos
PROCESO: DESCUBRIMENTO DE GRUPOS
Britos, P., Grosser, H., Rodríguez, D., Garcia-Martinez, R.
(2008). Detecting Unusual Changes of Users Consumption.
IFIP Series, 276: 297-306.
CASO:
REFERENCIAS:
Se desea descubrir los patrones de llamadas de un usuario dado para llamadas locales, llamadas nacionales o y llamadas
internacionales en orden a detectar desvios en dichos patrones.
El perfil de usuario se estará representando con la distribución de frecuencia en la cuál un determinado usuario realiza un tipo de llamada determinada, mostrando esta estructura de
datos el patrón de consumo del mismo.
Las redes SOM) pueden tomar esta información y construir estos patrones de manera no supervisada por criterios de semejanza, sin saber nada a priori de los datos.
Para evitar ruidos en los datos, se utilizan 3 redes SOM que generen patrones para representar a las llamadas LOC, NAT e INT respectivamente.
El perfil de usuario se construye utilizando todos los patrones
generados por las 3 redes.
PROCESO: DESCUBRIMENTO DE GRUPOS
Patrones generados llamadas locales
0 5 10 15 20 25 30 35
0 5 10 15 20 25
Hora
Duración
Distribución de frecuencias CUP
0 0,005 0,01 0,015
1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241 PATRONES
(1-144: LOC, 145-208: NAT, 209-244: INT)
Frecuencia
Distribución de frecuencias UPH
0 0.002 0.004 0.006 0.008 0.01
1 16 31 46 61 76 91 106 121 136 151 166 181 196 211 226 241
PATRONES
(1-144: LOC, 145-208: NAT, 209-244: INT)
Frecuencia
PATRONES DE CONSUMO DE LA POBLACION DE USUARIOS
PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T
PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T+P
Aplica cuando se requiere identificar cuales son las condiciones para obtener determinado resultado en el dominio del problema.
Identificación de características del local mas visitado por los clientes
PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Ejemplos de problemas que requieren este proceso:
Identificación de factores que inciden en el alza las ventas de un producto dado
Establecimiento de características o rasgos de los clientes con alto grado de fidelidad a la marca
Establecimiento de atributos demográficos y
psicográficos que distinguen a los visitantes de un website
Gentileza: M.Ing. Paola Britos
PROCESO:
Gentileza: M.Ing. Paola Britos
Identificación de atributo Clase
DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Reglas de Comportamiento
Aplicación de TDIDT
PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Britos, P. Abasolo, M., García-Martínez, R. y Perales, F. 2005.
Identification of MPEG-4 Patterns in Human Faces Using Data Mining Techniques. Proceedings 13 th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision: 9-10.
CASO:
REFERENCIAS:
A partir de una base de datos con medidas antropométricas del rostro humano (MPEG4 FDP Face Definition Parameters)
desarrolladas por la Universidad de las Islas Baleares se busca
ver si existen reglas que permitan caracterizar diferencias en los
rostros segun el sexo.
PROCESO: DESCUBRIMENTO DE REGLAS
DE COMPORTAMIENTO
Aplica cuando se requiere identificar cuales son los factores con mayor incidencia (o frecuencia de ocurrencia) sobre un
determinado resultado del problema.
Factores con incidencia sobre las ventas
PROCESO: PONDERACION DE INTERDEPENDENCIA DE ATRIBUTOS
Ejemplos de problemas que requieren este proceso:
Rasgos distintivos de clientes con alto grado de fidelidad a la marca
Atributos claves que convierten en vendible a un determinado producto
Características sobresalientes que tienen los visitantes de un website
Gentileza: M.Ing. Paola Britos
PROCESO:
Gentileza: M.Ing. Paola Britos
Identificación de atributo Clase Aplicación
de TDIDT
PONDERACION DE INTERDEPENDENCIA
DE ATRIBUTOS
Aplica cuando se requiere identificar cuales son las condiciones de pertenencia a cada una de las clases en una partición
desconocida “a priori”, pero presente en la masa de información disponible sobre el dominio de problema.
Tipología de perfiles de clientes y caracterización de cada tipología
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Ejemplos de problemas que requieren este proceso:
Distribución y estructura de los datos de mi website
Segmentación etaria de mis estudiantes y comportamiento de cada segmento
Clases de llamadas telefónicas en una región y caracterización de cada clase
Gentileza: M.Ing. Paola Britos
PROCESO:
Gentileza: M.Ing. Paola Britos
DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
SOM
Generación de archivos de grupos
Identificación de atributo clase
Aplicación TDIDT Reglas de
Comportamiento de cada Grupo
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Cogliati, M., Britos, P., García-Martínez, R. 2006. Patterns in Temporal Series of Meteorological Variables Using SOM &
TDIDT. IFIP Series, 217: 305-314.
CASO:
REFERENCIAS:
En un grupo de series cronológicas de variables meteorológicas (temperatura, presión, intensidad dirección de viento) en Allen, en el Alto Valle del Río Negro se busca encontrar correlaciones entre características de la dirección e intensidad del viento, y el comportamiento de la temperatura del aire y la presión
atmosférica.
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Conjunto de registros de fenómenos meteorológicos
Clusters de registros de fenómenos meteorológicos
SOM TDIDT
TDIDT TDI DT
TDID T
TDIDT TDIDT
TDIDT
TDIDT
Aplica cuando se requiere identificar cuales son las condiciones con mayor incidencia (o frecuencia de ocurrencia) en la
determinación de una clase (cuyo comportamiento está descripto en términos de reglas)
Rasgo con mayor presencia en los clientes con alto grado de fidelidad a la marca
PROCESO:
Ejemplos de problemas que requieren este proceso:
Frecuencia de ocurrencia de cada perfil de de clientes
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES
EN REGLAS DE COMPORTAMIENTO
PROCESO:
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
Identificación del atributo
clase
Identificación del atributos antecedentes y consecuentes clase
Base con atributos relevantes y
y clase asociada
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
Jiménez Rey, E., Rodríguez, D., Britos, P., García-Martínez, R.
(2008). Identificación de Problemas de Aprendizaje de
Programación con Explotación de Información. Proceedings del XIV Congreso Argentino de Ciencias de la Computación, Workshop de Tecnología Informática Aplicada en Educación, Artículo 1881. ISBN 978-987-24611-0-2.
Britos, P., Jiménez Rey, E., García-Martínez, E. (2008). Work in Progress: Programming Misunderstandings Discovering
Process Based On Intelligent Data Mining Tools. Proceedings 38th ASEE/IEEE Frontiers in Education Conference. Session F4H: Assessing and Understanding Student Learning. ISBN 978-1-4244-1970-8.
CASO:
REFERENCIAS:
El Profesor de un curso de programación básica desea explorar
qué conceptos mal aprendidos están relacionados con el hecho
de que los estudiantes no logren descubrir el algoritmo correcto
asociado al problema propuesto y cuales de aquellos tienen
mayor incidencia
VARIABLE DE CLASE
¿Logra Descubrir el Algoritmo?
¿Descubre la Naturaleza del Problema?
¿Comprende el Objetivo del Problema?
¿Consigue Generalizar la Solución?
¿Aplica Método de Refinamientos Sucesivos?
¿Logra Funcionamiento del Programa?
¿Obtiene una Solución Lógica?
¿Controla Condición Fin de Ciclo Repetitivo?
¿Usa Conectores Lógicos en forma correcta?
VARIABLES PREDICTORAS
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
(TDIDT)
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
(Redes Bayesianas)
Se aplican redes bayesianas a las
variables que aparecen en las distintas reglas identificadas
- 100%
20%
80%
96%
4%
86%
14%
El estudiante descubre el algoritmo = sí El estudiante descubre el algoritmo = no
- 100%
- 7%
87%
7%
25%
62%
12%
57%
29%
14%
El estudiante logra funcionamiento del programa = sí El estudiante logra funcionamiento del programa = no
El estudiante logra funcionamiento del programa = sí, con algún error
- 100%
47%
53%
100%
- 86%
14%
El estudiante generaliza la solución = sí El estudiante generaliza la solución = no
79%
21%
93%
7%
100%
- 86%
14%
El estudiante comprende el objetivo del problema = sí El estudiante comprende el objetivo del problema = no
24%
76%
87%
13%
100%
- 86%
14%
El estudiante descubre la naturaleza del problema = sí El estudiante descubre la naturaleza del problema = no
67%
14%
19%
67%
20%
13%
79%
17%
4%
100%
- - El estudiante usa conectores lógicos correctamente = sí
El estudiante usa conectores lógicos correctamente = no El estudiante usa conectores lógicos correctamente = no evaluado
43%
43%
- 67%
13%
20%
67%
8%
25%
86%
14%
- El estudiante controla finalización ciclo repetitivo = sí
El estudiante controla finalización ciclo repetitivo = no
El estudiante controla finalización ciclo repetitivo = no siempre
86%
5%
10%
60%
20%
20%
58%
17%
25%
86%
- 14%
El estudiante programó alguna vez = no
El estudiante programó alguna vez = sí, en lenguaje Pascal El estudiante programó alguna vez = sí, en otro lenguaje
14%
69%
17%
33%
67%
- 50%
38%
12%
71%
14%
14%
El estudiante aplica método de refinamientos sucesivos = sí El estudiante aplica método de refinamientos sucesivos = incompleto
El estudiante aplica método de refinamientos sucesivos = no
Mala Regular
Buena Muy
Buena
El estudiante obtiene una solución lógica VARIABLES
Aplica cuando se requiere identificar cuales son las condiciones con mayor incidencia (o frecuencia de ocurrencia) en los atributos descriptores de un grupo.
Identificación del factor dominante que incide en el alza las ventas de un producto dado
PROCESO:
Ejemplos de problemas que requieren este proceso:
Identificación del tipo de llamada mas frecuente en una región
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES
EN GRUPOS DESCUBIERTOS
PROCESO:
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN GRUPOS DESCUBIERTOS
Aplicación de SOM
Identificación del atributos y grupo asociado