• No se han encontrado resultados

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

N/A
N/A
Protected

Academic year: 2021

Share "TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN"

Copied!
26
0
0

Texto completo

(1)

TECNOLOGÍAS INTELIGENTES

PARA EXPLOTACIÓN DE INFORMACIÓN

PROCESOS Y CASOS DE ESTUDIO

Dr. Ramón García-Martínez

CURSO DE DOCTORADO

(2)

PROCESOS EI

CORRESPONDENCIA ENTRE PROCESOS DE

EXPLOTACION DE INFORMACION, TECNOLOGIAS INTELIGENTES E INTELIGENCIA DE NEGOCIO

Predicción Agrupamiento

Ponderación Inducción

Agrupamiento + Inducción Inducción

+ Ponderación Agrupamiento + Ponderación

Redes BP Redes SOM

Redes Bayesianas Algoritmos TDIDT

SOM + TDIDT TDIDT + Redes Bayesianas

SOM + Redes Bayesianas

TECNOLOGIAS PROCESO EXPLOTACION DE INFO PARA INTELIGENCIA DE NEGOCIO

Descubrimiento de reglas de comportamiento

Descubrimiento de grupos

Ponderación de interdependencia de atributos

Descubrimiento de reglas de pertenencia a grupos

Ponderación de atributos relevantes en reglas de comportamiento

Ponderación de atributos relevantes en cada grupo descubierto

Predicción de valores de atributos

(3)

Aplica cuando en un patrón <atributos de entrada, atributos de salida>

se requiere predecir el valor de los atributos de salida para unos atributos de entrada dados.

Predicción de flujo de ventas

PROCESO: PREDICCION DE VALORES DE ATRIBUTOS

Ejemplos de problemas que requieren este proceso:

Predicción de flujo de demanda

Predicción del variables geofisicas en prospección

petrolera.

(4)

PROCESO: PREDICCION DE VALORES DE ATRIBUTOS

Identificación de atributos de entrada y

de salida

Archivos con atributos

de entrada y salida identificados (patrones)

Entrenamiento de Red BP para el reconocimiento de correspondencia de atributos de salida con los de entrada

Red BP entrenada

(5)

PROCESO: PREDICCION DE VALORES DE ATRIBUTOS

Inferir anomalías y variaciones de velocidades en capas con espesores muy por debajo de la resolución sísmica a partir de la sección sísmica y datos de pozo. Utilizando la predicción de

datos faltantes.

Cersosimo, S., Ravazzoli, C., García-Martínez, R., 2006.

Identification of Velocity Variations in a Seismic Cube Using Neural Networks. IFIP Series, 218: 11-19.

CASO:

REFERENCIAS:

(6)

Aplica cuando se requiere identificar una partición en la masa de información disponible sobre el dominio de problema.

Identificación de segmentos de clientes para bancos y financieras

PROCESO: DESCUBRIMENTO DE GRUPOS

Ejemplos de problemas que requieren este proceso:

identificación de tipos de llamadas de clientes para empresas de telecomunicación

identificación de grupos sociales con las mismas características

identificación de grupos de estudiantes con características homogéneas

Gentileza: M.Ing. Paola Britos

(7)

PROCESO: DESCUBRIMENTO DE GRUPOS

Gentileza: M.Ing. Paola Britos

SOM

Generación de archivos de grupos

(8)

PROCESO: DESCUBRIMENTO DE GRUPOS

Britos, P., Grosser, H., Rodríguez, D., Garcia-Martinez, R.

(2008). Detecting Unusual Changes of Users Consumption.

IFIP Series, 276: 297-306.

CASO:

REFERENCIAS:

Se desea descubrir los patrones de llamadas de un usuario dado para llamadas locales, llamadas nacionales o y llamadas

internacionales en orden a detectar desvios en dichos patrones.

El perfil de usuario se estará representando con la distribución de frecuencia en la cuál un determinado usuario realiza un tipo de llamada determinada, mostrando esta estructura de

datos el patrón de consumo del mismo.

Las redes SOM) pueden tomar esta información y construir estos patrones de manera no supervisada por criterios de semejanza, sin saber nada a priori de los datos.

Para evitar ruidos en los datos, se utilizan 3 redes SOM que generen patrones para representar a las llamadas LOC, NAT e INT respectivamente.

El perfil de usuario se construye utilizando todos los patrones

generados por las 3 redes.

(9)

PROCESO: DESCUBRIMENTO DE GRUPOS

Patrones generados llamadas locales

0 5 10 15 20 25 30 35

0 5 10 15 20 25

Hora

Duración

Distribución de frecuencias CUP

0 0,005 0,01 0,015

1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241 PATRONES

(1-144: LOC, 145-208: NAT, 209-244: INT)

Frecuencia

Distribución de frecuencias UPH

0 0.002 0.004 0.006 0.008 0.01

1 16 31 46 61 76 91 106 121 136 151 166 181 196 211 226 241

PATRONES

(1-144: LOC, 145-208: NAT, 209-244: INT)

Frecuencia

PATRONES DE CONSUMO DE LA POBLACION DE USUARIOS

PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T

PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T+P

(10)

Aplica cuando se requiere identificar cuales son las condiciones para obtener determinado resultado en el dominio del problema.

Identificación de características del local mas visitado por los clientes

PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO

Ejemplos de problemas que requieren este proceso:

Identificación de factores que inciden en el alza las ventas de un producto dado

Establecimiento de características o rasgos de los clientes con alto grado de fidelidad a la marca

Establecimiento de atributos demográficos y

psicográficos que distinguen a los visitantes de un website

Gentileza: M.Ing. Paola Britos

(11)

PROCESO:

Gentileza: M.Ing. Paola Britos

Identificación de atributo Clase

DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO

Reglas de Comportamiento

Aplicación de TDIDT

(12)

PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO

Britos, P. Abasolo, M., García-Martínez, R. y Perales, F. 2005.

Identification of MPEG-4 Patterns in Human Faces Using Data Mining Techniques. Proceedings 13 th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision: 9-10.

CASO:

REFERENCIAS:

A partir de una base de datos con medidas antropométricas del rostro humano (MPEG4 FDP Face Definition Parameters)

desarrolladas por la Universidad de las Islas Baleares se busca

ver si existen reglas que permitan caracterizar diferencias en los

rostros segun el sexo.

(13)

PROCESO: DESCUBRIMENTO DE REGLAS

DE COMPORTAMIENTO

(14)

Aplica cuando se requiere identificar cuales son los factores con mayor incidencia (o frecuencia de ocurrencia) sobre un

determinado resultado del problema.

Factores con incidencia sobre las ventas

PROCESO: PONDERACION DE INTERDEPENDENCIA DE ATRIBUTOS

Ejemplos de problemas que requieren este proceso:

Rasgos distintivos de clientes con alto grado de fidelidad a la marca

Atributos claves que convierten en vendible a un determinado producto

Características sobresalientes que tienen los visitantes de un website

Gentileza: M.Ing. Paola Britos

(15)

PROCESO:

Gentileza: M.Ing. Paola Britos

Identificación de atributo Clase Aplicación

de TDIDT

PONDERACION DE INTERDEPENDENCIA

DE ATRIBUTOS

(16)

Aplica cuando se requiere identificar cuales son las condiciones de pertenencia a cada una de las clases en una partición

desconocida “a priori”, pero presente en la masa de información disponible sobre el dominio de problema.

Tipología de perfiles de clientes y caracterización de cada tipología

PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS

Ejemplos de problemas que requieren este proceso:

Distribución y estructura de los datos de mi website

Segmentación etaria de mis estudiantes y comportamiento de cada segmento

Clases de llamadas telefónicas en una región y caracterización de cada clase

Gentileza: M.Ing. Paola Britos

(17)

PROCESO:

Gentileza: M.Ing. Paola Britos

DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS

SOM

Generación de archivos de grupos

Identificación de atributo clase

Aplicación TDIDT Reglas de

Comportamiento de cada Grupo

(18)

PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS

Cogliati, M., Britos, P., García-Martínez, R. 2006. Patterns in Temporal Series of Meteorological Variables Using SOM &

TDIDT. IFIP Series, 217: 305-314.

CASO:

REFERENCIAS:

En un grupo de series cronológicas de variables meteorológicas (temperatura, presión, intensidad dirección de viento) en Allen, en el Alto Valle del Río Negro se busca encontrar correlaciones entre características de la dirección e intensidad del viento, y el comportamiento de la temperatura del aire y la presión

atmosférica.

(19)

PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS

Conjunto de registros de fenómenos meteorológicos

Clusters de registros de fenómenos meteorológicos

SOM TDIDT

TDIDT TDI DT

TDID T

TDIDT TDIDT

TDIDT

TDIDT

(20)

Aplica cuando se requiere identificar cuales son las condiciones con mayor incidencia (o frecuencia de ocurrencia) en la

determinación de una clase (cuyo comportamiento está descripto en términos de reglas)

Rasgo con mayor presencia en los clientes con alto grado de fidelidad a la marca

PROCESO:

Ejemplos de problemas que requieren este proceso:

Frecuencia de ocurrencia de cada perfil de de clientes

Gentileza: M.Ing. Paola Britos

PONDERACIÓN DE ATRIBUTOS RELEVANTES

EN REGLAS DE COMPORTAMIENTO

(21)

PROCESO:

Gentileza: M.Ing. Paola Britos

PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO

Identificación del atributo

clase

Identificación del atributos antecedentes y consecuentes clase

Base con atributos relevantes y

y clase asociada

(22)

PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO

Jiménez Rey, E., Rodríguez, D., Britos, P., García-Martínez, R.

(2008). Identificación de Problemas de Aprendizaje de

Programación con Explotación de Información. Proceedings del XIV Congreso Argentino de Ciencias de la Computación, Workshop de Tecnología Informática Aplicada en Educación, Artículo 1881. ISBN 978-987-24611-0-2.

Britos, P., Jiménez Rey, E., García-Martínez, E. (2008). Work in Progress: Programming Misunderstandings Discovering

Process Based On Intelligent Data Mining Tools. Proceedings 38th ASEE/IEEE Frontiers in Education Conference. Session F4H: Assessing and Understanding Student Learning. ISBN 978-1-4244-1970-8.

CASO:

REFERENCIAS:

El Profesor de un curso de programación básica desea explorar

qué conceptos mal aprendidos están relacionados con el hecho

de que los estudiantes no logren descubrir el algoritmo correcto

asociado al problema propuesto y cuales de aquellos tienen

mayor incidencia

(23)

VARIABLE DE CLASE

¿Logra Descubrir el Algoritmo?

¿Descubre la Naturaleza del Problema?

¿Comprende el Objetivo del Problema?

¿Consigue Generalizar la Solución?

¿Aplica Método de Refinamientos Sucesivos?

¿Logra Funcionamiento del Programa?

¿Obtiene una Solución Lógica?

¿Controla Condición Fin de Ciclo Repetitivo?

¿Usa Conectores Lógicos en forma correcta?

VARIABLES PREDICTORAS

PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO

(TDIDT)

(24)

PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO

(Redes Bayesianas)

Se aplican redes bayesianas a las

variables que aparecen en las distintas reglas identificadas

- 100%

20%

80%

96%

4%

86%

14%

El estudiante descubre el algoritmo = sí El estudiante descubre el algoritmo = no

- 100%

- 7%

87%

7%

25%

62%

12%

57%

29%

14%

El estudiante logra funcionamiento del programa = sí El estudiante logra funcionamiento del programa = no

El estudiante logra funcionamiento del programa = sí, con algún error

- 100%

47%

53%

100%

- 86%

14%

El estudiante generaliza la solución = sí El estudiante generaliza la solución = no

79%

21%

93%

7%

100%

- 86%

14%

El estudiante comprende el objetivo del problema = sí El estudiante comprende el objetivo del problema = no

24%

76%

87%

13%

100%

- 86%

14%

El estudiante descubre la naturaleza del problema = sí El estudiante descubre la naturaleza del problema = no

67%

14%

19%

67%

20%

13%

79%

17%

4%

100%

- - El estudiante usa conectores lógicos correctamente = sí

El estudiante usa conectores lógicos correctamente = no El estudiante usa conectores lógicos correctamente = no evaluado

43%

43%

- 67%

13%

20%

67%

8%

25%

86%

14%

- El estudiante controla finalización ciclo repetitivo = sí

El estudiante controla finalización ciclo repetitivo = no

El estudiante controla finalización ciclo repetitivo = no siempre

86%

5%

10%

60%

20%

20%

58%

17%

25%

86%

- 14%

El estudiante programó alguna vez = no

El estudiante programó alguna vez = sí, en lenguaje Pascal El estudiante programó alguna vez = sí, en otro lenguaje

14%

69%

17%

33%

67%

- 50%

38%

12%

71%

14%

14%

El estudiante aplica método de refinamientos sucesivos = sí El estudiante aplica método de refinamientos sucesivos = incompleto

El estudiante aplica método de refinamientos sucesivos = no

Mala Regular

Buena Muy

Buena

El estudiante obtiene una solución lógica VARIABLES

(25)

Aplica cuando se requiere identificar cuales son las condiciones con mayor incidencia (o frecuencia de ocurrencia) en los atributos descriptores de un grupo.

Identificación del factor dominante que incide en el alza las ventas de un producto dado

PROCESO:

Ejemplos de problemas que requieren este proceso:

Identificación del tipo de llamada mas frecuente en una región

Gentileza: M.Ing. Paola Britos

PONDERACIÓN DE ATRIBUTOS RELEVANTES

EN GRUPOS DESCUBIERTOS

(26)

PROCESO:

Gentileza: M.Ing. Paola Britos

PONDERACIÓN DE ATRIBUTOS RELEVANTES EN GRUPOS DESCUBIERTOS

Aplicación de SOM

Identificación del atributos y grupo asociado

Referencias

Documento similar

Artículo 13. Las solicitudes de reconocimiento presentadas, en las que se aleguen créditos obtenidos en títulos universitarios oficiales de Graduado, para la convalidación

Los edificios inteligentes también aceleran la adopción de tecnologías sostenibles, como los vehículos eléctricos y la energía solar, con una integración inteligente.. Y para

(...) la situación constitucional surgida tras la declaración del estado de emergencia es motivo de preocupación para la Comisión de Venecia. La declaración en sí misma no definió

Se consideran aprobadas con anterioridad las materias cursadas de acuerdo con el currículo regulado por la LOE con una calificación igual o superior a 5, que tengan

La combinación, de acuerdo con el SEG, de ambos estudios, validez y fiabilidad (esto es, el estudio de los criterios de realidad en la declaración), verificada la

Ámbito: GUI - La autenticidad, validez e integridad de este documento puede ser verificada mediante el &#34;Código Seguro de Verificación (CSV)&#34; en la

Además, es muy importante la valoración completa de la paciente con atención en el origen de la fístula, tiempo de recidiva, ausencia de infección, estado de los tejidos y

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o