Inteligencia de Negocios

14  Descargar (0)

Texto completo

(1)

Claudio Henríquez Berroeta

Inteligencia de Negocios

T E C N O L O G Í A S D E A P O Y O

(2)

Modelamiento de la toma de decisión y sus procesos

Temario

Introducción

Data Warehouse

Data Mining

Modelamiento del Conocimiento

Proceso KDD

(3)

Tecnologías de Apoyo

Introducción

Una vez definido el modelo de toma de decisión se debe seguir algún procedimiento para obtener los resultados deseados: sistema de apoyo a la toma de decisiones

En Inteligencia de Negocios el paradigma es:

utilizar conocimiento basados en hechos.

Hay dos aspectos fundamentales:

Hechos

Conocimiento

(4)

Tecnologías de Apoyo

Introducción

Hechos

Desde el punto de vista BI corresponden a situaciones de negocios sucedidas y reales

Importante: almacenar y organizar los hechos, que son todos los datos e información de negocios de una organización

Procedimiento: Data Warehouse

(5)

Tecnologías de Apoyo

Conocimiento

Definición: percepción de la verdad de proposiciones acerca de cosas o hechos

El conocimiento se obtiene mediante procesos inteligentes: experiencia, raciocinio, deducción, descubrimiento, etc.

Procedimientos y Tecnologías para generar conocimiento de los datos:

Data Mining

Modelamiento del conocimiento

Proceso KDD

(6)

Data WareHouse (DW)

Definición

Es una colección de integrada de bases de datos, diseñadas para apoyar la toma de decisiones (DSS), donde cada unidad de datos no es volátil (mantiene la historia) y es o fue relevante en tiempo.

Es una colección físicamente independiente de otros repositorios

Almacena datos agregados y operacionales particularmente separados de los ocupados en los procesos transaccionales (en línea)

Algunos conceptos o entidades

Almacén de datos operacional: alimentar el DW con datos actuales

Data Marts: versión especializada de DW

Metadatos: definición de que es cada dato

(7)

Data Mining (DM)

Definición

Es un conjunto de actividades ocupadas para encontrar patrones nuevos, ocultos o inesperados en los datos. Es decir generar conocimiento a partir de los datos

A las técnicas organizadas de data mining tendientes a obtener un resultado concreto se denomina Descubrimiento de Conocimiento desde los Datos (KDD)

Requerimientos

Disponer de un conjunto organizado de datos: Data Warehouse o Data Marts

Como define el conocimiento: técnicas de modelamiento

Disponer de un procedimiento claro y definido para generar el conocimiento: KDD

(8)

Modelamiento del Conocimiento

Introducción

Existen una gran variedad de esquemas ocupados para modelar el conocimiento.

La elección de un modelo específico dependerá de diversos factores:

Como de extrae o se arma el conocimiento

Área del conocimiento específico

Capacidad del modelo de retener conocimiento (precisión)

Capacidad que tiene el modelo de explicar: cajas negras, grises, etc.

Como se va a ocupar el conocimiento (DSS)

(9)

Modelamiento del Conocimiento

Categorización

Los algoritmos para generar conocimiento se pueden clasificar según las siguientes categorías

Clasificación: la idea es descubrir las reglas que definen si un objeto particular pertenece o no a un determinado conjunto o clase definida

Asociación: es el descubrimiento de correlaciones entre datos de entrada y las salidas producidas: generación de funciones

Secuencia: se ocupa para relacionar eventos en el tiempo, como predicción de valores, tasas de intereses: análisis de series de tiempo

Conglomerados (cluster): la idea es crear particiones en los datos, agrupando elementos según similaridad y generando clases (inducidas)

(10)

Metodologías Principales

Modelamiento Estadístico

Es el modelo más maduro y asentado

Fácil de entender

Se basa principalmente de el manejo y definición de Probabilidades Objetivas

Dispone de un base teórica bastante sólida, que otorga una seguridad a los resultados obtenidos como: rangos de significancia de los parámetros, se conoce la precisión de los resultados, etc.

Modelos pueden ser algo limitados:

principalmente relaciones lineales y definición de

pocos parámetros

(11)

Metodologías Principales

Modelamiento Neuronal

Las redes neuronales artificiales surgen del análisis de los modelos neuronales reales: se acercan más a los procesos inteligentes naturales

Desarrollan capacidades análogas:

Aprendizaje a partir de los datos

Modelamiento patrones complejos

Modelos no lineales y de muchas variables

Algunos “inconvenientes”:

Dificultad de entender los modelos

Una base teórica no completamente asentada

(12)

Metodologías Principales

Arboles de Decisión

Modelo conceptualmente simple que surge del proceso de toma de decisión

Fácil de entender y apropiado para sistemas de toma de decisión

Asume la toma de decisiones secuenciales sobre una variable específica

Tiende naturalmente a crecer de manera exponencial,

reduciendo la efectividad del manejo de muchas variables simultáneas

La capacidad de modelamiento algo más limitada que otros esquemas (como el neuronal)

Se dispone de procesos simples para construir árboles (inducción de árboles)

(13)

Metodologías Principales

Modelos específicos

Existen muchos modelos que se ajustan a una situación particular

Se obtiene mucho mayor eficiencia en el proceso de modelar conocimiento disponible

Ejemplos:

Modelo de series de tiempo

Modelos fenomenológicos: por ejemplo, modelos

meteorológicos

(14)

Metodologías Principales

Modelos híbridos

Las metodologías principales se pueden combinar convenientemente para generar modelos híbridos de distintos tipos, y aprovechar las ventajas de

cada uno

Arboles de decisión + redes neuronales

Modelos fenomenológicos + redes neuronales

Modelos fenomenológicos + estadísticos

Figure

Actualización...

Referencias

Related subjects :