• No se han encontrado resultados

bodegasdedatos-

N/A
N/A
Protected

Academic year: 2020

Share "bodegasdedatos-"

Copied!
34
0
0

Texto completo

(1)BODEGA DE DATOS Por: Fabiola del Toro Osorio.

(2) La toma de decisiones se facilita cuando se cuenta con información. En un mercado que cambia, las decisiones se deben tomar con base al conocimiento. conocimiento.

(3) Las bodegas de datos en la actualidad En el 1994,, Howard Dresdner de Gartner Group p predijo lo siguiente: “En el 1996, el uso de las soluciones de inteligencia de negocio cambiará dramáticamente de analistas dedicados a todos los gerentes y profesionales como la manera preferida de entender el negocio. g En lugar g de un p pequeño q número de analistas invirtiendo el cien por ciento de su tiempo analizando datos, todos los gerentes y profesionales invertirán el diez por ciento de su tiempo utilizando herramientas de inteligencia de negocio…”.

(4) Algunas motivaciones para la implementación l ó de d DW • • • • • • • •. Visualizar detalladamente su negocio Optimizar sus procesos Alcanzar sus metas y objetivos a partir de toma de decisiones basadas en conocimiento Interés en manejar grandes volúmenes de datos en la toma de decisiones Manejo de múltiples y variadas fuentes de información Eliminar la dispersión p de la información Minimizar las inconsistencias en la información Facilitar el acceso a la información histórica.

(5) Algunas definiciones de DW "Yo Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico". 1993 Susan Osterfeldt 1993,.

(6) Las bodegas de datos ponen a su disposición conocimiento. “Es una colección de datos para p soporte al proceso de toma de d ii decisiones”. ” W. H. Inmon.

(7) La construcción y uso de la bodega de datos para generar dicho conocimiento La Bodega de Datos NO es un producto, es un proceso. Extracción. Transformación. Carga. Visualización. El proceso de unir datos de diferentes fuentes, para extraer conocimiento.

(8) El almacenamiento de datos debe ser usado según sus propias caracteríscas Bases de datos operacionales. Sistema de B d Bodega d de D Datos t. . Orientación al proceso. Orientación a T Toma d de decisiones.

(9) Los datos a incluir en la bodega g potencian su uso Los datos a incluir en la bodega están asociados a información relevante en la organización. Ventas Facturas. Recursos Humanos. Definición productos. Conocimiento (Toma decisiones).

(10) Los datos unificados Integrada. La base de datos contiene los datos Integrada de todos los sistemas operacionales de la organización y dichos datos deben ser organización, consistentes Fuente1. Ventas. Fuente2. Fuentes Externas Fuentes Internas. Definición productos. Almacen de Datos.

(11) Los datos reflejan j fotos momento a momento Variable en el tiempo.

(12) Los datos permanecen en el tiempo No volátil volátil. La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura lectura, y se mantiene para futuras consultas..

(13) Otras visiones de las bodegas de datos Un almacén de datos es una copia p de las transacciones de datos específicamente estructurada para la consulta y el análisis. Un data warehouse no es más que la unión de todos los Data marts de una entidad entidad. Definición de Ralph Kimball.

(14) Los Data mart como un medio para para consolidar una bodega de datos Los Data marts son subconjuntos de datos de un data warehouse para áreas especificas especificas. Entre las características de un data mart destacan: – Usuarios limitados. – Área especifica. – Tiene un propósito especifico. – Tiene una función de apoyo..

(15) La visualización de la información se puede hacer a partir de cubos.

(16) Componentes de la bodega de datos. Tomado de The Data Warehouse Toolkit Second Edition The Complete Guide to Dimensional Modeling. Modeling Ralph Kimball, Margy Ross.

(17) Los mismos componentes pueden verse de d diferentes df maneras BD 1. Herramientas de consultas e informes Fuentes Internas. Herramientas EIS BD 2. ETL Fuente1. Fuente2. Almacen de Datos. Herramientas OLAP Herramientas Minería. Fuentes Externas.

(18) El motor de la bodega de datos maximiza el potencial d los de l demás d á componentes t de d la l solución l ió Gartner MQ 2001. Gartner MQ 2007.

(19) Diversidad de herramientas para Extracción, ó Trasformación f ó y Carga • • • • • • •. Suite de herramientas de Teradata Integration Services Microsoft S i d Suite de h herramientas i de d O Oracle l Data Integrator & Services Suite de herramientas de IBM Pentaho Data Integration (Software libre) ………….

(20) Algunos tips de las herramientas de ETL • • • • •. Rápido acceso a los datos Actualización de la información oportuna Escalabilidad l bilid d Capacidades de reinicio Integración con plataformas líderes.

(21) Diversidad de herramientas para Visualizar l la l información f ó Gartner 2007. Fuente: Gartner.

(22) Desarrollo incremental y metodología clara de implementación.

(23) Definición de preguntas – Hacia dó d se orienta la dónde l organización ó Visión Metas Objetivos Estrategias Factores de Éxito. Preguntas de Negocio.

(24) Se parte del análisis de los requerimientos de d la l DW Visión. Obj ti 1 Objetivo. Meta 1. Meta ….. Obj ti …. Objetivo. Obj ti n Objetivo. Meta n. Estrategia 1. Factor de Éxito 1. Activos de Información Factor de Éxito n. Estrategia …. Estratengia n.

(25) Modelando el negocio se validan los requerimientos y se inicia proceso P e rs o n a P e r s o n a ID E m. p re s a. E m p re s a ID. N u m e r o Id e n t ifi c a c io n T i p o Id e n t ifi c a c io n ID (F K ) N o m b re A p e llid o e m a il C a r g o ID (F K ) D ir e c c i o n C a s a D ir e c c i o n T r a b a j o T e le fo n o T r a b a jo T e le fo n o c a s a N u m e ro H ijo s In d C o n y u g u e T r a b a j a F e c h a N a c i m ie n t o P a s a t ie m p o ID ( F K ) T ip o In g re s o ID (F K ) A n t ig u e d a d L a b o r a lID (F K ) S e x o ID (F K ) E s t a d o C iv i lID (F K ) N i v e l E d u c a t i v o ID (F K ) E s t ra t o S o c ia lID (F K ) T i p o V i v i e n d a ID (F K ) M u l t i p l i c a d o r In g r e s o ID (F K ) E s t a d o C li e n t e ID ( F K ) T i p o C o n t r a t o ID (F K ) C i u d a d L a b o r a l ID (F K ) C i u d a d R e s i d e n c i a ID (F K ) In d C r e d i t o P r o v e e d o r e s P e r s o n a s a C a r g o ID (F K ) F e c h a In ic io F e c h a F in E m p r e s a ID (F K ) P r o fe s i o n I D (F K ). (F K ). Id e n t ifi c a c i o n D ir e c c i o n T e le fo n o E m p re s a D e s c P a g in a W e b C o d ig o E m p re s a C a l ifi c a c io n ID (F K ) T a m a ñ o ID ( F K ) In d E m p r e s a R e c o n o c id a N a t u r a le z a J u r i d i c a ID (F K ) R a n g o A vis o s D ir e c t o ID (F K ) T ip o N o m i n a ID ( F K ) A c t i v id a d E c o n o m ic a ID (F K ) I n d In d u s t r i a y C o m e r c i o R a n g o S a l a r i o P r o m e d i o A d m o n ID (F K ) R a n g o S a l a r i o P r o m e d io O p ID (F K ) I n g r e s o E m p l e a d o ID (F K ) R a n g o N u m e ro E m p le a d o s ID (F K ) F e c h a In ic io F e c h a F in T ip o R i e s g o ID (F K ) C a l ifi c a c io n E m p r e s a s ID (F K ) T ip o C o n v e n i o ID (F K ) T ip o A l i a n z a ID ( F K ) E n t id a d P r e p a g o s ID ( F K ) E n t id a d P r e p a g a d ID ( F K ) F u e r z a ID (F K ) In d C o n v e n io. C a l i fic a c i o n d e C l i e n t e s C a l ifi c a c io n C l i e n t e ID C a l ifi c a c io n C l i e n t e D e s. A c t ivid a d L a b o ra l A c t iv id a d L a b o r a lID A c t iv id a d L a b o r a lD e s c. C lie n t e C l i e n t e ID. C a u s a l R e t ir o C a u s a l R e t i r o ID C a u s a lR e tiro D e s c E s t a d o C lie n t e E s t a d o C l i e n t e ID E s t a d o C li e n t e D e s. T i p o R e la c i o n T i p o R e l a c io n ID T i p o R e l a c io n D e s c. A g e n c ia A g e n c i a ID C l a s e A g e n c i a ID C iu d a d ID (F K ) C o d ig o A g e n c ia A g e n c ia D e s c F e c h a in ic io F e c h a F in. (F K ). A le rta A le r t a ID. C l a s i fi c a c i o n C o m. e rc ia l. C l a s i fic a c i o n C o m. e r c i a lID. C l a s i fic a c i o n C o m. e r c i a lD e s c. A le rta. C li e n t e. A le r t a ID. (F K ). T ip o C lie n t e ID (F K ) In d C l i e n t e N u e v o T i p o R e la c i o n ID (F K ) In d V e h i c u l o In d P r o p i e d a d R a i z In d C a m a r a C o m e r c i o In d C l i e n t e B u e n o P e r fi l R i e s g o I D ( F K ) A n t ig u e d a d ID (F K ) E s t a d o A s o c ia d o ID (F K ) C l a s i fi c a c i o n C o m e r c i a l I D ( F K ) E s t a d o C l i e n t e ID (F K ) C a u s a l R e t ir o ID (F K ) C a l ifi c a c i o n C l i e n t e ID (F K ) A c t iv i d a d L a b o r a lID (F K ) T ip o A s o c ia d o ID ( F K ) A g e n c ia ID ( F K ) C a l ifi c a c i o n C o n fia r ID (F K ) F e c h a In ic io F e c h a F in A le r t a ID (F K ) E n t i d a d I n f o r m a n t e ID (F K ) E n t i d a d F i n a n c i e r a ID (F K ) E m p r e s a ID (F K ) P e r s o n a ID ( F K ) T i p o L o c a lID (F K ) T ip o C u e n t a ID (F K ) B i e n e s ID (F K ) C l a s i fi c a c i o n M e r c a d e o I D ( F K ). T ip o C lie n te T i p o C l ie n t e ID T i p o C l ie n t e D e s c P e r fi l R ie s g o P e r fil R i e s g o ID P e r fil R i e s g o D e s c T i p o A s o c ia d o T i p o A s o c i a d o ID T ip o A S s o c i a d o D e s c. A n t ig u e d a d ID. C a l ifi c a c i o n C o n fia r D e s. E n t i d a d In fo r m. T ip o L o c a l T ip o L o c a l ID. B ie n e s. E s t a d o A s o c ia d o ID. B ie n e s ID B ie n e s D e s c. E n t id a d F in a n c ie r a E n t id a d F in a n c ie r a ID E n t id a d F in a n c ie ra D e s c. a n t e. E n t id a d In fo r m. a n t e ID. E n t id a d In fo r m. a n t e D e s c. T ip o L o c a l D e s c C l a s i fic a c i ó n M. E s ta d o A s o c ia d o D e s c. A n tig u e d a d D e s c. C a l ifi c a c i o n C o n fia r ID. T ip o C u e n t a ID T ip o C u e n t a D e s c. A le rt a D e s c. E s t a d o A s o c ia d o. A n t ig u e d a d. C a l i f i c a c i o n C o n fi a r. T ip o C u e n t a. e rc a d e o. C l a s ifi c a c io n M. e r c a d e o ID. C l a s ifi c a c io n M. e rc a d e o D e s c.

(26) Llevan el modelo de negocios al modelo d l físico fí d de d datos P e rs o n a P e r s o n a ID E m p re s a. N u m e r o I d e n t i fi c a c i o n T i p o Id e n t i f i c a c i o n ID ( F K ) N o m b re A p e llid o e m a il C a r g o ID ( F K ) D ire c c io n C a s a D ire c c io n T ra b a jo T e l e fo n o T r a b a j o T e l e fo n o c a s a N u m e ro H ijo s In d C o n y u g u e T r a b a j a F e c h a N a c im ie n t o P a s a t i e m p o ID ( F K ) T i p o In g r e s o ID ( F K ) A n t i g u e d a d L a b o r a l ID ( F K ) S e x o ID ( F K ) E s t a d o C i v i l ID ( F K ) N i v e l E d u c a t i v o ID ( F K ) E s t r a t o S o c i a l ID ( F K ) T i p o V i vi e n d a ID ( F K ) M u l t i p l i c a d o r In g r e s o ID ( F K ) E s t a d o C l i e n t e ID ( F K ) T i p o C o n t r a t o ID ( F K ) C i u d a d L a b o r a l ID ( F K ) C i u d a d R e s i d e n c i a ID ( F K ) In d C r e d i t o P r o v e e d o r e s P e r s o n a s a C a r g o ID ( F K ) F e c h a In i c i o F e c h a F in E m p r e s a ID ( F K ) P r o f e s i o n ID ( F K ). E m p r e s a ID ( F K ) I d e n t i fi c a c i o n D ire c c io n T e l e ffo n o E m p re s a D e s c P a g in a W e b C o d ig o E m p re s a C a l i f i c a c i o n ID ( F K ) T a m a ñ o ID ( F K ) In d E m p r e s a R e c o n o c i d a N a t u r a l e z a J u r i d i c a ID ( F K ) R a n g o A vi s o s D i r e c t o ID ( F K ) T i p o N o m i n a ID ( F K ) A c t i v i d a d E c o n o m i c a ID ( F K ) In d In d u s t r i a y C o m e r c i o R a n g o S a l a r i o P r o m e d i o A d m o n ID ( F K ) R a n g o S a l a r i o P r o m e d i o O p ID ( F K ) I n g r e s o E m p l e a d o ID ( F K ) R a n g o N u m e r o E m p l e a d o s ID ( F K ) F e c h a In i c i o F e c h a F in T i p o R i e s g o ID ( F K ) C a l i f i c a c i o n E m p r e s a s ID ( F K ) T i p o C o n v e n i o ID ( F K ) T i p o A l i a n z a ID ( F K ) E n t i d a d P r e p a g o s ID ( F K ) E n t i d a d P r e p a g a d ID ( F K ) F u e r z a ID ( F K ) In d C o n ve n i o. C a l i fi c a c i o n d e C l i e n t e s C a l i f i c a c i o n C l i e n t e ID C a l i fi c a c i o n C l i e n t e D e s. A c t ivid a d L a b o ra l A c t i v i d a d L a b o r a l ID A c t ivid a d L a b o ra lD e s c. C lie n t e C l i e n t e ID. C a u s a lR e t iro C a u s a l R e t i r o ID C a u s a lR e t iro D e s c E s t a d o C lie n t e E s t a d o C l i e n t e ID E s t a d o C lie n t e D e s T ip o R e la c io n T i p o R e l a c i o n ID T ip o R e la c io n D e s c. A g e n c ia A g e n c i a ID C la s e A g e C i u d a d ID C o d ig o A g A g e n c ia D F e c h a in ic F e c h a F in. n c i a ID ( F K ) (F K ) e n c ia esc io. C l a s i fi c a c i o n C o m e r c i a l C l a s i f i c a c i o n C o m e r c i a l ID C l a s i fi c a c i o n C o m e r c i a l D e s c. A le rt a A l e r t a ID. A le rt a C lie n t e A l e r t a ID ( F K ). T i p o C l i e n t e ID ( F K ) In d C l i e n t e N u e v o T i p o R e l a c i o n ID ( F K ) In d V e h i c u l o In d P r o p i e d a d R a i z In d C a m a r a C o m e r c i o In d C l i e n t e B u e n o P e r fi l R i e s g o I D ( F K ) A n t i g u e d a d ID ( F K ) E s t a d o A s o c i a d o ID ( F K ) C l a s i f i c a c i o n C o m e r c i a l ID ( F K ) E s t a d o C l i e n t e ID ( F K ) C a u s a l R e t i r o ID ( F K ) C a l i f i c a c i o n C l i e n t e ID ( F K ) A c t i vi d a d L a b o r a l ID ( F K ) T i p o A s o c i a d o ID ( F K ) A g e n c i a ID ( F K ) C a l i f i c a c i o n C o n fi a r ID ( F K ) F e c h a In i c i o F e c h a F in A l e r t a ID ( F K ) E n t i d a d In fo r m a n t e I D ( F K ) E n t i d a d F i n a n c i e r a ID ( F K ) E m p r e s a ID ( F K ) P e r s o n a ID ( F K ) T i p o L o c a l ID ( F K ) T i p o C u e n t a ID ( F K ) B i e n e s ID ( F K ) C l a s i f i c a c i o n M e r c a d e o ID ( F K ). T ip o C lie n t e T i p o C l i e n t e ID T ip o C lie n t e D e s c P e r fi l R i e s g o P e r fi l R i e s g o ID P e r fi l R i e s g o D e s c T ip o A s o c ia d o T i p o A s o c i a d o ID T ip o A S s o c ia d o D e s c. A n t i g u e d a d ID. C a l i fi c a c i o n C o n f i a r D e s T ip o C u e n t a T i p o C u e n t a ID T ip o C u e n t a D e s c. E n t i d a d In f o r m a n t e E n t i d a d In fo r m a n t e I D. T ip o L o c a l T i p o L o c a l ID. E n t i d a d In fo r m a n t e D e s c. T ip o L o c a lD e s c C l a s i fi c a c i ó n M e r c a d e o C l a s i fi c a c i o n M e r c a d e o I D. B ie n e s. E s t a d o A s o c i a d o ID. B i e n e s ID. E s t a d o A s o c ia d o D e s c. B ie n e s D e s c. E n t id a d F in a n c ie ra E n t i d a d F i n a n c i e r a ID E n t id a d F in a n c ie ra D e s c. A n t ig u e d a d D e s c. C a l i fi c a c i o n C o n f i a r I D. A le rt a D e s c. E s t a d o A s o c ia d o. A n t ig u e d a d. C a l i fi c a c i o n C o n f i a r. C l a s i fi c a c i o n M e r c a d e o D e s c.

(27) Se hace necesario identificar cuáles d datos pueden d llllevarse all DW • ¿En dónde se encuentran los datos? – Bases de datos internas – Bases de datos Externas. • ¿Cuáles son las transformaciones necesarias para llevar los datos? p • ¿Cómo se encuentran los datos? – Limpieza (data cleansing) – Criba (selección) de datos. • Volúmen de datos.

(28) A partir del modelo físico se especifican f llos procesos • Extracción Extracción. Tomando los datos de las fuentes • Transformación. Ajustes a los datos para que sean definidos según el modelo físico • Carga. Carga de datos en el DW LIMPIEZA DE DATOS.

(29) Las consultas son definidas y especificadas f d técnicamente é • Definición de consultas predefinidas d f d a nivell de d dimensiones y métricas • Cubos o Disponibilidad de d t para generación datos ió de d consultas ad‐hod • Definición de consultas estáticas como complemento en implementación mixta • Minería de datos. ¿Qué paso? ¿Por qué Paso? ¿Qué pasará? ¿Cómo hago que pase?. IMPLEMENTACION DE CONSULTAS EXITOSAS.

(30) Las pruebas minimizan los riesgos • •. Como cualquier solución la implementación de una bodega de datos debe ser probada La calidad de los datos es vital para una buena implementación – Una bodega de datos debe ser confiable – La información almacenada en la bodega g de datos debe ser relevante – La disponibilidad de los datos en la bodega de datos debe estar acorde a los lineamientos de la organización – Se debe garantizar que la integración de los datos es precisa y completa. • • •. Los recursos necesarios para el uso de la bodega de datos son claves para el éxito del proceso La información debe estar disponible según el plan definido procesos de extracción, transformación y carga g deben ser p probados Los p.

(31) Debemos partir de la historia • Cargas históricas. históricas El proceso de cargar la información histórica es uno de los pilares del inicio de la bodega de datos.

(32) El proceso apenas inicia ¿Tiene sentido tener una bodega de datos sin actualizar? ¿Qué tan frecuente se debe actualizar? ¿Se deben actualizar los datos o se deben reemplazar? l ?.

(33) ¿Cómo ha sido el avance de DW? • Miles de organizaciones alrededor del mundo hoy tienen la fortuna de tomar sus decisiones basados en el conocimiento a partir de la implementación de sus bodegas de datos • En Colombia Colombia, desde grandes hasta pequeñas empresas están obteniendo los mejores resultados después de haber implementado su bodega de datos.

(34) Preguntas.

(35)

Referencias

Documento similar

c CAPITULO II LOS DATOS DE LA ANTROPOLOGIA CRIMINAL Estos datos precisamente determinaron el movimiento moderno en la ciencia criminal y de ellos tomó el nombre la nueva escuela,

Luis Miguel Utrera Navarrete ha presentado la relación de Bienes y Actividades siguientes para la legislatura de 2015-2019, según constan inscritos en el

Se llega así a una doctrina de la autonomía en el ejercicio de los derechos que es, en mi opinión, cuanto menos paradójica: el paternalismo sería siempre una discriminación cuando

Actividades para el área de Persona, Familia y Relaciones Humanas Los estudiantes pueden encontrar en los mitos actos bondadosos a favor del hombre, la humanidad o una

De non ser así, as facturas non poderán tramitarse para o pago, e a USC, a través do responsable de asuntos económicos do centro da USC que solicitou os seus servicios Rexeitará

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)