Modelo para la Construcción de un Almacén de Datos (Data Warehouse) Edición Única

150  Descargar (0)

Texto completo

(1)

(2) M O D E L O P A R A L A C O N S T R U C C I Ó N D E UN A L M A C É N D E D A T O S (DATA W A R E H O U S E ). ITESM T e s i s presentada por. ADRIAN ENRIQUE AMOZORRUTIA BAUTISTA. P r e s e n t a d a ante la Dirección A c a d é m i c a d e la U n i v e r s i d a d Virtual del Instituto T e c n o l ó g i c o y d e E s t u d i o s S u p e r i o r e s d e Monterrey c o m o requisito parcial p a r a optar al título d e. M A E S T R O EN ADMINISTRACIÓN DE TECNOLOGIAS DE INFORMACIÓN. Diciembre de 1999. Maestría del Programa de Graduados en Ingeniería y Tecnología.

(3) M O D E L O P A R A L A C O N S T R U C C I Ó N D E UN A L M A C É N D E D A T O S (DATA W A R E H O U S E ). T e s i s presentada por ADRIAN ENRIQUE AMOZORRUTIA BAUTISTA. A p r o b a d a en contenido y estilo por. M.C. F r a n c i s c o J o s é Camargo Santacruz A S E S O R PRINCIPAL.. M . C . Humberto C á r d e n a s A n a y a. M.C. Luis H u m b e r t o Franco C á r d e n a s. SINODAL.. SINODAL.. Dra. M a r í a del S o c o r r o M a r c o s Kahn Programa de G r a d u a d o s en I n g e n i e r í a s y Tecnologías..

(4) A DIOS Y T O D O S L O S Q U E C R E E N EN MI..

(5) RESUMEN. E l objetivo principal d e este trabajo e s crear un modelo p a r a la construcción d e un a l m a c é n d e d a t o s y así a partir d e e s t e desarrollar la c a p a de t o m a de d e c i s i o n e s y c o n o c i m i e n t o s de u n a e m p r e s a , p a r a lograrlo s e tuvo q u e revisar literatura referente a e s t e t e m a a d e m á s d e q u e s e implementaron varios c a s o s p a r a construirlo y s e utilizaron c o n o c i m i e n t o s y a adquiridos a lo largo de mi carrera profesional e n el área. P o r lo tanto el m o d e l o construido e s u n a m e z c l a de e x p e r i e n c i a propia y de otros m o d e l o s y fuentes bibliográficas e s p e c i a l i z a d a s e n el tema.. L a contribución e s p e r a d a e s aportar a las e m p r e s a s de u n a herramienta v a l i o s a q u e les permita integrar s u información e n un almacén d e datos y planear c o n e s t e m o d e l o la creación de la c a p a de t o m a de d e c i s i o n e s así c o m o la de c o n o c i m i e n t o s d e s u n e g o c i o . A d e m á s de proveer a c c e s o rápido a la información d e la organización. Y contar c o n un a l m a c é n consistente p a r a la t o m a. de. d e c i s i o n e s e n línea p a r a poderlo publicar y distribuir la información c o n claridad y precisión. a. la. empresa,. a. sus. clientes. y. al. personal. interno. de. está..

(6) Í N D I C E D E CONTENIDO Capítulo. Página. 1. I N T R O D U C C I Ó N. 1. 2. IMPORTANCIA, C O N C E P T O S , O B J E T I V O S Y BENEFICIOS. 6. 2.1 2.2 2.3 2.4 2.5. Introducción D i f e r e n c i a s entre D a t a W a r e h o u s e y s i s t e m a s o p e r a c i o n a l e s Definición Objetivos E l desarrollo del a l m a c é n. 6 8 14 15 16. 3. P L A N E A C I Ó N Y ORGANIZACIÓN 3.1 Introducción 3.2 L a instrumentación del a l m a c é n 3.3 E l reto 3.4 E t a p a s d e la planeación y organización 3.5 Definición del objetivo, beneficios y justificación del proyecto 3.6 L o s b e n e f i c i o s 3.7 Criterios d e éxito 3.8 R i e s g o 3.9 Identificación de u s u a r i o s 3.10 Selección / confirmación d e la arquitectura de s i s t e m a s 3.11 Selección / confirmación d e las herramientas de diseño, extracción, transformación, explotación y desarrollo. 3.12 Selección del equipo d e trabajo 3.13 Creación del plan d e trabajo. 17 17 20 22 22 23 23 24 26 27 28. 4. R E Q U E R I M I E N T O S 4.1 Introducción 4.2 Entrevistas 4 . 3 A n a l i s t a s y u s u a r i o s dirigidos a f u n c i o n e s de n e g o c i o s 4.4 G e r e n t e s dirigidos a f u n c i o n e s de n e g o c i o s 4.5 A n a l i s t a s y u s u a r i o s r e l a c i o n a d o s a f u n c i o n e s d e n e g o c i o s 4.6 ¿ Q u é preguntar al usuario final? 4.7 U n análisis a d e c u a d o 4.8 Análisis d e n e g o c i o 4.9 Información específica d e datos 4.10 Documentación 4.11 E t a p a s p a r a la f a s e de requerimientos 4 . 1 2 Determinación / confirmación de la c o m u n i d a d de usuarios 4 . 1 3 Determinación / confirmación de los requerimientos 4.14 Confirmación de las herramientas de explotación y distribución. 32 32 33 35 36 36 39 41 41 42 44 45 45 46 47. 31 31 32.

(7) 4.15 4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23 4.24. Criterios p a r a las herramientas de explotación y distribución Cálculos R e g l a s d e cálculos Navegación Visualización Triggers, A g e n t e s y A l e r t a s Groupware Seguridad Gobierno de Aplicaciones C a r g a de Información al m e t a d a t a s o b r e el p r o c e s o. 47 47 48 49 49 50 50 51 51 51. 5. D I S E Ñ O D E L D A T A W A R E H O U S E 5.1 Introducción 5.2 E t a p a s p a r a el diseño del D a t a W a r e h o u s e 5.3 Elaboración del c u a d r o e l e m e n t o s p a r a el e s q u e m a estrella 5.4 Construcción del e s q u e m a lógico 5.5 P a s o s p a r a m o d e l a r 5.6 Criterios p a r a la selección de una herramienta de modelaje 5.7 Construcción del e s q u e m a físico. 52 56 56 56 57 57 58 58. 6. T R A N S F O R M A C I O N ( E x t r a c c i ó n , t r a n s f o r m a c i ó n y carga) 6.1 Introducción 6.2 E t a p a s d e la transformación d e datos 6.3 Análisis d e r e s p o n s a b l e s d e datos 6.4 Análisis d e fuentes d e datos 6.5 Desarrollo de la matriz d e r e s p o n s a b l e s d e datos 6.6 Desarrollo de la matriz d e fuentes de datos 6.7 Desarrollo de la matriz d e fuentes de datos contra requerimientos 6.8 Definición de la estrategia de transformación d e datos 6.9 Identificación de los c a n d i d a t o s a s e r s i s t e m a s d e legado 6.10 C u e s t i o n a r i o d e criterios 6.11 D o c u m e n t o s d e fuentes de registro 6.12 Análisis de las fuentes 6.13 Revisión del " s o u r c i n g " d e datos 6.14 Diseño d e conversión de datos 6.15 O b t e n c i ó n (sourcing) inicial de datos 6.16 C a r g a d e información al metadata s o b r e el p r o c e s o. 59 59 60 60 61 61 62. 7. E X P L O T A C I Ó N Y D I S T I B U C I Ó N 7.1 C a p a d e t o m a de d e c i s i o n e s 7.2 C a p a de c o n o c i m i e n t o s. 69 70 71. 8. A D M I N I S T R A C I Ó N Y C O N T R O L. 72. 62 63 64 64 64 65 66 66 66 68.

(8) 9. A P L I C A C I Ó N D E C A S O S C A S O 1: Construcción d e un D a t a W a r e h o u s e p a r a la B C I del I T E S M CEM C A S O 2: Construcción de un D a t a W a r e h o u s e p a r a la Dirección d e Informática del I T E S M - C E M C A S O 3: Construcción del un D a t a W a r e h o u s e e n Distribution S e r v i c e s Ltd. p a r a el proyecto C O M E R S A .. 73 74 91 112. CONCLUSIONES. 135. BIBLIOGRAFÍA. 140.

(9) CAPÍTULO 1 Introducción. En depende. la a c t u a l i d a d la competitividad en. gran. medida. de. la. y eficiencia de. rapidez c o n. que. se. las e m p r e s a s pueda. obtener. información c o n s i s t e n t e p a r a la t o m a d e d e c i s i o n e s . A u n q u e s e cuente c o n a c c e s o a la información d e la operación diaria, e s t a no e s suficiente. P a r a a n a l i z a r t e n d e n c i a s , d e s e m p e ñ o y h a c e r mejores d e c i s i o n e s d e n e g o c i o s e requiere un fácil y rápido a c c e s o a la información corporativa. L a solución e s un a l m a c é n d e d a t o s . U n a l m a c é n d e datos integra t o d a la información d e la e m p r e s a y la p o n e disponible a t o d a la gente, e s t a información forma parte d e v a r i a s f u e n t e s o p e r a c i o n a l e s por lo tanto d e b e de h a b e r un p r o c e s o d e extracción,. limpieza,. transformación,. carga. a. un. receptáculo. donde. c u a l q u i e r a p u e d a tener a c c e s o a ella o ésta p u e d a s e r distribuida a la organización y así iniciar. el p r o c e s o d e t o m a de d e c i s i o n e s e n t o d a la. empresa.. Sobre. definiciones. del. concepto. de. data. warehouse. hay. diferentes, sin e m b a r g o , las definiciones s o b r e el t e m a tres qué s o n las q u e m á s s e a p e g a n m á s a e s t a tesis:. i.

(10) •. E s el lugar d o n d e los directivos de la e m p r e s a p u e d e n a c c e d e r. información. para. realizar. p r o c e s o s g e r e n c i a l e s . (Oracle,. Computer. Select). •. U n a l m a c é n d e datos q u e las e m p r e s a s construyen y d o n d e. d e p o s i t a n s u información c o m o un activo v a l i o s o p a r a q u e ellos p u e d a n extraer c o n o c i m i e n t o y entendimiento de la operación y d e s e m p e ñ o de s u n e g o c i o . (Logic W o r k s , C o m p u t e r S e l e c t ) . •. E s u n a b a s e d e datos analítica q u e e s u s a d a c o m o la b a s e. tecnológica. p a r a los s i s t e m a s de soporte a la t o m a de d e c i s i o n e s. (Vidette, P o e , 1 9 9 6 ). E l objetivo principal d e este trabajo e s c r e a r un m o d e l o p a r a la construcción d e un a l m a c é n d e d a t o s y así a partir de este desarrollar la c a p a d e t o m a d e d e c i s i o n e s y c o n o c i m i e n t o s de u n a e m p r e s a , p a r a lograrlo s e tuvo q u e revisar literatura referente a e s t e t e m a a d e m á s d e q u e s e implementaron varios c a s o s p a r a construirlo y s e utilizaron c o n o c i m i e n t o s y a adquiridos a lo largo de mi c a r r e r a profesional e n desarrollo de software. P o r lo tanto el m o d e l o construido e s u n a mezcla. de. e x p e r i e n c i a propia y d e. otros. e s p e c i a l i z a d a s e n el t e m a .. 2. m o d e l o s y fuentes. bibliográficas.

(11) A l final d e la tesis s e entregará c o m o producto final un m o d e l o q u e a p o y e a la construcción d e un a l m a c é n d e datos (data w a r e h o u s e ) y a partir de este m o d e l o p o d e r construir la c a p a d e t o m a d e d e c i s i o n e s y c o n o c i m i e n t o s d e una empresa.. La. contribución. esperada es. aportar. a. las. e m p r e s a s de. una. h e r r a m i e n t a v a l i o s a q u e les permita planear c o n este m o d e l o la creación de la c a p a d e t o m a d e d e c i s i o n e s así c o m o la de c o n o c i m i e n t o s de s u n e g o c i o . A d e m á s d e proveer a c c e s o rápido a la información d e la organización. Y c o n t a r c o n un a l m a c é n consistente p a r a la t o m a de d e c i s i o n e s e n línea p a r a poderlo publicar y distribuir la información c o n claridad y precisión.. E n el capítulo uno s e h a b l a principalmente s o b r e el m a r c o teórico d e s c r i b e principalmente los c o n c e p t o s o terminología q u e gira e n t o m o al t e m a d e a l m a c e n e s d e datos c o m o s o n : s i s t e m a s d e a p o y o a la t o m a de d e c i s i o n e s , s i s t e m a s o p e r a c i o n a l e s , O n L i n e Analytical P r o c e s s del análisis multidimensional entre otros c o n c e p t o s . construcción del a l m a c é n de d a t o s .. 3. Y s e e x p o n e el m o d e l o p a r a la.

(12) E s t a e s la f a s e d e planeación y organización c o n la cual s e c o m i e n z a el m o d e l o y c o n s i s t e e n c o n o c e r c u a l e s s o n las n e c e s i d a d e s de nuestro usuario, e n t e n d e r el n e g o c i o y definir objetivos, beneficios, flujo de la información y la arquitectura e infraestructura, así m i s m o e s t a b l e c e r u n a aplicación q u e s e a la guía p a r a el desarrollo del proyecto y q u e e s t a s e s i g a de u n a m a n e r a tal q u e no s e p i e r d a la principal preocupación de la m i s m a , s e d e b e e s t a b l e c e r u n a línea de trabajo y s e d e b e m a n t e n e r e s a m i s m a línea todo el tiempo.. Requerimientos. en. esta fase. se. realizan t o d a s. las. entrevistas. que. p r o p o r c i o n e n la información r e l a c i o n a d a c o n la construcción del almacén d e datos, e s decir s e d e t e r m i n a n e s f o r m a específica las n e c e s i d a d e s d e información. E s t o e s de s u m a importancia p a r a p o d e r c o n o c e r la f o r m a e n c o m o fluye la información dentro d e la e m p r e s a y así construir un m o d e l o a d e c u a d o a las n e c e s i d a d e s d e información del n e g o c i o .. En. la. construcción. del. warehouse. se. hace. la. esquematización. c o r r e s p o n d i e n t e a los distintos d i a g r a m a s estrella q u e seguirán los datos y la forma en c o m o. s e relacionarán. entre. sí, e s t o s d i a g r a m a s s o n. información. relevante p a r a c o n o c e r c o m o s e representará la información internamente e n el a l m a c é n . P o r lo tanto la parte fuerte d e e s t a f a s e e s m o d e l a r a partir de los e l e m e n t o s d e información q u e s e h a y a n identificado e n la f a s e de requerimientos y transformarlos e n d i m e n s i o n e s y m e d i d a s .. 4.

(13) E n la f a s e de transformación s e d e b e identificar las fuentes origen d e d o n d e s e v a n a extraer los datos, así m i s m o s e determinan p r o c e s o s d e transformación de datos p a r a c a r g a r l a s al a l m a c é n . E n e s t a f a s e s e e s t a b l e c e n los estándares a seguir e n c u a n t o a la f o r m a e n q u e s e d e b e n introducir los datos e n el w a r e h o u s e p a r a q u e t o d a la información incluida e n el w a r e h o u s e m a n t e n g a los m i s m o s estándares y no s e t e n g a n p r o b l e m a s e n cuanto a la compatibilidad d e los mismos.. E n conclusión s e lleva a c a b o la arquitectura e infraestructura. del. almacén.. L a explotación y distribución c o n s i s t e e n determinar las herramientas p a r a poder h a c e r la explotación de la información a l m a c e n a d a en el almacén de datos, las distintas f o r m a s e n c o m o s e harán las b ú s q u e d a s de datos y la forma en c o m o s e deberán o p e r a r las políticas d e a c c e s o e n el almacén de datos.. E n el capítulo d e administración y control s e proponen m e c a n i s m o s p a r a llevar u n a d o c u m e n t a c i ó n de todo el p r o c e s o p a r a la construcción del almacén así como. ciertas. aplicaciones. para. controlar. los. cambios. y. administrar. los. requerimientos.. E n e l capítulo d e aplicación d e c a s o s s e p r e s e n t a un r e s u m e n s o b r e las fases d e c a d a proyecto d o n d e s e a p l i c a el m o d e l o y s u s resultados finales. P o r último e n las c o n c l u s i o n e s s e determinan los resultados finales d e este trabajo.. 5.

(14) CAPÍTULO 2 Importancia, conceptos, objetivos y beneficios. 2.1 Introducción. Para competir dentro del ambiente de negocios actual y en constante cambio, una empresa no se puede arriesgar a perder el tiempo entre montañas de información en busca de los datos que se necesitan para tomar decisiones críticas de negocios. Hoy en día, no es suficiente contar con el acceso a la información de las operaciones diarias. Para dar seguimiento a las tendencias, analizar el rendimiento y tomar mejores decisiones de negocios, se necesita de un acceso fácil y rápido a los datos corporativos y a la información competitiva. La solución es construir un almacén de datos (data warehouse) y así crear la capa de toma de decisiones y de conocimientos de una empresa. Por lo tanto, en un país que sufre y sufrirá. cambios. intensos,. internos. como. externos,. las. necesidades. de. información serán dinámicas y la gente que toma decisiones necesitará una respuesta rápida a sus requerimientos para tomar decisiones, además de contar con herramientas que les permitan hacer un análisis en tiempo real y así llevar a cabo una evaluación del desempeño y comportamiento de la empresa y su entorno, mediante indicadores de negocios. (OpenWorld, 1997). 6.

(15) L o s s i s t e m a s d e a p o y o a la t o m a de d e c i s i o n e s (Decisión Support S y s t e m s ) h a n s i d o el resultado d e la preocupación d e los departamentos de tecnología d e información d e las e m p r e s a s d e s d e h a c e varios años. P e r o en los últimos treinta a ñ o s h a n m o s t r a d o u n a evolución q u e v a d e s d e la utilización d e reportes c r e a d o s por un m a i n f r a m e c o n b a s e e n un archivo maestro, h a s t a el surgimiento de los a l m a c e n e s d e d a t o s (data w a r e h o u s e s ) . ( W . H . Inmon, 1996). L a l l e g a d a d e los s i s t e m a s m a n e j a d o r e s d e b a s e s de datos e n los 7 0 , así c o m o d e las h e r r a m i e n t a s p a r a u s u a r i o s finales, dieron a las o r g a n i z a c i o n e s u n a habilidad única p a r a a c c e s a r y controlar datos directamente (Sprangue, Ralph H., Watson, Hugh, 1993). S e formaron varios centros de información, ofreciendo a los u s u a r i o s finales c a p a c i d a d e s d e extracción. d e e s a información a través d e. p r o g r a m a s , q u e m á s a d e l a n t e s e volvieron insuficientes p u e s no podían realizar las siguientes f u n c i o n e s :. •. V a l i d a r las f u e n t e s d e los datos, y a fueran internas o externas.. •. V a l i d a r el m a r g e n d e tiempo q u e r e p r e s e n t a b a n los datos.. •. V a l i d a r el p r o c e s o d e transformación q u e habían llevado a c a b o los datos.. •. T e n e r u n a definición universal d e lo q u e contenía el centro de extracción d e información.. •. T e n e r u n a localidad s o l a y unificada p a r a ver la información originada por las fuentes d e b a s e s de datos.. 7.

(16) Estos sistemas. h a n e v o l u c i o n a d o c o n s i d e r a b l e m e n t e durante los últimos. años, teniendo c o m o e s t a d o actual de evolución el data w a r e h o u s e o almacén de datos, c o n s i d e r a d o hoy c o m o la mejor solución e n arquitectura p a r a el soporte a la t o m a d e d e c i s i o n e s . S i g u i e n d o e s t a línea d e evolución p o d e m o s notar q u e a punto d e. están. a l c a n z a r un equilibrio y entrar a u n a f a s e e n la c u a l podrán g a n a r. m a d u r e z . E l siguiente crecimiento significativo e n ellos sería la fusión d e distintas tecnologías d e a p o y o a las t o m a s de d e c i s i o n e s c o n o c i d a s ( O L A P / R O L A P / A d H o c Q u e r y , Report Writing y D a t a Mining) p a r a convertirse e n u n a solución m á s a m p l i a para. los c o n s u m i d o r e s. de. datos,. d e s d e analistas. de. negocios. hasta. altos. ejecutivos d e las e m p r e s a s . ( W . H . Inmon, 1996). 2.2 Diferencias entre data warehouse y sistemas operacionales.. U n a de las r a z o n e s m á s importantes detrás del surgimiento d e u n a d a t a w a r e h o u s e e s la n e c e s i d a d de a c c e d e r a la información, e s decir, q u e la b a s e d e datos c u a n d o r e c i b a un query no d e v u e l v a datos, sino información, e n oposición al a c c e s o o p e r a c i o n a l a d a t o s corporativos. L o s datos o p e r a c i o n a l e s d e s c r i b e n el e s t a d o actual d e un n e g o c i o , y la mayoría d e las a p l i c a c i o n e s o p e r a c i o n a l e s existen. para. resolver. preguntas. b a s a d a s e n el funcionamiento. diario. de. la. e m p r e s a . E l a c c e s o a la información q u e m a n e j a u n a data w a r e h o u s e e s utilizado p a r a a p o y a r c o n s u l t a s d e alto nivel, así c o m o la planeación y las actividades d e d e c i s i o n e s estratégicas. E n a c c e s o a la información generalmente s e tiene q u e lidiar c o n g r a n d e s v o l ú m e n e s d e datos. ( E D S , Diciembre 1995). 8.

(17) P o c a s a p l i c a c i o n e s soportan preguntas de e s t a n a t u r a l e z a y la mayoría d e las v e c e s los g e r e n t e s tienen q u e tomar la decisión q u e mejor les p a r e z c a . Durante m u c h o s a ñ o s los d e p a r t a m e n t o s d e tecnología de información han tratado de satisfacer información. tanto los requerimientos d e. procesamiento operacional como de. d e s d e u n a s o l a fuente d e datos corporativos, c o n éxito limitado. d e s d e un punto d e a p o y o a las d e c i s i o n e s . E l enfoque del d a t a w a r e h o u s i n g h a traído c o n s i g o un reconocimiento d e parte del la industria de T.I., d e que los sistemas. informacionales. y. operativos. son. fundamentalmente. diferentes. e. i n c o m p a t i b l e s . L o s requerimientos p a r a c a d a tipo de s i s t e m a s o n diferentes y c a d a s i s t e m a p r e s e n t a las siguientes diferencias:. M u c h a s a p l i c a c i o n e s o p e r a c i o n a l e s contestan las siguientes preguntas: E l p e d i d o a s i d o e x p e d i d o ¿El cliente p a g ó s u factura? ¿Cuál e s el estatus de un p e d i d o d a d o ? ; y las a p l i c a c i o n e s o p e r a c i o n a l e s las contestan bien. L o s datos o p e r a c i o n a l e s d e s c r i b e n el e s t a d o actual del n e g o c i o .. E n lo q u e refiere al almacén de d a t o s , s e u s a p a r a respaldar la t o m a de d e c i s i o n e s d e alto nivel, planeación y d e c i s i o n e s estratégicas p a r a soporte d e la t o m a d e d e c i s i o n e s . E l a c c e s o a la información u s u a l m e n t e m a n e j a g r a n d e s v o l ú m e n e s d e d a t o s , y r e s p o n d e g e n e r a l m e n t e a preguntas c o m o :. 9.

(18) ¿Cuál e s el impacto e n el n e g o c i o si las v e n t a s directas s e reducen e n un 20%? DIFERENCIAS Contenido d e d a t o s Organización d e datos. OPERACIONAL Valores actuales Aplicación por aplicación. N a t u r a l e z a d e los d a t o s Formato d e la estructura de los d a t o s Probabilidad d e a c c e s o Actualización d e los d a t o s. Dinámicos Compleja. Uso. ALMACEN DE DATOS Archivados y calculados A r e a s específicas de la empresa Estáticos Simple. Alta M o d e r a d a a alta A c t u a l i z a d a e n un c a m p o A c c e s a d a y m a n i p u l a d a , por registros. no hay actualización directa P r o c e s o s repetitivos P r o c e s o s analíticos. Figura 1. diferencias entre data warehouse y sistemas operacionales.. P o r lo tanto, un s i s t e m a o p e r a c i o n a l o d e p r o c e s a m i e n t o e n línea ( O L T P : On-line T r a n s a c t i o n P r o c e s s i n g ) , e s un s i s t e m a tal c o m o el de administración d e recursos h u m a n o s , d e asignación de créditos b a n c a r i o s , de recuperación y control de cartera o d e control de s e g u r o s , y s u función principal e s dar el soporte a las n e c e s i d a d e s diarias d e la e m p r e s a ; s o n s i s t e m a s normalmente o p t i m i z a d o s p a r a el manejo d e un conjunto. predefinido de t r a n s a c c i o n e s . L a mayoría d e los. s i s t e m a s e x i s t e n t e s dentro. d e las o r g a n i z a c i o n e s s o n s i s t e m a s o p e r a c i o n a l e s. orientados al m a n e j o d e t r a n s a c c i o n e s . E s t a s a p l i c a c i o n e s representan, e n sí m i s m a s , s i s t e m a s a i s l a d o s c u y o contenido d e datos fue diseñado p a r a atender los requerimientos específicos delimitados por el a l c a n c e de la aplicación. ( E D S , Diciembre 1995). 10.

(19) E s t o s s i s t e m a s g e n e r a n los d a t o s o p e r a c i o n a l e s , los c u a l e s s e caracterizan por s e r d a t o s d e t a l l a d o s , no r e d u n d a n t e s , que s e actualizan c o n s t a n t e m e n t e y q u e reflejan v a l o r e s al período d e tiempo a c t u a l . E s t o s datos serán transformados p a r a s e r el i n s u m o del d a t a w a r e h o u s e .. P o r ello, e s n e c e s a r i o a n a l i z a r y definir c u i d a d o s a m e n t e de los s i s t e m a s o p e r a c i o n a l e s a q u e l l o s datos q u e representen la e s e n c i a o filosofía del n e g o c i o q u e s e p r e t e n d a manejar, p a r a q u e s e. transformen y s e transfieran al data. warehouse.. M e d i a n t e e s e p r o c e s o a g r e g a m o s valor a los datos convirtiéndolos. en. información y haciéndolos de utilidad p a r a el manejo del n e g o c i o .. C o n b a s e e n lo anterior, p o d e m o s identificar q u e los s i s t e m a s o p e r a c i o n a l e s m a n e j a n los d a t o s detallados y estructurados p a r a registrar la operación de la organización, y por lo tanto, no están p r e p a r a d o s p a r a facilitar s u explotación y la t o m a de d e c i s i o n e s .. C o n s i d e r a n d o el e s q u e m a anterior,. el análisis de la información. más. relevante d e la operación de la e m p r e s a , s u interpretación y la t o m a de d e c i s i o n e s b a s a d a e n d i c h a información, resulta un elemento c l a v e e n la b ú s q u e d a y solución de los p r o b l e m a s del n e g o c i o .. 11.

(20) P a r a el a p o y o d e e s t e p r o c e s o , e n los últimos años han surgido una gran cantidad de a p l i c a c i o n e s d e tecnología y s i s t e m a s de información, c o m o s o n los s i s t e m a s d e información ejecutiva c o n o c i d o s c o m o S I E ' s o E I S ' s y los s i s t e m a s de soporte a la t o m a d e d e c i s i o n e s c o n o c i d o s c o m o D S S .. L o s s i s t e m a s d e información gerencial (MIS) están orientados a producir reportes q u e o r g a n i z a n información (un reporte de requerimientos d e materiales, la elaboración d e e s t a d o s financieros, etc.). L o s s i s t e m a s p a r a soporte d e d e c i s i o n e s ( D S S ) o los s i s t e m a s expertos, tienen c o m o objetivo a p o y a r la t o m a d e d e c i s i o n e s mediante la aplicación de m o d e l o s m a t e m á t i c o s y estadísticos, o d e c o n o c i m i e n t o específico a un p r o b l e m a particular. L o s S i s t e m a s d e Información E j e c u t i v a tienen c o m o objetivo primordial proveer d e t o d a la información n e c e s a r i a a los ejecutivos d e alto nivel p a r a a p o y a r l o s e n la t o m a d e d e c i s i o n e s . E n e s e sentido, un S I E e s un s i s t e m a d e información q u e permite a los ejecutivos a c c e s o rápido y efectivo a información c o m p a r t i d a , crítica p a r a el n e g o c i o , utilizando interfaces gráficas. L a interfaz del usuario p r o p o r c i o n a d a por e s t e tipo de s i s t e m a s e s m á s sofisticada q u e la de las a p l i c a c i o n e s p a r a el a l m a c e n a m i e n t o y soporte d e o p e r a c i o n e s t r a n s a c c i o n a l e s .. 12.

(21) L a minería d e datos e s el descubrimiento automatizado de patrones y relaciones. en. las. b a s e s de. datos.. A. diferencia. de. s i s t e m a s de. consulta,. a p l i c a c i o n e s O L A P ( O n L i n e Analytical P r o c e s s ) o del análisis multidimensional, los c u a l e s requieren u n a gran interacción del hombre p a r a encontrar información e n una b a s e d e d a t o s , la minería de datos h a c e uso de técnicas a v a n z a d a s d e estadística y del a p r e n d i z a j e d e las máquinas p a r a descubrir h e c h o s en g r a n d e s b a s e s d e d a t o s . ( T h o m s e n Erik, 1997). U n s i s t e m a d e minería de datos está formado por varios p r o g r a m a s d e c ó m p u t o , q u e r e a l i z a n , de m a n e r a automática, la b ú s q u e d a e n u n a b a s e de datos, de t e n d e n c i a s , d e s v i a c i o n e s , anomalías, patrones y s i t u a c i o n e s "interesantes.". L a s r e d e s n e u r o n a l e s s o n u n a tecnología d e p r o c e s a m i e n t o d e información de inteligencia artificial q u e b u s c a reproducir el. funcionamiento. del cerebro. h u m a n o r e s p e c t o a la forma c o m o p r o c e s a el conocimiento.. L o s s i s t e m a s expertos s o n c a p a c e s de h a c e r inferencias siguiendo p a s o s comparables. a. los. que. sigue. un. especialista. (médico,. biólogo,. geólogo,. matemático, etc.), c u a n d o r e s u e l v e un p r o b l e m a propio de s u disciplina.. C u a n d o los d a t o s no s e encuentran a c c e s i b l e s y el tiempo e s un factor crítico, las d e c i s i o n e s d e b e n llevarse a c a b o e n s u p o s i c i o n e s sin b a s e s y e n la intuición. P o r ello, e s fundamental el contar c o n u n a visión corporativa d e los datos p a r a solidificar la t o m a d e d e c i s i o n e s . (Turban, Efraim, 1998). 13.

(22) P a r a proveer d a t o s a los s i s t e m a s de soporte a la t o m a de d e c i s i o n e s , los d a t o s o p e r a c i o n a l e s relevantes s e extraen. de. las a p l i c a c i o n e s b a s a d a s e n. t r a n s a c c i o n e s . E n t o n c e s s o n t r a n s f o r m a d o s a un formato a d e c u a d o a la t o m a de d e c i s i o n e s y alimentan el a l m a c é n de datos corporativo. A partir de ahí s e facilita la explotación y análisis d e la información d e s d e distintos e n f o q u e s o tipos de sistemas.. 2.3. Definición. E l D a t a w a r e h o u s e e s un a l m a c é n de datos q u e las e m p r e s a s construyen y d o n d e d e p o s i t a n s u información c o m o un activo valioso p a r a poder luego extraer c o n o c i m i e n t o y entendimiento de la operación y d e s e m p e ñ o de s u n e g o c i o . (Logic Works). 14.

(23) 2.4. •. Objetivos. P r o v e e r a c c e s o a la corporación o a los datos de la organización. E l almacén d e d a t o s d e b e permitir a los u s u a r i o s c o n e c t a r s e c o n s u s c o m p u t a d o r a s p e r s o n a l e s y a s e a dentro o fuera de la e m p r e s a . L a s c o n e x i o n e s d e b e n s e r i n m e d i a t a s , e n d e m a n d a y c o n alto d e s e m p e ñ o .. •. C o n s i s t e n c i a e n los datos del a l m a c é n . L a c o n s i s t e n c i a s e refiere a obtener los m i s m o s h e c h o s e n c u a l q u i e r punto del tiempo. A d e m á s , d e b e c o n s i d e r a r la c o n s i s t e n c i a e n la actualización d e la información.. •. S l i c e a n d d i c e (rebanar y picar). D e b e proveer facilidades de. combinar. diferentes c o n c e p t o s d e n e g o c i o . •. A d e m á s d e d a t o s d e b e proporcionar herramientas p a r a realizar análisis e n línea.. •. P u b l i c a r y distribuir. información c o n calidad y precisión. (atributos d e. la. información). •. D e b e s e r un m e d i o confiable p a r a u n a reingeniería d e n e g o c i o s .. •. D e b e p r o p o n e r la construcción d e u n a arquitectura operativa e n c a s o de q u e no existan los s i s t e m a s fuentes q u e proporcionen información al almacén d e d a t o s . ( R a l p h K i m b a l l , 1996). 15.

(24) 2.5. El desarrollo del a l m a c é n. E l p r o c e s o d e desarrollo del a l m a c é n está dividido e n los siguientes c o m p o n e n t e s . Componente Organización Planeación. y. Requerimientos. Construcción del almacén. Transformación (Extracción, transformación y carga). Explotación y distribución. Administración y control. Descripción Definición del objetivo, beneficios y justificación del proyecto Identificación de procesos de alto nivel del negocio y flujo de información Determinación de criterios de éxito Determinación de riesgos del proyecto Identificación de tipos de usuario Selección del equipo de trabajo Selección / confirmación de la arquitectura de sistemas Selección / confirmación de las herramientas de diseño, extracción, transformación, explotación, distribución y desarrollo Creación del plan de trabajo Determinación / confirmación de la comunidad de usuarios Determinación / confirmación de los requerimientos Confirmación de las herramientas de explotación y distribución. Carga de información al metadata sobre el proceso Creación del modelo de datos lógico Creación del modelo de datos físico Carga de información al metadata sobre el proceso Análisis de responsables de datos Análisis de fuentes de datos Desarrollo de la matriz de responsables de datos (metadata) Desarrollo de la matriz de fuentes de datos (metadata) Desarrollo de la matriz de fuentes de datos contra requerimientos (metadata) Definición de la estrategia de extracción, transformación y carga de datos Carga de información al metadata sobre el proceso Construcción de la capa multidimensional Definición de la estrategia de distribución de la información Construcción de la capa de conocimientos Carga de información al metadata sobre el proceso Construcción de la aplicación metadata, control de cambios y análisis de impacto.. Figura 2. el desarrollo del almacén. 16.

(25) CAPÍTULO 3 Planeación y organización 3.1. Introducción. L a s o r g a n i z a c i o n e s q u e d a n inicio a e s f u e r z o s d e instrumentación. de. a l m a c e n e s d e d a t o s , conjuntan u n a serie de g r u p o s internos divergentes, p a r a a p o y a r el desarrollo d e tales proyectos. L a s p e r s p e c t i v a s d e los participantes en lo que s e refiere a lo q u e e s un almacén de datos y la mejor m a n e r a d e utilizarlo, p u e d e n variar e n gran m e d i d a .. •. L a g e r e n c i a d e alto nivel s e m u e s t r a tradicionalmente s o r p r e n d i d a por el c o s t o y sin e m b a r g o r e c o n o c e la ventaja competitiva q u e representa.. •. L o s a d m i n i s t r a d o r e s de datos inician las labores de diseño tan pronto c o m o el proyecto e s m e n c i o n a d o .. •. L o s u s u a r i o s s e muestran e n t u s i a s m a d o s por la habilidad d e " S a b e r l o T o d o y Verlo Todo".. •. L o s directores de s i s t e m a s s e muestran e n t u s i a s m a d o s por la posibilidad d e utilizar. nuevos. elementos. de. "hardware". y. "software".. Muy. pronto. los. p r o v e e d o r e s s e presentan ofreciendo consultoría gratuita e historias d e éxito.. 17.

(26) T o d o esto p u e d e s e r positivo p a r a la organización.. Desgraciadamente,. m u c h o s a l m a c e n e s d e datos terminan e n f r a c a s o c u a n d o los objetivos s o n v a g o s o p o c o realistas. E l c a m i n o del éxito está lleno de proyectos fallidos por m a l a s d e c i s i o n e s , o peor a ú n , a c a u s a de la indecisión.. L o s a l m a c e n e s d e datos p u e d e n a l m a c e n a r varios niveles de detalle d e información. P o r ejemplo, d e s c r i p c i o n e s múltiples, r e l a c i o n a d a s a c a d a depósito h e c h o e n u n a s u c u r s a l b a n c a r i a , incluyendo:. •. N o m b r e , dirección, n ú m e r o s telefónicos. •. F e c h a s , c a n t i d a d e s , tipos y t a s a s d e interés d e t r a n s a c c i o n e s. •. Destinatarios d e las t r a n s a c c i o n e s , e s t a d o s d e c u e n t a , otras c u e n t a s bajo el mismo nombre. •. S e r v i c i o s utilizados por el cliente, etc.. El. almacenamiento. de. tales. cantidades. de. información. detallada,. rápidamente d a c o m o resultado e n o r m e s a l m a c e n e s d e datos del orden de los "gigabytes". Diseñar un a l m a c é n d e datos p a r a resolver preguntas. específicas. p r o d u c e a l m a c e n e s d e m e n o r t a m a ñ o c o n altos niveles d e utilización y mejores tiempos de r e s p u e s t a .. 18.

(27) •. ¿Cuáles s u c u r s a l e s tienen el m a y o r n ú m e r o v e n t a s ?. •. ¿Cuál e s el motivo d e devolución m á s frecuente?. •. ¿Cuál fue el efecto d e u n a c a m p a ñ a publicitaria, e n la d e m a n d a y oferta de un producto?. •. ¿Cuál e s el porcentaje d e g a s t o s por área c o n respecto al total?. Estas. preguntas. identifican. la. información. específica. requerida. para. resolverlas.. L a s b a s e s d e datos s e utilizan p a r a capturar t r a n s a c c i o n e s d e n e g o c i o s e n el instante e n q u e o c u r r e n , a través d e s i s t e m a s de p r o c e s o t r a n s a c c i o n a l e n línea ("On-line T r a n s a c t i o n a l P r o c e s s i n g S y s t e m s " ) c o n o c i d o c o m o O L T P . E s t o significa que la b a s e d e datos contiene u n a duración limitada. E s t a s b a s e s de datos s o n a c t u a l i z a d a s rápidamente por m u c h o s usuarios, día c o n día.. U n a l m a c é n d e datos, por el contrario, m a x i m i z a el c o n o c i m i e n t o a c e r c a d e la información. durante. el p r o c e s o d e. P r o c e s s " ) t a m b i é n llamado O L A P .. análisis. en. línea. ("On-line. Analytical. L a información e s a l m a c e n a d a por períodos. m á s largos, al m i s m o tiempo q u e la información detallada e s s u m a r i z a d a e n niveles significativos tales c o m o días o s e m a n a s . (Vidette P o e , 1 9 9 6 ). 19.

(28) E x i s t e n s e i s características q u e distinguen un almacén de datos d e otros tipos d e b a s e s d e d a t o s :. 1. U n a l m a c é n d e d a t o s está s e p a r a d o d e los s i s t e m a s o p e r a c i o n a l e s . 2. S u propósito e s integrar fuentes d e d a t o s . 3. U n a l m a c é n d e d a t o s p u e d e s e r descrito d e s d e el punto de vista de m o d e l o . 4. L a información e s s e n s i t i v a al tiempo. 5. L a información e s s e n s i t i v a al sujeto (materia, t e m a o colección). 6. E l a l m a c é n d e d a t o s e s a c c e s i b l e a u s u a r i o s c o n un c o n o c i m i e n t o limitado a c e r c a d e estructuras d e datos. ( W . H . Inmon, 1996). 3.2. La i n s t r u m e n t a c i ó n del a l m a c é n. L a s i n s t r u m e n t a c i o n e s d e a l m a c e n e s d e datos tienden a diferir d e otros p r o y e c t o s d e administración de información e n lo siguiente:. •. T i e n d e n a tener u n a m a y o r visibilidad y sin e m b a r g o la g e r e n c i a d e m a n d a m a y o r asesoría por parte de los expertos.. •. T o d a s las n u e v a s herramientas y e q u i p o de c ó m p u t o requieren s e r e v a l u a d a s y s e l e c c i o n a d a s . L a selección de herramientas e s probablemente uno de los p a s o s m á s críticos durante el proyecto d e estudio.. •. L a instrumentación del a l m a c é n requiere d e un p r o c e s o iterativo q u e involucre el tiempo suficiente p a r a llevar a c a b o p r u e b a s , rediseño y u n a n u e v a serie d e pruebas.. 20.

(29) •. L a s c o r p o r a c i o n e s e n muy raras o c a s i o n e s han tenido e x p e r i e n c i a s c o n todos los c o m p o n e n t e s d e un a l m a c é n .. •. L o s requerimientos. m á s críticos e m p i e z a n a a p a r e c e r d e s p u é s de que el. a l c a n c e inicial h a s i d o definido, lo q u e p r o v o c a rezago. •. D e b i d o a los m e c a n i s m o s d e a l m a c e n a m i e n t o de los a l m a c e n e s de datos, frecuentemente. resulta. difícil. estimar. con. exactitud,. el. tamaño. y. los. requerimientos d e C P U . •. E l u s o a d e c u a d o d e un s i s t e m a de administración de c a m b i o s no e s muy c o m ú n . E l impacto resultante de la falta d e u s o de este tipo d e s i s t e m a s sobre un a l m a c é n d e d a t o s , p u e d e s e r u n a serie indiscriminada d e c a m b i o s a los s i s t e m a s o p e r a c i o n a l e s q u e no s e reflejan a s u v e z e n el almacén de datos. ( A r m s t r o n g , Robert, 1997). L o s p r o y e c t o s e x i t o s o s d e p e n d e n d e los p r o c e s o s y técnicas q u e luchan por a l c a n z a r retos c o m o los arriba m e n c i o n a d a s c o n las siguientes l e c c i o n e s :. •. E l reclutamiento del p e r s o n a l a d e c u a d o e s crucial. L o s recursos calificados s o n escasos.. •. L a s d e c i s i o n e s técnicas. y de n e g o c i o s están. relacionadas y deben. ser. consideradas paralelamente. •. L a instalación del n u e v o medio ambiente técnico implica entrenar n u e v a m e n t e al p e r s o n a l técnico y d e análisis.. •. E l desarrollo rápido y el u s o de prototipos d e b e n s e r c o m b i n a d o s c o n el fin de h a c e r llegar los resultados a los usuarios finales lo más pronto posible.. 21.

(30) 3.3. El reto. El a l m a c é n d e d a t o s plantea varios retos a s e r instrumentados:. 1. D e s e m p e ñ o - E l v o l u m e n a s o c i a d o c o n el almacén c o n f r e c u e n c i a resulta impresionante.. Los. asuntos. relacionados. con. el. almacenamiento. y. la. organización s o n los m á s relevantes. 2. E l p e r s o n a l q u e tiene el c o n o c i m i e n t o e s el principal protagonista del almacén d e d a t o s . R e s u l t a m u c h o m á s sencillo a g r e g a r e s p a c i o en d i s c o y c a p a c i d a d del p r o c e s a d o r q u e encontrar p e r s o n a l c o n o c e d o r . 3. E l conjunto d e h e r r a m i e n t a s d e b e recolectar, depurar y a n a l i z a r la información requerida.. 3.4. Etapas de la p l a n e a c i ó n y o r g a n i z a c i ó n. •. Definición del objetivo, beneficios y justificación del proyecto. •. Identificación d e p r o c e s o s d e alto nivel del n e g o c i o y flujo de información. •. Determinación d e criterios d e éxito. •. D e t e r m i n a c i ó n d e riesgos del proyecto. •. Identificación d e tipos de usuario. •. Selección / confirmación d e la arquitectura de s i s t e m a s. •. Selección. /. confirmación. de. las. herramientas. t r a n s f o r m a c i ó n , explotación, distribución y desarrollo •. Selección del e q u i p o de trabajo. •. C r e a c i ó n del plan de trabajo. 22. de. diseño,. extracción,.

(31) 3.5. Definición del objetivo, beneficios y justificación del proyecto. Definir el objetivo e s m u y importante y a q u e s e entenderá el propósito principal del proyecto a d e m á s ayudará a mantener a todo el equipo y al cliente e n f o c a d o h a c i a un fin c o m ú n y así no crear f a l s a s expectativas.. 3.6. L o s beneficios. C u a n d o el reto d e la instrumentación h a sido s u p e r a d o , los siguientes beneficios p u e d e n s e r o b t e n i d o s por la organización entera:. 1. L a información estará disponible a tiempo. 2. L o s d a t o s s e convierten e n información. 3. L a s d e m a n d a s d e los analistas s e verá reducida debido al alto nivel de organización d e la información. 4. E l u s o d e r e c u r s o s mejorará d e b i d o a la extracción eficiente d e información de los s i s t e m a s o p e r a c i o n a l e s . 5. L a información g e n e r a d a por d i v e r s o s s i s t e m a s será integrada e n eficiente facilitando a s í s u utilización.. 23. forma.

(32) L a m e t a tanto del diseñador, c o m o del d e s a b o l l a d o r del almacén d e datos, c o n s i s t e e n h a c e r q u e t o d a la información s e encuentre disponible p a r a t o d o s los u s u a r i o s a u t o r i z a d o s . E s t o h a c e posible q u e todos los usuarios tengan a c c e s o a la información q u e requieren e n un período corto de tiempo, llevar a c a b o s u análisis y tener la certidumbre a c e r c a de s u exactitud y c o n s i s t e n c i a . Finalmente el análisis iterativo d e d a t o s c r e a la oportunidad p a r a llevar a c a b o un análisis conjunto de la información.. 3.7. Criterios de éxito. E l criterio d e éxito del a l m a c é n d e datos e s utilizado p a r a determinar las ventajas q u e éste traerá a la operación del n e g o c i o de la organización. que. patrocina el proyecto. L a s e x p e c t a t i v a s d e los usuarios finales s o n v a l o r a d a s y b a l a n c e a d a s contra el c o s t o del desarrollo y la operación del a l m a c é n . L o s criterios d e éxito q u e serán instrumentados por el equipo de diseño y desarrollo d e b e n e s t a b l e c e r s e e n t é r m i n o s cuantificables y sin a m b i g ü e d a d .. L a información a d i c i o n a l r e l a c i o n a d a c o n el criterio d e éxito del almacén d e datos incluye lo siguiente:. •. U n conjunto d e u s u a r i o s finales de a c u e r d o a lo definido e n los requerimientos. L o s u s u a r i o s serán c l a s i f i c a d o s c o m o Estratégicos (consulta d e información), O p e r a c i o n a l e s ( o r g a n i z a d o r e s d e datos) y Tácticos (generadores de datos). C a d a grupo de u s u a r i o s d e b e r á s e r e x p l i c a d o o definido.. 24.

(33) •. U n a matriz. que. mostrará. las c a p a c i d a d e s de. los usuarios. (crear,. leer,. actualizar y borrar), p a r a c a d a área sujeto del almacén. •. U n a matriz d e u s u a r i o s c o n la v e l o c i d a d de a c c e s o requerido, f r e c u e n c i a y v o l u m e n p a r a c a d a á r e a sujeto del a l m a c é n .. •. U n a matriz d e u s u a r i o s c o n la complejidad de a c c e s o p a r a c a d a área sujeto del almacén.. S e p u e d e decir q u e todo a l m a c é n d e datos b u s c a el desarrollo de un m o d e l o d e d a t o s e x p a n s i b l e que incluya. los c o m p o n e n t e s que a p o y e n las áreas. sujeto d e s i g n a d a s , a s a b e r :. •. E l desarrollo d e reglas r e l a c i o n a d a s c o n el "sourcing" de datos de las áreas sujeto, u n a v e z q u e los requerimientos finales para las m i s m a s h a y a n sido terminados.. •. E l desarrollo d e reglas r e l a c i o n a d a s c o n la c o n s i s t e n c i a del "sourcing" de datos del a l m a c é n , a partir d e las áreas sujeto identificadas q u e soportan las b a s e s d e d a t o s d e las a p l i c a c i o n e s .. •. E l " s o u r c i n g " d e datos d e s d e las b a s e s de datos d e los s i s t e m a s o p e r a c i o n a l e s , h a c i a las á r e a s sujeto del a l m a c é n de datos, aplicando las transformaciones apropiadas.. 25.

(34) •. L a selección e instrumentación de la(s) plataforma(s) de "hardware". y la. infraestructura c o n los r e c u r s o s suficientes p a r a satisfacer los requerimientos del a l m a c é n de d a t o s .. •. L a selección e instrumentación de las herramientas de generación de reportes ("On-line. Analytical. Process". OLAP). para. satisfacer el. número. y. las. características d e los requerimientos de los u s u a r i o s finales. •. E l desarrollo d e un e s q u e m a d e a c c e s o y s e g u r i d a d d e usuarios a p r o p i a d o , q u e permita un a c c e s o controlado al almacén de datos.. •. E l desarrollo d e u n a estrategia e x i t o s a de respaldo y recuperación. para. soportar el a m b i e n t e d e trabajo del a l m a c é n de datos y del usuario final.. 3.8. Riesgos. L o s r i e s g o s permiten valorar el impacto e n el éxito del almacén de datos propuesto, c u a n d o los c o m p o n e n t e s del m i s m o no están disponibles o están incompletos.. 26.

(35) 3.9. Identificación de tipos de usuario. P o d e m o s clasificar a los u s u a r i o s del a l m a c é n de datos de la siguiente forma:. TIPO DE USUARIO. DESCRIPCIÓN. ADMINISTRADOR D E Lleva a cabo el monitoreo de la BASE DE D A T O S base de datos correspondiente al (DBA) Almacén de Datos desde el punto de vista técnico, realizando el mantenimiento de sus componentes con el fin de garantizar su integridad y eficiencia DESARROLLADOR S e encarga del desarrollo de aplicaciones encaminadas a la explotación del Almacén de Datos con base en los requerimientos generados por los Usuarios de Reportes Finales ANALISTA La labor del Analista consiste en generar información para el soporte a la toma de decisiones con base en el análisis directo de los hechos almacenados en el Almacén de Datos USUARIO D E Usuarios de reportes predefinidos y R E P O R T E S FINALES generados periódicamente. CREAR. L ACTUA E LIZAR E R. BORRAR. •. • •. •. •. •. •. • •. •. •. Figura 3. Identificación de tipos de usuario. Y dentro d e la categoría d e u s u a r i o s finales s e p u e d e encontrar los siguientes: •. U s u a r i o c a s u a l : a c c e d e s o l a m e n t e e n o c a s i o n e s e s p e c i a l e s . N e c e s i t a análisis predefinido y n a v e g a c i ó n .. •. A n a l i s t a d e n e g o c i o : u s a la información a diario, pero no tiene el conocimiento técnico p a r a realizar reportes.. •. U s u a r i o p o d e r o s o : h a c e s u s propios m a c r o s y reportes, c a m b i a los parámetros y m a n i p u l a los resultados.. 27.

(36) •. D e s a r r o l l a d o r de aplicación: proporciona soporte al negocio, no solo crea reportes sino q u e define estándares e identifica dónde y c ó m o ubicar reportes. (Vidette P o e , 1996). L o importante e s q u e s e identifique a los diferentes tipos d e usuario y s e les proporcionen. las herramientas. y. licencias n e c e s a r i a s p a r a que exploten. el. a l m a c é n d e d a t o s de a c u e r d o a s u s n e c e s i d a d e s .. 3.10. S e l e c c i ó n / c o n f i r m a c i ó n de la arquitectura de sistemas. L a arquitectura e s un conjunto de reglas o estructuras q u e proveen el m a r c o d e soporte p a r a el a r m a z ó n d e todo el diseño del producto o el s i s t e m a . Definir el tipo de arquitectura lógica y física (infraestructura) e s u n a parte importante del m o d e l o , y a q u e d e a c u e r d o al tipo d e arquitectura q u e s e elija s e definirán las estrategias de extracción, transformación, explotación y distribución del a l m a c é n d e datos. (Vidette P o e , 1996). L o s tipos d e arquitectura m á s c o m u n e s s o n los siguientes:. D a t a w a r e h o u s e centralizado: e s la arquitectura m á s c o m ú n , normalmente es. una. base. de. gran. tamaño. donde. se. centraliza. la. información. y. la. administración. L a ventaja e s q u e e s posible migrar d e e s t a arquitectura a otra y la administración e s m á s s e n c i l l a. 28.

(37) D a t a w a r e h o u s e d e s c e n t r a l i z a d o : los datos s o n transformados, rediseñados y c a r g a d o s e n b a s e s s e p a r a d a s (data marts). E s t e tipo de arquitectura no tiene u n a b a s e d e d a t o s d e gran t a m a ñ o , sin e m b a r g o la administración e s compleja.. D a t a w a r e h o u s e distribuido: e n e s t a arquitectura todas las áreas obtienen información d e un m o d e l o corporativo y a unificado. T o d a s las áreas obtienen información. v a l i d a d a , p r o b a d a , consistente y verificada. S e s e p a r a el p r o c e s o de. transformación e integración del p r o c e s o d e diseño. S e a u m e n t a el d e s e m p e ñ o e n el a c c e s o a la información. H a y m á s s e g u r i d a d en la información. P e r o la administración e s m á s c o m p l e j a. Virtual d a t a w a r e h o u s e : s e utiliza tecnología middleware. L o s usuarios requieren d e u n a interfaz inteligente p a r a c r e a r un metadata (diccionario de datos) de las fuentes y ejecutar peticiones en línea y e n tiempo real. N e c e s i t a b u e n a infraestructura d e r e d e s . S i las b a s e s s o n distribuidas e s posible q u e h a y a retraso en la r e s p u e s t a d e p e t i c i o n e s .. D a t a w a r e h o u s e c o n actualización: los datos s o n extraídos e integrados e n una b a s e relacional o corporativa d e b i d o a q u e existen diferentes fuentes c o n i n c o n s i s t e n c i a e n la información. L a información e s c a r g a d a d e s p u é s a el data w a r e h o u s e , y los n u e v o s d a t o s s o n a c t u a l i z a d o s c o n información q u e n e c e s i t a s e r integrada y distribuida p a r a la t o m a de d e c i s i o n e s .. 29.

(38) L a m i s m a arquitectura lógica p u e d e requerir u n a diferente arquitectura física (infraestructura) d e p e n d i e n d o d e un ambiente corporativo e n particular. (Vidette P o e , 1996). P a r a definir el tipo d e infraestructura q u e s e utilizará e n el almacén d e datos s e d e b e n t o m a r e n c u e n t a los siguientes puntos:. •. E l tipo d e infraestructura y arquitectura c o n q u e c u e n t a la e m p r e s a p a r a s u s s i s t e m a s o p e r a c i o n a l e s . L a relación q u e tiene la e m p r e s a c o n p r o v e e d o r e s y a existentes.. •. C a p a c i d a d e s t i m a d a del a l m a c é n de datos. S e d e b e proyectar dentro de un límite d e tiempo, i n c l u y e n d o los a r c h i v o s p a r a producción, p r u e b a s y desarrollo. T a m b i é n las á r e a s d e soporte a los s i s t e m a s q u e e s el e s p a c i o requerido p a r a a l m a c e n a r "sotfware" y soportar s u operación.. •. Cálculo d e c a p a c i d a d del p r o c e s a d o r . T o m a n d o e n c u e n t a los p r o c e s o s e n línea (On L i n e T r a n s a c t i o n s ) . L o s p r o c e s o s batch q u e s o n u s a d o s p a r a g e n e r a r reportes p r e d e t e r m i n a d o s . C a r g a diaria (creación y actualización del almacén de datos). C a r g a m e n s u a l (creación y actualización del almacén d e datos) y transformaciones de datos. (sumarizaciones). Además. s e d e b e tomar. en. consideración. los p r o c e s o s d e desarrollo. Utilización de la red actual de. transmisiones. y. servidores.. Debido. a. la. cantidad. de. información. que. p r o p o r c i o n a el a l m a c é n d e datos a los usuarios hay q u e determinar el impacto que t e n d r á e n la red d e la corporación. ( W . H . Inmon, 1996). 30.

(39) 3.11 S e l e c c i ó n / c o n f i r m a c i ó n de las herramientas de diseño, extracción, transformación, e x p l o t a c i ó n , distribución y desarrollo. Al. seleccionar. las. herramientas. de. cualquiera. de. las. etapas. es. r e c o m e n d a b l e s e g u i r l o s siguientes criterios:. •. A s e g u r a r q u e la e m p r e s a s e a líder e n el m e r c a d o y t e n g a p r e s e n c i a e n México c o n s i d e r a b l e .. •. E l s o p o r t e q u e d e n s e a local. •. O f r e z c a s e r v i c i o s d e capacitación. •. El equipo de hardware s e a escalable. •. Integración y c o n e c t i v i d a d c o n la arquitectura e l e g i d a y del n e g o c i o. 3.12. S e l e c c i ó n del equipo de trabajo. El p e r s o n a l q u e tiene el c o n o c i m i e n t o e s el principal protagonista del a l m a c é n d e d a t o s . R e s u l t a m u c h o m á s sencillo agregar e s p a c i o e n d i s c o y c a p a c i d a d d e l p r o c e s a d o r q u e encontrar p e r s o n a l c o n o c e d o r . Y lo importante e n formar un b u e n e q u i p o e s q u e t e n g a n c o n o c i m i e n t o s o b r e el e n f o q u e técnico d e a c u e r d o a la infraestructura s e l e c c i o n a d a y la parte d e n e g o c i o .. 31.

(40) 3.13. C r e a c i ó n del plan de trabajo. L a creación del plan d e trabajo d e b e realizarla el equipo e n conjunto,. ya. que c a d a uno e s experto e n s u área de conocimiento y p u e d e estimar el tiempo que t o m a r á e n c a d a parte del proyecto.. CAPÍTULO 4: Requerimientos 4.1. Introducción. E s importante e n t e n d e r q u e el desarrollo de un A l m a c é n de datos D W H (Data W a r e h o u s e ) , e s diferente. al desarrollo d e un s i s t e m a o p e r a c i o n a l d e. información, e s t o s e d e b e aplicar al tratar d e obtener los requerimientos de los usuarios. E l objetivo c o m o d e s a b o l l a d o r d e e s t e tipo d e s i s t e m a s e s r e c o n o c e r las n e c e s i d a d e s d e información de los usuarios. P o r lo q u e s e d e b e aplicar la e x p e r i e n c i a n e c e s a r i a p a r a llevar las entrevistas de m a n e r a a d e c u a d a y así obtener la información n e c e s a r i a p a r a el desarrollo. O t r a parte q u e s e d e b e cuidar e s el h e c h o d e q u e m u c h o s d e los usuarios no h a n tenido contacto c o n un p r o c e s o analítico, ni h a n utilizado herramientas de tipo final p a r a el a p o y o e n l a t o m a d e d e c i s i o n e s , por lo q u e no p u e d e n imaginar el rango d e o p c i o n e s q u e p u e d e otorgar un s i s t e m a d e e s t e tipo, y e s m u y c o m ú n q u e el usuario.(Vidette P o e , 1996). E l propósito d e la recolección de requerimientos p a r a un D W H e s entender c ó m o e s el m a n e j o del n e g o c i o por parte de los u s u a r i o s , qué datos s o n los que. 32.

(41) 3.13. C r e a c i ó n del plan de trabajo. L a creación del plan d e trabajo d e b e realizarla el equipo e n conjunto,. ya. que c a d a uno e s experto e n s u área de conocimiento y p u e d e estimar el tiempo que t o m a r á e n c a d a parte del proyecto.. CAPÍTULO 4: Requerimientos 4.1. Introducción. E s importante e n t e n d e r q u e el desarrollo de un A l m a c é n de datos D W H (Data W a r e h o u s e ) , e s diferente. al desarrollo d e un s i s t e m a o p e r a c i o n a l d e. información, e s t o s e d e b e aplicar al tratar d e obtener los requerimientos de los usuarios. E l objetivo c o m o d e s a b o l l a d o r d e e s t e tipo d e s i s t e m a s e s r e c o n o c e r las n e c e s i d a d e s d e información de los usuarios. P o r lo q u e s e d e b e aplicar la e x p e r i e n c i a n e c e s a r i a p a r a llevar las entrevistas de m a n e r a a d e c u a d a y así obtener la información n e c e s a r i a p a r a el desarrollo. O t r a parte q u e s e d e b e cuidar e s el h e c h o d e q u e m u c h o s d e los usuarios no h a n tenido contacto c o n un p r o c e s o analítico, ni h a n utilizado herramientas de tipo final p a r a el a p o y o e n l a t o m a d e d e c i s i o n e s , por lo q u e no p u e d e n imaginar el rango d e o p c i o n e s q u e p u e d e otorgar un s i s t e m a d e e s t e tipo, y e s m u y c o m ú n q u e el usuario.(Vidette P o e , 1996). E l propósito d e la recolección de requerimientos p a r a un D W H e s entender c ó m o e s el m a n e j o del n e g o c i o por parte de los u s u a r i o s , qué datos s o n los que. 32.

(42) manejan. U n a c l a v e básica e s q u e los u s u a r i o s s i e m p r e harán preguntas p a r a la toma de d e c i s i o n e s . P o r ello, el s i s t e m a d e b e de s e r dirigido h a c i a e s t o s objetivos ,ya. que. se. pude. diseñar. un. sistema. increíble,. pero. dirigido. hacia. otras. expectativas y no p a r a la futura t o m a d e d e c i s i o n e s .. 4.2. Entrevistas. Existen. puntos. que. deben. de t o m a r s e. en cuenta. en. el p r o c e s o. de. entrevistas, a s a b e r :. •. U n a p e r s p e c t i v a a m p l i a d e n e g o c i o s : por. ejemplo. que. p l a n e a n d o la p o s i b l e expansión e n u n a área específica. la e m p r e s a. esté. de n e g o c i o s e n los. siguientes c i n c o años. •. Especificación. d e detalles a c e r c a de los datos y los e l e m e n t o s q u e. serán. c l a v e s e n la implantación inicial del D W H . •. E n t e n d e r el u s o principal del núcleo de los datos iniciales.. •. C o m p a r t i r la información q u e s e t e n g a e n c o m ú n p a r a q u e otra unidad de n e g o c i o s h a g a u s o d e ella o e n el futuro p u e d a n integrarse.. •. T e n e r p r e s e n t e q u e p u e d e n existir otros usuarios c o n a c c e s o a los datos e influir e n e s t o s .. 33.

(43) P a r a a s e g u r a r el éxito e s importante contar c o n analistas de s i s t e m a s y m o d e l a d o r e s d e d a t o s q u e participen e n el p r o c e s o de entrevista.. S i el equipo de. trabajo no c u e n t a c o n e x p e r i e n c i a e n un proyecto de D W H e s n e c e s a r i o incluir un consultor d e D S S (Decisión Support S y s t e m ) e n el equipo.. También. es. importante. involucrar. a. personas. pertenecientes. a. la. c o m u n i d a d d e u s u a r i o s finales, este tipo de personal tiene m u c h o trabajo, por lo que e s difícil d e contactar; sin e m b a r g o , e s n e c e s a r i o h a c e r l o s c o n s c i e n t e s de la importancia del proyecto y m a n t e n e r l o s al tanto. P a r a e s c o g e r la p e r s o n a a quien s e v a a entrevistar e s n e c e s a r i o tener e n c u e n t a las siguientes características:. •. A n a l i s t a s y u s u a r i o s dirigidos a f u n c i o n e s d e n e g o c i o s .. •. G e r e n t e s dirigidos a f u n c i o n e s d e n e g o c i o s .. •. Analistas y usuarios relacionados a funciones de negocios.. •. Gerentes relacionados a funciones de negocios.. •. Ejecutivos.. 34.

(44) 4.3. Analistas y usuarios dirigidos a funciones de negocios.. 1. Definir la calendarización d e entrevistas d e b e s e r una de las primeras c o s a s q u e s e d e b e n e s t a b l e c e r al iniciar un proyecto. 2. C o n s e g u i r la a g e n d a del usuario. 3. M a n e j a r c o m o m á x i m o 2 entrevistas por día, p a r a e x a m i n a r las notas obtenidas entre s e s i o n e s . 4. P r o v e e r un m a r c o al usuario por medio d e u n a muestra de entrevista. 5. T e n e r u n a p e r s o n a d e alto rango q u e involucre a l p e r s o n a l y e s t o s s e sientan c o m p r o m e t i d o s c o n él. 6. P e d i r. a. los. usuarios. una. muestra. de. los. reportes. que. ellos. reciben. p e r i ó d i c a m e n t e , c r e a n , etc. 7. P u b l i c a r las entrevistas p a r a q u e los d e m á s s e p a n quién está involucrado. 8. Dejar el t i e m p o n e c e s a r i o p a r a la c a p t u r a d e c a d a una de la entrevistas. 9. P a s a r t i e m p o c o n las p e r s o n a s p a r a las q u e está dirigido el s i s t e m a . E l objetivo d e e s t a entrevista e s entender el análisis diario (qué e s lo q u e s e m a n e j a de manera. manual,. los reportes. c r e a d o s y los tipos de preguntas. que. se. manejan). 10. S e d e b e d e limitar el n ú m e r o d e p e r s o n a s q u e s e entrevistan teniendo c o m o m á x i m o cuatro.. E s t a s entrevistan d e b e n tener c o m o duración, un mínimo d e 2 horas y un m á x i m o h a s t a d e 4 h o r a s , d e b i d o al tipo d e información que m a n e j a n .. 35.

(45) L a primera entrevista e s s i e m p r e la m á s larga, las entrevistas s u b s e c u e n t e s s o n d e m e n o r d u r a c i ó n . S e d e b e ser un tanto formal, manejar l a s entrevistas d e m a n e r a directa, sin la p r e s e n c i a d e u n a p e r s o n a de m a y o r jerarquía y a que esto p u e d e influir e n los resultados. . (Vidette P o e , 1996). 4.4. Gerentes dirigidos a funciones de negocios.. E s t a s entrevistas d e b e n durar d o s h o r a s c o n un m á x i m o d e 4 p e r s o n a s . L a meta principal e s e n t e n d e r los objetivos del n e g o c i o . ¿ C ó m o s e d e b e comportar el p e r s o n a l ? ¿ Q u é tipo d e análisis realiza usted m i s m o ? ¿Qué e s lo q u e h a c e c o n los reportes q u e le d a n ?. 4.5. Analistas y usuarios relacionados a funciones de negocios.. E s t a entrevista t a m b i é n d e b e d e durar d o s h o r a s y tener un m á x i m o de 4 p e r s o n a s . L a s p e r s o n a s m á s útiles s o n a q u e l l a s q u e interactúan de m a n e r a directa c o n los datos y/o f u n c i o n e s de n e g o c i o . S e d e b e mantener este grupo monitoreado p a r a v e r c ó m o utilizan los m i s m o s datos y qué otros datos s o n integrados p a r a realizar otros análisis.. 36.

(46) Gerentes relacionados a funciones de negocios.. L a s entrevistas c o n e s t e grupo han d a d o muy b u e n o s resultados, debido a que tienen m u c h a s r e s p o n s a b i l i d a d e s . E s t a s entrevistas d e b e n de durar una h o r a como máximo.. Ejecutivos. L a p e r s o n a d e alto nivel q u e n o s está d a n d o a p o y o s e d e b e entrevistar d e m a n e r a p e r s o n a l e individual. L a s entrevistas d e b e n d e durar 3 0 minutos y c o m o m á x i m o 1 h o r a . E s t a s d e b e n m a n e j a r s e h a s t a el final de todas las entrevistas. C o n e s t a entrevista s e d e b e n a r m a r t o d a s las entrevistas q u e s e han realizado por lo que e s básica p a r a integrarlas.. E s t a s p e r s o n a s tienen u n a visión muy a m p l i a d e que e s lo q u e quieren del departamento. en. un. futuro. inmediato,. mediano. plazo. y. largo. plazo.. Su. participación hará q u e las d i v e r s a s áreas s e involucren c o n mayor s e r i e d a d el proyecto.. 37.

(47) D e b i d o al tiempo previsto, s e d e b e de s e r breve y c o n c i s o , e n las preguntas que s e r e a l i c e n .. •. ¿Cuáles s o n las r e s p o n s a b i l i d a d e s d e tu p u e s t o ?. •. ¿Cuáles s o n los objetivos del corporativo?. •. ¿Cuáles s o n los factores críticos q u e impiden a l c a n z a r d i c h o s objetivos?. •. ¿ Q u é ayudaría a prevenir d i c h o s f a c t o r e s ?. •. ¿Cuáles s o n las p r e s i o n e s m a s g r a n d e s de n e g o c i o s q u e s e tienen hoy e n día?. •. ¿ C u á l e s serían los i m p a c t o s financieros al solucionar e s t o s p r o b l e m a s ?. •. ¿ P o r q u é n e c e s i t a información diaria?. •. ¿ C u á l e s s o n tus requerimientos d e análisis?. •. ¿Cuáles. son. las. oportunidades. que. se. tienen. beneficios? •. ¿ C ó m o te c o m p a r a s contra tus c o m p e t i d o r e s ?. 38. para. mejorar. los.

(48) 4.6. ¿ Q u é preguntar al usuario final?. S e harán diferentes preguntas a los ejecutivos, gerentes y analistas. A los gerentes y a n a l i s t a s s e les harán las siguientes preguntas:. •. D e s c r i b e tu p u e s t o .. •. ¿ C ó m o s e m i d e tu d e s e m p e ñ o ?. •. ¿Cuáles s o n los p r o b l e m a s d e n e g o c i o q u e enfrentas hoy e n día?. Es. importante. c o n o c e r el flujo de. la información. dentro. y fuera. del. departamento. E n m u c h o s c a s o s el e s f u e r z o q u e s e h a g a para entender el manejo de este flujo hará q u e s e d i s m i n u y a el tiempo de análisis.. •. ¿ Q u é e s lo q u e s e r e c i b e ?. •. ¿ Q u é reportes s e reciben c o n m a y o r f r e c u e n c i a ?. •. ¿Cuáles s o n los q u e utilizas?. •. ¿ Q u é tan s e g u i d o r e c i b e s este reporte?. •. ¿ Q u é e s lo q u e s e b u s c a dentro del reporte?. •. ¿ Q u é m á s h a c e s c o n este reporte?. 39.

(49) P o r lo g e n e r a l s e inicia c o n este reporte y d e s p u é s s e h a c e todo un análisis otro tipo d e hoja, por lo q u e el reporte tan solo fue el inicio.. ¿ Q u é e s lo q u e c r e a s ? ¿ Q u é reportes c r e a s ? ¿ C o n q u é periodicidad d e s a r r o l l a s este análisis? ¿Quién obtiene e s t a información? ¿Otras á r e a s c r e a n el m i s m o reporte? D e s e r así ¿cuál? ¿ C ó m o s e utiliza? ¿ C u á n t o tiempo te lleva al crearlo? ¿ D e d ó n d e o b t i e n e s la información? S i tuvieras t i e m p o ,. ¿cuáles serían los siguientes p a s o s que harías. a n a l i z a r e s t a información?. 40. para.

(50) 14.7. Un análisis adecuado.. L a m a y o r í a de los u s u a r i o s finales no s o n c a p a c e s d e definir c u a l e s s o n s u s requerimientos a d e c u a d o s . D e s d e s u punto de vista les gustaría tener los últimos 10 a ñ o s a detalle y c o n esto podrían h a c e r s u análisis. C o m o esto no e s posible e s necesario. hacer. preguntas. adecuadas para. saber cuales son. los. análisis. a d e c u a d o s p a r a el futuro. (Vidette P o e , 1 9 9 6 ). •. ¿ Q u é tipos d e análisis h a c e s ?. •. ¿Quién h a c e la pregunta original? (cliente, jefe). •. ¿ C ó m o r e s u e l v e s e s t a s p r e g u n t a s hoy e n día?. •. H a y e j e m p l o s d e lo q u e s e h a h e c h o e n el p a s a d o. Existirán s i t u a c i o n e s e n d o n d e el análisis e s t a diversificado, e s decir, q u e otra área t a m b i é n lo h a c e por lo q u e las f u n c i o n e s s e d u p l i c a n .. 4.8. Análisis de negocio. E j e m p l o de preguntas de n e g o c i o : •. ¿ C ó m o d e s a r r o l l a s los p r o g r a m a s de promoción?. •. ¿ C ó m o evalúas la productividad d e la promoción?. •. ¿ C o n q u é f r e c u e n c i a , revisas el comportamiento de los p r o v e e d o r e s ?. •. ¿ C ó m o e s el m a n e j o d e los niveles de inventario?. 41.

(51) 4.9. I n f o r m a c i ó n específica de datos. •. ¿ D e d ó n d e v i e n e n los d a t o s ?. •. ¿ Q u é tan s e g u i d o s e a c t u a l i z a n ?. •. ¿ Q u é nivel d e detalle s e n e c e s i t a ?. •. ¿ Q u i é n e s el r e s p o n s a b l e de e s t o s ?. D e s p u é s s e d e b e explorar la fuente d e los datos y h a c e r las m i s m a s preguntas. L a jerarquía d e las fuentes d e b e q u e d a r claramente e s t a b l e c i d a , s e incluirá un d i a g r a m a . L a mayoría de las o r g a n i z a c i o n e s tienen v e n t a s de producto, un d e p a r t a m e n t o d e v e n t a s , etc.. P a r a e n t e n d e r e s t e tipo d e estructuras s e d e b e n tener c l a r o s los siguientes puntos:. •. A q u é nivel s e d e s a r r o l l a el análisis (hay v e c e s q u e s e h a c e en d o n d e s e n e c e s i t a o e n d o n d e e s lo único a lo q u e s e tiene a c c e s o ) .. •. C u á l e s el nivel m á s bajo d e detalle dentro d e la organización.. •. E x i s t e n c i a d e múltiples jerarquías (dentro de la organización p u e d e existir u n a jerarquía e n algún o a l g u n o s departamentos).. •. T e r m i n o del a ñ o fiscal.. •. P e r i o d i c i d a d ( s e m a n a l , q u i n c e n a l , m e n s u a l , etc.).. 42.

(52) S i a ú n no s e e s t a b l e c e n e s t o s períodos, e s posible partir del análisis de los reportes existentes.. S e d e b e estar p r e p a r a d o p a r a discutir el proyecto c o n este usuario, e s t a p e r s o n a por lo g e n e r a l tiene interés e n ver el desarrollo y el progreso del m i s m o .. 43.

Figure

Figura 1. diferencias entre data warehouse y sistemas operacionales.

Figura 1.

diferencias entre data warehouse y sistemas operacionales. p.18
Figura 6.  E l a b o r a c i ó n del cuadro elementos para el  e s q u e m a estrella

Figura 6.

E l a b o r a c i ó n del cuadro elementos para el e s q u e m a estrella p.65
Figura 7. Desarrollo de la matriz de responsables de datos.

Figura 7.

Desarrollo de la matriz de responsables de datos. p.70
Figura 8. desarrollo de la matriz de fuentes de datos (metadata)

Figura 8.

desarrollo de la matriz de fuentes de datos (metadata) p.71
Figura 9.  A p l i c a c i ó n del modelo en el  c a s o  I T E S M - C E M BCI

Figura 9.

A p l i c a c i ó n del modelo en el c a s o I T E S M - C E M BCI p.91
Figura 10. Arquitectura de 3  c a p a s para el proyecto  I T E S M - C E M BCI

Figura 10.

Arquitectura de 3 c a p a s para el proyecto I T E S M - C E M BCI p.99
Figura 11. Flujo de  i n f o r m a c i ó n

Figura 11.

Flujo de i n f o r m a c i ó n p.130
Figura 12.  D e t e r m i n a c i ó n de usuarios.

Figura 12.

D e t e r m i n a c i ó n de usuarios. p.135

Referencias

Actualización...