Sistemas de Información Gerencial
Tema 5: Introducción a la Inteligencia de Negocios
INDICE
•
Introducción a la Inteligencia de Negocios
•
Arquitectura de un Sistema
•
Importancia IN
•
Conceptos de Datawarehouse
•
Ciclo de vida de un Datawarehouse
Se necesita entender no solo QUÉ está pasando, sino CUÁNDO, DÓNDE, QUIÉN Y PORQUÉ. Solución a los requerimientos de información con OPORTUNIDAD. Escalar, contribuir y compartir a todos los tipos de usuarios en la organización.
Se necesita información y conocimiento a partir de los datos de la empresa
.
Nace así el concepto de Inteligencia de Negocio
(
Business Intelligence):
No es una tecnología
Es un conjunto de sistemas de información que trabajan de forma coordinada.
Sistemas de almacenamiento de datos (data
warehouse)
Sistemas de minería de datos (data mining)
Herramientas de procesamiento analítico de datos
(OLAP)
Sistemas de administración de conocimiento (KBS)
Herramientas de consulta y reporte de datos
Tableros de información (Dashboards)
“ Business Intelligence se refiere al proceso de convertir datos en conocimiento y conocimiento en acciones para crear la ventaja competitiva del negocio“.
The Data Warehousing Institute
• “Business Intelligence es una herramienta crítica para el éxito y sobrevivencia de su organización hoy en día, no se trata solo de herramientas y tecnología, sino también de organización “.
• Gartner Group
“La inteligencia del negocio es como convertir la información de la empresa en una arma
estratégica“.
Teddy Dale
Consultor Internacional
“La información en las
organizaciones está aumentando rápidamente, así como, las
decisiones críticas del negocio; el problema es la actitud de las
empresas para utilizar estos datos “.
Gartner Group
Información
“ Inteligencia de Negocio se refiere al proceso de
convertir datos en conocimiento y conocimiento en
acciones para crear la ventaja competitiva del
negocio “
The Data Warehousing InstituteDatos Información Conocimiento Ventaja Competitiva
Agregar Datos
Database, Data Mart, Data Warehouse, ETL
Tools, Integration Tools Presentar Datos Conocimiento sobre los datos Toma de decisiones Reporting Tools, Dashboards, Static Reports, Mobile Reporting,
Add Context to Create Information, Descriptive
Statistics, data mining
Decisions are Fact-based and
Data-driven
“ Inteligencia de Negocio se refiere al proceso de
convertir datos en conocimiento y conocimiento en
acciones para crear la ventaja competitiva del
negocio “
The Data Warehousing Institute1. Introducción. Inteligencia de Negocio Definición
1. Introducción. Inteligencia de Negocio Uso
Procesos de Extracción, Transformación y Carga Data Mining (Business Analytics) • Estadísticas • Análisis de Tendencias y Comportamientos • Proyecciones OLAP (On-Line Analytical Processing)Análisis Multidimensional • Análisis de FCE • Análisis de Datos Sumarizados Reportes y Consultas • Análisis del Detalle de Información Data Warehouse (Data Mart) • Modelo del Negocio
Integrado • Repositorio de Información • Metadata Datos Externos Dashboards (Tableros)
2. Arquitectura de un Sistema
Procesos de Extracción, Transformación y Carga
Data Warehouse (Data Mart)
• Modelo del Negocio Integrado
• Repositorio de Información • Metadata
Datos Externos
2. Arquitectura de un Sistema
Data Warehouse. Proceso ETL
Reportes y Consultas •Análisis del Detalle de Información Data Warehouse (Data Mart) Dashboards (Tableros)
2. Arquitectura de un Sistema
Tableros, reportes y consultas
OLAP (On-Line Analytical Processing)Análisis Multidimensional • Análisis de FCE • Análisis de Datos Sumarizados Data Warehouse (Data Mart)
2. Arquitectura de un Sistema
Análisis multidimensional
Data Mining (Business Analytics) •Estadísticas •Análisis de Tendencias y Comportamientos • Proyecciones Data Warehouse (Data Mart)
2. Arquitectura de un Sistema
Business
•Cualquier organización grande o pequeña, necesita
integrar la información de su cadena de valor, con el objetivo de analizarla, para poder tomar decisiones y diseñar estrategias de negocio
• eficientes
.
Sistemas Operacionales y Datos Externos Análisis de Información
Valor para el Negocio
3. Inteligencia de Negocio. Su aporte. Su
importancia
Herramienta de análisis para el conocimiento del negocio C O N O C. D E L N E G O C I O Servidor Base de Datos Red Carga Limpieza Transformación Extracción Diseño
3. Inteligencia de Negocio. Su aporte. Su
importancia
Top 10 Business and Technology Priorities
3. Inteligencia de Negocio. Su aporte. Su
importancia
Considerado por 'Forbes' como uno de los siete científicos de datos más poderosos del
mundo
3. Inteligencia de Negocio. Su aporte. Su
La información en las organizaciones está aumentando rápidamente, así como, las
decisiones críticas del negocio; el problema es la actitud de las empresas para utilizar estos datos
Oportunidad: En 2015, Gartner predice que
4,4 millones de empleos serán creados en torno a big data. (Gartner, 2013)
¿Que es un Data Warehouse?
(Bodega o almacén de datos). Colección de datos orientados a un determinado negocio. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis de información.
• Es un repositorio para almacenar y analizar datos con naturaleza de variables cuantitativas y cualitativas
• Es considerado una de las partes centrales de un sistema de BI
• Permite separar los sistemas transaccionales de los informacionales en dos entornos de manera que el análisis de los datos existentes no interfiera con el procesamiento y registro de nuevos datos
Data Warehouse como integrador de datos
CRM Inventarios Ventas Producción Gestión human Compras Filiales Cartera4. Conceptos Básicos de DWH
4. Conceptos Básicos de DWH
• Los datos almacenados están orientados a un objetivo especifico, integrando la variable del tiempo para la toma de decisiones.
• Es un sistema integrados, pues agrupa a todos los sistemas
operacionales en un sistema de información con formatos y
códigos consistentes.
• El DW es variante en el tiempo porque los datos se organizan y almacenan en jerarquías en el tiempo, lo que permite análisis retrospectivos, comparativos de estados actuales y de períodos anteriores.
Propuesta 005.
Refuerce el concepto de DWH por medio del video “Benefits of a Data Warehouse”
Data Warehouse
• Es el maestro o centralizador de la información.
• Soporta múltiples áreas del negocio
• Maneja un alto detalle de la información
• Es un integrador de las fuentes de información
• No es necesario el uso de un modelo dimensional pero puede alimentar a modelos dimensionales.
• Coordina la gestión de información de los Datamarts
Datamart
• Es una aplicación del DWH
• Está construida para soportar una línea de negocio.
• Ideal para “sumarizar”
grandes cantidades de datos.
• Se concentra en integrar datos de una área específica.
• Es construida usando un modelo o esquema dimesional estrella
Un primer acercamiento a una arquitectura descentralizada de Datamart (DM): Almacenes Inventarios Producción Exportación DM CRM DM Riesgos DM Financiero
4. Conceptos Básicos de DWH
Data Warehouse corporativo o centralizado: Almacenes Inventarios Producción Exportación DM CRM DM Riesgos DM Financiero DWH Corporativo
4. Conceptos Básicos de DWH
Datamarts5. Ciclo de Vida de un DWH
Datos
Metodología del ciclo de vida proyectos DWH/BI de Kimball:
Tecnología
La metodología del ciclo de vida de Kimball aunque fue concebido a mediados de la década de los 80’s, fue publicada por primera vez indicando los años 90’s; desde entonces, se ha utilizado con éxito por miles de proyectos de DWH y BI, principalmente en sector industrial, áreas de aplicación, empresarial y desarrollo tecnológico (technical platform). Esta metodología se ha convertido en las mejores prácticas en la industria en general.
A continuación se mencionan brevemente las etapas de la propuesta de Kimball:
Planeación del Proyecto (Project Planning)
Definición y alcance del proyecto de DWH, incluyendo la
evaluación y justificación del proyecto.
Modelación Dimensional (Dimensional Modeling)
La definición de los requerimientos del negocio (área funcional) determinarán los datos necesarios para hacer frente a los requisitos analíticos de los usuarios finales.
Diseño Físico (Physical Design)
Definición de las estructuras físicas para apoyar el diseño de datos lógico. Claramente se requiere de un diseño lógico para convertirlo
en una base de datos física, debido a que los detalles de
implementación varían ampliamente desacuerdo a la tecnología (hardware y aplicaciones), tipo de proyecto, modelo lógico, volumen estimado, SGDB y las herramientas de acceso; estos elementos dan directrices en dicho diseño.
Diseño e Implementación de ETL (Data Staging Design and Development)
Este Etapa se divide en tres elementos: Extracción, Transformación y Carga.
El proceso de extracción expone los problemas de calidad de datos, debido a que la calidad de los datos impactará significativamente la credibilidad del DWH, es necesario solucionar los problemas de calidad. Es importante tener presente dos realidades:
• Los problemas de calidad son usualmente un reflejo del pobre diseño de datos y/o la implementación de los sistemas.
• La mayoría de estos problemas pueden ser reparados y
monitorizados para reducir el impacto sobre las aplicaciones
5. Ciclo de Vida de un DWH
Estándares
Modelo Físico de Datos
Plan de indexación Diseño y construcción de la instancia de DB Plan Global Estructura Física de Almacenamiento Monitorización Diseño Físico
5. Ciclo de Vida de un DWH
Diseño Técnico de Arquitectura (Technical Architecture Design)
En esta etapa se considera la integración de múltiples tecnologías. Se consideran tres factores: Requerimientos del negocio, ambiente tecnológica actual y el direccionamiento técnico futuro.
Selección e Instalación de Producto (Product Selection and Installation) Con base al diseño técnico de arquitectura, se especifica los componentes de arquitectura tales como plataforma del hardware, herramientas de acceso a los datos, sistema de gestión de base de datos entre otros. En este etapa el elemento de integración toma singular importancia.
Especificación de Aplicaciones Usuario Final (End User Application
Specification) Se definen las aplicaciones de usuario, restringiendo el acceso ad hoc al DWH. Estas aplicaciones cubren los complementes de visualización, exploración, data mining y herramientas de BI tales como EIS y Dashboard.
Desarrollo de Aplicaciones Usuario Final (End User Application
Development) Aborda la configuración de las herramientas de usuario final,
dependiendo de la dimensión del proyecto, estas aplicaciones demandarán su propia arquitectura que soporte los usuarios y la integración con el DWH.
Despliegue (Deployment)
Convergencia y funcionamiento de la tecnología, datos y aplicaciones de usuario final desde la estación de cada unos de los analistas o estrategas de BI. Se deben tener presente procesos de capacitación y de soporte al usuario sobre las aplicaciones.
Mantenimiento y Crecimiento (Maintenance and Growth)
Frente al usuario final: se les debe entregar apoyo y formación.
Funcionamiento eficaz del DWH: monitorización de los procesos y procedimientos, estas métricas serán argumento para una posible etapa de crecimiento.
Gestión de Proyectos (Project Management)
Garantiza las actividades en el ciclo de vida de funcionamiento y sincronía, que se enfocan en el estado de procesos de monitorización, seguimiento de problemas y gestión de cambios; por otra parte, le corresponde desarrollar el plan de comunicación del proyecto.
Propuesta 006.
Realizar la lectura de artículo “A Holistic Approach for Managing Requirements of Data
Warehouse Systems.” Eighth Americas Conference on Information Systems, Schiefer, J., List, B.
& Bruckner, R.M.
La metodología del ciclo de vida de Kimball aunque fue concebido a mediados de la década de los 80’s, fue publicada por primera vez indicando los años 90’s; desde entonces, se ha utilizado con éxito por miles de proyectos de DWH y BI, principalmente en sector industrial, áreas de aplicación, empresarial y desarrollo tecnológico (technical platform). Esta metodología se ha convertido en las mejores prácticas en la industria en general.
Hardware App. Almacenamiento (SGDB) App. De extracción y manipulación de datos Herramienta Middleware DWH Corporativo Hardware
Garantizar que tenga altas
características técnicas acorde a los
complejos requerimientos de
información de los usuarios.
Capacidad de potencializar (crecer) Procesamiento paralelo:
SMP (Symmetric Multiprocessing) MPP (Massively Parallel Processing) NUMA (Non-Uniform Memory
Architecture)
Hardware App. Almacenamiento (SGDB) App. De extracción y manipulación de datos Herramienta Middleware DWH Corporativo SGDB
Un Sistema de Gestión de Base de Datos consiste en una colección de datos interrelacionados y un
conjunto de programas para
acceder a los mismos.
• El programa de almacenamiento (servidor) es independiente al programa de consulta (Cliente) de los usuarios • El objetivo son complejas visualización • Contempla las consultas en lugar de la un esquema de de múltiples concurrencia usuarios
6. Construcción de un DWH
Hardware App. Almacenamiento (SGDB) App. De extracción y manipulación de datos Herramienta Middleware DWH Corporativo
Extracción y manipulación (ETL)
Funcionalidades básicas:
• Control de la extracción de los datos y su automatización
• Acceso a diferentes tecnologías.
• la arquitectura de independiente del Uso de metadatos • Interfaz hardware
6. Construcción de un DWH
Hardware App. Almacenamiento (SGDB) App. De extracción y manipulación de datos Herramienta Middleware DWH Corporativo Herramientas Middleware
Parveen conectividad entre
entornos diferentes, para ayudar a la gestión del Data Warehouse.
Analizadores y aceleradores de consulta: Optimizan tiempos de Sistemas respuesta desde los
operacionales al DW.
Deben estar abiertas a todos los entonos de:
• Almacenamiento de datos (OLE, ODBC, etc.)
• Bases de datos (DB2, SQL,
Oracle, MySQL, etc.)
de capa (SNA de LU6.2, • Estándares transporte: DECnetr, etc.
6. Construcción de un DWH
Elementos a tener presente en la construcción de un DWH:
• Detectar y corregir errores (duplicados, eliminar valores sin sentido, procesos básicos de imputación)
• Manejo de valores codificados para las variables. Es importante tener un adecuado diccionario de datos disponible para los usuarios.
• Reestructurar y añadir nuevos campos (enriquecer el sistema) de acuerdo las necesidades del usuario.
• Emplear el concepto de Metadatos (datos que describen otros datos)
• No debe soportar procesos transaccionales del negocio.
6. Construcción de un DWH
6. Salidas de un DWH
Querys - Reporting Análisis multidimensional Dara Mining DWH Corporativo consultas y Querys - Reporting Generación de reportes. Pueden o ser informes dinámicos. para procesos de predefinidos Fundamentales Monitorización (Dashboard). Es posible ubicar las herramientas y metodologías EIS (Decision SupportSystem) y CPM
Performance
(Corporate Managemnet) dependiendo de este componente de explotación del DWH.
Querys - Reporting Análisis multidimensional Dara Mining DWH Corporativo Análisis Multidimensional
Facilitan el análisis de datos por medio de dimensiones y jerarquías, utilizando consultas rápidas y predefinidas.
OLAP: Su objetivo es agilizar la consulta de grandes cantidades de
datos. Utiliza estructuras
multidimensionales que contienen datos de grandes Bases de datos
Querys - Reporting Análisis multidimensional Dara Mining DWH Corporativo Data Mining Es la aplicación de modelos
matemáticos sobre la información
almacenada en el DWH. El
resultado de los modelos soporte la toma de decisión en el proceso de BI.
Es fundamental garantizar la optimización de los modelos y su ejecución automática según la necesidad del negocio.
Data mining arquitectura
requiere de una
propia que
interconecta a los usuarios con el DWH por medio de un servidor negociador.
.