• No se han encontrado resultados

Business intelligence para la generación de indicadores y control de desempeño, en el área de compras agrícolas de la empresa "Pronaca"

N/A
N/A
Protected

Academic year: 2020

Share "Business intelligence para la generación de indicadores y control de desempeño, en el área de compras agrícolas de la empresa "Pronaca""

Copied!
153
0
0

Texto completo

(1)

UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS ANDES UNIANDES – SANTO DOMINGO

FACULTAD DE SISTEMAS MERCANTILES CARRERA DE SISTEMAS

PROYECTO DE EXAMEN COMPLEXIVO PREVIO A LA OBTENCIÓN DEL TITULO DE INGENIERO EN SISTEMAS E INFORMÁTICA

TEMA:

BUSINESS INTELLIGENCE PARA LA GENERACIÓN DE INDICADORES Y CONTROL DE DESEMPEÑO, EN EL ÁREA DE COMPRAS AGRÍCOLAS DE

LA EMPRESA “PRONACA”.

AUTOR: LIC. ARROBO LAPO ESTALIN VLADIMIR ASESOR: ING. LOZADA TORRES EDWIN FABRICIO

AMBATO – ECUADOR

(2)

APROBACIÓN DEL ASESOR DEL TRABAJO DE TITULACIÓN

CERTIFICACIÓN:

Quien suscribe, legalmente CERTIFICA QUE: El presente Trabajo de Titulac ió n realizado por el señor Estalin Vladimir Arrobo Lapo, estudiante de la Carrera de Sistemas, Facultad de Sistemas Mercantiles, con el tema “BUSINESS INTELLIGENCE PARA LA GENERACIÓN DE INDICADORES Y CONTROL DE DESEMPEÑO, EN EL ÁREA DE COMPRAS AGRÍCOLAS DE LA EMPRESA PRONACA”, ha sido prolijamente revisado, y cumple con todos los

requisitos establecidos en la normativa pertinente de la Universidad Regional Autónoma de los Andes -UNIANDES-, por lo que apruebo su presentación.

Ambato, Noviembre de 2017

________________________________________

ING. EDWIN FABRICIO LOZADA TORRES

(3)

DECLARACIÓN DE AUTENTICIDAD

Yo, Estalin Vladimir Arrobo Lapo, estudiante de la Carrera de Sistemas, Facultad de Sistemas Mercantiles, declaro que todos los resultados obtenidos en el presente trabajo de investigación, previo a la obtención del título de INGENIERO EN SISTEMAS E INFORMÁTICA, son absolutamente originales, auténticos y personales; a excepción de las citas, por lo que son de mi exclusiva responsabilidad.

Ambato, Noviembre de 2016

________________________________________

SR. ESTALIN VLADIMIR ARROBO LAPO CI. 171594410-2

(4)

DERECHOS DE AUTOR

Yo, Estalin Vladimir Arrobo Lapo, declaro que conozco y acepto la disposició n constante en el literal d) del Art. 85 del Estatuto de la Universidad Regional Autónoma de Los Andes, que en su parte pertinente textualmente dice: El Patrimonio de Ia UNIANDES, está constituido por: La propiedad intelectual sobre las Investigacio nes, trabajos científicos o técnicos, proyectos profesionales y consultaría que se realicen en la Universidad o por cuenta de ella;

Ambato, Noviembre de 2017

______________________________________ LIC. ESTALIN VLADIMIR ARROBO LAPO CI. 171594410-2

(5)

DEDICATORIA

Dedicado el presente trabajo de investigación a mi hijo Matías, quién es mi fuente de inspiración para el día a día en mis actividades y a mi esposa Marisela quién es mi compañera de vida.

(6)

AGRADECIMIENTO

A Dios principalmente, quién me da salud y fortaleza para poder conseguir las metas propuestas, a mi esposa y a mi hijo, a quienes no pude dedicarles el merecido tiempo en familia para poder alcanzar el presente logro, quienes con su comprensión me apoyaron para el desarrollo de esta tesis.

(7)

RESUMEN

(8)

ABSTRACT

The present thesis develops a Business Intelligence System for the agricultural purchasing area of the Pronaca company, using Open Source tools, currently can only be competitive applying new technologies, but it is not possible yet since the area of agricult ura l purchases of the Pronaca company does not have automated information analysis tools, to know exactly how the business of buying agricultural raw material is operating, to know if we are doing things correctly to meet the business objectives, it is here where Business Intelligence applies. This thesis starts by investigating the basic concepts of Business Intelligence, after knowing about the steps involved in this process and taking into account that the administrative and managerial area of Agricultural Purchasing does not have a tool of easy access and free as the tool Pentaho Open Source Business Intelligence, which is a Business Intelligence solution that contains a set of free programs to generate Business Intelligence, includes integrated tools for generating reports, data mining, ETL, etc. This tool has been booming at the business level for several years and since it is Open Source we do not need to spend big investments in front of the commercia l tools, even more taking into account the time of recession that we live and in many companies are not ready or not have the resources to acquire a tool of the commercia l type. In the present work we will explain step by step each one of the components of Pentaho and how they will allow us to apply Business Intelligence, using this solutio n based on new trends and tools of information analysis. In today’ era, information is key

(9)

ÍNDICE GENERAL

APROBACIÓN DEL ASESOR DEL TRABAJO DE TITULACIÓN

DECLARACIÓN DE AUTENTICIDAD

DERECHOS DE AUTOR

DEDICATORIA5

AGRADECIMIENTO

RESUMEN

ABSTRACT

ÍNDICE GENERAL

ÍNDICE DE FIGURAS

ÍNDICE DE TABLAS

INTRODUCCIÓN ... 1

Antecedentes de la Investigación ... 1

Planteamiento del problema... 2

Formulación del Problema ... 3

Delimitación del problema... 3

Objeto de Investigación y Campo de Acción ... 4

Línea De Investigación ... 4

Objetivos ... 4

Objetivo general ... 4

Objetivos Específicos... 4

Idea a Defender ... 4

Justificación de la Actualidad, Necesidad e Importancia del Tema. ... 5

CAPITULO I... 6

(10)

1.1 Business Intelligence ... 6

1.2 Análisis de información ... 8

1.2.1 Definiciones ... 8

1.2.2 Características Bi ... 9

1.2.3 Proceso de Bi ... 9

1.2.4 Componentes de Business Intelligence ... 10

1.3 Metodologías para el Desarrollo de BI ... 24

1.3.1 Metodología Inmon ... 24

1.3.2 Metodología K imball ... 25

1.3.3 Metodología Hefesto ... 27

1.4 Tipos de Arquitectura ... 27

1.4.1 Top-down... 27

1.4.2 Bottom-up ... 27

1.4.3 Híbrida ... 28

1.5 Comparación de Metodologías de BI... 29

1.6 Bases de datos ... 29

1.6.1 Sistemas de gestión de base de datos. ... 29

1.6.2 Gestores de base de datos propietarios ... 30

1.6.3 Gestores de base de datos libres ... 30

1.6.4 Postgresql... 31

1.7 Pentaho ... 32

1.7.1 Características generales de Pentaho. ... 32

1.7.2 Tipos de licencia de Pentaho ... 33

1.7.3 Plataforma de Pentaho Community Edition. ... 34

(11)

1.7.5 Mondrian... 35

1.7.6 Reporting ... 35

1.7.7 Pentaho Data Acces Project ... 35

1.7.8 Análisis de negocio de Pentaho ... 35

1.7.9 Editor de metadatos ... 36

1.7.10 Pentaho Schema Workbench ... 36

1.7.11 Community Dashboard Framework (CDF) ... 36

1.8 Indicadores de control de desempeño KPI ... 37

1.8.1 Tipos de indicadores ... 38

1.8.2 Cómo definir un indicador:... 38

1.8.3 Partes de un indicador... 39

1.8.4 Como medir los resultados del indicador ... 39

1.9 Cuadros de mando ... 40

1.9.1 Sistema de información ejecutivo ... 41

1.9.2 Tipos de cuadros de mando ... 41

1.10 Conclusiones Parciales del Capitulo ... 42

CAPITULO II ... 44

2 MARCO METODOLOGICO ... 44

2.1 Caracterización del Sector... 44

2.1.1 Situación Actual... 44

2.1.2 Compras Agrícolas ... 45

2.2 Modalidad de Investigación ... 46

2.2.1 Cualitativo... 46

2.2.2 Cuantitativo... 46

(12)

2.3.1 Bibliográfica ... 46

2.3.2 De campo ... 47

2.3.3 Documental ... 47

2.4 Métodos investigativos... 47

2.4.1 Inductivo-Deductivo ... 47

2.4.2 Analítico-Sintético ... 47

2.4.3 Hipotético-Deductivo ... 48

2.5 Técnica a utilizar ... 48

2.5.1 La encuesta ... 48

2.5.2 La entrevista... 49

2.6 Población y Muestra ... 49

2.6.1 Análisis e Interpretación de la Encuesta ... 50

2.6.2 Resumen de la entrevista aplicada al Jefe de Compras Agrícolas de la empresa Pronaca... 57

2.7 Propuesta del investigador ... 59

2.7.1 Objetivos generales de la propuesta ... 59

2.8 Conclusiones Parciales del Capítulo ... 59

CAPITULO III ... 61

3 MARCO PROPOSITIVO ... 61

3.1 Descripción de la propuesta ... 61

3.2 Objetivo general ... 61

3.3 Selección de Metodología de implementación. ... 61

3.4 Características de la Metodología Hefesto ... 61

3.5 Empresa analizada ... 62

(13)

3.6.1 Factibilidad Técnica... 63

3.6.2 Factibilidad Operativa ... 64

3.6.3 Factibilidad Económica ... 65

3.6.4 Costo total del proyecto ... 65

3.7 Desarrollo de la solución Business Intelligence utilizando la metodología “Hefesto”... 66

3.7.1 Definición de requerimientos ... 66

3.7.2 Análisis de requerimientos ... 66

3.7.3 Análisis de los O LTP ... 69

3.7.4 Modelo lógico del Datawarehouse ... 76

3.7.5 Integración de datos ... 85

3.7.6 Creación de Cubos Multidimensionales ... 95

3.7.7 Instalación pentaho-server-ce-7.0.0.0-12 ... 101

3.7.8 Iniciamos consola PUC de BI Server. ... 101

3.7.9 Instalación de Saiku Analytics y Saiku Chart Plus... 103

3.7.10 Estructura de los indicadores: ... 112

3.7.11 Visualización de indicadores ... 112

Conclusiones ... 116

Recomendaciones... 117

BIBLIOGRAFIA

Antecedentes de la investigación

Planteamiento del problema

Formulación del problema

Delimitación del problema

(14)

Objetivos

Objetivo general

Objetivos específicos

Fundamento teórico conceptual de la propuesta

Metodología de la investigación

(15)

ÍNDICE DE FIGURAS

Figura 1. Proceso BI... 9

Figura 2 Componentes de Business Intelligence ... 11

Figura 3. Puntos de control de Calidad de datos. ... 14

Figura 4 Proceso ETL. ... 15

Figura 5 Formación de Cubos O lap. ... 22

Figura 6 Arquitectura Inmon... 25

Figura 7 Arquitectura K imball ... 26

Figura 8 Top Down ... 27

Figura 9 Bottom Up ... 28

Figura 10 Híbrida ... 28

Figura 11.- Cumplimiento inmediato de información requerida ... 51

Figura 12 .- Automatización de procesos de análisis de información ... 52

Figura 13.- Existencia de datos históricos ... 53

Figura 14.- Formato de entrega de información ... 54

Figura 15.- Solicitud de información redundante. ... 55

Figura 16.- Aprobación de Sistema de Inteligencia de Negocios. ... 56

Figura 17.- Disposición a utilizar el BI... 57

Figura 18.- Modelo Conceptual ... 69

Figura 19.- Diagrama Entidad - Relación ... 71

Figura 20.- Modelo conceptual ampliado ... 76

Figura 21.- Tabla de dimensión "DIM_FECHA" ... 77

Figura 22.- Tabla de dimensión "DIM_UBICA_GEOGRAFICA" ... 78

Figura 23.- Tabla de dimensión "DIM_PESAJE" ... 79

Figura 24.- Tabla de dimensión "DIM_LIQUIDACIONES" ... 80

Figura 25.- Tabla de dimensión "DIM_PROVEEDO " ... 80

Figura 26.- Tabla de dimensión “DIM_ARTICULOS” ... 81

Figura 27.- Tabla de dimensión "DIM_CENTROS" ... 81

Figura 28.- Tabla de dimensión "DIM_TECNICOS"... 82

Figura 29.- Tabla de dimensión "DIM_UBICACION_ZONAS"... 82

Figura 30.- Tabla de dimensión "DIM_CONTRATOS" ... 83

Figura 31 Diseño de tablas de hechos ... 84

(16)

Figura 33.- Versión Pentaho Data Integration ... 86

Figura 34.- Proceso carga inicial... 86

Figura 35.- Procesos "JOB_CARGA_STAGE_I" ... 87

Figura 36.- Procesos "JOB_CARGA_DIMENSIONES" ... 89

Figura 37.- Tabla de hechos ... 90

Figura 38.- Obtiene datos de la base STAGING ... 91

Figura 39.- Dimension lookup DIM_ARTICULOS ... 91

Figura 40.- Valida si campo es N ULL ... 93

Figura 41.- Tabla de salida "FACT ANALISIS COMPRAS" ... 94

Figura 42.- Versión Schema Workbench ... 95

Figura 43.- Modelo lógico para creación del cubo multidimensional ... 96

Figura 44.- Indicadores cubo "ANALISIS PAGOS HASTA 2016" ... 97

Figura 45.- Dimensiones de los atributos insertados al cubo ... 98

Figura 46.- Jerarquía DIM_ARTICULOS ... 98

Figura 47.- Jerarquías DIM_FECHA... 99

Figura 48.- JERARQUÍAS DIM_LIQUIDACIÓN ... 99

Figura 49.- JERARQUÍAS DIM_PROVEEDOR... 99

Figura 50.- Jerarquía DIM_TECNICOS ... 100

Figura 51.- Jerarquías DIM_GEO GRAFÍA... 100

Figura 52.- Jerarquías DIM_CENTROS... 100

Figura 53.- Ruta de pentaho-server 7.0... 101

Figura 54.- Iniciar consola PUC de Pentaho 7.0... 102

Figura 55.- Frontend Pentaho 7.0 ... 102

Figura 56.- Saiku Anayltics y Saiku Chart Plus ... 103

Figura 57.- Administrar fuentes de datos... 104

Figura 58.- Nueva conexión en PUC ... 104

Figura 59.- Creación de conexión a Postgresql ... 105

Figura 60.- Publicar cubo... 105

Figura 61.- Publicación exitosa... 106

Figura 62.- Abrir Saiku Analytics... 106

Figura 63.- Nueva consulta con "Saiku Analytics"... 107

Figura 64.- Como seleccionar cubo publicado en "Saiku Analytics" ... 107

(17)

Figura 66.- Análisis compras por provincias ... 109

Figura 67.- Análisis de compras en modo gráfico de barras... 110

Figura 68.- Análisis de compras en modo de gráfico de torta ... 110

Figura 69.- Estadísticas básicas ... 111

Figura 70.- Ilustración 61 Consulta en lenguaje "MDX". ... 111

Figura 71.- lustración 62 Estructura de los indicadores... 112

Figura 72.- Indicador de Compras por técnicos agrícolas ... 113

Figura 73 .- Indicador de captación de la empresa respecto a la disponibilidad de grano ... 114

(18)

ÍNDICE DE TABLAS

Tabla 1 Comparación de metodologías de Business Intelligence. ... 29

Tabla 2 Comparación de características en Pentaho Community y Enterprise Edition . 34 Tabla 3 Tabla del personal de la empresa ... 50

Tabla 4.- Cumplimiento inmediato de información requerida. ... 50

Tabla 5.- Automatización de procesos de análisis de información. ... 51

Tabla 6 .- Existencia de datos históricos... 52

Tabla 7.- Formato para entrega de informes requeridos ... 53

Tabla 8.- Solicitud de información redundante... 54

Tabla 9.- Aprobación de Sistema de Inteligencia de Negocios ... 55

Tabla 10.- Disposición a utilizar la herramienta BI ... 56

Tabla 11 Encuesta al jefe de compras agrícolas ... 58

Tabla 12 Costos de materiales ... 65

Tabla 13 Costos de operación ... 65

Tabla 14 Costo Total del Proyecto... 65

Tabla 15Análisis de requerimientos... 67

Tabla 16 Identificar Indicadores y Perspectivas ... 68

(19)

1

INTRODUCCIÓN

Antecedentes de la Investigación

La intensificación de la competencia global, la caída de las fronteras políticas y geográficas y una demanda cada vez mayor por parte del cliente, sin importar el tipo de negocio que se ejecute, han hecho de esta una era de cambios sin precedentes, tanto en el gobierno como en los negocios. Las empresas están forzadas a encontrar radicalme nte nuevas formas de competir y de servir a los clientes, esta es la era de la información.

Business Intelligence es la transformación de datos en Información, para luego transformar la Información en Conocimiento a través de la guía de una metodología, es un conjunto de técnicas y herramientas que apoyan la toma de decisiones, enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes.

Al realizar una investigación preliminar se pudo apreciar que existen trabajos relacionados con el tema, como por ejemplo el trabajo de tesis desarrollado por las Ingenieras Sofía Anabel Bustos Barrera y Verónica Nathaly Mosquera Artieda en la Escuela Politécnica del Ejército ESPE, con el tema "Análisis, Diseño e Implementac ió n de una Solución Business Intelligence para la generación de indicadores y control de desempeño, en la empresa Otecel s.a., utilizando la metodología Hefesto v2.0", cuyo objetivo es implementar una solución BI para el área de pruebas de la Gerencia de Construcción de la empresa Otecel S.A., mediante la investigación, aplicación de tecnologías actuales y utilización de herramientas de software libre empleando la metodología Hefesto.

(20)

2

Planteamiento del problema

Business Intelligence se encarga de recopilar información de bases de datos de distintas fuentes, para organizarla y combinarla, de tal forma que nos permita explotarla en base a análisis, desarrollando para este fin procesos iterativos que permitan el análisis de información para obtener de este el conocimiento, lo que conlleve a que los tomadores de decisiones puedan efectuar una fácil interpretación y compresión de la informac ió n presentada, y logrando con la transformación de los datos de la empresa en conocimie nto una gran ventaja competitiva.

Los datos de la empresa constituyen el principal recurso para esta y más aún para el desarrollo de una solución Business Intelligence (BI), cuyo objetivo principal es encontrar información relevante sobre la situación del negocio.

La empresa “Pronaca”, es una empresa privada dedicada a la elaboración de alimentos,

para este propósito dentro de la cadena de valor de la empresa consta el abastecimie nto de materia prima de Maíz y Soya, el área de “Compras Agrícolas” con sede en el cantón Buena Fe en la provincia de Los Ríos, se encarga de gestionar las compras de estos granos, por tanto nos enfocaremos en los procesos que realiza la mencionada área.

En la actualidad el área de Compras Agrícolas no cuenta con una herramienta que permita generar ágilmente reportes a los jefes y directivos encargados de la toma de decisiones, este proceso se lo maneja de manera manual, lo cual genera retrasos en tiempos de respuesta y cargas operacionales innecesarias.

(21)

3

Mediante los indicadores y resultados obtenidos se puede determinar medidas de cambio y mejora basados en el análisis de información y datos procesados, que generan una visión más clara del estado actual del negocio.

La implantación de una solución BI representa un apoyo de gran utilidad al momento de realizar informes, puesto que actualmente las personas encargadas de la obtención de reportes, tienen que dedicar tiempo asignado a otras tareas para entregar los resultados al personal encargado de tomar las decisiones, los tomadores de decisiones requieren contar con información relevante para definir estrategias claves.

El área de Compras Agrícolas realiza frecuentemente reuniones gerenciales, como producto de estas reuniones surge la necesidad de conocer información vital, la cual se la requiere de forma inmediata, al no contar con una herramienta tecnológica para la preparación de esta información a disposición de los analistas de información, la preparación de esta información puede demorarse incluso días debido a la ingente cantidad de datos que se maneja. El gerente de Compras Agrícolas y los directivos deben tener acceso rápido a la información para realizar un análisis personalizado de los diferentes escenarios relacionados con el ciclo de cultivo del grano de maíz, desde la venta de semillas y fertilizantes, la compra del grano de maíz y los cumplimientos de entrega en volumen y calidad.

Formulación del Problema

¿Cómo obtener de forma inmediata la información sobre los procesos del área de Compras Agrícolas de Pronaca?

Delimitación del problema.

El presente estudio se realizará en el área de “Compras agrícolas” de la empresa “Pronaca”, ubicada en el cantón Buena Fe, donde se considerará los procesos

(22)

4

Objeto de Investigación y Campo de Acción

Objeto de Estudio: Sistemas de información.

Campo de acción: Sistema de Business Intelligence.

Línea De Investigación

Desarrollo de Software y Programación de Sistemas.

Objetivos

Objetivo general

Implementar una solución Business Intelligence para la generación de indicadores y control de desempeño, en el área de compras agrícolas de la empresa Pronaca.

Objetivos Específicos

 Fundamentar científicamente los conceptos relacionados a las soluciones de Business Intelligence con software libre.

 Identificar la problemática en la gestión de la información en el área de compras

agrícolas en la empresa Pronaca.

 Desarrollar un sistema de Business Intelligence con herramientas de software libre,

para la generación de indicadores y control de desempeño en el área de compras agrícolas en la empresa "Pronaca".

Idea a Defender

(23)

5

Justificación de la Actualidad, Necesidad e Importancia del Tema.

Un sistema de Business Intelligence es un software o aplicativo que tiene como finalidad transformar los datos de una compañía en información y conocimiento para obtener una ventaja competitiva. Las herramientas de Business Intelligence permiten reunir, depurar, transformar los datos obtenidos de operaciones diarias como pedidos, facturas, movimientos contables, nóminas, operaciones en información estructurada lista para su explotación directa, mediante análisis y conversión en conocimiento que sirva para el soporte a la toma de decisiones del negocio. Permite adaptar la frecuencia y el formato de la información al gusto de nuestras necesidades. Así la herramienta Business Intellige nce debe adaptarse a las necesidades de un cargo que cumpla funciones como tomador de decisiones en la empresa.

Partiendo desde la primicia que Business Intelligence es la gestión y explotación analít ica de los datos de una empresa para ayudar a la toma de decisiones, también se le conoce como Inteligencia Empresarial, en el mercado se dispone de toda una gran variedad de soluciones, basadas en un conjunto de herramientas. Para que una solución pueda ser considerada como una solución BI completa, debe incluir herramientas integradas como ETL (extraer, transformar y cargar), almacén de datos (Data Warehouse, OLAP, Data Marts), gestor de definición de dimensiones, métricas e indicadores, debe tener también Motor de Reglas del Negocio para Análisis (Estadísticas, Data Mining, Simulac ió n, Optimización, Procesos), generador de informes, cuadro de mandos y capa de presentación web.

(24)

6

CAPITULO I

1. MARCO TEORICO

1.1 Business Intelligence

El objetivo básico de la Inteligencia de Negocios o Business Intelligence es apoyar de forma sostenible y continua a las organizaciones para mejorar su competitividad, facilitando la información necesaria para la toma de decisiones. El primero que acuñó el término fue Howard Dresner que, cuando era consultor de Gartner, popularizó Business Intelligence o BI, como un término para describir un conjunto de conceptos y métodos que mejoraran la toma de decisiones, utilizando información sobre lo que había sucedido, lo que en Business Intelligence se le llama hechos. (Lluís Cano, 2007)

BI es un proceso interactivo para explorar y analizar información estructurada sobre un área (normalmente almacenada en un almacén de datos o datawarehouse), para descubrir tendencias o patrones, a partir de los cuales derivar ideas y extraer conclusiones. El proceso de Business Intelligence incluye la comunicación de los descubrimientos. Las áreas incluyen clientes, proveedores, productos, servicios y competidores. (Gartner, 2016)

Al referir a proceso iterativo, al hablar de BI estamos suponiendo que se trata de un análisis de información continuado en el tiempo, no sólo en un momento puntual. Aunque evidentemente este último tipo de análisis nos puede aportar valor, es incomparable con lo que nos puede aportar un proceso continuado de análisis de información, en que podemos ver tendencias, cambios, variabilidades, etc. (Lluís Cano, 2007)

(25)

7

sistemas de Business Intelligence eficaces dan a los encargados de tomar decisiones la capacidad de mantener sus dedos en el pulso de sus negocios sobre cada paso en el camino. (Thierauf, 2001)

En todo proyecto de BI hay un momento inicial en el que por primera vez accedemos a información que nos facilita su interpretación. En esta primera fase, lo que hacemos es “explorar” para comprender qué sucede en nuestro negocio, es posible incluso que

descubramos nuevas relaciones que hasta el momento desconocíamos (Lluís Cano, 2007).

El crecimiento de la Inteligencia de negocios se puede vincular al hecho que el software de BI está mejorando y es más barato de usar en el día a día, por no mencionar la reducción de los costos de hardward. La inteligencia de negocios se desarrolla constantemente, se renueva cuando es necesaria y se aplica donde es necesaria, es una fuente importante de ventaja competitiva para lo responsables de la toma de decisiones de una empresa, cuanto más la usan los tomadores de decisiones, más contribuyen al bienestar general de una empresa. (Thierauf, 2001)

Con el análisis se pretende descubrir relaciones entre variables, tendencias, es decir, cuál puede ser la evolución de la variable, o patrones. Si un cliente tiene una serie de características, con el análisis se define cuál es la probabilidad de que otro con simila res características actúe igual que el anterior. La información que utilizamos en BI está almacenada en tablas relacionadas entre ellas. Las tablas tienen registros y cada uno de los registros tiene distintos valores para cada uno de los atributos. Estas tablas están almacenadas en lo que conocemos como datawarehouse o almacén de datos. (Lluís Cano, 2007).

(26)

8

1.2 Análisis de información

Las tecnologías de Información han tenido una evolución sorprendente desde su inicio en los años 50, es así que la potencia de cálculo informático crece exponencialmente todos los años, a este crecimiento de la Informática, paralelamente le ha acompañado el de la información, cuyas ingentes cantidades de información acumulada, hace imposib le interpretar o descifrar esta información de forma natural, es aquí donde entra el Anális is de Información, con el objetivo de sacar a ese gran cúmulo de datos su máximo valor. (Sarduy Domínguez, 2014)

El objetivo del análisis de información es obtener ideas relevantes, de las distintas fuentes de información, de tal forma que sea posible expresar el contenido de esta informac ió n sin ambigüedades. (Sarduy Domínguez, 2014)

1.2.1 Definiciones

En el contexto de la sociedad de la información se ha propiciado la necesidad de tener mejores, más rápidos y más eficientes métodos para extraer y transformar los datos de una organización en información y distribuirla a través de la cadena de valor.

La Inteligencia de negocio o Business Intelligence responde a dicha necesidad, y podemos considerar que es una evolución de los sistemas de soporte a las decisiones (Sarduy Domínguez, 2014).

“Se denomina Business Intelligence o Inteligencia Empresarial, al conjunto de estrategias y aspectos relevantes enfocados a la administración y creación de conocimiento a través del análisis de datos existentes en una organización o empresa” (Bernabeu, 2010).

“La inteligencia de Negocios BI es una herramienta bajo la cual diferentes tipos de

organizaciones, pueden soportar la toma de decisiones basadas en información precisa y oportuna, garantizando la generación del conocimiento necesario que permita escoger la alternativa que sea más conveniente para el éxito de la empresa”. (Rosado Gómez & Rico

(27)

9

1.2.2 Características Bi

A continuación las principales características de BI de acuerdo a (Rosado Gómez & Rico Bautista, 2010).

 Adaptabilidad continúa. La incertidumbre y el cambio continuo son el estado natural

de los sistemas de toma de decisiones. En este tipo de proyectos siempre se está cambiando el punto de vista analítico.

 Trabajo conjunto. El usuario operativo del software deberá ser parte activa dentro de

los grupos de TI que desarrollan los sistemas de BI.

 Jerarquías flexibles. Los grupos de trabajo dentro del gobierno del sistema BI, deberán

estar estructurados con jerarquías flexibles que fomenten el intercambio de información

 Personas antes que Procesos. Se debe priorizar la entrega de información a las

personas que controlan los procesos y no tanto en definir los procesos que han de controlar las personas.

1.2.3 Proceso de Bi

Figura 1. Proceso BI

Fuente: (DATAPRIX, 2009)

(28)

10

1. Dirigir y planear: En esta fase se recolecta los requerimientos de información de los usuarios, así como se entenderá sus diversas necesidades, de esta recolección se generará las preguntas que les ayudará a alcanzar los objetivos.

2. Recolección de información: En esta fase se extrae la información necesaria desde las diversas fuentes de información de la empresa, con la finalidad de obtener todos los datos necesarios para encontrar las respuestas a las preguntas que salieron del paso anterior.

3. Procesamiento de datos: Se carga e integran los datos lo más simple posible, se crea una base de datos para almacenar esta información o se utiliza una existente pero consolidando la información.

4. Análisis y Producción: Se trabaja sobre datos extraídos e integrados en el paso anterior, se utiliza las herramientas disponibles de BI, para crear la inteligencia, el resultado de las preguntas planteadas en un inicio se generan mediante creación de reportes e indicadores.

5. Difusión: Se entrega a los usuarios las herramientas adecuadas, las mismas que permitirán interactuar con los datos de manera sencilla y rápida.

1.2.4 Componentes de Business Intelligence

De acuerdo a (Lluís Cano, 2007) los componentes son:

 Fuentes de información, las cuales se utilizaran para alimentar de información el

datawarehouse.

 Proceso ETL, consiste en la extracción, transformación y carga de los datos en el

datawarehouse. Antes de almacenar con informac ión el datawarehouse es necesario que los datos sean transformados, limpiados, filtrados y redefinidos, esto debido a que los datos que están almacenados en los sistemas transacciona les no son idóneos para la toma de decisiones.

 El Datawarehouse o almacén de datos, aquí se almacena los datos de forma que

se maximice su flexibilidad, facilidad de acceso y administración.

 El motor OLAP, que proveerá capacidad de cálculo para las consultas,

(29)

11

 Las herramientas de visualización, las mismas que permitirán el análisis y la navegación a través de los mismos.

Figura 2 Componentes de Business Intelligence

Fuente: (Lluís Cano, 2007)

1.2.4.1 Fuentes de Información

Las fuentes de información se las obtiene básicamente de los sistemas operacionales o transaccionales, estas incluyen las aplicaciones desarrolladas a medida como ERP, CRM, SCM, etc. También se incluye a los sistemas de informació n departamentales que administran previsiones, presupuestos, hojas de cálculo, etc. Las fuentes de informac ió n proporcionadas por terceros son útiles para enriquecer la información que se dispone sobre los clientes. En algunos casos es interesante incorporar información referente como población, número de habitantes, etc. (Lluís Cano, 2007) .

(30)

12

información estructurada. Éstas incluyen los sistemas transaccionales, que también se llaman sistemas operativos, sistemas de proceso de transacción o sistemas de origen. Los sistemas de planificación de recursos empresariales, que conducen a la coherencia con los procesos normalizados y tienen un alcance más amplio que los sistemas transacciona les tradicionales. (Sabherwal & Becerra Fernandez, 2010)

Las grandes corporaciones en promedio tienen ocho bases de datos, pudiendo llegar hasta cincuenta bases de datos, trayendo consigo una gran complejidad para cargar la información a un datawarehouse, acceder a distintas bases de datos requiere distintas habilidades y el conocimiento de distintas sintaxis de SQL, por tanto es clave conocer el modelo de información transaccional. Los datos obtenidos de las fuentes operacionales no siempre son consistentes a través de las distintas aplicaciones de las que se obtiene, ya que suelen no estar integradas, estas aplicaciones no están documentadas correctamente, frecuentemente son aplicaciones que han sido modificadas a lo largo del tiempo por varios programadores. (Lluís Cano, 2007)

Un sistema BI no es nada sin una fuente de datos válida. Al diseñar un sistema de BI, primero debemos determinar los datos que se deben consumir para el análisis. La mayoría de las organizaciones tienen varios sistemas de información que les ayudan en sus operaciones diarias. Los datos internos de un sistema que ayuda en las operaciones diarias de una organización suele ser un buen candidato para un proyecto de BI. Los datos también pueden provenir de fuentes de datos externas o incluso públicas. Estas fuentes de datos que proporcionan la información que impulsa una implementación de BI se denominan los alimentos de datos. (Czernicki, 2009)

(31)

13

Hay que tomar en cuenta que en ocasiones no se dispone de la información necesaria para completar el modelo de negocio planteado, esto nos obliga a modificar las aplicacio nes transaccionales para conseguir los datos requeridos.

1.2.4.2 Calidad de datos

La calidad de datos del contenido de un datawarehouse es esencial, al respecto Bill Inmon en su artículo sobre “Business Intelligence Network” dice “Las organizaciones actúan sobre la suposición de que la información de la que disponen es precisa y válida. Si la información no es válida, entonces no pueden responder de las decisiones basadas en ella”. (Lluís Cano, 2007)

Es necesario que en el datawarehouse no existan errores, ya que estos se propagarán a lo largo de toda la organización y son difíciles de ubicar, ocasionando que se tomen decisiones erróneas la mismas que afectarán negativamente a los resultados de la organización, generando costos elevados debido a que la calidad de datos no es la correcta. (Lluís Cano, 2007)

La calidad de los datos es crítica para el proyecto de Business Intelligence, si los usuarios perciben que no tenemos suficiente calidad de datos rápidamente desprestigiarán el proyecto. Se debe tomar en cuenta que los errores se pueden originar en la recuperación de los datos fuente, el proceso ETL, o del propio datawarehouse.

(32)

14

alternativa es más rápida de ejecutar, resulta mucho más costosa a largo plazo. (Lluís Cano, 2007)

En el siguiente gráfico se presenta el proceso en el que se señalan los puntos de control de calidad de datos en la carga de datos, la auditoría y reconciliación, y las acciones realizadas por los usuarios de Business Intelligence. (Lluís Cano, 2007)

Figura 3. Puntos de control de Calidad de datos.

Fuente: (Lluís Cano, 2007)

1.2.4.3 Proceso de extracción, transformación y carga (ETL)

El proceso de extracción, transformación y carga (ETL), recupera los datos de las diversas fuentes de información y alimenta el Datawarehouse.

(33)

15

Figura 4 Proceso ETL.

Fuente: (Lluís Cano, 2007)

El proceso ETL se divide en 5 subprocesos. (Lluís Cano, 2007)

1. Extracción: Recupera los datos físicamente de las distintas fuentes de informac ió n, los datos se los obtiene en bruto.

2. Limpieza: Recupera los datos en bruto y comprueba su calidad, elimina los datos duplicados y si es posible se corrige los valores erróneos y se completa los valores vacíos, hasta este momento se debe disponer de datos limpios y de alta calidad. 3. Transformación: Este proceso recupera los datos limpios de la fase anterior, y

estructura estos datos de alta calidad y realiza funciones de agregado de acuerdo a los distintos modelos de análisis.

4. Integración: Este proceso valida que los datos que se va a cargar en el datawarehouse sean consistentes con las definiciones y formato del datawarehouse, estos procesos demandan una gran complejidad puesto que se debe integrar los modelos de diversas áreas de negocio.

(34)

16

Extracción

Este proceso se lo puede realizar utilizando herramientas ETL o también de forma manual. La ejecución de forma manual implica utilizar algún lenguaje de programació n que permite extraer los datos desde el origen. La mejor opción es utilizando herramie ntas especializadas de ETL, ya que las mismas han sido preconcebidas y diseñadas para realizar esta función.

Se debe cumplir con el objetivo de extraer únicamente los datos de los sistemas transaccionales que son necesarios, los mismos que deberán quedar listos para el resto de subprocesos ETL.

Una buena práctica en este proceso es crear almacenes de datos intermedios llamados “Data Staging”, este almacén estará entre las fuentes de información y los pasos

posteriores, con el objetivo de contar con la información consolidada para el datawarehouse y también para ganar velocidad de acceso a los datos con las funcionalidades del Datawarehouse como análisis de cubos, reportes, dashboards, etc. (Lluís Cano, 2007)

Limpieza

La limpieza de datos es clave, los sistemas transaccionales contienen datos que no han sido limpiados y obligatoriamente deben ser depurados y limpiados. Principalmente en proyectos CRM la limpieza de datos es clave ya que los nombres de clientes, direcciones deben ser depurados para eliminar duplicados. Si no realizamos este proceso de una forma exhaustiva, al momento de mostrar los resultados de Business Intelligence produciremos usuarios escépticos al tener el caso por ejemplo de un cliente duplicado. (Lluís Cano, 2007)

Generalmente en los sistemas transaccionales los datos están “sucios” por las siguie ntes

razones:

(35)

17

 Ausencia de ingresar ciertos valores.

 Existen campos que tienen múltiples utilidades. Para ciertos clientes se ingresa un tipo

de información y para otros, otra distinta.

 Se ingresa valores difíciles de entender.

 Se ingresa valores contradictorios.

 No se usa apropiadamente los campos para el fin de tipo de información que fueron

creados.

 Vulneración de las reglas del negocio.

 Reutilización de claves primarias con valores que existen en registros históricos

almacenados en respaldos de años anteriores.

 Identificadores de variables que no son únicos.

 Problemas de carga de antiguos sistemas o de integración de sistemas.

La limpieza de datos se puede dividir en las siguientes etapas (Lluís Cano, 2007);

 Depurar los valores (Parsing): Este proceso localiza e identifica los elementos

individuales de información en las fuentes de datos y los aísla en los ficheros de destino. Por ejemplo separa el nombre completo de un cliente, en nombre, primer apellido, segundo apellido, o la dirección en calle, número, piso, etc.

 Corregir (Correcting): Este proceso corrige los valores individuales de los atributos

usando algoritmos de corrección y fuentes de datos externas. Por ejemplo comprueba una dirección y el código postal correspondiente.

 Estandarizar (Standardizing): Este proceso transforma valores en formatos definidos

y consistentes través de rutinas de conversión aplicando procedimientos de estandarización y que se son definidos por las reglas del negocio. Por ejemplo adicionando el tratamiento Sr., Sra. o sustituyendo los diminutivos de nombres por los nombres correctamente escritos.

 Relacionar (Matching): Este proceso elimina duplicados, basándose en las reglas del

negocio a través de la búsqueda y relación de los valores de los registros, corrigiéndolos y estandarizándolos.

 Consolidar (Consolidating): Este proceso analiza e identifica relaciones entre

(36)

18

Transformación

Una vez que se cuenta con los datos “limpios”, se realiza la transformación de los datos de acuerdo con las reglas del negocio y los estándares previamente definidos. En la transformación se puede realizar un cambio de formato, sustitución de códigos, valores agregados como la suma total de ventas, normalmente las herramientas BI pre calculan estos valores para optimizar el rendimiento de las consultas sobre el datawarehouse. (Lluís Cano, 2007)

Este proceso es esencial ya que se ajusta el nivel de granularidad o detalle, es decir podemos definir almacenar registros en el datawarehouse anualmente, mensualmente o semanalmente.

Integración

En esta etapa integramos y cargamos los datos en el datawarehouse y realiza mos comprobaciones para saber si la información que contamos ahora en el datawarehouse es la misma que contábamos en el sistema transaccional, es necesario no dejar pasar algún error en esta fase ya que de lo contrario se conduciría a tomar decisiones erróneas por parte de los usuarios. (Lluís Cano, 2007)

Actualización

(37)

19

1.2.4.4 Datawarehouse o almacén de datos

Para poder realizar análisis empresarial que genere respuestas a los requerimientos de los usuarios tomadores de decisiones, la información que se requiere proviene de distintas fuentes, por tal razón se requiere un entorno seguro y estable para facilitar este anális is. Los sistemas transaccionales que soportan la gestión del día a día en las empresas, no soportan ni la estructura de las bases de datos ni la capacidad de procesamiento requerida ya que se sobrecargaría la transaccionalidad diaria con el procesamiento del anális is, adicionalmente los sistemas transaccionales cuentan únicamente con información actual y no disponen de información de periodos anteriores, la información histórica es necesaria para el análisis empresarial. (Lluís Cano, 2007)

La aparición de los datawarehouse o almacenes de datos son la respuesta a las necesidades de los usuarios que necesitan información consistente, integrada e histórica y que esta información esté preparada para ser analizada para poder tomar decisiones.

Según Bill Inmon “Un datawarehouse debe ser orientado sobre un área, integrado, indexado al tiempo, es un conjunto no volátil de información que soporta la toma de decisiones”.

Características de un Datawarehouse

Orientada al negocio

La información está clasificada de acuerdo a los aspectos que son de interés para la empresa, la clasificación que se realiza afecta al diseño y la implementación de los datos encontrados, puesto que la estructura difiere de los procesos operacionales orientados a las aplicaciones (Bernabeu, 2010).

(38)

20

Las fuentes de datos producidas por distintos departamentos y aplicaciones ya sean internas o externas, deben ser consolidadas antes que se agreguen a un Datawarehouse (Bernabeu, 2010).

Variante en el tiempo

En una datawarehouse se puede manejar grandes volúmenes de datos por esta razón los tiempos de ejecución de las consultas pueden aumentar, en cambio en un ambiente operacional la información se obtiene inmediatamente al momento del acceso (Bernabeu, 2010).

No volátil

En el ambiente operacional del datawarehouse existe la carga y el acceso a los datos, por esta razón no cambian, no se requiere mecanismos de control de recuperación (Bernabeu, 2010).

Estructura del Datawarehouse

La estructura de un datawarehouse se define por el nivel de detalle. (Bernabeu, 2010)

1. Detalle de datos actuales, son datos de gran tamaño, se almacenan a nivel de detalle, su administración es compleja principalmente porque se necesita habilitar el acceso lo más sencillo posible y muy veloz a la información y que refleje los eventos recientes.

2. Detalle de datos históricos, son datos almacenados a nivel de detalle, la informac ió n que contienen es antigua para consultas esporádicas.

3. Datos ligeramente resumidos, ofrecen fácil acceso, son los datos ya resumidos y tienen un bajo nivel de detalle, agrupan los datos bajo las condiciones establecidas en el análisis.

(39)

21

5. Metadatos, se representa la información acerca de los datos, este contenido no se extrae de los sistemas operacionales.

1.2.4.5 Query and Reporting

Se presentan como las herramientas que ayudan en la construcción de informes, los mismos que se muestran en detalle o en forma agregada, esta información se la obtiene del Datawarehouse.

Mediante Query and Reporting se puede definir la flexibilidad de acceso, proporcional a la experiencia y conocimiento del usuario sobre la información del negocio. Es recomendable que se clasifique el acceso a este tipo de informes en tres niveles de dificultad. (Bernabeu, 2010).

1. Los usuarios con poco conocimiento sobre la información del negocio y poca experiencia en análisis podrán solicitar la ejecución de informes o consultas predefinidas según parámetros predeterminados.

2. Los usuarios con alguna experiencia podrán generar consultas flexibles mediante una interfaz gráfica amigable.

3. Los usuarios con vasto conocimiento sobre la información del negocio y formació n técnica en lenguajes de consulta podrán escribir, total o parcialmente una consulta en un lenguaje de interrogación de datos.

Características de las Herramientas Reporting

Este tipo de herramientas cuenta con las siguientes características (Bernabeu, 2010):

 Informes dinámicos.

 Información según los niveles de usuario.

 Disponibilidad de formatos de salida de informes.

 Distintos canales de salida.

(40)

22

Definición

Las herramientas OLAP consisten en una tecnología que permite realizar análisis de información en línea, permite ejecutar consultas sobre la información del negocio para la toma de decisiones, estas herramientas brindan respuestas inmediatas a preguntas del negocio con cierto nivel de complejidad, se utiliza la información histórica para entender la evolución de la información en el tiempo. (Bernabeu, 2010).

Características

 Muestra información organizada y resumida, en formato de tablas, gráficos, reportes, de este modo la información se mantiene organizada y disponibles para todos los usuarios.

 Da la facilidad de apreciar un gran volumen de información a través de un simple

análisis, obteniendo incluso información impredecible.

 Permite organizar la estructura de datos definiendo dimensiones, de esta forma se

puede analizar la información combinando jerarquías.

 Los cubos OLAP se generan mediante esquemas definidos sobre el datawarehouse,

las dimensiones definen los dominios de información, los miembros de una dimens ió n se agrupan en forma jerárquica (Bernabeu, 2010).

Figura 5 Formación de Cubos Olap.

Fuente: (Bernabeu, 2010).

Esquemas

(41)

23

Este esquema consiste en estructurar la información en procesos, vistas y métricas recordando la forma de una estrella. A nivel de diseño, consiste en una tabla de hechos en el centro para el hecho objeto de análisis y una o varias tablas de dimensión por cada punto de vista de análisis que participa de la descripción de ese hecho. En la tabla hecho encontramos los atributos destinados a medir o cuantificar sus métricas y las uniones con las dimensiones. (Conesa Caralt & Curto Díaz, 2010)

Esquema Copo de nieve

Este esquema permite que las tablas de las dimensiones se encuentren normalizadas lo que simplifica las operaciones de datos, pero otorga mayor complejidad a su estructura, esto hace que los tiempos de respuesta en los análisis multidimensionales sean mayores . (Bernabeu, 2010).

Cuadros de Mando

Los cuadros de mando permiten manejar y visualizar gran cantidad de información visual, de tal manera que con un vistazo sea entendible para los usuarios de la solución de BI, este entorno es muy intuitivo.

Da la posibilidad de conocer el estado actual del negocio y medir el logro de objetivos mediante indicadores clave de desempeño o KPI’s (Key Performance Indicators), en base a esta medición de los KPI’s se realizan planes de acción o se toma medidas

oportunamente. (Bernabeu, 2010).

Requisitos de los Cuadros de mando

Los indicadores deben cumplir los siguientes requisitos (Bernabeu, 2010):

 Ser selectivos, se deben centrar en lo importante de forma concreta, evitando analizar

indicadores irrelevantes.

(42)

24

 Ser oportunos, deben estar disponibles para mostrar la información en el momento que se lo requiere, ya que deben conducir a tomar decisiones en cualquier momento.

 Ser sencillos, los indicadores deben ser lo más intuitivos posibles, de tal manera que

un usuario que no esté familiarizado con el funcionamiento del negocio no tenga problema en entenderlo.

 Ser aceptados, los indicadores deben ser útiles y ser usados y aprobados por los

miembros de la organización.

1.3 Metodologías para el Desarrollo de BI

Entre las metodologías más relevantes, utilizadas para el desarrollo e implementación de Soluciones de BI, tenemos:

1.3.1 Metodología Inmon

Esta metodología fue desarrollada por Bill Inmon en el año 1992 en su libro “Build ing the Data Warehouse”. Para esta metodología un Data Warehouse es considerado como un conjunto de datos orientados por temas, integrados, variantes en el tiempo y no volátiles, cuyo objetivo es ser un apoyo importante para la toma de decisiones. El Data Warehouse es una parte de un sistema de BI y los Data Marts obtienen su información a partir de este Data Warehouse y para ser almacenada la información es necesario normalizarla antes de almacenarse (Lluís Cano, 2007).

(43)

25

Figura 6 Arquitectura Inmon

Fuente: (Bernabeu, 2010)

1.3.2 Metodología Kimball

En esta metodología el Data Warehouse se forma del conjunto de todos los repositorios de datos existentes en una empresa denominados Data Marts. La información siempre se almacena en un modelo dimensional. Otra forma de denominar ésta aproximación es como “Bottom-up”.

En la metodología Kimball, un Data Warehouse se considera como una copia de los datos transaccionales para realizar la consulta y el análisis de los mismos. La metodología de Kimball, también conocida como Modelo Dimensional (Dimensional Modeling), está basado en el Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle).

Para almacenar los datos, las estructuras de estos requieren una presentación dimensio na l. En el Modelo Dimensional se constituyen modelos de tablas y relaciones con el propósito de optimizar la toma de decisiones, basándose en las sentencias Sql realizadas de una base de datos relacional que están ligadas con la medición o un conjunto de mediciones de los resultados de los procesos de negocio (Bernabeu, 2010).

(44)

26

Dimensional está compuesto por una tabla con una llave combinada, llamada tabla de hechos, y un conjunto de tablas más pequeñas llamadas tablas de dimensiones. Los elementos de estas tablas se pueden definir de la siguiente manera:

Hechos, es una colección de piezas de datos del contexto. Cada hecho representa una

parte del negocio, una transacción o un evento.

Dimensiones, es una colección de miembros, unidades o individuos del mismo tipo.

Medidas, son atributos numéricos de un hecho que representan el comportamie nto

del negocio relativo a una dimensión

Cada punto de entrada a la tabla de hechos está conectado a una dimensión, lo que permite determinar el contexto de los hechos.

Una base de datos dimensional se puede concebir como un cubo de tres o cuatro dimensiones (OLAP), en el que los usuarios pueden acceder a una porción de la base de datos a lo largo de cualquiera de sus dimensiones.

Dado que es un muy común representar a un modelo dimensional como una tabla de hechos rodeada por las tablas de dimensiones, frecuentemente se lo denomina también modelo estrella.

Figura 7 Arquitectura Kimball

(45)

27

1.3.3 Metodología Hefesto

La Metodología Hefesto permite la construcción de un DW simplificando el proceso en relación a otras metodologías, al eliminar cierta complejidad innecesaria y comprender cada paso de lo que se está realizando, esta metodología busca entregar lo más pronto posible una primera implementación del Data Warehouse para lograr mostrar las ventajas de su implementación, de esta manera comenzar a satisfacer las necesidades y motivar a los usuarios.

1.4 Tipos de Arquitectura

1.4.1 Top-down

En esta arquitectura se define inicialmente el Datawarehouse y después se realiza el desarrollo, y se construyen y cargan los Data Marts (Bernabeu, 2010).

Figura 8 Top Down

Fuente: (Bernabeu, 2010)

1.4.2 Bottom-up

(46)

28

Figura 9 Bottom Up

Fuente: (Bernabeu, 2010)

1.4.3 Híbrida

Con este tipo de arquitectura se puede realizar el desarrollo de un Data Mart o un Datawarehouse, de acuerdo al alcance empresarial y la magnitud de datos y fuentes de análisis.

Figura 10 Híbrida

(47)

29

1.5 Comparación de Metodologías de BI.

Metodología INMON KIMBALL HEFESTO

Autor Bill Inmon Ralph Kimball Ing. Ricardo Bernabeu

Arquitectura Top-Down Bottom-up Híbrida

Estructura base Data Warehouse Data Mart Data Mart y Data Warehouse Previamente las

interrogantes que se despejarán son conocidas, cada fase posee un gran nivel de detalle,

aumentando el

costo.

Se basa en experimentos y modelos de prototipos, es flexible y menos costosa.

Parte del Anális is de Requerimie ntos para la generación de indicadores y realizar el anális is de los datos.

Tabla 1 Comparación de metodologías de Business Intelligence .

Fuente: (Bernabeu, 2010)

1.6 Bases de datos

Un sistema de base de datos es básicamente un sistema computarizado para guardar registros, es decir es un sistema computarizado cuya finalidad general es almacenar información y permitir a los usuarios recuperar y actualizar esa información con base en peticiones. La información en cuestión puede ser cualquier cosa que sea de importanc ia para el individuo u organización. (Date, 2001)

1.6.1 Sistemas de gestión de base de datos.

(48)

30

los últimos años, pero en medida que aumenta el tamaño de un proyecto de software el cual es medido en volumen de datos que se maneja y número de transacciones que se realiza en cierto tiempo, surgen otras características que ponen a prueba el sistema de base de datos.

Existen gestores de base de datos propietarios y libres

1.6.2 Gestores de base de datos propietarios

Para el uso de estos gestores se requiere pagar el costo de licencia. Como ventaja estos gestores de base de datos son capaces de almacenar grandes cantidades de datos, utilizando gran variedad de datos y son ajustables para empresas grandes y pequeñas (Ferrusca Alvarez, 2015). Entre los sistemas de gestión propietarios tenemos:

 Oracle

 Microsoft Sql Server

 dBase

 IBM Db2

 Sybase

1.6.3 Gestores de base de datos libres

Estos gestores de base de datos los podemos descargar y utilizarlos sin pagar un costo por su uso. Tienen la ventaja que pueden ser usados sin restricciones y pueden ser redistribuidos, ya que es posible modificarlos y distribuirlos con las modificacio nes (Ferrusca Alvarez, 2015).

 María DB

 MySQL

 PostgreSQL

 Sqlite

(49)

31

1.6.4 Postgresql

PostgreSQL es un sistema de gestión de base de datos relacional de objetos, basado en POSTGRES, desarrollado por la Universidad de California en el Departamento de Ciencias de Computación de Berkeley. POSTGRES fue pionero en muchos conceptos que solo se convirtieron disponibles en algunos sistemas de base de datos comerciales mucho más tarde (PostgreSQL, 2017).

PostgreSQL es un descendiente de código abierto del código original de Berkeley. Este soporta una gran cantidad de SQL estándar y ofrece muchas características modernas como:

 Consultas complejas.

 Claves foráneas.

 Triggers.

 Vistas actualizables.

 Integridad transaccional.

 Control de concurrencia multi versión.

También, PostgreSQL puede ser extendido por el usuario en muchas formas, por ejemplo agregando nuevos:

 Tipos de datos.

 Funciones.

 Operadores.

 Funciones de agregado.

 Métodos de índice.

 Lenguajes procesales.

(50)

32

1.7 Pentaho

Pentaho es una herramienta de Business Intelligence desarrollada bajo la filosofía del software libre para la gestión y toma de decisiones empresariales. Es una plataforma compuesta de diferentes programas que satisfacen los requisitos de BI. Ofreciendo soluciones para la gestión y análisis de información, incluyendo el anális is multidimensional OLAP, presentación de informes, minería de datos y creación de cuadros de mando para el usuario. (Gravitar, 2017)

La plataforma ha sido desarrollada bajo el lenguaje de programación Java, y tiene un ambiente de implementación también basado en Java, haciendo así que Pentaho sea una solución muy flexible al cubrir una alta gama de necesidades empresariales.

1.7.1 Características generales de Pentaho.

Proporciona funcionalidad crítica para usuarios finales como:

 Acceso vía web.

 Informes parametrizados.

 Scheduling.

 Suscripciones.

 Distribución.

Desarrollado para:

 Ser embebible.

 Ser fácil de extender.

 No consumir muchos recursos.

 Desarrollado 100% en java, posee portabilidad, escalabilidad e integración.

Multiplataforma:

(51)

33

 Mac.

 Linux/Unix.

 Windows.

1.7.2 Tipos de licencia de Pentaho

Pentaho ofrece la licencia Pentaho Community Edition y la versión Enterprise Edition.

Software y servicios Edición Community Enterprise Edition

Informes Fuente abierta Certificado Análisis Fuente abierta Certificado Cuadros de mando Fuente abierta Certificado Integración de datos /ETL Fuente abierta Certificado Plataforma Business Intelligence Fuente abierta Certificado Minería de datos Fuente abierta Certificado Interacción con foros de la comunidad Fuente abierta Certificado Documentación Web de la comunidad

Soporte profesional:

 Soporte telefónico

 Soporte por email

 Acuerdo de nivel de servicio

 Casos de soporte sin límites

Mantenimiento de software:

 Mantenimiento de software

 Parches de versiones

 Arreglos incluidos en versiones

posteriores.

Por personal interno. Por ingenieros de Pentaho

Funcionalidad mejorada:

 Consola empresarial de Pentaho.

 Inicio de sesión única.

 Configuración de seguridad

simplificada

 Diagnóstico de la aplicación.

 Utilidades del repositorio.

 Gestión del ciclo de vida.

(52)

34

 Vencimiento automatizado de contenido.

 Clustering (agrupamiento).

 Supervisión del rendimiento.

 Gestión y monitoreo del ETL.

Software certificado:

 Software estabilizado.

 Ciclo de liberación administrado.

 Construcción optimizada.

 Documentación profesional.

 Base de conocimiento.

 Apoyo consultativo.

 Paquetes de asistencia remota.

o Instalación y configuración de paquetes.

o Diseño e integración de paquetes.

o Paquetes de resolución de problemas y optimización.

 Foro en línea de la edición empresarial:

 Entrenamiento basada en la web.

Garantía de software:

 Indemnización por propiedad

intelectual.

 Garantía de servicios.

Tabla 2 Comparación de características en Pentaho Community y Enterprise Edition

Fuente: (Open Source Business Intelligence, 2008)

1.7.3 Plataforma de Pentaho Community Edition.

(53)

35

lógica de integración de datos específicos a Spark y a menudo requieren habilidades de desarrollo en Java, con Pentaho sólo se necesita diseñar su lógica una vez, independientemente del motor de ejecución. La ejecución es adaptable a Pentaho y permite a los usuarios vincular la carga de trabajo con el motor de procesamiento más apropiado, sin tener que reescribir ninguna lógica de integración de datos. (Predictive Analysis Today ReviewDesk, 2017).

1.7.4 Pentaho Data Integration (PDI)

La integración de datos con Kettle entrega una poderosa extracción, transformación y carga de las capacidades ETL, usando una innovación basada en el enfoque de los metadatos.

1.7.5 Mondrian

Es el servidor de procesamiento analítico online (OLAP), permite a los usuarios del negocio analizar grandes y complejos cantidades de datos en tiempo real.

1.7.6 Reporting

Es la suite de herramientas de reporteo de código abierto que habilita la creación de reportes analíticos y relacionales desde un amplio rango de fuente de datos.

1.7.7 Pentaho Data Acces Project

Es una arquitectura general para fácil creación y uso de datos pensados todos en software BI de Pentaho.

1.7.8 Análisis de negocio de Pentaho

(54)

36

1.7.9 Editor de metadatos

Es una herramienta que simplifica la experiencia del usuario creando reportes y permite construir dominios de metadatos y modelos de datos relacionales.

1.7.10 Pentaho Schema Workbench

Es una interfaz de diseño visual que permite crear y probar los esquemas de cubos OLAP. El diseñador de agregación provee una interfaz simple que permite crear y desplegar tablas de agregado para mejorar el rendimiento de los cubos OLAP de Mondrian.

1.7.11 Community Dashboard Framework (CDF)

Es un framework de código abierto que permite la creación de cuadros de mando altamente personalizables, están en la parte superior del servidor de Pentaho Business Intelligence. CDF se basa en estándares de desarrollo web como CSS, HTML 5 y JavaScript, aprovechando algunos frameworks comúnmente usados como JQuery o Bootstrap. (Pentaho, 2017)

1.7.11.1 Principales características de CDF.

 Basado en tecnologías de fuente abierta.

 Usa AJAX.

 Cuenta con un ciclo de vida con componentes que interactúan entre sí.

 Separa la lógica (Javascript) de la presentación (html, css).

 Extensible, el cual da a los usuarios un alto nivel de personalización.

 La biblioteca de componentes es ampliable de forma avanzada.

 Posibilidad de que los usuarios avanzados inserten sus propios fragmentos de código

(55)

37

1.7.11.2 Uso de CDF

 El escenario más común es ser usado como parte de una solución de Pentaho.

 En modo autónomo es una alternativa a la Consola de usuario de Pentaho, PUC por

sus siglas en inglés.

 Integrado con Porlets, aplicaciones php, portales de intranet e incluso aplicaciones de

escritorio.

CDF reúne los informes, gráficos y tablas que el servidor BI de Pentaho proporciona en una manera coherente, que el desarrollador puede utilizar para crear visualmente cuadros de mando atractivos y útiles, utilizando html simple y javascript

Los nuevos componentes se pueden integrar en el framework, y el “MetaLayer” permite

a los desarrolladores ahorrar tiempo y evitar errores al copiar y pegar, recopilando la lógica empresarial en unidades bien organizadas que puedan compartirse entre paneles. (Pentaho, 2017).

1.8 Indicadores de control de desempeño KPI

Los indicadores son datos que muestran el estado de una actividad, estos pueden medir cualquier cosa. En el caso de ser indicadores clave, se llaman Indicadores Clave de desempeño o KPI (Key Performance Indicators) por sus siglas en inglés.

Un indicador clave de desempeño o KPI es una métrica de negocio para evaluar los factores que son cruciales para el éxito de una organización. El propósito de usar KPI es enfocar la atención en las tareas y procesos que la gerencia ha determinado como los más importantes para avanzar hacia metas y objetivos declarados. (TechTarget, 2017)

Referencias

Documento similar