UNIVERSIDAD REGIONAL AUTÓNOMA DE LOS ANDES
“UNIANDES”
FACULTAD DE SISTEMAS MERCANTILES
PROGRAMA MAESTRÍA EN INFORMÁTICA EMPRESARIAL
PROYECTO DE INVESTIGACIÓN PREVIA A LA OBTENCIÓN DE GRADO ACADÉMICO DE MAGISTER EN INFORMÁTICA EMPRESARIAL
TEMA:
“SISTEMA DE BUSINESS INTELLIGENCE PARA LA GESTIÓN DE ATENCIÓN TÉCNICA DE RECLAMOS EN LA EMPRESA ELÉCTRICA RIOBAMBA S.A.”
AUTORA:
ING. SÁNCHEZ CUADRADO NORMIÑA ELIZABETH
ASESORES:
ING. FERNÁNDEZ VILLACRES GUSTAVO EDUARDO, MBA ING. MARTÍNEZ CAMPAÑA CARLOS EDUARDO, MSC.
APROBACIÓN DE LOS ASESORES DEL TRABAJO DE TITULACIÓN
CERTIFICACIÓN:
Quien suscribe, legalmente CERTIFICA QUE: El presente Trabajo de Titulación
realizado por la señora Ing. Normiña Elizabeth Sánchez Cuadrado, Maestrante del
Programa de Maestría en Informática Empresarial, Facultad de Sistemas
Mercantiles, con el tema “SISTEMA DE BUSINESS INTELLIGENCE PARA LA
GESTIÓN DE ATENCIÓN TÉCNICA DE RECLAMOS EN LA EMPRESA ELÉCTRICA RIOBAMBA S.A.”, ha sido prolijamente revisado, y cumple con todos los requisitos establecidos en la normativa pertinente de la Universidad Regional
Autónoma de los Andes -UNIANDES-, por lo que apruebo su presentación.
Ambato, Agosto del 2016.
Atentamente,
_____________________________ Ing. MSC, Carlos Martínez
ASESOR
______________________________ Ing. MBA, Eduardo Fernández
DECLARACIÓN DE AUTENTICIDAD
Yo, Normiña Elizabeth Sánchez Cuadrado, Maestrante del Programa de Maestría
en Informática Empresarial, Facultad de Sistemas Mercantiles, declaro que todos
los resultados obtenidos en el presente trabajo de investigación, previo a la
obtención del Grado Académico de MAGISTER EN INFORMÁTICA
EMPRESARIAL, son absolutamente originales, auténticos y personales; a excepción de las citas, por lo que son de mi exclusiva responsabilidad.
Ambato, Agosto de 2016.
_________________________________
Ing. Normiña Elizabeth Sánchez Cuadrado
C.I.: 0603145368
DERECHOS DE AUTOR
Yo, Normiña Elizabeth Sánchez Cuadrado, declaro que conozco y acepto la
disposición constante en el literal d) del Art. 85 del Estatuto de la Universidad Regional Autónoma de Los Andes, que en su parte pertinente textualmente dice: El
Patrimonio de la UNIANDES, está constituido por: La propiedad intelectual sobre
las Investigaciones, trabajos científicos o técnicos, proyectos profesionales y
consultaría que se realicen en la Universidad o por cuenta de ella.
Ambato, Agosto de 2016.
_________________________________
Ing. Normiña Elizabeth Sánchez Cuadrado
C.I.: 0603145368
DEDICATORIA
Dedico esta tesis en primer lugar a Dios, por permitirme llegar a obtener mis metas.
Al amor de mi vida Eduardo Gavidia, mi esposo incondicional y amigo fiel, por su
apoyo, su amor y su preocupación para que yo siga alcanzando un peldaño más
en mi vida profesional, en bien de nuestro hogar, gracias amor por estar siempre a
mi lado. A mis dos princesas Vivian Alejandra y Doménica Stefanía, quienes son la
razón de mi vida, por quiénes lucho cada día con mucho ahínco y tenacidad, para
poder brindarles el mejor ejemplo de vida. A mis Padres Gribaldo y Rosita por ser
ellos la luz que guía mi vida, con su apoyo, amor y bendiciones diarias, a
Merceditas, Patricio y Luis por ser más que hermanos amigos, al peque de la casa
Dorian Patricio. A ustedes Mamá Elvita, Albita, Anita, Alex, Sandrita y Carlos por
siempre están pendientes de nosotros.
AGRADECIMIENTO
A Dios, porque día a día me ha bendice, fortalece y me proporciona la sabiduría
para culminar mi trabajo de Tesis, A mi esposo, mis hijas, mis padres, mis
herman@s y a toda mi familia por su extraordinario apoyo moral. A mis queridos
Docentes, Tutores de Tesis de tan Ilustre Universidad, gracias por proporcionarme
sus valiosos conocimientos, y a mis compañeros de trabajo Ingenieros Gloria
Padilla, Galo Paguay, Diego Chérrez y Jorge Romero, un Dios le pague.
RESUMEN EJECUTIVO
Este trabajo tiene por objeto desarrollar un sistema de Busines Intellegence que
permita mejorar los procesos en el departamento de distribución y alumbrado
público de la Empresa Eléctrica Riobamba S.A.
En el primer capítulo está desarrollado la parte de la introducción, objetivos hacia
dónde quiere llegar mi trabajo investigativo, el planteamiento del problema del que
voy a desarrollar mi tema de tesis, las variables con las cuales voy a trabajar y el
aporte práctico, científico y la novedad científica de mi tema.
En el segundo capítulo se tiene la fundamentación teórica de las herramientas a
utilizar con las sustentaciones bibliográficas referidas.
El tercer capítulo es la propuesta a desarrollarse en la cual detallo la solución de un
busines intellegence, observar ¿qué está ocurriendo?, comprender ¿por qué
ocurre?, predecir ¿qué ocurrirá?, colaborar ¿qué debería hacer el equipo?, decidir
¿qué camino se debe seguir?; realizando un sistema BI amigable y confiable que
permita mejorar los procesos en el departamento de distribución y alumbrado
ABSTRACT
This research work has as an objective to develop a system of business intelligence
that may permit raising the processes in the department of distribution and public
lighting of the Riobamba Electric Company.
In the first chapter, we may find developed the introduction, objectives to where the
research needs to reach, the problem on which I will develop my thesis, the variables
with which I will work with and practical plus scientific proposal and the scientific
novelty of the theme.
In the second chapter, we may find the theoretical rationale of the tools used ad
bibliography referred to.
The third chapter, is the proposal to be developed in which the solution is detailed
of the business intelligence. Observe, what is happened? Collaborate, what should
the team do? Decide, what road should we take? Making a BI friendly and trustful
system that may permit to better up the processes in the department of distribution
ÍNDICE CARATULA
APROBACIÓN DE LOS ASESORES DEL TRABAJO DE TITULACIÓN DECLARACIÓN DE AUTENTICIDAD
DERECHOS DE AUTOR DEDICATORIA
AGRADECIMIENTO RESUMEN EJECUTIVO ABSTRACT
Introducción... 1
Antecedentes de la Investigación ... 1
Planteamiento del problema ... 2
Delimitación del Problema ... 4
Objeto de Estudio: ... 4
Campo de Acción ... 4
Línea de Investigación ... 5
Objetivos ... 5
Objetivo General ... 5
Objetivos Específicos ... 5
Idea a Defender ... 5
Justificación... 5
Metodología de Investigación ... 6
Breve Resumen de la Estructura de la Tesis ... 6
Novedad, Aporte Teórico y Significación Práctica ... 7
Aporte Teórico ... 7
Significación Práctica ... 7
Novedad Científica ... 7
CAPITULO I ... 8
1. Marco Teórico ... 8
1.1. Sistemas de Información ... 8
1.2. Tecnologías de la Información ... 10
1.3. Business Intelligence ... 10
1.3.1. Sistemas de la Información Gerenciales (MIS) ... 11
1.3.2. Cuadros de Mandos Integrales (CMI) ... 11
1.3.4. Sistemas de Información para Ejecutivos (EIS) ... 12
1.3.5. Sistemas Expertos (WKS – Knowledge Working Systems) ... 12
1.4. Componentes de un Business Intelligence ... 12
1.4.1. Datos Externos y Operacionales ... 13
1.4.2 Herramientas de construcción y modelamiento de Data Warehouse ... 13
1.4.3 Administrador de Datos ... 14
1.4.4 Componente de Acceso ... 14
1.4.5 Herramientas de Explotación de Información ... 14
1.5. Arquitectura de un Business Intelligence ... 16
1.5.1 Sistemas Fuentes ... 17
1.5.2 Capa Data Warehouse ... 17
1.5.2.1 Definición de Data Warehouse ... 17
1.5.2.2 Características de un Data Warehouse ... 18
1.5.2.3 Arquitectura de un Data Warehouse ... 19
1.5.2.4 Esquema de Modelamiento ... 31
1.6. Administradores de Bases de Datos ... 35
1.6.1. MySql ... 35
1.6.2. Pentaho ... 36
1.7. Beneficios del Business Intelligence ... 38
CAPITULO II ... 40
2. Marco Metodológico y Planteamiento del Problema ... 40
2.1. Caracterización del Sector ... 40
2.2. Descripción del Procedimiento Metodológico ... 43
2.2.1. Modalidad de Investigación ... 43
2.2.1.1. Por el Propósito ... 43
2.2.2. Métodos, Técnicas e Instrumentos ... 44
2.2.3. Métodos de Investigación ... 44
2.2.3.1. Métodos Teóricos ... 44
2.2.3.2. Técnicas de Investigación ... 44
2.2.3.3. Instrumentos de Investigación ... 44
2.2.4. Población y Muestra ... 45
2.2.5. Interpretación de Resultados de las Encuestas Aplicadas ... 45
2.2.6. Entrevista a los Administradores de la Empresa Eléctrica Riobamba S.A. ... 53
2.3. Propuesta del Investigador ... 54
CAPITULO III ... 55
3. PROPUESTA ... 55
3.1. Tema: ... 55
3.2. Objetivos ... 55
Objetivo General ... 55
Objetivos Específicos ... 55
3.3. Descripción de la propuesta ... 55
3.4. Desarrollo de la Propuesta ... 56
3.4.1. Metodología de desarrollo de la Propuesta ... 56
3.5. Modelado Dimensional ... 57
3.5.1. Elegir el Proceso de Negocio ... 57
3.5.2. Establecer los Niveles de Granulidad ... 58
3.5.3. Elegir las Dimensiones ... 58
3.5.4. Identificar la Tabla de Hechos ... 59
3.6. Diseño Físico ... 60
3.6.1. Interfaces con Hardware ... 60
3.6.2. Interfaces con Software ... 60
3.7. Diseño e Implementación de Subsistemas ETL ... 62
3.7.1. Diseño de Business Intelligence en Pentaho ... 62
3.7.2. Proceso de ETL (Extracción, Transformación y Carga) ... 63
3.8. Implementación ... 77
3.8.1. Requerimientos para la Implementación ... 77
3.8.2. Implementación y Pruebas ... 77
Ilustraciones N° 60: Reporte Modo Gráfico, N° Reclamos Por Parroquias Urbanas y Rurales del Cantón Riobamba………..86
3.4.9. Validación de la Propuesta ... 86
CONCLUSIONES ... 87
RECOMENDACION ... 88
BIBLIOGRAFÍA ... 89
INDICE DE ILUSTRACIONES
Ilustraciones N° 1: Sistemas de Información ... 8
Ilustraciones N° 2: Componentes de un BI ... 13
Ilustraciones N° 3: Arquitectura de un BI ... 17
Ilustraciones N° 4: Arquitectura de un Dara Warehouse ... 20
Ilustraciones N° 5: Gestor de Carga ... 22
Ilustraciones N° 6: Confiabilidad de los datos. ... 23
Ilustraciones N° 7: Cubo Dimensional ... 27
Ilustraciones N° 8: Esquema de Modelos Multidimensionales ... 32
Ilustraciones N° 9: Esquema en Estrella ... 33
Ilustraciones N° 10: Esquema Copo de Nieve ... 34
Ilustraciones N° 11: Esquema Constelación ... 35
Ilustraciones N° 12: MySQL ... 35
Ilustraciones N° 13: Pentaho ... 36
Ilustraciones N° 14: Logo Empresa Eléctrica Riobamba S.A. ... 40
Ilustraciones N° 15: Pregunta N°1 ... 46
Ilustraciones N° 16: Pregunta N°2 ... 47
Ilustraciones N° 17: Pregunta N°3 ... 48
Ilustraciones N° 18: Pregunta N°4 ... 49
Ilustraciones N° 19: Pregunta N°5 ... 50
Ilustraciones N° 20: Pregunta N°6 ... 51
Ilustraciones N° 21: Pregunta N°7 ... 52
Ilustraciones N° 22: Ciclo de Vida Kimball ... 57
Ilustraciones N° 23: Tabla de Dimensiones ... 59
Ilustraciones N° 24: Tabla de Hechos ... 59
Ilustraciones N° 25: Configuración Virtual ... 60
Ilustraciones N° 26: Inicialización de la Máquina Virtual ... 61
Ilustraciones N° 27: Login BIServer ... 61
Ilustraciones N° 28: Menú de Ubuntu ... 62
Ilustraciones N° 29: Diseño BI ... 62
Ilustraciones N° 30: Proceso ETL ... 63
Ilustraciones N° 31: MySQL Workbench ... 63
Ilustraciones N° 32: Conexión a la BD de la EERSA ... 64
Ilustraciones N° 33: Datos BD dbsarh EERSA ... 64
Ilustraciones N° 35: Modelo Físico de Hechos y Dimensiones ... 65
Ilustraciones N° 36: Data Integration – Spoon ... 71
Ilustraciones N° 37: Creación Input – Output ATR ... 72
Ilustraciones N° 38: Tabla Input ATR ... 72
Ilustraciones N° 39: Tabla Output ATR ... 73
Ilustraciones N° 40: Tabla Input – Output de Tablas de Dimensiones ... 73
Ilustraciones N° 41: Diseño del Job ATR ... 74
Ilustraciones N° 42: Diseño del Cubo ... 75
Ilustraciones N° 43: Inicialización de Pentaho ... 75
Ilustraciones N° 44: Pentaho ... 76
Ilustraciones N° 42: Menú Pentaho ... 76
Ilustraciones N° 45: Administrador de Orígenes de Datos ... 76
Ilustraciones N° 46: Reportes en Pentaho - Saiku ... 78
Ilustraciones N° 47: Menú de Selección del Cubo ... 79
Ilustraciones N° 48: Medidas y Dimensiones del Cubo_ATR ... 79
Ilustraciones N° 49: Reporte Modo Tabla N° Reclamos por Cantón de Provincia de Chimborazo………..80
Ilustraciones N° 50: Reporte Estadístico de N° de Reclamos de la Provincia de Chimborazo ... 80
Ilustraciones N° 51: Reporte Modo Gráfico N° Reclamos por Cantón de Provincia de Chimborazo………..81
Ilustraciones N° 52: Reporte Lineal N° Reclamos de la Provincia de Chimborazo ... 81
Ilustraciones N° 53: Menú Exportación de Datos ... 82
Ilustraciones N° 54: Exportación Datos a Formato PDF ... 82
Ilustraciones N° 55: Reporte Modo Tabla de Reclamo Técnicos ... 83
Ilustraciones N° 56: Reporte Modo Gráfico de Reclamo Técnicos... 83
Ilustraciones N° 57: Consulta de Reclamo Técnicos por Cantones ... 84
Ilustraciones N° 57: Reporte Modo Tabla, Reclamos Técnicos del Urbano y Rural del Cantón Riobamba ... 84
Ilustraciones N° 58: Reporte Modo Gráfico, Reclamos Técnicos del Urbano y Rural del Cantón Riobamba ... 85
Ilustraciones N° 59: Reporte Modo Tabla, N° Reclamos Por Parroquias Urbanas y Rurales del Cantón Riobamba………..85
INDICES DE TABLAS
Tabla N° 1: Población de Usuarios con Servicio de Energía Eléctrica. ... 45
Tabla N° 2: Pregunta N°1 ... 46
Tabla N° 3: Pregunta N°2 ... 47
Tabla N° 4: Pregunta N°3 ... 48
Tabla N° 5: Pregunta N°4 ... 49
Tabla N° 6: Pregunta N°5 ... 50
Tabla N° 7: Pregunta N°6 ... 51
1
Introducción
Antecedentes de la Investigación
En una investigación preliminar, llevada a cabo en la biblioteca de UNIANDES, se
han encontrado algunos trabajos de titulación a nivel de post grados que sirven
como antecedentes al presente trabajo investigativo, entre ellos podemos
mencionar el desarrollado por el Ing. Franklin W. Montece Mosquera, con su tema:
“Sistema de Toma de Lectura de Medidores Eléctricos Mediante El uso de
Asistentes Digitales Personales (PDA)”, trabajo presentado en el año 2014, previo
a la Obtención del título de Magister en Ingeniería de Sistemas. Del estudio del
mismo se puede deducir que con la automatización informática de procesos como:
toma de lectura de los medidores electrónicos bifásico que son los LE los cuales
cuentan con tres lecturas la activa, reactiva y demanda, estas lecturas se harán por
horarios para las grandes empresas; los medidores trifásicos tiene un ciclómetro
fijo, tienen una demanda fija propuesta por la empresa de acuerdo a la carga
instalada, estos procesos de atención mejorarán notable mente la calidad del
servicio al cliente. Del análisis técnico se puede apreciar que las lecturas
efectuadas se registrarán en el software con característica cliente – servidor en Oracle y sus interfaces son agradables y de fácil acceso.
Además se ha investigado en los diferentes repositorios ubicados en la web de
varias universidades y politécnicas del país, y es así que se ha encontrado la tesis
del Master Carlos Fabián Boada Sánchez presentada en el años 2012 en la
Universidad Andina Simón Bolívar Sede Ecuador, cuyo tema es “Beneficios e
Impactos de las Soluciones de Inteligencia de Negocios en el sector de servicios
Aeroportuarios. Caso de estudio: Diseño de un panel de control para el área de
operaciones del Aeropuerto Mariscal Sucre de Quito” y en la cual se pudo encontrar
los beneficios que tiene una solución de inteligencia de negocios en el sector de
servicios en este caso en aeropuertarios, basado en el comportamiento de
transporte aéreo nacional e internacional, el mismo que abarca un diseño e
implementación de un prototipo de inteligencia de negocios que presenta paneles
2
inteligentes, dashboards, semáforos, gráficos y reportes dinámicos. El Aeropuerto
Mariscal Sucre de Quito, tendrá una ventaja competitiva al contar con información
clave para la toma acertada de decisiones de los diferentes niveles gerenciales, en el momento y espacio requerido.
Es importante destacar el desarrollo tecnológico en este mundo globalizado, que
hoy en día la información es la clave para obtener una ventaja competitiva en el
mundo de los negocios, se ha encontrado la tesis del Master Augusto Enrique
Hayashida Marchinares en los años 2009 en la Universidad Nacional Mayor de San
Marcos de la República del Perú, titulada “Business Intelligence bajo plataforma IP
versión 6 y su influencia en la gestión empresarial”, en la cual para mantenerse
competitiva una empresa; los gerentes y quienes toman las decisiones requieren
de un acceso rápido y fácil a información útil y valiosa de la empresa. Una forma de
solucionar este problema es por medio del uso de Business Intelligence o
Inteligencia de Negocios, la misma que está orientada para cubrir las expectativas
de las diferentes áreas de la empresa.
Planteamiento del problema
La Industria Eléctrica a nivel mundial ha sido reconstruida a partir de un esquema
centralizado o de monopolio a una estructura moderna de mercadotecnia
competitiva. Esta transformación se está dando desde el siglo anterior. Actualmente
muchas personas y sus gobiernos están de acuerdo en el hecho de que, en la
mayoría de los casos, la existencia de un mercado competitivo de energía resulta
en un mecanismo más apropiado para el suministro de la misma, ya que permite la
libertad de las decisiones, mejorar la economía de los clientes y producen mercados
que operan más eficientemente y a costos reducidos.(Valle, 2010)
Los procedimientos para la atención de reclamos de los consumidores de
Empresas Eléctricas de Distribución, el Directorio del Consejo Nacional de
Electricidad CONELEC, considera que: el Art. 4 de la Ley Orgánica de Defensa del
Consumidor, establece que las empresas proveedoras de servicios públicos
domiciliarios deben contar con una oficina y un registro de reclamaciones en donde
constarán las presentadas por los consumidores; que, el inciso segundo del Art. 59
3
emprender las acciones legales ante la justicia ordinaria, que considere más
apropiada a efectos de reclamar el resarcimiento de los daños y perjuicios que
fueren ocasionados por deficiencias en el suministro de energía, alteraciones de voltaje en más o en menos y tarifas que excedan los valores legalmente aprobados
de conformidad con la Ley; que, el inciso segundo del Art. 4 del Reglamento
Sustitutivo del Reglamento de Suministro del Servicio de Electricidad, establece
que el consumidor podrá reclamar ante el distribuidor y en caso de inconformidad
ante el CONELEC, para lo cual deberá presentar los documentos que justifiquen su
reclamo; que, el inciso tercero de los mismos Artículo y Reglamento, establece que
el distribuidor está obligado a resarcir los daños que se produjeren en los equipos
del consumidor, ocasionados por deficiencias o fallas del servicio eléctrico, previa
verificación que deberá efectuar de conformidad con los procedimientos
establecidos en la regulación que para el efecto emita el CONELEC; que, el Art. 25
del Reglamento Sustitutivo del Reglamento de Suministro del Servicio de
Electricidad, dispone que cuando los consumidores consideren que el servicio de
electricidad prestado por el distribuidor no está conforme a las disposiciones
emitidas en el referido Reglamento, podrán presentar su reclamo al distribuidor.
La provincia de Chimborazo que se encuentra en la zona centro del país, en la
ciudad de bonita Sultana de los Andes contamos con la Empresa Eléctrica
Riobamba S.A., tiene una visión de ser una empresa de excelencia con
infraestructura tecnológica innovadora, responsabilidad social, índice de gestión
referentes, talento humano capacitado y comprometida en la prestación del servicio
y el cuidado del ambiente, cuya misión es suministrar le servicio público de energía
eléctrica en nuestra área de concesión con efectividad y transparencia,
preservando el medio ambiente y contribuyendo al desarrollo socioeconómico.
Dentro de los múltiples servicios que brinda la institución, cuenta con el Área de
Distribución y Alumbrado Público, en el cual se realiza la recepción y registro de
información por interrupciones de servicio de energía eléctrica o alteraciones
técnicas (variaciones de voltaje), daños en la red eléctrica de distribución bajo
voltaje, daños en la red eléctrica de distribución medio voltaje, revisión de
medidores, daños en el alumbrado público, análisis termográfico en las redes
4
registros se transforman en ordenes de trabajo, que son entregados en forma
impresa o reportados vía radio motorola por el personal de turno a los jefes de
grupos de los móviles de mantenimiento, tomándoles un tiempo de traslado al sitio del problema y otro tiempo para la ejecución del trabajo, de esta forma satisfaciendo
la necesidad del usuario en un tiempo establecido por la regulación.
Se enlista a continuación los problemas presentes en la empresa.
• Toda esta información se tiene almacenada en una base de datos, del cual no se hace uso adecuado de la misma, limitándonos a brindar un eficiente
servicio y poco efectivo la gestión de la información.
• Al no contar con un sistema que gestione adecuadamente los reportes de los daños en la red de bajo voltaje y medio voltaje se dificulta la obtención
de información relevante.
• No dispone de herramientas analíticas que proporcionen reportes certeros y veraces, provocando una toma de decisiones erróneas.
• Los procesos para la elaboración de informes gerenciales se lo realizan en forma manual, se emiten con retraso de una semana hasta un mes,
proporcionado información desactualizada y poco oportuna para la toma de
decisiones.
Formulación del problema
¿Cómo mejorar la gestión de atención de reclamos técnicos en la Empresa
Eléctrica Riobamba S.A.?
Delimitación del Problema Objeto de Estudio:
Sistemas informáticos
Campo de Acción
Aplicaciones para la toma de decisiones gerenciales.
5
es generar, distribuir y comercializar el servicio de energía eléctrica y alumbrado
público a la ciudadanía.
Línea de Investigación
Desarrollo de software y programación de sistemas.
Objetivos
Objetivo General
Desarrollar un sistema Business Intelligence para el mejoramiento de la gestión de
atención técnica de reclamos en la Empresa Eléctrica Riobamba S.A.
Objetivos Específicos
• Fundamentar científicamente un Business Intelligence, sus herramientas de desarrollo y atención técnica de reclamos.
• Diagnosticar los niveles de calidad en la gestión de atención técnica de reclamos en la Empresa Eléctrica Riobamba S.A.
• Elaborar un sistema Business Intelligence que incorpore el módulo para la emisión de reportes especiales requeridos por la institución.
Idea a Defender
Con la implementación de un sistema Business Intelligence se mejorará la gestión
de atención técnica de reclamos en la Empresa Eléctrica Riobamba S.A.
Justificación
En el área de Distribución y Alumbrado Público de la Empresa Eléctrica Riobamba
S.A., dispondrá con una sistema que la facilitará el proceso de datos para
convertirlos en información que debe ser usada en informes gerenciales que
permitan la toma de decisiones oportunas para la gestión de atención de reclamos
técnicos, con el cual se tendrá la habilidad de transformar los datos en información
y esta información en conocimiento, para optimizar los procesos de toma de
decisiones, es por ello que al emplear este sistema BI se logrará:
6
• Al contar con un sistema inteligente de negocios se identificará con precisión los daños de la red eléctrica de distribución de bajo voltaje y medio voltaje,
para solventar los inconvenientes registrados por los usuarios de la Empresa
Eléctrica gracias a sus reportes relevantes emitidos.
• Emplear herramientas analíticas eficientemente para la elaboración de reportes gerenciales certeros y veraces, tomando buenas decisiones.
• Contar con reportes estadísticos actualizados, para el análisis de la gestión técnica de los reclamos de la empresa.
Metodología de Investigación
La metodología de la investigación se refiere a una serie de técnicas o procesos
que sirven para realizar las investigaciones científicas e incluso las documentales. Los Métodos a utilizar en la siguiente investigación son:
• Método de Análisis – Síntesis: Para la elaboración de la sustentación científica que sustenta la solución del problema.
• Método de Inducción – Deducción: Consiste en establecer enunciado universales a partir de cierta experiencia, esto es, ascender lógicamente a
través del conocimiento científico, desde la observación de los fenómenos o
hechos a la realidad universal que los contiene.
Las partes de este método son:
Observación: Aquí se percibe la asociación de los fenómenos, donde se presenta la inducción, lo que nos permite formular teorías y deducciones.
Deducción: Esta es la conclusión producida por el proceso de observación. Experimentación: Se considera que entre más experimentaciones y movimientos existan mayores deducciones se producirán y se producirán
leyes con mayor probabilidad de ser verdaderas.
• Método Sistémico: Se lo utiliza para aplicar lo teórico con la aplicación práctica.
Breve Resumen de la Estructura de la Tesis
La tesis esta estructura en 3 capítulos, en el primer capítulo se establece las bases
bibliográficas que sustenta la misma, con las aportaciones de los contenidos de las
7
El segundo capítulo se encuentra la metodología a emplear en la tesis con su
enfoque cuantitativo, cualitativo que nos lleva a las conclusiones y
recomendaciones respectivas.
El tercer capítulo corresponde a la propuesta sugerida para ser tomada en cuenta
e implementada, con las pruebas necesarias.
Novedad, Aporte Teórico y Significación Práctica
Aporte Teórico
La investigación sistematiza los contenidos teóricos sobre la organización por
procesos, las estrategias orientadas a las empresas públicas y privadas dándoles
un enfoque informático para la automatización de procesos y mejorar la gestión del
área de distribución y alumbrado público de la Empresa Eléctrica Riobamba S.A.
Significación Práctica
Esta investigación se considera que puede ser utilizada como solución para el
control y la gestión de proyectos de esta área, ya que a través del estudio de los
procesos la aplicación de estrategias más adecuadas a nuestro entorno se
establece una referencia para la automatización y control.
La investigación favorece a la Dirección de Operación y Mantenimiento DOM,
especialmente al departamento de distribución y alumbrado público, fortalecerá el
control de la atención técnica de los reclamos que solicitan los usuarios de la
provincia de Chimborazo, dando información en tiempo real lo cual traerá beneficio
en la Empresa Eléctrica Riobamba S.A.
Novedad Científica
La novedad científica se encuentra en la propuesta que contiene aspectos teóricos,
metodológicos e informáticos para el desarrollo de un sistema Business
Intellegence que permita mejorar la gestión de atención técnica de reclamos en la
8 CAPITULO I
1. Marco Teórico
1.1. Sistemas de Información
“Es un conjunto de elementos que interactúan entre sí con el fin de apoyar a las
actividades de una empresa o negocio”, (Turban, 2001).
“Un Sistemas de Información definido técnicamente es un conjunto de
componentes interrelacionados que recopilan, procesan, almacena y distribuye
información para soportar la toma de decisiones y el control de la organización”,
(http://es.slideshare.net/, 2008).
Tomando los criterios de los autores se concluye que los sistemas de información
es un conjunto de componentes que al interactuar entre ellos automatizan
procesos, proporcionan información que servirá de apoyo para la toma de
decisiones, para lograr ventajas competitivas a través de su implementación.
(Canal Visual Basic.Net, 2016) Los sistemas de información de acuerdo a la
información investigada se han dividido de acuerdo al siguiente esquema
presentado en esta figura:
Ilustraciones N° 1: Sistemas de Información Fuente: Obtenido de sitio web “http://www.ongei.gob.pe/”
Sistemas Estratégicos
Los sistemas estratégicos están orientados a soportar y apoyar la toma de
9
más confiable y precisa para el proceso de toma de decisiones. Se caracterizan
porque son sistemas sin carga periódica de trabajo, es decir, su utilización no es
predecible, al contrario de los otros casos, cuya utilización es periódica.
Destacan entre estos sistemas: los Sistemas de Información Gerencial (MIS),
Sistemas de Información Ejecutivos (EIS), Sistemas de Información Georeferencial
(GIS),Sistemas de Simulación de Negocios que en la práctica son sistemas
expertos o de Inteligencia Artificial. (Murillo Félix, 1997)
Sistemas Tácticos
Diseñados para soportar las actividades de coordinación de actividades y manejo
de documentación, definidos para facilitar consultas sobre información almacenada
en el sistema, proporcionar informes y, en resumen, facilitar la gestión
independiente de la información por parte de los niveles intermedios de la
organización.
Destacan entre ellos: los Sistemas Ofimáticos (OA), Sistemas de Transmisión de
Mensajería (E-mail y Fax Server), coordinación y control de tareas (WorkFlow) y
tratamiento de documentos (Imagen, Trámite y Bases de Datos Documentarios).
Sistemas Técnico-Operativos
Son llamados sistemas transaccionales u operacionales. Con estos sistemas se
logran ahorros significativos de mano de obra, debido a que automatizan tareas
operativas de la organización. Con frecuencia son el primer tipo de Sistemas de
Información que se implanta en las organizaciones. Se empieza apoyando las
tareas a nivel operativo de la organización. Son intensivos en entrada y salida de
información; sus cálculos y procesos suelen ser simples y poco sofisticados. Tienen
la propiedad de ser recolectores de información, es decir, a través de estos
sistemas se cargan las grandes bases de información para su explotación posterior.
Son fáciles de justificar ante la gerencia general, ya que sus beneficios son visibles
y palpables. (Vázquez, 2012)
Sistemas Interinstitucionales
Este último nivel de sistemas de información está surgiendo actualmente, es
10
global, el cual obliga a pensar e implementar estructuras de comunicación más
estrechas entre la organización y el mercado, todo esto a partir de la generalización
de las redes informáticas de alcance nacional y global como lo es el INTERNET, que se convierten en vehículo de comunicación entre la organización y el mercado.
1.2. Tecnologías de la Información
Vivimos en tiempos en que se presta una atención extraordinaria a una serie de
dispositivos que ayudan al intercambio de información y la comunicación entre las
personas. Cada día más habitantes del planeta parecieran necesitar de estos
aparatos. Casi en todo orden de cosas el acceso a estos dispositivos parece
esencial, ya no sólo para permitir la interacción a distancia entre individuos, sino
que también para facilitar el comercio, la ciencia, el entretenimiento, la educación,
y un sinnúmero de actividades relacionadas con la vida moderna del siglo
XXI,(Romaní, 2009).
Incluso, el Banco Mundial ha definido el acceso que los países tienen a las
tecnologías de información y comunicación (TIC) como uno de los cuatro pilares
para medir su grado de avance en el marco de la economía del conocimiento,
(World Bank Institute, 2008).
Las Tecnologías de la Información y la Comunicación, también conocidas como
TIC, son el conjunto de tecnologías desarrolladas para gestionar información y
enviarla de un lugar a otro. Abarcan un abanico de soluciones muy amplio. Incluyen
las tecnologías para almacenar información y recuperarla después, enviar y recibir
información de un sitio a otro, o procesar información para poder calcular resultados
y elaborar informes (Beit, 2015).
Hoy en día las TIC forman parte fundamental de las empresas públicas, privadas o
mixtas para su desarrollo y progreso, brindando las mejores opciones para una
óptima toma de decisiones.
1.3. Business Intelligence
Business Intelligence es la habilidad para transformar los datos en información, y la
información en conocimiento, de forma que se pueda optimizar el proceso de toma
11
Es una estrategia empresarial que persigue incrementar el rendimiento de la
empresa o la competitividad del negocio, a través de la organización inteligente de
sus datos históricos (transacciones u operaciones diarias), usualmente residiendo en Data Warehouse corporativos o Data Marts departamentales. (ITMadrid, 2016)
1.3.1. Sistemas de la Información Gerenciales (MIS)
Proporcionan informes periódicos para la planeación, el control y la toma de
decisiones. Son sistemas que se sustentan en la relación que surge entre las
personas y las computadoras. Soportan un amplio espectro de tareas de las
organizaciones -que supera la capacidad de los sistemas de procesamiento de
datos-, dentro de las cuales se incluye el análisis, y la toma de decisiones. Estos
sistemas se componen de tres funciones: la recopilación de datos, tanto internos
como externos; el almacenamiento y procesamiento de información; y la
transmisión de información a los gestores. (Vázquez, 2012)
1.3.2. Cuadros de Mandos Integrales (CMI)
También conocido como Balanced Scorecard (BSC) o dashboard, es una
herramienta de control empresarial que permite establecer y monitorizar los
objetivos de una empresa y de sus diferentes áreas o unidades.
También se puede considerar como una aplicación que ayuda a una compañía a
expresar los objetivos e iniciativas necesarias para cumplir con su estrategia,
mostrando de forma continuada cuándo la empresa y los empleados alcanzan los
resultados definidos en su plan estratégico. (Sinnexus, Sinergia e Inteligencia de
Negocio S.L., 2016)
1.3.3. Sistemas de Soporte a la Toma de Decisiones (DSS)
DSS es una herramienta de Business Intelligence enfocada al análisis de los datos
de una organización. En principio, puede parecer que el análisis de datos es un
proceso sencillo, y fácil de conseguir mediante una aplicación hecha a medida o un
ERP sofisticado. Sin embargo, no es así: estas aplicaciones suelen disponer de
12
estática, pero no permiten profundizar en los datos, navegar entre ellos, manejarlos
desde distintas perspectivas. (Sinnexus, 2016)
También depende de una base de datos como fuente de información, pero se
distingue del MIS, porque hace énfasis en cada una de las etapas de la toma de
decisiones: inteligencia, diseño, elección e implementación. El soporte se realiza a
varios niveles de los equipos de gestión, desde los altos ejecutivos a los gestores
de base. Sin embargo, la decisión depende de la persona responsable. Son fáciles
de usar. (Murillo Félix, 1997)
1.3.4. Sistemas de Información para Ejecutivos (EIS)
Los EIS's han sido confundidos en sus orígenes con los DSS's. Algunas de sus
características son: estar personalizado al ejecutivo como individuo; posibilita
extraer, filtrar, consolidar y visualizar los datos críticos; se puede acceder en tiempo
real a las variables que definen el estado de la empresa; se visualizan tendencias
y suministra informes de incidencias; brinda mecanismos de alarma, para atraer la
atención del usuario, ante desviaciones importantes de las variables críticas; cuenta
con una interface amigable con el usuario, que necesita de un mínimo
entrenamiento para su uso; es usado directamente por los ejecutivos, sin
intermediarios y presenta la información que incorpora, simultáneamente, junto a gráficos, tablas, textos y sonidos. (Vázquez, 2012)
1.3.5. Sistemas Expertos (WKS – Knowledge Working Systems)
Captura y utiliza el conocimiento de un experto para la solución de un problema
particular. Si bien en los DSS la decisión dependía de la persona responsable, el
sistema experto selecciona la mejor solución al problema o al tipo específico de
problemas. (Vázquez, 2012)
1.4. Componentes de un Business Intelligence
Un sistema Business Intelligence se compone de diferentes tecnologías que se
integran para formar una sola solución empresarial. Estos componentes se orientan a transformar los datos en información oportuna y confiable para el usuario final.
13
Ilustraciones N° 2: Componentes de un BI
Fuente: Obtenido de sitio web “http://es.slideshare.net/”
1.4.1. Datos Externos y Operacionales
Los datos operacionales son el principal componente que integra un entorno
Business Intelligence, residen en los sistemas transaccionales que son los
encargados de almacenar los datos operativos que se generan diariamente en cada
institución. Estos datos operacionales constituyen la base de todo sistema Business
Intelligence ya que de estos depende la calidad de información que se entregue al
usuario final. (Vázquez, 2012)
1.4.2 Herramientas de construcción y modelamiento de Data Warehouse Estas herramientas sirven para el desarrollo y construcción de un Data Warehouse,
se utilizan para realizar las configuraciones y arquitectura, modelamiento de la base
de datos, y diseño de los procesos para alimentar al Data Warehouse, esto incluye
los procesos ETL (Extracción, Transformación y Carga ), utilizados para depurar
datos, estos procesos son usados para reducir la redundancia y eliminar las
variaciones causadas por los diferentes formatos de las bases de datos de donde
se obtienen los datos operacionales, para así cargarlos al Data Warehouse con
esto se logra tener datos consistentes, exactos y válidos. A menos que se cuente
con datos correctos almacenados en el Data Warehouse no se podrá obtener todos
los beneficios que ofrece un sistema Business Intelligence, por tal motivo este
14
sirven también para administrar, planificar las tareas de carga y monitorear los
procesos. (Romaní, 2009).
1.4.3 Administrador de Datos
El Administrador de Datos en un entorno Business Intelligence corresponde al
administrador de base de datos el cual se usa para acceder y mantener los datos
del Data Warehouse y/o Datamarts y de la base de datos de metadatos.
En este componente se encuentra la base de datos donde se almacenan los datos
transformados y donde accederán las herramientas de despliegue para presentar
los informes al usuario final.
En el administrador reside también la base de datos de Metadatos que se utiliza
para obtener información acerca de todos los procesos de un Data Warehouse.
1.4.4 Componente de Acceso
Este componente proporciona los servicios middleware que conectan a los usuarios
finales al almacén de los datos.
A través de este componente se mantiene una conexión entre las herramientas de
despliegue y el Data Warehouse, logrando así que los usuarios finales cuenten con
información oportuna y actualizada.
A través de este componente las herramientas de explotación de información
acceden a la base de datos Data warehouse para extraer los datos necesarios para
presentar los informes solicitados por los usuarios.
Este componente es en muchos de los casos un ODBC y no hace falta instalar un
software adicional. (Murillo Félix, 1997)
1.4.5 Herramientas de Explotación de Información
Este componente es crucial para cualquier sistema de Business Intelligence
completo ya que son herramientas necesarias para comprender los datos y
utilizarlos para tomar decisiones inteligentes. Proporcionan toda la funcionalidad de
análisis y creación de informes empresariales dirigidos a una amplia gama de
15
Cada producto de mercado integra, combina, adapta y personaliza varias técnicas
de análisis de datos para que el usuario no tenga problemas en el momento de
elaborar sus informes. Dichas técnicas son:
Query and Reporting:
Son usadas para extraer datos según un criterio de consulta, herramientas para la
elaboración de informes y listados, tanto en detalle como sobre información
agregada, a partir de la información de los data Warehouses y Datamarts.
Cuadro de Mando Analítico:
Elaboración de resumen de informes e indicadores clave para la gestión, que
permitan a los gestores de la empresa analizar los resultados de la misma de forma
rápida y eficaz. En la práctica es una herramienta de consulta orientada a la
obtención y presentación de indicadores para la dirección. (ITMadrid, 2016)
Cuadro de Mando Integral o Estratégico:
Este modelo parte de que la estrategia de la empresa es el punto de referencia para
todo proceso de gestión interno. Con él los diferentes niveles de dirección y gestión
de la organización disponen de una visión de la estrategia de la empresa traducida
en un conjunto de objetivos, iniciativas de actuación e indicadores de evolución.
El cuadro de mando integral es una herramienta que permite alinear los objetivos
de las diferentes áreas o unidades con la estrategia de la empresa y seguir su
evolución. (Todo BI, 2010)
Online Analytical Processing (OLAP)
“Herramientas que manejan interrogaciones complejas de bases de datos
relacionales, proporcionando un acceso multidimensional a los datos, capacidades
intensivas de cálculo y técnicas de indexación especializadas. Permiten a los
usuarios trocear sus datos planteando queries sobre diferentes atributos o ejes.
Utilizan un servidor intermedio para almacenar los datos multidimensionales pre
16 Datamining (Minería de Datos)
Son auténticas herramientas de extracción de conocimiento útil, a partir de la
información contenida en las bases de datos de cualquier empresa. El objetivo que
se persigue es descubrir patrones ocultos, tendencias y correlaciones, y presentar
esta información de forma sencilla y accesible a los usuarios finales, para
solucionar, prever y simular problemas del negocio.
El datamining incorpora la utilización de tecnologías basadas en redes neuronales,
árboles de decisión, reglas de inducción, análisis de series temporales y
visualización de datos”. (Merino, 2005)
1.5. Arquitectura de un Business Intelligence
Una solución de Business Intelligence parte de los sistemas de origen de una
organización (bases de datos, ERPs, ficheros de texto...), sobre los que suele ser
necesario aplicar una transformación estructural para optimizar su proceso
analítico.
Para ello se realiza una fase de extracción, transformación y carga (ETL) de datos.
Esta etapa suele apoyarse en un almacén intermedio, llamado ODS, que actúa
como pasarela entre los sistemas fuente y los sistemas destino (generalmente un
datawarehouse), y cuyo principal objetivo consiste en evitar la saturación de los
servidores funcionales de la organización. La información resultante, ya unificada,
depurada y consolidada, se almacena en un datawarehouse corporativo, que puede
servir como base para la construcción de distintos datamarts departamentales.
Estos datamarts se caracterizan por poseer la estructura óptima para el análisis de
los datos de esa área de la empresa, ya sea mediante bases de datos
transaccionales (OLTP) o mediante bases de datos analíticas (OLAP). (Sinnexus,
2016)
Una arquitectura Business Intelligence se divide en las siguientes capas:
• Sistemas Fuentes
17 • Capa Business intelligence
Ilustraciones N° 3: Arquitectura de un BI
Fuente: Obtenido de sitio web http://www.sinnexus.com”
1.5.1 Sistemas Fuentes
Los datos administrados por los sistemas de aplicación operacionales son la fuente
principal de datos para el Data Warehouse. Estos sistemas son los encargados de
recolectar información diaria de las tareas operativas de la organización. Distintos
procesos de carga se encargan de extraer los datos de dichas bases y de
ingresarlos al Data Warehouse. (Merino, 2005)
1.5.2 Capa Data Warehouse
La Capa Data Warehouse es el centro de la arquitectura en un sistema Business
Intelligence, que se encarga de organizar y almacenar los datos para el análisis de
los mismos.
1.5.2.1 Definición de Data Warehouse
Un Data Warehouse es una base de datos empresarial que contiene datos
extraídos de los sistemas transaccionales y de otras fuentes, previamente
18
información histórica lo que favorece al análisis de tendencias del negocio. Los
datos almacenados en el data warehouse deben estar integrados, consolidados,
asegurados y depurados, de modo que sean el soporte de decisiones corporativas.
Los sistemas de Data Warehousing son el centro de la arquitectura de un sistema
Business Intelligence ya que es de esta base de datos de donde se obtiene la
información para desplegarla a una amplia variedad de individuos, esta es la
principal razón de negocios que conduce al concepto de Data Warehouse. (Todo
BI, 2010)
1.5.2.2 Características de un Data Warehouse
Un Data Warehouse debe cumplir con ciertas características para convertirse en
una verdadera base de información para el análisis y la toma de decisiones. Un
Data Warehouse tiene las siguientes características:
• Orientado a temas
• Integrado
• Variable en el tiempo
• No volátil
Orientado a temas
La primera característica del Data Warehouse es que los datos son almacenados
por temas del negocio y no por aplicación, es decir que la información está
organizada en base a los aspectos que son de interés para la empresa desde la
perspectiva del usuario final. Muchas aplicaciones organizan sus datos desde la
perspectiva del negocio, para automatizar las transacciones del negocio, mejorar la
rapidez de acceso y actualización de los datos.
Este tipo de organización de datos no es la más adecuada para operaciones de
consulta que se necesita en un ambiente decisional.(Merino, 2005) Integrado
Un aspecto importante en una ambiente Data Warehouse es que sus datos están
19
ser cargados al Data Warehouse, esto garantiza manejar información consolidada,
exacta y confiable para el negocio.
La integración de datos se muestra de muchas maneras: en convenciones de
nombres, en la medida uniforme de variables, en la codificación de estructuras, en
atributos físicos de los datos consistentes.
Variable en el tiempo
Toda la información del Data Warehouse es requerida en algún momento, esta es
una característica básica de los datos en un Data Warehouse. Un Data Warehouse
almacena y maneja grandes cantidades de datos históricos y son utilizados para
comparaciones, análisis de tendencias y pronósticos. Es una base de datos que
acumula años de información transaccional. Por la necesidad de administrar tanto
la información histórica como las actuales, un Data Warehouse es mayor que las
bases de datos operacionales. (World Bank Institute, 2008).
No volátil
La información es útil sólo cuando es estable. Los datos operacionales cambian
sobre una base momento a momento. La perspectiva más grande, esencial para el
análisis y la toma de decisiones, requiere una base de datos estable. Los datos en
un Data Warehouse son estables, se insertan nuevos datos pero lo datos existentes
no son removidos. (MX, 2015)
1.5.2.3 Arquitectura de un Data Warehouse
Un Data Warehouse puede ser implementado de varias maneras, en ell siguiente
gráfico muestra la arquitectura clásica de un Data Warehouse, compuesto por:
• Fuentes de Datos
• Motor del Data Warehouse:
Gestor de Carga
Metadatos
Agregaciones
20 Gestor de Respaldos
DW Repositorio
• DataMart:
BDD Dimensional
Gestor del DataMart
• Herramientas de Acceso
Ilustraciones N° 4: Arquitectura de un Dara Warehouse
Fuente: Obtenido de sitio web “http://www.ongei.gob.pe/”
Fuentes de Datos
Cualquier origen de información que pueda ser considerado para el Data
Warehouse, aquí se incluye los siguientes elementos:
Los sistemas OLTP`s que son los sistemas de Legacy que actualmente operan
21
Datos antiguos provenientes de migraciones.
Fuentes externas como otros sistemas de la compañía, sistemas de otras
empresas, sistemas de gobierno, internet, etc.
Datos de oficina, archivos en formato de Word, Excel, archivos planos, PDF’s,
mails, etc.
El Motor de Data Warehouse
Está integrado por los siguientes componentes:
Gestor de Carga
Quizá sea uno de los elementos más importantes para el data warehouse,
generalmente incluye las operaciones de:
Extracción: Es el proceso que accesa a los datos OLTP existentes, en cualquier forma que exista, desde cualquier DBMS en que exista. Típicamente, extracción y
el siguiente paso, propagación, son administrados por el mismo producto. No todas
las herramientas de extracción y propagación soportan todas las plataformas, de
tal manera que una faceta importante de la selección de herramientas es si la
herramienta soporta los sistemas operativos y las bases de datos que se esté
usando para el data warehouse. (Herrera, 2007)
Propagación: Es el proceso de mover datos desde los sistemas fuente hacia el sistema objetivo que contendrá el data warehouse. El proceso de propagación toma
lugar en tiempo real, o en un calendario predeterminado (batch), o sobre demanda,
y puede efectuar un refresco total del warehouse o justo un cambio neto. Cuando
se selecciona una herramienta de propagación, se aspira que ésta ofrezca la gestión de cambios netos como también refresco total y permitirá tantas
actualizaciones en tiempo real y calendarizadas (batch). (Merino, 2005)
22
problemas de información tale como campos no inicializados o valores inválidos en
los datos importados. (MX, 2015)
Transformación: Convierte datos desde su formato OLTP al apropiado formato del data warehouse ejecutando funciones tales como desnormalización de datos,
traduciendo códigos hacia texto significativo, convirtiendo una variedad de formatos
de fechas hacia un formato estándar, convirtiendo texto tal como nombres de
ciudades hacia texto estándar y renombrando campos desde nombres técnicos no
significativos hacia nombres significativos que un usuario final entenderá. (Merino,
2005)
Carga: Los datos fuentes normalmente son extraídos y almacenados en archivos temporales tipo texto, los mismos que deben ser cargados a la base de datos del
data warehouse. La figura resume el proceso de carga, los archivos temporales
finalmente son colocados en la base de data warehouse de destino. (Herrera, 2007)
Ilustraciones N° 5: Gestor de Carga
Fuente: Obtenido de sitio web “https://www.adictosaltrabajo.com”
El módulo de Gestor de Carga también es conocido como Integrador, y es muy
importante tanto en la Fase de Construcción como en la Fase de Explotación de un
23
Ilustraciones N° 6: Confiabilidad de los datos.
Fuente: Obtenido de sitio web “http://www.gestiopolis.com/”
Meta Datos
Esta área del warehouse almacena todas las definiciones de los meta datos (datos
acerca de los datos) usados por todos los procesos en el warehouse.
Los Meta datos son usados para una variedad de propósitos incluyendo:
Los procesos de extracción, transformación y carga (meta datos es usado para
mapear las fuentes de datos a una vista común de la información dentro del
warehouse).
Los procesos de gestión del warehouse (cada tabla es descrita incluyendo su
estructura, índices, vistas; meta datos es usado también para automatizar la
producción de tablas resumen).
Como parte de los procesos de gestión de consulta (meta datos es usado para
dirigir una consulta a la fuente de datos más apropiada).
Agregaciones
Este componente del warehouse almacena todos los datos agregados, predefinidos
y generados por el gestor del warehouse.
El propósito de información resumida es para mejorar el rendimiento de las
consultas. Aunque hay costos operacionales incrementados asociados con la
agregación inicial de los datos, esto debería ser compensado eliminando el
24
clasificación o agrupación) en las respuestas a las consultas de los usuarios. El
dato agregado es actualizado continuamente en la medida que nuevos datos son
cargados en al warehouse. (Herrera, 2007) Gestor del Data Warehouse
En algunos casos el gestor del warehouse también genera perfiles de consultas
para determinar qué índices y agregaciones son apropiadas. Un perfil de consulta
puede ser generado para cada usuario, grupo de usuario, o el data warehouse y
está basada en la información que describe las características de las consultas
tales como la frecuencia, tablas objetivo, y tamaño de los results set.
Gestor de Respaldos
Es el componente que se encarga de respaldar constantemente la información del
repositorio del data warehouse.
Repositorio del Data Warehouse
Es el repositorio en si o la base de datos física donde se almacena la información
del data warehouse.
Un DBMS para trabajar con un sistema de Data warehouse debe cumplir con los
siguientes requerimientos:
Rendimiento de carga: Data Warehouse requiere de carga incremental de nuevos datos en una base periódica dentro de ventanas de tiempo pequeñas. El
rendimiento de procesos de carga debería ser medido en cientos de millones de
filas o gigabytes de datos por hora y no debería haber un límite máximo que
restringa al negocio.
Procesamiento de carga: Muchos pasos deben ser dados para cargar un dato nuevo o actualizado hacia el datawarehouse incluyendo conversión de datos,
filtrado, reformateado, chequeos de integridad, almacenamiento físico, indexación
y actualización de los meta datos. Aunque cada paso en la práctica puede ser
atómico, el proceso de carga debería parecer que se ejecuta como una unidad de
25
Gestión de Calidad de los Datos: El data warehouse debe asegurar consistencia local, consistencia global e integridad referencial a pesar de las fuentes “sucias” y
tamaños masivos de bases de datos la preparación y carga son pasos necesarios, ellos no son suficientes. La habilidad para responder a las consultas de los usuarios
finales es la medida del éxito para una aplicación de data warehouse. Mientras más
preguntas son respondidas, los analistas tienden a solicitar preguntas más
complejas y creativas
Rendimiento de consultas: Gestión basada en hechos y análisis ad hoc no deben ser retardadas o inhibidas por el rendimiento del RDBMS data warehouse.
Consultas complejas y grandes para operaciones claves del negocio deben ser
completadas en un período de tiempo razonable.
Escalabilidad de terabytes: El tamaño de data warehouse está creciendo a enormes tasas con tamaños en el rango de cientos de gigabytes hasta los terabytes
y petabytes (1015). Los RDBMS no deben tener ninguna limitación arquitectural para el tamaño de la base de datos y deberían soportar gestión modular y paralela. En
el evento de fallas, el RDBMS debería soportar disponibilidad continua, y proveer
mecanismos para recuperación. El RDBMS debe soportar dispositivos de
almacenamiento en masa tales como discos ópticos y dispositivos de gestión de
almacenamiento jerárquico. Finalmente, rendimiento de consultas no debería ser
dependiente del tamaño de la base de datos, sino más bien de la complejidad de la
consulta. (Vázquez, 2012)
Escalabilidad de Usuarios en Masa: El pensamiento actual es que el acceso a un data warehouse es limitado a un número de usuarios gerenciales relativamente
bajo.
Se predice que en el futuro, data warehouse RDBMS debería ser capaz de soportar
cientos, o aún miles de usuarios concurrentes mientras se mantiene un aceptable
rendimiento en las consultas
Trabajo en Red: Sistemas de data warehouse deberían ser capaces de cooperación en un gran red de data warehouse. El data warehouse debe incluir
26
warehouse. Los usuarios deberían ser capaces de mirar en y trabajar con múltiples
data warehouses desde una estación de cliente única.
Facilidad de Administración: La muy grande escala y naturaleza cíclica en el tiempo del data warehouse demanda facilidad y flexibilidad administrativa. El
RDBMS debe proveer control para límites de recursos en la implementación.
Análisis Dimensional Integrado: a potencia de vistas multidimensionales es ampliamente aceptada y soporte dimensional debe ser inherente en el RDBMS
warehouse para proveer el más alto rendimiento para herramientas OLAP
relacional. El RDBMS debe soportar creación rápida y fácil de resúmenes comunes
precalculados en grandes datawarehouses, y proveer herramientas de
mantenimiento para automatizar la creación de estos agregados precalculados. (Herrera, 2007)
Funcionalidad de consulta avanzada: Usuarios finales requieren cálculos analíticos avanzados, análisis secuencial y comparativo, y accesos consistentes a
datos detallados y resumidos. Usando SQL en un ambiente cliente servidor y
herramientas apunte y dispare puede algunas veces ser no práctico o aún imposible
debido a la complejidad de las consultas de los usuarios. El RDBMS debe proveer
un completo y avanzado set de operaciones analíticas. (Vázquez, 2012)
Cubos Dimensionales
Un modelo de datos multidimensional soporta el manejo de una vasta cantidad de
datos empresariales y temporales. De esta forma surge la instancia del modelo
multidimensional, también conocido como cubo o hipercubo. Para clarificarlo un
poco se puede imaginar un cubo con tres dimensiones: producto, tiempo, región;
donde cada dimensión tiene diferentes niveles o hechos, para finalmente intersectar
estos valores y obtener una medida.
La medida es el índice de un producto como puede ser el huevo en el mes de mayo
27
Ilustraciones N° 7: Cubo Dimensional
Fuente: Ing. Normiña E. Sánchez C.
Herramientas de Acceso
“Estas herramientas pueden reunirse en 4 grupos:
• Herramientas de Minería de Datos
• Herramientas de Procesamiento Analítico en Línea (OLAP) • Herramientas de Desarrollo de Aplicaciones
• Herramientas de Reportes y Consultas
Herramientas de Minería Datos
Es una herramienta que permite inferir comportamientos, modelos, relaciones y
estimaciones de los datos, para poder realizar predicciones de los mismos, sin
prescindir de algún patrón o regla preestablecida o conocida.
El datamining básicamente es una técnica de descubrir patrones y relaciones entre
los datos que a simple vista no se puedan inferir, las consultas de datamining
pueden tardar de minutos a horas dependiendo el volumen de datos que tengan
28
Las herramientas que se utilizan o construyen para datamining están basadas en
inteligencia artificial, sistemas expertos, algoritmos genéticos y árboles de
probabilidad, entre otras muchas más. Este análisis de datos representa un capital enorme para cualquier organización que disponga de grandes volúmenes de datos
históricos, ya que conocería el comportamiento de los objetos necesarios para
incrementar su producción.
Para tomar ventajas y competir eficazmente, es muy importante determinar y utilizar
la información estratégica que se oculta en los datos. El proceso de minería de
datos, puede dividirse en tres etapas:
• Las distintas fuentes de datos deben integrarse de forma que estén representados todos los componentes de la organización. Esta visión de
conjunto enriquece notablemente los resultados. • Ejecutar el proceso de análisis de las bases de datos.
• Transformar las conclusiones obtenidas en reglas comprensibles y que posibilite la toma de decisiones”. (Merino, 2005)
Herramientas de Procesamiento Analítico en Línea (OLAP)
“Típicas aplicaciones de negocios para estas herramientas incluyen evaluación de
la efectividad de una campaña de marketing, previsión de ventas de productos, y
planificación de la capacidad.
Estas herramientas asumen que los datos están organizados en un modelo
multidimensional, el cual es soportado por una base de datos multidimensional
especial (MDDBMS) o por una base de datos relacional diseñada para permitir
consultas multidimensionales.
Este tipo de herramientas permiten a los usuarios ingresar a un data warehouse
desde cualquier dimensión simple para empezar el análisis, luego navegar a otra
dimensión para un mayor análisis de la información.
OLAP, Es Online Analytical Processing. Se trata de una forma de almacenar la información en una Base de Datos que permita realizar de forma más efectiva las
29
MOLAP, Multidimensional OLAP. Tanto los datos fuente como los datos agregados o precalculados residen en el mismo formato multidimensional. Optimiza las
queries, pero requiere más espacio de disco y diferente software. El primer punto está dejando ser un problema: el espacio de disco cada vez es más barato.
ROLAP, Relational OLAP. Tanto los datos precalculados y agregados como los datos fuente residen en la misma base de datos relacional. Si el DataWarehouse
es muy grande o se necesita rapidez por parte de los usuarios puede ser un
problema.
HOLAP, Hybrid OLAP: Es una combinación de los dos anteriores. Los datos agregados y precalculados se almacenan en estructuras multidimensionales y los
de menor nivel de detalle en el relacional. Requiere un buen trabajo de análisis para
identificar cada tipo de dato.
Los elementos básicos de un sistema OLAP son: Dimensiones, Medidas,
Jerarquías de la Dimensión, Nivel de Agregación, Atributos e Indicadores”. (Herrera, 2007)
Dimensiones: “Son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Una dimensión puede ser
creada para usarse en un cubo individual o en múltiples cubos.
Una dimensión creada para un cubo individual, es llamada dimensión privada. Por
el contrario si esta puede ser usada por múltiples cubos, se le llama dimensión
compartida. Estas podrán ser usadas dentro de todo cubo, en la base de datos, así
se optimiza el tiempo y se evita el andar duplicando dimensiones privadas.
Las dimensiones compartidas, también habilitan la estandarización de las métricas
de negocios entre cubos. Por ejemplo, el estandarizar las dimensiones compartidas
para el tiempo y localización geográfica, aseguran que los datos analizados, desde
diferentes cubos, estén organizados similarmente.
Medidas: Son datos numéricos de interés primario para los usuarios del cubo. Algunas medidas comunes son Ventas en unidades, ventas en pesos, costo de