FACULTAD DE INGENIERÍA INDUSTRIAL
ESCUELA PROFESIONAL DE INGENIERÍA INFORMÁTICA
TESIS
“IMPLEMENTACION DE UNA SOLUCION DE INTELIGENCIA DE NEGOCIOS PARA UNA EMPRESA AGROINDUSTRIAL”
PRESENTADA POR:
Br. MONTERO SILVA BORIS JAVIER
TESIS PARA OPTAR EL TÍTULO DE INGENIERO INFORMÁTICO
LINEA DE INVESTIGACIÓN COMPUTACIÓN
PIURA – PERÚ
2018
DEDICATORIA
Dedico el presente proyecto de Tesis en primer lugar a Dios, por la bendición de darme la vida. También a mis padres Javier y Ángela por apoyarme en todo momento, a mi hermana Brenda y sobre todo pensando en mi hija Anghela por darme esa fuerza y motivación en salir adelante por ella.
Boris Montero.
AGRADECIMIENTO
Agradezco a mi asesor el Ing. Persi Cabrera por la confianza en apoyarme y asesorarme en este proyecto de tesis. De igual manera una agradecimiento especial a los Docente de la facultad Ingeniería Industrial quienes influenciaron en mi aprendizaje y formación profesional.
Índice
Dedicatoria... vi
Agradecimiento ... vii
Resumen ... xvii
ABSTRACT ... xviii
Introducción ... 19
Capítulo 1: El Problema de Investigación ... 20
1.1. Descripción y Formulación del Problema ... 20
1.1.1. Descripción ... 20
1.1.2. Formulación ... 21
1.2. Objetivos de la Investigación ... 22
1.2.1. Objetivo General... 22
1.2.2. Objetivos Específicos ... 22
1.3. Justificación de la Investigación ... 23
Capítulo 2: Marco Teórico ... 24
2.1. Marco Referencial ... 24
2.1.1. La Producción en el Agro Peruano ... 24
2.1.2. La Agro Exportación en el Perú ... 25
2.2. Marco Teórico ... 27
2.2.1. Business Intelligence (BI): Inteligencia de Negocio ... 27
2.2.1.1. Definición ... 27
2.2.1.2. Importancia ... 27
2.2.1.3. Beneficios ... 27
2.2.1.4. Arquitectura de Inteligencia de negocios ... 28
2.2.2. Data Warehouse ... 29
2.2.2.1. Definición ... 29
2.2.2.2. Procesos básicos de un Data Warehouse ... 30
2.2.2.3. Elementos del Data Warehouse ... 31
2.2.3. Metodología Kimball ... 33
2.2.3.1. Definición ... 33
2.2.3.2. Modelo Dimensional ... 33
2.2.3.3. Etapas de la Metodología Kimball ... 36
2.3. Hipótesis de Investigación ... 39
2.3.1. Hipótesis general ... 39
2.3.2. Identificación y operacionalización de variables ... 39
2.3.2.1. Identificación de variables ... 39
2.3.2.2. Operacionalización de variables: Indicadores ... 39
Capítulo 3: Desarrollo Metodológico ... 40
3.1. Diseño de la Investigación ... 40
3.1.1. Tipo de investigación ... 40
3.1.2. Modelo teórico ... 40
3.1.3. Diseño de la investigación ... 40
3.1.4. Método de investigación ... 40
3.1.5. Uso de software de tratamiento y análisis ... 40
3.2. Cobertura del Estudio ... 41
3.2.1. Población ... 41
3.2.2. Muestra ... 41
3.3. Recolección de datos e información ... 42
3.4. Análisis y Procesamiento de Información ... 43
3.4.1. ETAPA 1: PLANEACIÓN Y ADMINISTRACIÓN DEL PROYECTO ... 43
3.4.1.1. Definición del proyecto ... 43
3.4.1.2. Preparación para un proyecto de Data Warehouse ... 43
3.4.1.3. Alcance ... 43
3.4.1.4. Planificación del proyecto ... 43
3.4.1.5. Administración del proyecto ... 44
3.4.2. ETAPA 2: DEFINICIÓN DE LOS REQUERIMIENTOS DEL NEGOCIO... 44
3.4.2.1. Requerimientos funcionales del usuario final ... 44
3.4.2.2. Requerimientos no funcionales ... 45
3.4.3. ETAPA 3: DISEÑO DE LA ARQUITECTURA TÉCNICA ... 45
3.4.3.1. Datos ... 45
3.4.3.2. Back Room - Fuente de Datos ... 46
3.4.3.3. Front Room – Sistema de Información Ejecutiva. ... 46
3.4.3.4. Modelo Transaccional de la Base de Datos ... 47
3.4.4. ETAPA 4: MODELO DIMENSIONAL ... 48
3.4.4.1. Elección de proceso de Negocios ... 48
3.4.4.2. Nivel de Granularidad ... 49
3.4.4.3. Esquema del modelo dimensional ... 50
3.4.4.4. Sentencias SQL para crear el Datamart ... 51
3.4.4.5. Modelado lógico del Datamart ... 53
3.4.5. ETAPA 5: DISEÑO FÍSICO ... 54
3.4.5.1. Modelo Físico del Datamart ... 54
3.4.5.2. Diccionario de datos del Datamart ... 55
3.4.6. ETAPA 6: SELECCIÓN DE PRODUCTOS ... 57
3.4.6.1. Hardware ... 57
3.4.6.2. Software ... 58
3.5. Desarrollo de la Herramienta de mejora ... 59
3.5.1. Diseño de Datos (Proceso ETL): ... 59
3.5.1.1. ETAPA 7: DISEÑO E IMPLEMENTACION DEL SUBSISTEMA DE ETL .... 59
3.5.1.2. ETAPA 8: ESPECIFICACIÓN DE LA APLICACIÓN BI ... 73
3.5.2. Desarrollo de la Presentación de datos (Cubo): Analysis Services ... 75
3.5.2.1. ETAPA 9: DESARROLLO DE LA APLICACIÓN BI ... 75
3.5.2.2. ETAPA 10: IMPLEMENTACIÓN ... 96
3.5.2.3. ETAPA 11: CRECIMIENTO Y MANTENIMIENTO ... 96
Capítulo 4: Presentación y Discusión de Resultados... 97
4.1. Análisis e Interpretación de Resultados... 97
4.1.1. Área de Reportes (Microsoft Excel) ... 97
4.1.2. Cumplimiento de Requerimientos ... 102
4.1.2.1. Requerimiento N° 1: Acopiadores por Zonas ... 102
4.1.2.2. Requerimiento N° 2: Productos por Zona ... 103
4.1.2.3. Requerimiento N° 3: Productos por Acopiador ... 104
4.1.2.4. Requerimiento N° 4: Acopiador por Producto ... 105
4.1.2.5. Requerimiento N° 5: Productos por Mes... 106
4.1.2.6. Requerimiento N° 6: Cantidad de Productos por Acopiador al Mes... 107
4.1.2.7. Requerimiento N° 7: Cantidad de Productos por Acopiador al Año... 108
4.1.2.8. Requerimiento N° 8: Acopiadores más solicitados por mes ... 109
4.1.2.9. Requerimiento N° 9: Acopiadores más Frecuentes por Año... 110
4.1.2.10. Requerimiento N° 10: Productos más Ingresados ... 111
4.1.2.11. Requerimiento N° 11: Gastos por Acopiador al Mes ... 112
4.1.2.12. Requerimiento N° 12: Gastos por Productos al Mes ... 113
4.1.2.13. Requerimiento N° 13: Gastos por Productos al Año ... 114
4.1.2.14. Requerimiento N° 14: Gasto Total de Acopiador por Año ... 115
4.2. Discusión de Resultados ... 116
4.2.1. Resultados Finales ... 116
4.2.2. Cumplimiento de Requerimientos ... 116
Conclusiones ... 118
Recomendaciones ... 119
Referencias bibliográficas ... 120
Anexos ... 124
Índice de Tablas
Tabla 1. Operacionalización de Variables ... 39
Tabla 2. Hechos y Medidas ... 48
Tabla 3. Hechos ... 49
Tabla 4. Diccionario de datos Dim_Acopiador ... 55
Tabla 5. Diccionario de datos Dim_Producto ... 55
Tabla 6. Diccionario de datos Dim_Zona ... 56
Tabla 7. Diccionario de datos Tiempo... 56
Tabla 8. Características de Servidor ... 57
Tabla 9. Características de PC Usuario ... 57
Tabla 10. Caracteristicas de Software ... 58
Índice de Figuras
Figura 1. Arquitectura de BI ... 29
Figura 2. Elementos de un DW ... 31
Figura 3. Esquema Estrella ... 34
Figura 4. Esquema Copo de nieve ... 35
Figura 5. Metodología Kimball (Ralph Kimball, 1997) ... 36
Figura 6. Origen de Obtención de datos. ... 42
Figura 7. Modelo Base de Datos Transaccional ... 47
Figura 8. Esquema del modelo de datos Dimensional ... 50
Figura 9. Modelado Lógico del Datamart ... 53
Figura 10. Modelo Físico del Datamart ... 54
Figura 11. Conexión base de datos Origen ... 59
Figura 12. Conexión a base de datos Destino ... 60
Figura 13. Conexión para Limpiar Dimensiones... 61
Figura 14. Ejecutando Limpieza de Dimensiones ... 61
Figura 15. Mapeo Datos - Acopiador ... 62
Figura 16. Ejecutando ETL - Acopiador ... 63
Figura 17. Carga Final ETL - Acopiador ... 63
Figura 18. Mapeo Datos - Producto... 64
Figura 19. Ejecutando ETL - Producto ... 65
Figura 20. Carga Final ETL - Producto ... 65
Figura 21. Mapeo Datos - Zona ... 66
Figura 22. Ejecutando ETL - Zona ... 67
Figura 23. Carga Final ETL - Zona ... 67
Figura 24. Ejecutando ETL - Tiempo ... 68
Figura 25. Carga Final ETL - Tiempo ... 72
Figura 26. Mapeo de Datos - Acopio_Producto ... 73
Figura 27. Ejecutando ETL - Acopio_Producto ... 74
Figura 28. Carga Final ETL - Acopio_Producto ... 74
Figura 29. Conexión para el Analysis Services ... 75
Figura 30. Selecion de Origen de Datos ... 76
Figura 31. Selección de Tablas y Vistas ... 77
Figura 32. Asistente Final de Vista ... 78
Figura 33. Vista - Diseño Final ... 79
Figura 34. Cubo - Diseño Final ... 80
Figura 35. Conexión Dimensión Acopiador ... 81
Figura 36. Atributos Dimensión Acopiador ... 82
Figura 37. Dimensión Acopiador - Asistente Final ... 83
Figura 38. Conexión Dimensión Producto ... 84
Figura 39. Atributos Dimensión Producto ... 85
Figura 40. Dimensión Producto - Asistente Final ... 86
Figura 41. Conexión Dimensión Zona ... 87
Figura 42. Atributos Dimensión Zona ... 88
Figura 43. Dimensión Zona - Asistente Final... 89
Figura 44. Conexión Dimensión Tiempo ... 90
Figura 45. Atributos Dimensión Tiempo ... 91
Figura 46. Dimensión Tiempo - Asistente Final ... 92
Figura 47. Implementación de Cubo ... 93
Figura 48. Procesamiento de Cubo ... 94
Figura 49. Cubo - Proceso Terminado ... 95
Figura 50. Conexión a Servidor Base de Datos ... 97
Figura 51. Seleccionando Cubo ... 98
Figura 52. Guardando Conexión de Datos ... 99
Figura 53. Estableciendo Área de Trabajo - Excel ... 100
Figura 54. Área de Trabajo - Excel (Hoja de Cálculo) ... 101
Figura 55. Reporte N° 1: Acopiadores por Zonas ... 102
Figura 56. Reporte N° 2: Productos por Zona ... 103
Figura 57. Reporte N° 3: Productos por Acopiador ... 104
Figura 58. Reporte N° 4: Acopiador por Producto ... 105
Figura 59. Reporte N° 5: Productos por Mes ... 106
Figura 60. Reporte N° 6: Cantidad de Productos por Acopiador al Mes ... 107
Figura 61. Reporte N° 7: Cantidad de Productos por Acopiador al Año ... 108
Figura 62. Reporte N° 8: Acopiadores más solicitados por mes ... 109
Figura 63. Reporte N° 9: Acopiadores más Frecuentes por Año ... 110
Figura 64. Reporte N° 10: Productos más Ingresados ... 111
Figura 65. Gráfico - Productos más Ingresados ... 111
Figura 66. Reporte N° 11: Gastos por Acopiador al Mes ... 112
Figura 67. Reporte N° 12: Gastos por Productos al Mes ... 113
Figura 68. Gráfico - Gastos por Productos al Mes ... 113
Figura 69. Reporte N° 13: Gastos por Productos al Año ... 114
Figura 70. Gráfico - Gastos por Productos al Año ... 114
Figura 71. Reporte N° 14: Gasto Total de Acopiador por Año ... 115
Figura 72. Gráfico - Gasto Total de Acopiador por Año... 115
Índice de Anexos
Anexo 1. Matriz de Consistencia de la tesis ... 124 Anexo 2. Ficha de Observación ... 125
RESUMEN
El proyecto consistió en desarrollar una solución de Inteligencia de Negocios para el apoyo y mejora en la obtención de información estratégica sobre el acopio de productos agroindustriales necesarios por la empresa para así permitir a la gerencia tomar decisiones adecuadas y aumentar en su productividad junto a su economía.
Para el desarrollo del proyecto de tesis se implementó un Data Warehouse en el cual, con la creación del Datamart se pudo conseguir que la información emitida mediante reportes del sistema transaccional que cuenta la empresa entre los años 2013 al año 2016, se optimice y obtenga de manera rápida, eficaz, confiable y dinámica, cuyos resultados mostrados han servido para comparar de mejor forma en qué año se tuvo mayor productividad, como así también, qué productos y acopiadores por temporada son los más solicitados en determinado mes o año según la necesidad de información de la gerencia de la empresa.
El informe final del proyecto de tesis consta de cuatro capítulos: Capítulo I se basa en la identificación y formulación del problema, los objetivos de la investigación y su justificación.
En el Capítulo II se presenta el marco referencial, marco teórico y la hipótesis establecida en la investigación. En el Capítulo III establecemos la metodología, diseño de la investigación junto a la recolección de datos, análisis y procesamiento de la información. Finalmente en el Capítulo IV es la presentación y discusión de resultados obtenidos, siendo esta la Solución de Inteligencia de Negocios.
Palabras claves: Inteligencia de Negocios, información estratégica, toma de decisiones, Data Warehouse, Datamart.
ABSTRACT
The project consisted of developing a Business Intelligence solution for the support and improvement in obtaining strategic information on the collection of agro-industrial products needed by the company in order to allow management to make appropriate decisions and increase their productivity along with their economy.
For the development of the thesis project, a Data Warehouse was implemented in which, with the creation of the Datamart, it was possible to obtain that the information issued by means of reports of the transaction system that the company counts between 2013 and 2016, is optimized and obtained from a fast, efficient, reliable and dynamic way, whose results have been used to better compare the year in which productivity was highest, as well as, what products and seasonal collectors are the most requested in a given month or year according to the need of information of the management of the company.
The final report of the thesis project consists of four chapters: Chapter I is based on the identification and formulation of the problem, the objectives of the research and its justification.
Chapter II presents the referential framework, theoretical framework and the hypothesis established in the research. In Chapter III we establish the methodology, design of the research along with data collection, analysis and information processing. Finally in Chapter IV is the presentation and discussion of results obtained, this being the Business Intelligence
Keywords : Business Intelligence, Strategic Information, Decision making, Data Warehouse, Datamart.
INTRODUCCIÓN
En la actualidad la agroindustria en el Perú ha tenido importantes cambios desde los últimos 50 años, siendo hoy más que nunca la principal fuente de ingresos para los pequeños, medianos y grandes productores, como también resultando muy beneficiada la economía peruana y resaltado las ventajas competitivas a nivel internacional. Este desarrollo se debe a un buen ejemplo de eficacia, gestión empresarial y aprovechamiento de nuestra diversidad natural de tierras, productos, climas, entre otros factores propios de nuestro país.
Así mismo el impresionante incremento de las Agroexportaciones peruanas ha permitido posicionar al Perú como uno de los principales países productores de la alcachofa y el esparrago en EE.UU., así como el de la palta y el mango en Europa, destacando a la costa peruana poseedora de buenos y mejores cultivos (Piura, Lambayeque, La Libertad, Ancash y Lima principalmente).
En referencia a la investigación del presente trabajo se pretende determinar y analizar los requerimientos de la empresa con respecto al manejo estratégico de la información en el acopio de productos. Llagando a la solución que consistió en implementar y desarrollar un modelo dimensional, previamente con la implementación de un Data Warehouse con los datos procesados en la base de datos, por lo cual se utilizó las herramientas de inteligencia de negocios que es el Microsoft SQL Server 2017, haciendo uso de su Analysis Services, para la creación de un Datamart, para así obtener el cubo dimensional con los hechos y dimensiones a analizar e interpretar, junto con la información estratégica obtenida de manera dinámica y optima por medio de gráficos y filtros amigables a través del Microsoft Excel , que permitió acceder a una información de calidad al gerente de la empresa y así tener una mejor visión y estrategia para su toma de decisiones, como también a los encargados en llevar el control del acopio de productos.
CAPÍTULO 1: EL PROBLEMA DE INVESTIGACIÓN 1.1. DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA
1.1.1. Descripción
Hoy en día las empresas exportadoras en el Perú han tenido un crecimiento favorable y es de vital importancia llevar un manejo real y oportuno de la información de la empresa, principalmente en el área gerencial y para los jefes de área quienes interactúan con el sistema implementado en la empresa, además el uso de herramientas tecnológicas que existen en la empresa hasta el momento, estas son operativas para llevar el manejo, desarrollo y productividad de la empresa.
El sistema actual de la empresa es un sistema transaccional en el cual los datos obtenidos entre sus áreas funcionales sólo son almacenados y como tal carecen de información estratégica.
La empresa no lleva un adecuado manejo y control en el acopio de los productos, ya que los encargados informan que se dan desabastecimiento y falta de información exacta en los productos, generando altos costos operativos y afectando la rentabilidad, la información que se obtiene del sistema es pobre lo cual produce un análisis sin mayor valor para el negocio.
La demora en los tiempos para brindar información estratégica y no poder tomar acciones de manera oportuna es el principal problema que se presenta en los reportes que muestra el sistema ya implementado en la empresa.
El área de gerencia no cuenta con información estratégica y veraz de sus procesos. En el proceso de producción se detectó que la información que se obtiene del sistema no es la adecuada, ya que al llevar el acopio del producto a transformar y realizar así luego una exportación directa por parte de la empresa, no se controla su real disponibilidad y contar con los productores activos. Por lo cual se obtiene el incumplimiento del plan de producción diseñado y por ende no es lo que la gerencia esperaba como resultado final en productividad.
La empresa no cuenta con un modelo de herramienta tecnológica en relación a la inteligencia de negocios. Hoy en día las metodologías de inteligencia de negocios nos permiten describir mejor la productividad de la empresa y así incrementar la confianza directa con los clientes y proveedores.
Observando esta problemática, se recurrió a una solución de Inteligencia de Negocios que nos ayudó sobre los procesos de negocio antes señalados, optimizando los tiempos de espera para obtener reportes con información estratégica, tanto para los niveles directivo y táctico de la empresa. Con lo que permitió que esta optimice sus áreas de negocio.
Al implementar inteligencia de negocios se desarrolló un Data Warehouse el cual ayudó en el manejo y control de la información obtenida sobre un mejor acopio de los productos para la empresa.
1.1.2. Formulación
¿De qué manera se implementará una solución de inteligencia de negocios en el acopio de productos agroindustriales para la empresa?
1.2. OBJETIVOS DE LA INVESTIGACIÓN
1.2.1. Objetivo General
Implementar una solución de inteligencia de negocios en el acopio de productos agroindustriales para la empresa
1.2.2. Objetivos Específicos
Determinar los requerimientos de información de acuerdo a las necesidades de la empresa en el acopio de productos.
Evaluar la información de la base de datos obtenida del sistema transaccional e implementar el Data Warehouse.
Construir el Datamart que cumpla con los requerimientos necesarios para el acopio de productos mediante un modelo dimensional de los hechos que se van analizar para obtener información estratégica.
Proporcionar y describir el análisis de la información estratégica obtenida a partir del modelo dimensional realizado.
1.3. JUSTIFICACIÓN DE LA INVESTIGACIÓN
En la empresa agroindustrial exportadora existen los inconvenientes ya identificados anteriormente, el cual demandó que en la implementación del proyecto se realicen procesamientos de información obtenidos de un sistema transaccional con el que ya cuenta la empresa, estos procesamientos de información estuvieron basados en el desarrollo de una solución de Inteligencia de Negocios y la creación del Datamart para la optimización estratégica de la información.
Con la implementación de inteligencia de Negocios permitió y se pretendió reducir los costos operativos y optimizar los tiempos en referencia al procesamiento de la información la cual facilitará a llevar un mejor manejo y control estratégico para la gerencia de la empresa y los encargados del acopio de productos.
CAPÍTULO 2: MARCO TEÓRICO 2.1. MARCO REFERENCIAL
2.1.1. La Producción en el Agro Peruano
Según, Villar C. Freddy (2007), la agricultura es la actividad más importante de nuestros pobladores rurales. Así mismo, el plantea las siguientes características:
Ocupa al 21% de la Población Económicamente Activa (2.7 millones de habitantes).
Aporta el 9% al PBI nacional (US$ 5.6 mil millones, a precios del año 1994).
Produce el 11% del valor total de las exportaciones nacionales (US$ 1,570 millones, 2005).
Significa en infraestructura de riego, el 16% de la inversión a nivel nacional (137 millones de dólares).
Representa el 80% de la provisión de alimentos para la población peruana.
Dependencia alimentaria en importaciones: arroz, 3%; vacuno, 2%; ave, 1%;
leche fresca, 12%; azúcar caña, 14%; MAD, 48%; trigo, 88%; aceites, 56%, entre otros.
Los indicadores sociales reflejan la pobreza en zonas rurales: desnutrición (41%), analfabetismo (26%), con necesidades básicas insatisfechas (67%).
Falta de acceso a servicios públicos básicos: educación, salud, saneamiento, infraestructura, seguridad alimentaria.
Es relevante el rol del sector agrícola y su desarrollo agroindustrial, aun cuando su participación en el crecimiento económico declina con el desarrollo, pues mantiene su papel fundamental en la seguridad alimentaria.
Por el contrario, la población residente en la sierra ha pasado de representar el 65%
a sólo 36% durante el mismo período. Por esta razón, las orientaciones básicas de las políticas agrícolas se formulan a menudo en el contexto de estrategias de desarrollo agrícola a mediano y largo plazo.
Según, el INEI (2014), el sector Agropecuario viene creciendo por 12 años consecutivos y durante el año 2013 aumentó en 2,20% por la mayor demanda externa de productos agroindustriales. El comportamiento del subsector agrícola está sustentado en la mayor producción de mango (146,6%), uva (20,9%), cacao (14,3%), caña de azúcar (6,0%) y papa (2,1%); en tanto, disminuyó la producción
de café en -19,7% como resultado de la plaga de la roya amarilla y el arroz cáscara en -0,3%.
2.1.2. La Agro Exportación en el Perú
La economía del Perú se basa en la exportación de recursos naturales, principalmente mineros, agrícolas y pesqueras. La incipiente industrialización del país -frenada en buena medida por la crisis económica de fines de los 80 y la apertura económica en los 90- y la escasez de inversión pública ha provocado que no se haya podido aprovechar efectivamente su riqueza en recursos naturales. Aun así, en la década de los 90, el PBI y las exportaciones crecieron a tasas anuales promedio del 3,97% y 8,0%, respectivamente. También aumentó al 3,9% la penetración de nuestros productos en el mercado externo medido por el coeficiente de exportaciones / PBI y; por otro lado, el efecto de las exportaciones en el crecimiento del PBI aumentó al 27,6%.
Como afirma (Martínez Lino) “Como es de conocimiento, la agricultura y la industria han sido consideradas tradicionalmente como dos sectores separados tanto por sus características como por su función en el crecimiento económico. La Agroindustria la podemos clasificar como la distinción entre industrias proveedoras de materias primas e industrias consumidoras de materias primas”
(FAO, 2009).
La producción agroindustrial de frutas, legumbres y hortalizas tiene un alto potencial de desarrollo, basado en la exportación al hemisferio norte, tanto debido a las especiales condiciones climatológicas del Perú, como a la disponibilidad de tierra agrícola. Se estima que la superficie cultivada actual podría duplicarse, con una adecuada identificación de cultivos en relación a las posibilidades que ofrecen las distintas zonas del país y la mejora en los sistemas de riego. Sin embargo, la principal limitación para una actual expansión de la frontera agrícola, insumo indispensable de la agroindustria, es la falta de una legislación adecuada respecto al acceso y uso de las tierras y aguas.
Actualmente en el Perú se cultiva unos 2,6 millones de hectáreas, de las cuales unas 180 mil corresponden a frutas y alrededor de 120 mil a hortalizas, situadas principalmente en la costa. Sin embargo, la mayoría de la producción se destina a los mercados nacionales para su consumo en estado fresco, con algunas excepciones como el espárrago, maracuyá, limón, mango, piña, cebolla y uvas, los
que son demandados por las plantas industriales, que los procesan para luego dirigirlos al mercado externo.
La agricultura peruana cuenta con más de 40 mercados internacionales abiertos, con demanda por cítricos, capsicum o ajíes, así como por la quinua, que ya se envía a la India, y las paltas, que llegan a China y Japón.
Según, el diario El Peruano, “de acuerdo con las estadísticas del Minagri, el Perú se encuentra entre los 10 primeros países proveedores de alimentos del mundo, y hasta el 2014 fue el número uno en espárrago, quinua y maca; el tercero en palta y alcachofa, y el cuarto en pimientos secos. Nuestro país también es el quinto productor mundial de uvas frescas y frijol; el sexto de mangos; el sétimo de mandarinas, café, jengibre; el noveno de aceitunas y habas; y el décimo de cebollas y arándanos.”
Según, el diario “El Comercio”, las Agroexportaciones peruanas (tradicionales y no tradicionales) sumó entre enero y abril de este año US$ 1,502 millones, 5% más que en el mismo periodo del 2016, cuando ascendieron a US$
1.432 millones, informó la Gerencia de Agroexportaciones de la Asociación de Exportadores (ADEX).
Los despachos agrarios tradicionales (US$ 112 millones 525 mil) presentaron un alza de 6,4% por la recuperación del café (US$ 77 millones 805 mil) que creció 7% y representó el 69,1% de los envíos totales. Otras partidas son los demás azúcares, lana sin cardar ni peinar, demás azúcares de caña o remolacha y cueros y pieles enteros de bovino.
De un total de 41 destinos, los cinco mercados que lideraron el ranking son EE.UU. (US$ 22 millones 109 mil) y Bélgica (US$ 14 millones 893 mil) que de forma conjunta representaron el 32,8% del total. Otros que destacaron por su crecimiento, independientemente de su monto, fueron España (58,3%) e India (51,8%).
2.2. MARCO TEÓRICO
2.2.1. Business Intelligence (BI): Inteligencia de Negocio 2.2.1.1. Definición
Es la combinación de tecnología, herramientas y procesos que me permiten transformar los datos almacenados en información, esta información en conocimiento y este conocimiento dirigido a un plan o una estrategia comercial.
La inteligencia de negocios debe ser parte de la estrategia empresarial, esta le permite optimizar la utilización de recursos, monitorear el cumplimiento de los objetivos de la empresa y la capacidad de tomar buenas decisiones para así obtener mejores resultados.
Como afirma (Díaz, 2012) “Business Intelligence se entiende al conjunto de metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y administración de información que permite tomar mejores decisiones a los usuarios de una organización”
2.2.1.2. Importancia
En las organizaciones hoy en día, se maneja un gran flujo de información el cual era inimaginable hace algunos años atrás. Gracias que la tecnología se puede llevar un mejor control de información, en este caso contamos con la inteligencia de negocios que nos brinda una variedad de herramientas.
La importancia del Business Intelligence para las empresas está en que estas herramientas permiten tener un control absoluto de la información, de esta forma las organizaciones pueden gestionar estos datos de forma más rápida y eficaz para así poder entender su situación actual, plantear posibles escenarios futuros y tomar decisiones más inteligentes basadas en el conocimiento.
2.2.1.3. Beneficios
Como beneficios que brinda a las empresas la inteligencia de negocios podemos determinar los siguientes:
Manejar el crecimiento. El reto para las empresas es evolucionar, es crecer y esto significa “cambio”. Que tan ágiles son los procesos para enfrentar los cambios y las necesidades puntuales de la empresa.
Control de costos. El manejo de costos es el detonador que fuerza muchas empresas a considerar una solución de inteligencia de negocios, para tener la capacidad de medir gastos y ver esto a un nivel de detalle que identifique la línea de negocio, producto, centro de costo, y otras.
Entender mejor los clientes. Las empresas almacenan toneladas de información valiosa relacionada a sus clientes. El reto es transformar esta información en conocimiento y este conocimiento dirigido a una gestión comercial que represente algún tipo de ganancia para la empresa.
Indicadores de gestión. Los indicadores de desempeño me permiten representar medidas enfocadas al desempeño organizacional con la capacidad de representar la estrategia organizacional en objetivos, métricas, iniciativas y tareas dirigidas a un grupo y/o individuos en la organización.
Dentro de las capacidades funcionales de los indicadores de gestión podemos mencionar: el monitoreo, análisis y la administración.
2.2.1.4. Arquitectura de Inteligencia de negocios
Una solución de Business Intelligence parte de los sistemas de origen de una organización (bases de datos, ERPs, ficheros de texto...), sobre los que suele ser necesario aplicar una transformación estructural para optimizar su proceso analítico.
Para ello se realiza una fase de extracción, transformación y carga (ETL) de datos. Esta etapa suele apoyarse en un almacén intermedio, llamado ODS, que actúa como pasarela entre los sistemas fuente y los sistemas destino (generalmente un Data Warehouse), y cuyo principal objetivo consiste en evitar la saturación de los servidores funcionales de la organización.
La información resultante, ya unificada, depurada y consolidada, se almacena en un Data Warehouse corporativo, que puede servir como base para la construcción de distintos Datamarts departamentales. Estos Datamarts se caracterizan por poseer la estructura óptima para el análisis de los datos de esa área de la empresa, ya sea mediante bases de datos transaccionales (OLTP) o mediante bases de datos analíticas (OLAP).
Figura 1. Arquitectura de BI
2.2.2. Data Warehouse 2.2.2.1. Definición
Como afirma (Silberschatz, Korth, & Sudarshan, 2006) “Un Data Warehouse (DW) es un gran repositorio lógico de datos que permite el acceso y manipulación flexible de grandes volúmenes de información provenientes tanto de transacciones detalladas como datos agregados de fuentes de distinta naturaleza”. Entonces con un adecuado repositorio de datos podemos recolectar y organizar la información necesaria para poder realizar un buen sistema de inteligencia de negocios para la toma de decisiones.
Una Data Warehouse es una base de datos diferente a la de los sistemas operacionales en cuanto a que:
Es orientado a sujetos.
Maneja grandes cantidades de información.
Comprende múltiples versiones de un esquema de bases de datos.
Condensa y agrega información.
Integra y asocia información de muchas fuentes de datos 2.2.2.2. Procesos básicos de un Data Warehouse
Un Data Warehouse es un lugar de almacenamiento, el almacenamiento es un proceso (R. Hackathorn, 1997). Estos procesos son:
Extracción:
El proceso de extracción consiste en estudiar y entender los datos fuente, tomando aquellos que son de utilidad para el Data Warehouse.
Transformación:
Una vez que los datos son extraídos, éstos se transforman. Este proceso incluye corrección de errores, resolución de problemas de dominio, borrado de campos que no son de interés, generación de claves, agregación de información, etc.
Carga e Índices:
Al terminar el proceso de transformación, se cargan los datos en el Data Warehouse.
Chequeo de Calidad:
Una vez ingresada la información al Data Warehouse, se realizan controles de calidad para asegurar que la misma sea correcta.
Liberación/Publicación:
Cuando la información se encuentra disponible, se le informa al usuario.
Es importante publicar todo cambios que se hayan realizado.
Consulta:
El usuario final debe disponer de herramientas de consulta y procesamiento de datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS, Datamining, etc.
Feedback:
A veces es aconsejable seguir el camino inverso de carga. Por ejemplo, puede alimentarse los sistemas legales con información depurada del Data Warehouse o almacenar en el mismo alguna consulta generada por el usuario que sea de interés.
Auditoría:
Los procesos de auditoría permiten conocer de donde proviene la información así como también qué cálculos la generaron.
Seguridad:
Una vez construido el Data Warehouse, es de interés para la organización que la información llegue a la mayor cantidad de usuarios pero, por otro lado, se tiene sumo cuidado de protegerlo contra posibles 'hackers', 'snoopers' o espías.
El desarrollo de Internet ha incrementado éste dilema.
Respaldo y Recuperación:
Se deben realizar actividades de backup y restore de la información, tanto la almacenada en el Data Warehouse como la que circula desde los sistemas fuente al Data Warehouse.
2.2.2.3. Elementos del Data Warehouse
Figura 2. Elementos de un DW
Sistemas Fuentes:
Es un sistema operacional, cuya función es capturar las transacciones típicas del negocio. La prioridad en este tipo de sistema la tienen las operaciones de actualización. Las consultas sobre estos sistemas son simples y su demanda está restringida. Mantienen pocos datos históricos.
Data Staging Area:
Área de almacenamiento y un conjunto de procesos que limpian, transforman, combinan, quitan duplicados, archivan y preparan los datos fuente para ser utilizados en el Data Warehouse.
Servidor de Presentación:
Máquina física en donde se almacenan y organizan los datos del Data Warehouse para luego ser consultados por reportes, consultas de usuario y otras aplicaciones.
Data Store:
Lugar en donde se integran los sistemas operacionales antes de ser cargados al Data Warehouse.
Metadata:
Toda información en el Data Warehouse que no sean los datos almacenados.
Data Warehouse:
Fuente de datos apta para consultas en una organización.
Datamarts:
Es un conjunto lógico del Data Warehouse. Una Data Warehouse se construye como la integración de varios Datamart.
OLAP (On-Line Analytic Processing):
La actividad de consultar y presentar de una forma específica los datos del Data Warehouse.
ROLAP (Relational OLAP):
Conjunto de interfaces de usuario y aplicaciones que dan a las bases relacionales un sabor multidimensional.
MOLAP (Multidimensional OLAP):
Conjunto de interfaces, aplicaciones y bases de datos propietarias que tienen un fuerte sabor multidimensional.
Aplicación Usuario Final:
Colección de herramientas que consultan, analizan y presentan la información necesaria para apoyar las necesidades del negocio.
Herramientas de Acceso de Usuario Final:
Son clientes del Data Warehouse, mantienen una sesión con el servidor de presentación mandándole sentencias SQL. La información obtenida es presentada de forma de pantalla, reporte, gráfico o alguna otra forma de análisis del usuario.
Aplicaciones de Modelado:
Cliente sofisticado del Data Warehouse, con capacidad analítica. Entre ellas se encuentran las herramientas de Datamining.
2.2.3. Metodología Kimball 2.2.3.1. Definición
Metodología Kimball o también llamado Modelo Dimensional (Dimensional Modeling), se basa en lo que se denomina ciclo de vida (Business Dimensional Lifecycle) (Ralph Kimball, Ross M., 2013). Este es el ciclo de vida del proyecto de Data Warehouse que está basado en cuarto principios básicos:
Centrarse en el negocio: Hay que concentrarse en la identificación de los requerimientos del negocio y su valor asociado, y usar esos esfuerzos para desarrollar relaciones sólidas con el negocio, agudizando el análisis del mismo y la competencia consultiva de los implementadores.
Construir una infraestructura de información adecuada: Diseñar una base de información única, integrada, fácil de usar, de alto rendimiento donde se refleja la amplia gama de requerimientos de negocio identificados en la empresa.
Realizar entregas en incrementos significativos: Crear el almacén de datos (DW) en incrementos entregables en plazos de 6 a 12 meses. Hay que usar el valor de negocio de cada elemento identificado para determinar el orden de aplicación de incrementos. En esto la metodología se parece a las metodologías agiles de construcción de software.
Ofrecer la solución completa. Proporcionar todos los elementos necesarios para entregar valor a los usuarios de negocios. Para comenzar, esto significa tener un almacén de datos sólidos, bien diseñado, con calidad probada, y accesible. También se deberá entregar herramientas de conducta ad hoc, aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio web y documentación.
2.2.3.2. Modelo Dimensional
En el modelo dimensional se constituyen modelos de tablas y relaciones con el propósito de optimizar la toma de decisiones, con base en las consultas hechas en una base de datos relacional que están ligadas con la medición o un conjunto de mediciones de los resultados de los procesos de negocio.
El modelo Dimensional es una técnica de diseño lógico que tiene como objetivo presentar los datos dentro de un marco de trabajo estándar e intuitivo, para permitir su acceso con un alto rendimiento. Cada Modelo Dimensional está compuesta por una tabla con una llave combinada, llamada tabla de hechos, y un
conjunto de tablas más pequeñas llamadas tablas de dimensiones. Los elementos de estas tablas se pueden definir de la siguiente forma:
Hechos: Es una colección de piezas de datos y datos de contexto. Cada hecho representa una parte del negocio, una transacción o un evento.
Dimensiones: Es una colección de miembros, unidades o individuos del mismo tipo.
Medidas: Son atributos numéricos de un hecho que representan comportamiento del negocio relativo a una dimensión.
Una base de datos consta de una o más tablas, y las relaciones entre todas las tablas de la base de datos se denomina colectivamente el esquema de base de datos. Aunque hay muchos diseños de esquema diferentes, las bases de datos en las que se realizan consultas de datos históricos generalmente utilizan un diseño de esquema dimensional. Entre los esquemas tenemos dos modelos principales:
Modelo Estrella
Un esquema de estrella es un tipo de esquema de base de datos relacional que consta de una sola tabla de hechos central rodeada de tablas de dimensiones.
Este esquema es ideal por su simplicidad y velocidad para ser usado en análisis multidimensionales (OLAP, Datamarts y otros), permite implementar la funcionalidad de una base de datos multidimensional utilizando una clásica base de datos relacional. El cual también tiene y brinda una simplicidad en relación al usuario final en poder hacer las consultas de manera dinámica y eficaz de la información obtenida.
Figura 3. Esquema Estrella
Modelo Copo de nieve
El esquema de copo de nieve consta de una tabla de hechos que está conectada a muchas tablas de dimensiones, que pueden estar conectadas a otras tablas de dimensiones a través de una relación de muchos a uno.
Este esquema se implementa sobre base de datos relacionales (ROLAP), un elemento clave es el cubo OLAP. Estos cubos (también llamados hipercubos) almacenan grandes volúmenes de datos que posteriormente deben ser analizados en función de unos determinados parámetros.
Las tablas de un esquema de copo de nieve generalmente se normalizan en el tercer formulario de normalización. Cada tabla de dimensiones representa exactamente un nivel en una jerarquía.
Figura 4. Esquema Copo de nieve
2.2.3.3. Etapas de la Metodología Kimball
Figura 5. Metodología Kimball (Ralph Kimball, 1997)
A. Planificación del proyecto
En este proceso de planificación se determina el propósito del proyecto de DW/BI, sus objetivos específicos y el alcance del mismo, los principales riesgos y una aproximación inicial a las necesidades de información. Esta etapa se centra en definir los recursos, el alcance, identificar, programar y planificar las tareas.
B. Definición de Requerimientos del Negocio.
Proceso determinante para el éxito del proceso del Data Warehouse (DW), basado en la interacción directa con el negocio, conocer sobre el negocio, personal, clientes y competidores. Todo este proceso se realiza por medio de análisis de documentos internos, entrevistas al personal y un estudio externo de la organización.
C. Modelado Dimensional
El proceso de diseño comienza con un modelo dimensional de alto nivel obtenido a partir de los procesos priorizados de la matriz descrita en el punto anterior. El proceso iterativo consiste en 4 pasos:
Establecer el proceso de negocio.
Establecer el nivel de granularidad.
Elegir las dimensiones.
Identificar medidas y las tablas de hechos.
D. Diseño Físico
Esta etapa es la base fundamental para el soporte de las estructuras necesarias en el diseño lógico. En el cual se determinan los estándares del entorno de la base de datos.
E. Diseño de la arquitectura técnica
Esta etapa está relacionado con los procesos y herramientas que se aplican a los datos. En el área técnica existen dos conjuntos que tienen distintos requerimientos, brindan sus propios servicios y componentes de almacenaje de datos: Back room: Responsable de la obtención y preparación de los datos, por lo que también se conoce como adquisición de datos. Front room es responsable de entregar los datos a la comunidad de usuario y también se le conoce como acceso de datos.
F. Diseño e implementación del subsistema de ETL
El subsistema de Extracción, Transformación y Carga (ETL) es la base sobre la cual se alimenta el Data Warehouse. Si se diseña adecuadamente, puede extraer los datos de los sistemas de origen de datos, aplicar diferentes reglas para aumentar la calidad y consistencia de los mismos, consolidar la información proveniente de distintos sistemas, y finalmente cargar (grabar) la información en el DW en un formato acorde para la utilización por parte de las herramientas de análisis.
G. Implementación
La implementación representa la convergencia de la tecnología, los datos y las aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Existen varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitación, el soporte técnico, la comunicación y las estrategias de feedback.
H. Mantenimiento y crecimiento del DW
Para administrar el entorno del Data Warehouse existente es importante enfocarse en los usuarios de negocio, los cuales son el motivo de su existencia, además de gestionar adecuadamente las operaciones del Data Warehouse, medir y proyectar su éxito y comunicarse constantemente con los usuarios para establecer un flujo de retroalimentación, En esto consiste el mantenimiento. Finalmente, es importante sentar las bases para el crecimiento y evolución del Data Warehouse en donde el aspecto clave es manejar el crecimiento y evolución de forma iterativa
utilizando el Ciclo de vida propuesto, y establecer las oportunidades de crecimiento y evolución en orden por nivel prioridad.
I. Selección de productos e instalación
Se evalúa y selecciona cuales son los componentes necesarios específicos de la arquitectura (plataforma de hardware, motor de la BD, herramienta de ETL, etc.).
J. Desarrollo de aplicaciones para usuario finales
Involucra configuraciones de los metadatos y construcción de reportes específicos.
K. Especificación de aplicaciones de BI
En esta tarea se proporciona, a una gran comunidad de usuarios una forma más estructurada y por lo tanto, más fácil, de acceder al almacén de datos. Se proporciona este acceso estructurado a través de lo que llamamos, aplicaciones de inteligencia de negocios (Business Intelligence Aplications). Las aplicaciones de BI son la cara visible de la inteligencia de negocios: los informes y aplicaciones de análisis proporcionan información útil a los usuarios. Las aplicaciones de BI incluyen un amplio espectro de tipos de informes y herramientas de análisis, que van desde informes simples de formato fijo, a sofisticadas aplicaciones analíticas que usan complejos algoritmos e información del dominio.
2.3. HIPÓTESIS DE INVESTIGACIÓN
2.3.1. Hipótesis general
Se implementará una solución de inteligencia de negocios en el acopio de productos agroindustriales para la empresa mediante la creación de un Data Warehouse.
2.3.2. Identificación y operacionalización de variables 2.3.2.1. Identificación de variables
Variable descriptiva:
X: Solución de inteligencia de negocios.
2.3.2.2. Operacionalización de variables: Indicadores
Tabla 1. Operacionalización de Variables
Ítem Variables Indicador Definición Conceptual
Definición
Operacional Instrumento Fuente
I1
Variable descriptiva:
Solución de Inteligencia de Negocios
Información de calidad.
Accesibilidad a la
información.
Confiabilidad de la
información.
Es la posibilidad tienen las organizaciones de ampliar sus oportunidades, tales mejorar y controlar su productividad y establecer una mejor posición competitiva en el mercado
Se refiere a la utilización de la herramientas de Inteligencia de Negocios, tales como:
Microsoft SQL Server 2017 y Microsoft Excel 2013
Ficha de
observación Base de Datos
Fuente: Elaboración propia
CAPÍTULO 3: DESARROLLO METODOLÓGICO 3.1. DISEÑO DE LA INVESTIGACIÓN
3.1.1. Tipo de investigación
La investigación es de tipo Descriptiva. Se considera investigación descriptiva aquella en la cual se analiza como es y se manifiesta un fenómeno y sus componentes. (Hernández Sampieri, Roberto, 2014).
3.1.2. Modelo teórico
Se utilizó la Metodología Ralph Kimball. Es una metodología empleada para la construcción de un almacén de datos (Data Warehouse, DW) que no es más que, una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza (Kimball, R., 2013).
3.1.3. Diseño de la investigación
El diseño de investigación es no Experimental - Transaccional. Es aquella investigación que se encarga de recolectar datos en un solo momento, en un tiempo único. Su propósito es describir variables en un momento dado (Hernández Sampieri, Roberto, 2014).
3.1.4. Método de investigación
Se empleó el método cuantitativo. (Rodríguez Peñuelas (2010, p.32), señala que el método cuantitativo se centra en los hechos o causas del fenómeno social, con escaso interés por los estados subjetivos del individuo. Este método utiliza el cuestionario, inventarios y análisis demográficos que producen números, los cuales pueden ser analizados estadísticamente para verificar, aprobar o rechazar las relaciones entre las variables definidas operacionalmente, además regular la presentación de resultados de estudios cuantitativos viene sustentada con tablas estadísticas, gráficas y un análisis numérico.
La técnica de investigación que se utilizó en este caso fue de acuerdo a la observación de datos. Anexo N° 2
3.1.5. Uso de software de tratamiento y análisis
Toda la información esta computarizada y los datos cuantitativos obtenidos para el proyecto serán analizados e interpretados mediante el uso de software que son el Analysis Services de Microsoft SQL Server 2017 y Microsoft Excel.
3.2. COBERTURA DEL ESTUDIO
3.2.1. Población
La población del proyecto fue tomado del total de registros en el acopio de productos en la empresa obtenida de la base de datos y atendiendo los requerimientos de satisfacción que requiere principalmente el gerente de la empresa para la toma de decisiones.
3.2.2. Muestra
Se tomó como muestra toda la información obtenida de la base de datos entre los años 2013, 2014,2015 y 2016 para el presente trabajo.
3.3. RECOLECCIÓN DE DATOS E INFORMACIÓN
Los datos e información se obtuvieron principalmente de la base de datos del sistema transaccional con la que cuenta la empresa, siendo el modelo de la base la siguiente:
Figura 6. Origen de Obtención de datos.
3.4. ANÁLISIS Y PROCESAMIENTO DE INFORMACIÓN
3.4.1. ETAPA 1: PLANEACIÓN Y ADMINISTRACIÓN DEL PROYECTO
Para el presente proyecto se utilizó la metodología de Ralph Kimball que para este caso es el más adecuado para dar un buen seguimiento en el desarrollo de la Solución de Inteligencia de Negocios.
3.4.1.1. Definición del proyecto
Habiendo analizado la situación problemática de la empresa se observó que tiene la necesidad de contar con un Sistema de Inteligencia de Negocios para así poder brindar y describir las características sobre la información en el acopio de productos a los encargados y al gerente para un mayor apoyo en sus decisiones.
3.4.1.2. Preparación para un proyecto de Data Warehouse
Después de haber planteado y presentado el proyecto a la Empresa Agroindustrial, este mostro un gran interés en el desarrollo del presente proyecto, en la cual se contará con el apoyo de la gerencia y el área involucrada en brindar toda la información solicitada (Base de Datos).
3.4.1.3. Alcance
El principal objetivo del proyecto fue centrado en el desarrollo e implementación de una Solución de Business Intelligence (BI). La solución se dio en el área del acopio de productos en el cual se abarco lo siguiente:
Para dar solución a los requerimientos se desarrolló, los cubos de información correspondientes, siendo los encargados y responsables relacionados en el acopio de productos quienes analicen los cubos.
Se desarrolló el Datamart requerido para analizar los datos necesarios que conformaron el Data Warehouse.
Se obtuvo y genero los reportes dinámicos de la información requerida de acuerdo a las necesidades de la empresa en dicha área ya mencionada.
3.4.1.4. Planificación del proyecto
Después de analizar la necesidad de implementar Business Intelligence en la empresa Agroindustrial se asignó los siguientes roles para tener a los responsables durante la realización del proyecto:
Beneficiarios: General: Empresa Agroindustrial.
Específicos: Gerente de la empresa y encargados del acopio de productos.
Administrador de Sistema y Base de datos: Encargado del área tecnológica.
Diseñador y desarrollador de proyecto: Tesista (Montero Silva Boris Javier).
Personal involucrado: Gerente y encargados de área.
3.4.1.5. Administración del proyecto
Se realizó el desarrollo del proyecto mediante un monitoreo y administración de los avances realizados, pruebas, y presentación total del Sistema BI por parte del gerente y los responsables involucrados, siguiendo el cronograma establecido anteriormente.
3.4.2. ETAPA 2: DEFINICIÓN DE LOS REQUERIMIENTOS DEL NEGOCIO Los requerimientos fueron obtenidos y analizados de acuerdo a las entrevistas realizadas al gerente de la empresa y los encargados en el acopio de productos, quienes serán los que interactúen con los Datamart para el análisis de la información estratégica, como también se dio la observación a la base de datos, obteniendo así los siguientes requerimientos:
3.4.2.1. Requerimientos funcionales del usuario final
1) Requerimiento N° 1. Permitir conocer los acopiadores por zonas.
2) Requerimiento N° 2. Permitir conocer los productos por zonas.
3) Requerimiento N° 3. Permitir conocer los productos por acopiador.
4) Requerimiento N° 4. Permitir conocer los acopiadores por producto.
5) Requerimiento N° 5. Permitir conocer los productos ingresados por mes determinado.
6) Requerimiento N° 6. Permitir conocer la cantidad de productos ingresados por acopiador al mes.
7) Requerimiento N° 7. Permitir conocer la cantidad de productos ingresados por acopiador al año.
8) Requerimiento N° 8. Permitir conocer los acopiadores más solicitados por determinado mes.
9) Requerimiento N° 9. Permitir conocer los acopiadores más frecuentes por año.
10) Requerimiento N° 10. Permitir conocer los productos más ingresados frecuentemente.
11) Requerimiento N° 11. Permitir conocer los gastos por acopiador en un mes determinado.
12) Requerimiento N° 12. Permitir conocer los gastos por productos en un mes determinado.
13) Requerimiento N° 13. Permitir conocer el gasto total al año por productos.
14) Requerimiento N° 14. Permitir conocer el gasto total al año por acopiador.
3.4.2.2. Requerimientos no funcionales
Se solicita por parte de la empresa que se obtenga información de calidad y estratégica para el buen control y almacenamiento en el acopio de los productos.
Se requiere establecer una adecuada seguridad en la administración de la información mediante el Datamart que se obtendrá.
Para la realización e implementación de la inteligencia de negocios se hará uso de las siguientes herramientas tecnológicas: Microsoft SQL Server 2017 Analysis Services como herramienta de diseño y construcción de los cubos y Microsoft Office Excel 2013 para la presentación de la información obtenida del Datamart.
Para el desarrollo del proyecto se realizará el procesamiento de los datos obtenidos y proporcionados por la empresa mediante el análisis de los requerimientos funcionales y no funcionales.
3.4.3. ETAPA 3: DISEÑO DE LA ARQUITECTURA TÉCNICA
En el diseño de la arquitectura de la Solución de Inteligencia de Negocios, tomamos como referencia las capas que conforman el diseño: Datos, Back Room y Front Room.
3.4.3.1. Datos
Para llevar a cabo la implantación de la aplicación BI, se creó los procesos necesarios para obtener los datos que formaran parte de la información de los Datamart.
Actualmente los datos que conforman la información total de la empresa esta almacenada e implementada en Microsoft SQL Server 2008, estos datos fueron obtenidos y analizados directamente de la base de datos.
Para el desarrollo del Datamart y el cubo correspondiente, se requirió de la información relacionada a los acopiadores, productos, zonas, precios e ingresos.
En este caso se hizo uso de las siguientes tablas de la base de datos actual de la empresa:
CALIQCOM
DELIQCOM
ACOPIA
ZONA
PRODUCTO
VARIEDAD
3.4.3.2. Back Room - Fuente de Datos
Los datos fueron extraídos de la base de datos transaccional donde está alojada la información de la empresa hacia el Datamart en el que se establecerá y realizará el proceso ETL.
3.4.3.3. Front Room – Sistema de Información Ejecutiva.
Luego que el Datamart fue diseñado y estructurado, se procede al poblamiento del Data Warehouse creado con respecto a los requerimientos analizados por la empresa, y con esto se obtiene la información estratégica que fue solicitada en el presente proyecto para ser ejecutada, procesada y analizada por el gerente y los encargados en el momento que lo requieran.
3.4.3.4. Modelo Transaccional de la Base de Datos
Figura 7. Modelo Base de Datos Transaccional
3.4.4. ETAPA 4: MODELO DIMENSIONAL 3.4.4.1. Elección de proceso de Negocios
En esta etapa que tiene el modelo propuesto de la metodología de Ralph Kimball, después de haber obtenido y detectado los requerimientos funcionales y no funcionales, en coordinación con la empresa se estableció que el proyecto se centra principalmente en el proceso de obtener información estratégica y de calidad en el acopio de productos, ya que este es el proceso del cual dependerán los demás procesos a seguir. Método consiste en cuatro componentes: Elección del Datamart, elección del objetivo de la tabla de hechos, elección de las dimensiones, elección de los hechos.
a) Elección del Datamart
En este componente ya establecido el proceso en el cual se desarrollará el proyecto, identificaremos el posible Datamart el cual será diseñado para la empresa.
b) Elección del Objetivo de la Tabla de Hechos y Medidas
Siendo la tabla de hechos ya identificada de nombre “Acopio_Productos” que se utilizara en la elaboración del Datamart, tiene como objetivo principal el de almacenar y procesar los datos necesarios para obtener la información estratégica requerida por la empresa.
Tabla 2. Hechos y Medidas
Tabla de hechos Objetivo
Acopio_Productos
“Obtener y manejar un mejor control de información estratégica
en el acopio de productos”.
Medidas
Cantidad
Precio_Compra
Fuente: Elaboración propia
c) Elección de las Dimensiones
Luego de identificar la tabla de hechos, procedemos a establecer sus dimensiones siendo estas las siguientes:
Dim_Productos
Dim_Acopiadores
Dim_Zonas
Dim_Tiempo
d) Elección de los Hechos
Dentro de la identificación de la tabla de hechos también podemos definir los hechos:
Tabla 3. Hechos
Tabla de Hechos Hechos
IngresoProductos
Cantidad Productos Ingresados Cantidad Acopiadores
Gastos por Productos Gastos por Acopiadores
Fuente: Elaboración propia
3.4.4.2. Nivel de Granularidad
Dimensión Producto
Dimensión Acopiadores
Dimensión Zona
Dimensión Tiempo
3.4.4.3. Esquema del modelo dimensional
Después del haber realizado el análisis y la identificación de la tabla de hechos y las dimensiones se obtuvo el siguiente modelo dimensional final:
Figura 8. Esquema del modelo de datos Dimensional
3.4.4.4. Sentencias SQL para crear el Datamart
CREATE DATABASE [DWAGROPERU]
go
use [DWAGROPERU]
go
CREATE TABLE [dbo].[DIM_ACOPIADOR]
(
[Acopiador_Key] [int] IDENTITY(1,1) NOT NULL, [Cod_Acopiador] [char](11) NOT NULL,
[Apellido_Pat] [varchar](30) NULL, [Apellido_Mat] [varchar](30) NULL, [Nombre_Acopiador] [varchar](30) NULL, [DNI] [char](8) NULL,
) go
CREATE TABLE [dbo].[DIM_PRODUCTO]
(
[Nombre_Producto] [varchar](50) NULL, [Producto_Key] [int] NOT NULL,
) go
CREATE TABLE [dbo].[DIM_ZONA]
(
[Nombre_Zona] [varchar](60) NULL, [Zona_Key] [int] NOT NULL,
) go
CREATE TABLE [dbo].[TIEMPO]
(
[INDICE] [char](8) NOT NULL, [Año] [char](4) NULL,
[Semestre] [char](10) NULL, [Trimestre] [char](10) NULL, [Bimestre] [char](10) NULL, [DesMes] [varchar](10) NULL, [Mes] [char](2) NULL,
[Dia] [char](2) NULL, )
go
CREATE TABLE [dbo].[ACOPIO_PRODUCTOS]
(
[Acopiador_Key] [int] NULL, [cod_acopiador] [char](11) NULL, [Producto_Key] [int] NOT NULL, [Zona_Key] [int] NOT NULL,
[Tiempo_Key] [char](8) NOT NULL, [Cantidad] [float] NOT NULL, [Precio_Compra] [float] NOT NULL
CONSTRAINT FK_Acopiador_Key FOREIGN KEY (Acopiador_Key) REFERENCES Dim_Acopiador (Acopiador_Key),
CONSTRAINT FK_Producto_Key FOREIGN KEY (Producto_Key) REFERENCES Dim_Producto (Producto_Key),
CONSTRAINT FK_Zona_Key FOREIGN KEY (Zona_Key) REFERENCES Dim_Zona (Zona_Key),
CONSTRAINT FK_Tiempo_Key FOREIGN KEY (Tiempo_Key) REFERENCES Tiempo (INDICE),
PRIMARY KEY(Acopiador_Key,Producto_Key,Zona_Key,Tiempo_Key) )
go
3.4.4.5. Modelado lógico del Datamart
Figura 9. Modelado Lógico del Datamart
3.4.5. ETAPA 5: DISEÑO FÍSICO 3.4.5.1. Modelo Físico del Datamart
Figura 10. Modelo Físico del Datamart
3.4.5.2. Diccionario de datos del Datamart
Acopiador
Tabla 4. Diccionario de datos Dim_Acopiador
Llave Nombre del Atributo Tipo de Dato Descripción
KEY Acopiador_key Int Clave que identifica
al acopiador
Cod_Acopiador Char(11) Código del
Acopiador Apellido_Pat Varchar(30) Apellidos Paterno
del Acopiador Apellido_Mat Varchar(30) Apellidos Materno
del Acopiador Nombre_Acopiador Varchar(30) Nombres del
Acopiador
DNI Char(8)
Documento Nacional de Identificación del
Acopiador
Fuente: Elaboración propia
Producto
Tabla 5. Diccionario de datos Dim_Producto
Llave Nombre del Atributo Tipo de Dato Descripción
KEY Producto_key Int
Clave que identifica al
producto Nombre_Producto Varchar(50) Descripción del
Producto
Fuente: Elaboración propia
Zona
Tabla 6. Diccionario de datos Dim_Zona
Llave Nombre del Atributo Tipo de Dato Descripción
KEY Zona_key Int Clave que
identifica la Zona Nombre_Zona Varchar(60) Descripción de la
Zona
Fuente: Elaboración propia
Tiempo
Tabla 7. Diccionario de datos Dim_Tiempo
Llave Nombre del Atributo Tipo de Dato Descripción
KEY INDICE Char(8) Clave de la
Dimensión Tiempo
Semestre Char(10)
Semestre del ingreso de los
Productos
Bimestre Char(10)
Bimestre del ingreso de los
Productos
Trimestre Char(10)
Trimestre del ingreso de los Productos
Año Char(4) Año del ingreso de
los Productos
Mes Char(2) Mes del ingreso de
los Productos
Dia Char(4) Día del ingreso de
los Productos DesMes Varchar(10) Descripción del
Mes
Fuente: Elaboración propia
3.4.6. ETAPA 6: SELECCIÓN DE PRODUCTOS
Para el desarrollo del proyecto y su implementación se hizo la elección de los siguientes productos de herramientas tecnológicas:
3.4.6.1. Hardware
Para el soporte, la instalación de software, la base de datos y de los servidores OLAP, se obtuvo las siguientes características de Hardware:
Servidor
Tabla 8. Características de Servidor
Nombre Servidor ProLiant E5-2620 V3
Procesador Dual Intel Xeon E5 - 2620V3/3.2 GHz
Memoria Cache 15 MB SmartCache
Memoria RAM 64 GB - DDR4 1600/1866
Disco Duro 2 × 2TB
Fuente: Elaboración propia
PC Usuario
Tabla 9. Características de PC Usuario
Producto Equipo de cómputo en oficina
Marca ADVANCE VISSION VS6755
Modelo VISSION VS6755
Procesador INTEL CORE i3 4170 3.70 GHz 3 MB CACHE L3
Memoria RAM 8 GB – DDR3
Disco Duro 1TB – SATA 6.0 Gb/s
Almacenamiento Óptico DVD SUPERMULTI
Monitor LED – 19.5 PULG – 1600×900
Sistema Operativo WINDOWS 8.1 PRO – 64 BITS EN ESPAÑOL
Fuente: Elaboración propia