Capítulo III: Aplicación de la solución
3.2 Suite de BI Pentaho
Primeramente, se extraen los datos, se cargan y transforman a través del Data integration después se visualiza el cubo y se construyen un grupo de reportes como como los OLAP (On-Line Analytical Processing), ad-Hoc y Dinámicos con los cuales la dirección de la entidad objeto de estudio puede apoyar sus decisiones
Desarrollo de las ETL
Para el desarrollo del mercado de datos se diseñaron varias ETL las cuales responden a las dimensiones y tablas de hechos mencionadas en la bus matrix en la tabla 2.3, estas ETL se encargan de extraer, transformar y cargar los datos al datamart dividiéndolos en dos grupos, hechos y dimensiones ya que el modelo en estrella del datamart así lo exige.
Las fuentes de los datos a utilizar son a partir de la base de datos elaborada por el autor a la empresa. Esta base de datos cuenta con la información necesaria para que la extracción solo sea realizada desde la misma.
El desarrollo de dichas ETL se realiza con la debida secuencia lógica, donde primero se cargan las dimensiones y por último las tablas de hechos. A continuación, se muestran las ETL utilizadas en este proyecto.
La ETL mostrada en la figura 3.3 correspondiente a la dimensión plantilla fue elaborada a partir de la extracción de los datos de la tabla plantilla de la base de datos operacional y luego se le hicieron las coincidencias con la tabla colaboradores para obtener los atributos necesarios para la confección de la dimensión.
67 La ETL que aparece en la 3.4 fue creada únicamente a través de los steps de suite de Pentaho, en esta ETL el autor le crea un atributo fecha a partir de la generación de filas, se le realiza el cálculo correspondiente para que tenga la fecha de cada día y luego se normalizan los valores de forma tal que pueda conocerse a que mes, trimestre, semestre, y año pertenece cada fecha. Cabe resaltar que esta dimensión nos provee distintas perspectivas para el análisis de la información.
Figura 3.4: Modelo de la dimensión tiempo.
En la figura 3.5 se muestra la ETL de modalidad donde el autor le realiza la entrada a la tabla modalidad y luego les realiza los cambios correspondientes a sus atributos para ser insertados en la base de datos con la actualización de los mismos.
68
Figura 3.5: Modelo de la dimensión modalidad
El proceso de transformación y carga de la dimensión categoría se muestra en la tabla 3.6 es bastante similar al anterior, solo que se extraen los datos de la tabla categoría y se actualizan en la base de datos.
Figura 3.6: Modelado de la dimensión categoría.
A continuación, se describirá como fue el proceso de extracción, transformación y carga de las ETL de las tablas de hechos. Para lograr la correcta carga de datos en el datamart es preciso primero haber procesado las ETL de las dimensiones anteriores para que las tablas de hechos puedan adquirir las llaves foráneas de las dimensiones ya descritas. Para la obtención de las llaves foráneas se les hará coincidir a las dimensiones y las tablas de la base de datos operativa mediante los identificadores que presentan las tablas de la base de datos operativa, así como las dimensiones que fueron generadas a través de las mismas. Los datos fueron filtrados y calculados según las necesidades de información.
En las figuras 3.7, 3.8 y 3.9 se muestran las ETL del modelo estrella en constelación de hechos con las tablas de hechos bajas, disponible y plantilla respectivamente. (En cuestión de elaboración, las ETL de las tablas de hechos son muy similares). En las misma se transforman todos los datos necesarios para la visualización del cubo con los valores pre calculados para cada una de ellas en específico de los hechos y la actualización en el mercado de datos.
69
Figura 3.7: Modelo de la tabla de hecho baja
70
Figura 3.9: Modelo de la tabla de hecho plantilla.
En la siguiente figura (3.10) se muestran Base de datos final para el mercado de datos a partir de las trasformaciones donde se muestran todos los datos del mercado de datos para ser analizado posteriormente.
71
Construcción de los cubos
Los servidores de base de datos OLAP utilizan estructuras multidimensionales para almacenar datos y relaciones entre los datos. Las estructuras multidimensionales pueden visualizarse como cubos de datos y como cubos dentro de cubos de datos. Cada lado del cubo es una dimensión.
En las figuras 3.11 y 3.12 se muestran la construcción de los cubos a través teniendo en cuenta cada dimensión y la medida.
72 Figura3.12: Construcción del cubo para la publicación de los datos
Reporte OLAP
Después de acceder a la interfaz de Pentaho y seleccionar un (New Analysis View) se selecciona el cubo y el esquema deseado para el reporte, el cual se puede ir desagregando por cada uno de los campos que tenga dicho reporte, además que existe una barra en la parte superior del reporte que da la posibilidad de configurar el mismo.
El siguiente reporte muestra los códigos de un grupo de entidades que pertenecen a un municipio y se pueden visualizar los ingresos asociados a estas entidades, teniendo como criterio los ingresos por cada colaborador perteneciente a cada entidad.
73 Figura3.13: Reporte OLAP de los ingresos de las entidades del municipio Florida.
Partiendo de la necesidad de priorizar entidades a la hora de destinar inversiones a los centros de trabajo de mayor desempeño, según el aporte de los colaboradores que se encuentran cumpliendo misión. Con este reporte la dirección de salud y en particular la dirección del departamento de colaboración puede apoyar el proceso de decisiones asertivas sobre el plan de presupuestos para mantenimientos constructivos u otras partidas para el mejoramiento de dichas entidades teniendo en cuenta que planes anteriores no consideraban los ingresos de los colaboradores, en el tiempo y por tipos de colaboraciones.
74 Figura3.13: Reporte OLAP por los ingresos, ganancias por cantidad de colaboradores.
Esta visualización de los datos se realiza a partir de periodo de tiempo determinados mostrado a la izquierda del reporte, la cantidad de colaboradores, los ingresos totales y las ganancias.
Con esta visualización de los datos se pueden hacer análisis para la distribución de los recursos teniendo en cuenta distintos periodos de tiempo para la movilidad de los colaboradores durante todo el mes para evitar un grupo de indisciplinas respecto a la entrada y salida de los colaboradores con la utilización de pasaporte, el no cumplir los términos de aviso previo, o no regresar en el tiempo establecido de las vacaciones programadas y/o licencia no retribuida entre otras.
75
Reporte ad-Hoc
En la suite de Pentaho existen varias herramientas para hacer reportes ad-hoc, en este caso se utilizó para la generación de indicadores Pentaho report disegner, esta herramienta permite diseñar reportes para el usuario final.
En la figura 3.14 se muestra la herramienta de diseño con las diferentes áreas que contienen el reporte para una mejor visualización del usuario final que en este caso es de la dirección de Salud Pública en la Provincia de Camagüey.
El diseño del reporte tiene tres dimensiones relacionadas con el mismo, la dimensión tiempo para ver el periodo de tiempo que se solicítate para dicho reporte, la dimensión baja de colaboradores con las causas asociadas a dicha baja y el balance de dichas bajas con las perdidas asociadas a las mismas.
76 .
Conclusiones Parciales
1. El desarrollo de la interface para la creación DB transaccional en php interactiva con la web posibilita al usuario una mejor comprensión del sistema siendo una herramienta de mucha utilidad.
2. Los reportes generados por la solución informática le permiten al usuario tener una detallada explicación del sistema siendo este de gran ayuda para la dirección de Salud Pública en la Provincia de Camagüey en generar y en particular para el departamento de colaboración.
77
Conclusiones Generales
78
Conclusiones generales.
1. Después de un análisis bibliográfico se evaluaron las metodologías de Bill Inmon y Ralph Kimball determinándose a partir de distintos criterios que la metodología de Kimball era la adecuada para dicha aplicación.
2. Se desarrolló una solución de inteligencia de negocio siguiendo la metodología de Kimball con las características de la entidad objeto de estudio que soporte el sistema de información.
3. La aplicación de la solución posibilitó gestionar y visualizar exitosamente los datos generados en el departamento de colaboración mediante un mercado de datos que permite a los mismos tener una comprensión óptima de la aplicación para apoyar el proceso de toma de decisiones.
79
Recomendaciones
80
Recomendaciones.
1. Lograr reportes dinámicos y consultas ad-hoc con mayor profundidad y teniendo en cuenta otros posibles mercados de datos y en dependencia de las necesidades de la dirección y de las decisiones a tomar.
2. Perfeccionar el sistema transaccional, a partir de la utilización de un sistema gestor de base de datos más profesional y potente que el usado en el proyecto. 3. Perfeccionar la interfaz gráfica, de manera que le facilite el uso de la solución a
82
Bibliografía.
1. ALTER, S. 1980. Decision support systems: current practice and continuing challenges.
2. BALLARD, C., ABDEL-HAMID A, FRANKUS R, HASEGAWA F, LARRECHART J, LEO P & RAMOS J 2006. Improving Business Performance Insight with Business Intelligence and Business Process Management.
3. BDDIMENSIONALES. 2016. Base de Datos Dimensionales. Obtenido de wikispces:
https://bddimensionales.wikispaces.com/Modelado+Dimensional%20- %20Modelos%20dimensionales.
4. BLANCO, C. J. Q., SAKIPOVA, D. Y. T. & CORDERO, D. V. Módulo de Inteligencia de Negocio en un sistema de control de la producción en plantas de generación de energía distribuida.
5. BOID10. 2011. BOID10, Information Desing Tool. SAP.
6. BOUMAN, R. & VAN DONGEN, J. 2010. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL., Indianapolis, Indiana, Wiley Publishing.
7. BRESLIN, M. 2004a. Data Warehousing Battle of the Giants. 9.
8. BRESLIN, M. 2004b. Data Warehousing Battle of the Giants : Comparing the Basics of the Kimball and Inmon Models. 9, 6–20.
9. BREZANY, F., ZHANGY, Y., JANCIAK, I. & CHEN, P. 2013. An Elastic OLAP Cloud Platform. 353-363.
10. CIENTEC, S. F. 2014. Claves y Componentes de la Inteligencia de Negocio [Online]. Available: http://www.cientec.com/analisis/ana-claves.html.
11. CRONO. 2010. Business Inteligence. Obtenido de BI: http://businessintelligence.es/crono-etl.html
12. CODY, W. F., KREULEN, J. T., KRISHNA, V. & SPANGLER, W. S. 2002. The integration of business intelligence and knowledge management. IBM systems journal, 41, 697-713.
13. CORPORATION, M. 2004. Guía de Estrategia de Business Intelligence. 14. DBVIS, S. (2017). DbVisualizer. Obtenido de DbVisualizer:
https://www.dbvis.com/
15. DOMINGUES, M., JORGE, A., SOARES, C., LEAL, J. & MACHADO, P. 2007. A Data Warehouse for Web Intelligence. 487-499.
16. DRESNER, H. 1992. El centro de la competencia de la Inteligencia de Negocio. Available: http://www.gartner.com/technology/home.jsp.
17. DRUZDZEL, M. & FLYNN, R. 1999. Decision Support Systems. Encyclopedia of Library and Information Science.
18. ETL - Tools. 2017. Business Intelligence - Almacenes de Datos - ETL. Obtenido de ETL - Tools.Info: http://etl tools.info/es/bi/almacendedatos_esquema-
83 19. ERFENG, Z. & ZIYANG, L. 2008. Multi-dimensional Model-based Database
System Development about Dam Safety Monitoring. 1.
20. FEREYDOON, A. & MOSTAFAPOUR, M. 2012. Business intelligence as a key strategy for development organizations. Procedia Technology, 1.
21. FORBES, T. 2010. Managing Information in the Enterprise: Perspectives for Business Leaders.
22. GAMEIRO, C. 2011. Implementation of Business Intelligence tools using Open Source Approach.
23. GÁMEZ, R., ALVEIRO, A., RICO, B. & DEWAR, W. 2010. Inteligencia de negocios: Estado del arte. Scientia et Technica, 1, 321-326.
24. GOEDE, R. & HUISMAN, M. 2010. The Suitability of Agile Systems Development Methodologies for Data Warehouse Development. 99–106. 25. HEGADI, R. & TECHNOLOGIES, W. 2011. Design and Analysis of DWH and
BI in Education Domain 3 . Proposed Data warehouse. 8, 545–552.
26. HERNÁNDEZ, D. L. G., CUEVAS, A. S., CERVANTES, Y. E. & SÁNCHEZ, M. T. Solución de inteligencia de negocios para la integración de la información comercial y contable.
27. HP. 2016. Hewlett Packard. Obtenido de Análisis avanzado de Vertica: http://www8.hp.com/ec/es/software-solutions/advanced-sql-big-data-analytics/ 28. IBERMÁTICA 2008. Inteligencia de negocio.
29. IBM, S. G. 2003. The DB2 Framework for Business Intelligence., Somers, New York 10589, IBM Corporation.
30. IGERENCIA. 2010. Inteligencia de negocio. Componentes de inteligencia de Negocio [Online]. Available:
http://www.igerencia.com/inteligencia_de_negocios/componentes.htm. 31. INSTITUTE & S/F, T. D. W. 2014. BUSINESS INTELLIGENCE. ALFARO, E. 32. DÍAZ, F., OSORIO, M. A., AMADEO, A. P. & ROMERO, D. Aplicando
estrategias y tecnologías de Inteligencia de Negocio en sistemas de gestión académica. XV Workshop de Investigadores en Ciencias de la Computación, 2013.
33. KEEN, P. 1978. Decision support systems: an organizational perspective. 34. KEEN, P. 1980. Decision support systems: a research perspective. Decision
support systems : issues and challenges., Oxford.
35. KIMBALL, R., ROSS, M., THORNTHWAITE, W., MUNDY, J. & BECKER, B. 2008. The Data Warehouse Lifecycle Toolkit Table of Contents.
36. LITTLE, J. D. 1970. Models and Managers:The Concept of a Decision Calculus. Management Science.
37. MARRERO, I. 2008. La inteligencia de negocios desde la perspectiva cubana: retos y tendencias [Online]. Available: http://www.biomundi.pco.cu.
38. MARX, J. 2009. Business Intelligence – Data Warehousing., Oldenburg, Germany Wirtschaftsinformatik I, Very Large Business Applications, Carl von Ossietzky Universität Oldenburg.
84 39. MICROSYSTEMS, S. 2005. Business Brief Business Intelligence and Data
Warehousing (BIDW) – Transform Raw Data into Business Results., Santa Clara, California 95054 USA Sun Microsystems: 11.
40. MISNER, S. 2009. Business Intelligence: Planning Your First Microsoft BI Solution. Technet Magazine.
41. MITHAS, S., RAMASUBBU, N. & SAMBAMURTHY, V. 2011. How information management capability influences firm performance. MIS Quarterly.
42. MOORE, J. H. & CHANG, M. G. 1980. Design of Decision Support Systems. Data Base.
43. MORENO, R. 2013. Análisis, Diseño e Implementación de datamarts para las áreas de ventas y recursos humanos de una empresa dedicada a la
exportación e importación de productos alimenticios. Tesis de grado, Pontificia Universidad Católica del Perú.
44. NEGASH, S. 2004a. Business intelligence. Communications of the Association for Information Systems, 13, 177-195.
45. NEGASH, S. 2004b. “Business intelligence”. Communications of the Association for Information Systems,. 13.
46. PARR, O. 2000. Data Mining Cookbook Modeling Data for Marketing, Risk, and Customer Relationship Management [Online]. Available:
http://books.google.com.co/books?id=L3w0loZrcU0C&printsec=frontcover&dq= Data+Mining+Cookbook#v=onepage&q=&f=false.
47. PONJUÁN, L. 2014. Gestión de la Información [Online]. Available:
http://www.ecured.cu/index.php/Categor%C3%ADa:Ciencias_de_la_Informaci
%C3%B3n. .
48. PORTER, M. 2016. Diarium. Obtenido de Sistema de Gestión Empresarial: https://diarium.usal.es/id00710310/2016/03/16/business-intelligence/
49. POWER, D. J. 1997. What is a DSS? The On-Line Executive Journal for Data- Intensive Decision Support., 1(3).
50. RIVADERA, G. 2015. La metodología de Kimball para el diseño de Almacenes de datos ( Data warehouses ). 56-71.
51. ROJAS, M. 2012. Estrategia business intelligence usando herramientas open source.
52. SÁEZ MOSQUERA, I. 2008. Procedimientos y arquitectura de apoyo para la asistencia decisional en procesos estratégicos de Gestión Logística.
Universidad Central Marta Abreu de Las Villas.
53. SAP, B. 2017. SAP. Obtenido de SAP: http://www.sap.com/solution/platform- technology/analytics/business-intelligence-bi.html
54. SAVITRI, F. & LAKSMIWATI, H. 2011. Study of localized data cleansing process for ETL performance improvement in independent datamart. 1-6. 55. SCHEIN, E. H. & ROPKE, J. 2003. Transforming knowledge into action.
56. SERVICES, D. 2015. Data Services, Document Version: 4.2 Support Packages 6. SAP.
85 57. SINGH, R. & SINGH, K. 2010. A Descriptive Classification of Causes of Data
Quality Problems in Data Warehousing. 7, 41-51.
58. SPRAGUE, R. & CARLSON, E. 1982. Building effective decision support systems., New Jersey, Prentice-Hall.
59. STACKOWIAK, R., RAYMAN, J. & R, G. 2007. Oracle Data Warehousing and Business Intelligence Solutions. [Online]. Available:
http://books.google.com.co/books?id=Gxy6_drRWRgC&dq=%22Oracle+Data+ Warehousing+and+Business+Intelligence+Solutions%22&printsec=frontcover& source=bn&hl=es&ei=W0uJSqmqGsqltgewwtjnDA&sa=X&oi=book_result&ct=r esult&resnum=4#v=onepage&q=&f=false.
60. TURBAN, E. 1995. Decision support and expert systems: management support systems.
61. VÉRCILLES, C. 2009. Business Intelligence: Data Mining and Optimization for Decision Making.
62. ZELENI, M. 1975. Multiple criteria decision making.
63. ZHANG, X., SUN, W., WANG, W., FENG, Y. & SHI, B. 2006. Generating Incremental ETL Processes Automatically. 2.
Anexo 1 Lista de modalidades de misión y su abreviatura.
Abreviatura Misión
Om Operación Milagro
Omcg Operación Milagros con compensación de gastos
Gia Grupo integral de atención
Smc Servicios médicos cubanos
Pis Programa integral de salud
Piscg Programa integral de salud con compensación de gastos
Atc Atención técnica de colaboración
hr-na Misión Henry Reeve
cod288 Grupo especial
Gid Grupo integral docente
Anexo 2: Categorías ocupacionales de los colaboradores que prestan servicios.
Categoría ocupacional
médicos no especialistas
médicos especialistas
licenciados y otros profesionales
estomatólogos no especialistas
Técnicos
estomatólogos especialistas
Anexo 3: Países con colaboradores. Países Venezuela Tanzania Gambia Perú Jamaica Nicaragua Botswana Guyana
Africa del Sur
Qatar
Guinea Ecuatorial
Swazilandia
Mozambique
Honduras Etiopía Bahrein Trinidad y Tobago Portugal Dominica Islas Seychelles Antigua y Barbudas Bolivia Belice Arabia Saudita Zimbabwe Sierra Leona Rusia Chad Guinea Bissau
Argelia Congo Ghana Brasil Bahamas Kuwait Burkina Fasso Granada
Saint Kitts y Nevis
Cabo Verde Djibouti Uruguay Santa lucía Gabón Ecuador Guinea Conakry
El Salvador Surinam Angola Haití Guatemala Namibia