Aplicación de técnicas de minería de datos para el análisis de información del sector educativo de Colombia
Texto completo
(2) Resumen. ii. Este documento presenta los resultados y el proceso de investigación realizado para el desarrollo de un prototipo de sistema de información que permite la aplicación de técnicas de minería de datos a un modelo de base de datos dimensional realiza la integración de una muestra de información de los resultados de las pruebas del Icfes aplicadas a los grados 11, y los datos obtenidos por mediante el uso de la plataforma de datos abiertos facilitada por el gobierno nacional..
(3) Introducción. iii. La información hoy en día se presenta como uno de los activos más importantes para organizaciones de diferente índole, ya que su correcto análisis permite tomar estratégicamente decisiones dentro de la organización [1]. El proceso de análisis y depuración de la información requiere un proceso de integración de las fuentes de datos y la explotación de dichos datos mediante procesos sofisticados como lo es la minería de datos [2]. Por ello el siguiente trabajo muestra el proceso de desarrollo de un prototipo funcional de sistema de información para minería de datos relacionado con la data generada por los exámenes de estado aplicados a los grados once en Colombia [3]. En primer lugar, se detalla una revisión de la bibliografía y las problemáticas planteadas para el desarrollo de la investigación con relación a la integración de información de los resultados del icfes aplicados a grados 11, que permite obtener un plan de acción para iniciar los procesos de desarrollo del prototipo. Una vez se obtiene el plan de acción se realiza el diseño y desarrollo del prototipo de sistema de integración de información en primer lugar se realiza la creación de la base de datos dimensional y los procesos ETL en la herramienta pentaho que van a realizar el cargue de información para la integración de fuentes de datos. Una vez creado el modelo de base de datos y realizados los procesos de cargue de data se procede a diseñar e implementar una estrategia de minería de datos en la herramienta Weka que nos permite explotar datos de forma efectiva de un modelo ya estructurado de base de datos dimensional. Finalmente se presentan los resultados, su análisis y las conclusiones obtenidas del proceso de investigación..
(4) Tabla de Contenidos. iv. Capítulo 1 ........................................................................................................................................ 1 1. Descripción de la Investigación .............................................................................................. 1 1.1. Planteamiento/Identificación del Problema .................................................................... 1 1.2. Objetivos ......................................................................................................................... 2 1.2.1. General. ....................................................................................................................... 2 1.2.2. Específicos. ................................................................................................................. 2 1.3. Justificación del trabajo/Investigación ............................................................................ 3 1.4. Hipótesis ......................................................................................................................... 3 1.5. Marco referencial ............................................................................................................ 4 1.6. Metodología de la investigación ................................................................................... 22 1.7. Organización del trabajo de grado ................................................................................ 23 1.8. Estudio de sistemas previos .......................................................................................... 24 Capítulo 2 ...................................................................................................................................... 27 2. Desarrollo del prototipo funcional de sistema de información ............................................. 27 2.1. Diseño de la arquitectura empresarial ........................................................................... 27 2.1.1. Aplicación ................................................................................................................. 27 2.1.1.1. Punto de vista comportamiento de la aplicación ....................................................... 28 2.1.1.2. Punto de Vista de Cooperación de Aplicación ......................................................... 29 2.1.1.3. Punto de vista de estructura de aplicación ................................................................ 30 2.1.1.4. Punto de vista uso de la aplicación ........................................................................... 32 2.1.2. Tecnología................................................................................................................. 33 2.1.2.1. Punto de vista de infraestructura. .............................................................................. 34 2.1.2.2. Punto de vista uso de la infraestructura. ................................................................... 35 2.1.2.3. Punto de vista implementación y despliegue. ........................................................... 36 2.1.2.4. Punto de vista estructura de la información. ............................................................. 37 2.1.2.5. Punto de vista realización del servicio. ..................................................................... 38 2.1.2.6. Punto de vista por capas. ........................................................................................... 39 2.1.3. Motivación. ............................................................................................................... 42 2.1.3.1. Punto de vista de Stakeholders. ................................................................................ 43 2.1.3.2. Punto de vista realización de objetivos. .................................................................... 44 2.1.3.3. Punto de vista contribución de los objetivos............................................................. 46 2.1.3.4. Punto de vista principios. .......................................................................................... 47 2.1.3.5. Punto de vista realización de los requerimientos. ..................................................... 48 2.1.3.6. Punto de vista motivación. ........................................................................................ 50 2.1.4. Migración. ................................................................................................................. 51 2.1.4.1. Punto de vista proyecto. ............................................................................................ 52 2.1.4.2. Punto de vista migración. .......................................................................................... 53 2.1.4.3. Punto de vista migración. .......................................................................................... 54 2.2. Diseño y desarrollo de la base de datos dimensional .................................................... 56 2.2.1. Dimensión de periodo ............................................................................................... 56 2.2.2. Dimensión de tiempo ................................................................................................ 56 2.2.3. Dimensión de ubicación ............................................................................................ 56 2.2.4. Dimensión de género ................................................................................................ 57.
(5) 2.2.5. Dimensión de identidad ...........................................................................................57v 2.2.6. Dimensión de tipo estudiante .................................................................................... 57 2.2.7. Dimensión de instituciones ....................................................................................... 57 2.2.8. Tabla de hechos de resultados icfes .......................................................................... 58 2.3. Reglas de implementación para la base de datos ......................................................... 58 2.4. Diseño y desarrollo etapa de integración de datos ........................................................ 61 2.5. Fuentes de datos ............................................................................................................ 61 2.6. Diseño y desarrollo etapa de minería de datos.............................................................. 72 Capítulo 3 ...................................................................................................................................... 77 3. Resultados y discusión. ......................................................................................................... 77 Capítulo 4 ...................................................................................................................................... 90 4. Conclusiones. ........................................................................................................................ 90 Lista de referencias ....................................................................................................................... 91 Anexos .......................................................................................................................................... 94.
(6) Lista de tablas. vi. Tabla 1. Estudios previos de proyectos de minería de datos. ....................................................... 24 Tabla 2. Análisis para el desarrollo de la estructura dimensional................................................. 62.
(7) Lista de figuras. vii. Figura 1. Tipos de Datos tomado de [17] ..................................................................................... 10 Figura 2. Cuadrante mágico de Gartner para herramientas de integración de datos tomado de (Informatica LLC, 2018). ...................................................................................................... 14 Figura 3. Arquitectura de un Data Warehouse tomado de (J. Grisanti, 2018). ............................. 16 Figura 4. Cuadrante mágico de Gartner para herramientas de bases de datos (Altus Soft, 2018).17 Figura 5. Ejemplo de dimensiones. ............................................................................................... 18 Figura 6. Esquema de estrella ....................................................................................................... 19 Figura 7. Esquema de copo de nieve. ........................................................................................... 19 Figura 8. Esquema constelación ................................................................................................... 20 Figura 9. Proceso de extracción Minería de Datos ....................................................................... 22 Figura 10. Punto de vista comportamiento de la aplicación ......................................................... 29 Figura 11. Punto de vista cooperación de la aplicación ................................................................ 30 Figura 12. Punto de vista estructura de la aplicación.................................................................... 31 Figura 13. Punto de vista uso de la aplicación .............................................................................. 33 Figura 14. Punto de vista infraestructura ...................................................................................... 35 Figura 15. Punto de vista uso de la infraestructura ....................................................................... 36 Figura 16. Punto de vista implementación y despliegue............................................................... 37 Figura 17. Punto de estructura de la información ......................................................................... 38 Figura 18. Punto de vista realización del servicio ........................................................................ 39 Figura 19. Punto de vista por capas .............................................................................................. 41 Figura 20. Punto del stakeholder .................................................................................................. 44 Figura 21. Punto de la realización de objetivos. ........................................................................... 46 Figura 22. Punto de la contribución de objetivos. ........................................................................ 47 Figura 23. Punto de los principios. ............................................................................................... 48 Figura 24. Punto realización de los requerimientos. ..................................................................... 50 Figura 25. Punto realización de motivación. ................................................................................ 51 Figura 26. Punto de vista del proyecto.......................................................................................... 53 Figura 27. Punto de vista migración ............................................................................................. 54 Figura 28. Punto de vista implementación y migración ............................................................... 55 Figura 29. Estructura dimensional de la base de datos ................................................................. 60 Figura 30. Diagrama del proceso ETL para integración de datos................................................. 61 Figura 31. Etapa de extracción de la dimensión de ubicación ...................................................... 65 Figura 32. Etapa de transformación y carga de la dimensión de ubicación .................................. 65 Figura 33. Etapa de extracción de la dimensión de tipo documento ............................................ 65 Figura 34. Etapa de transformación y carga de la dimensión de tipo documento ........................ 66 Figura 35. Etapa de extracción de la dimensión de tiempo .......................................................... 66 Figura 36. Etapa de transformación y carga de la dimensión de tiempo ...................................... 66 Figura 37. Etapa de extracción de la dimensión institución ......................................................... 67 Figura 38. Etapa de transformación y carga de la dimensión institución ..................................... 67 Figura 39. Etapa de extracción de la tabla de hechos resultados Icfes ......................................... 68 Figura 40. Directorios de acceso. .................................................................................................. 70 Figura 41.Etapa I de JOB_TRF_FACT_INSTITUCIONES ........................................................ 70 Figura 42.Etapa II de JOB_TRF_FACT_INSTITUCIONES ....................................................... 71.
(8) Figura 43.Etapa III de JOB_TRF_FACT_INSTITUCIONES................................................. 71viii Figura 44.Etapa VI de JOB_TRF_FACT_INSTITUCIONES ..................................................... 72 Figura 45.Muestra de datos ........................................................................................................... 73 Figura 46.Interfaz Weka ............................................................................................................... 74 Figura 47.Conexión Weka – Base de datos Oracle....................................................................... 74 Figura 48.Ejemplo de consulta – Base de datos Oracle ................................................................ 75 Figura 49.Ejemplo del proceso de discretización con weka ......................................................... 76 Figura 50. Ejecución de la integración de datos por periodo ........................................................ 77 Figura 51. Visualización de puntajes para periodo 20162 ............................................................ 78 Figura 52. Configuración del arbol ............................................................................................... 80 Figura 53. Ejemplo de combinación de data y su comportamiento .............................................. 81 Figura 54. Visualización por pixeles ............................................................................................ 82 Figura 55. Consolidado de datos ................................................................................................... 83.
(9) 1 Capítulo 1 1. Descripción de la Investigación. 1.1.Planteamiento/Identificación del Problema La educación es uno de los ámbitos que actualmente se ve notoriamente impactado por el uso de tecnologías de la información y de las comunicaciones, ya que se presentan diferentes problemáticas y oportunidades al incluir estas herramientas en los diferentes procesos educativos de la sociedad colombiana. Sin embargo, no se ha realizado un profundo análisis del impacto de cómo ha evolucionado la educación colombiana en las diferentes regiones con el uso de las tecnologías de la información y la comunicación. Con la constante expansión de las tecnologías de la información y la comunicación, también se ha desarrollado un sin número de herramientas que permiten analizar la información que junto a la aplicación de algoritmos matemáticos y/o estadísticos permiten realizar un completo y detallado análisis para predecir lo que puede pasar a futuro en un sector particular, en este caso permitiría el uso de herramientas de minería de datos para obtener un completo análisis de que sucede con la educación en las diferentes zonas de Colombia y como puede ser proceso su evolución. Para realizar dicho análisis se requiere el uso de tecnologías como integración de datos en modelos de información y minería de datos que junto a la aplicación de algoritmos logren una cohesión y arrojen la información necesaria para validar como está evolucionando la educación colombiana con el uso de las TIC´s en las diferentes regiones del país.. ..
(10) 2 1.2.Objetivos 1.2.1. General. Aplicar técnicas de minería de data a una muestra significativa de datos otorgados por el programa de datos abiertos del gobierno, recolectados mediante la construcción de un prototipo de sistema de integración de información para analizar la información estadística consolidada en los exámenes de estado aplicados al grado 11 de las instituciones educativas de Colombia. 1.2.2. Específicos. . Clasificar la información estadística referente a los exámenes de estado aplicados al grado 11 de las instituciones educativas de Colombia mediante el estudio de fuentes reales de información otorgadas por el programa de datos abiertos del gobierno.. . Diseñar y desarrollar un sistema prototipo de minería de datos mediante el análisis y la integración de información usando herramientas especializadas en integración y análisis de datos para estructurar un sistema de información para análisis de la información estadística referente a los exámenes de estado aplicados al grado 11 de las instituciones educativas de Colombia.. . Generar una serie de reportes consolidados mediante la aplicación de algoritmos al prototipo de sistema de integrado de información creado mediante el proceso de integración de información para analizar las principales variables que afectan los procesos educativos de acuerdo a la información generada por los repositorios de datos abiertos de grados 11..
(11) 3 1.3.. Justificación del trabajo/Investigación Las técnicas de minería de datos, se basan en la aplicación del conocimiento teórico. de modelado de datos en sistemas de información, el uso de herramientas de integración de datos y la aplicación de algoritmos estadísticos. Estos procesos han sido utilizados en su gran mayoría en empresas del sector privado para la toma de decisiones de una forma estratégica, a diferencia del sector público donde actualmente se están iniciando con programas que permiten el desarrollo de estas técnicas. En Colombia con la estrategia de gobierno en línea está ejecutando programas donde se tiene acceso a la información de negocio de las organizaciones gubernamentales de forma libre esto permite que se pueden generar modelos de desarrollo de inteligencia de negocios donde se analicen desde diferentes perspectivas un área en particular. El referente de esta investigación es el sector educativo colombiano, se realiza la selección de este factor porque es un indicativo que se ve afectado no únicamente por variables propias de su entorno sino por otro tipo de variables que pueden ser socioeconómicas y políticas; esto permite la aplicación de técnicas de minería de datos que modele cuantitativamente la información que pertenece a un área de altas implicaciones para la sociedad en general. 1.4.Hipótesis La aplicación de técnicas de minería de datos a un prototipo de sistema de información integrado podrá permitir el análisis de una muestra de información referente a los exámenes de estado aplicado al grado 11 de las instituciones educativas de Colombia..
(12) 4 1.5.Marco referencial La Big Data se ha convertido en una de las palabras de moda en diferentes ámbitos: negocio, ingeniería de sistemas, informática, entre otros. Esto se ve influenciado porque cuando se obtiene una cantidad de datos elevada de información se plantea la forma de que se puede hacer con ellos. Esto ha remitido a crear metodologías, disposición de tecnologías para gestión de la información, de tal modo que puedan convertirse en información, y pueda ser aplicable en las organizaciones para la toma de decisiones, verificar la productividad junto con el comportamiento de los clientes frente a la compra de sus productos o servicios. De esta forma se llega al diseño de planes de acción para la organización, junto con planes estratégicos. La gestión de la información se ha convertido en uno de obtener conocimiento científico, ofreciendo marcos idóneos para conseguir un mejor entendimiento y una forma más eficaz de encontrar una respuesta a clara a datos masivos, respondiendo a las preguntas principales ¿Para qué sirven? ¿Cómo gestionarlos?, ¿Con qué? Esto con el fin de otorgarles valor y comenzar a evolucionar la tecnología, junto con las Bases de Datos, las cuales deben responder a las necesidades que se presentan hoy en día, la cual son los datos. Por tanto, se tiene en cuenta lo que sería la ingeniería informática, junto con los sistemas de información para lograr una solución óptima a estas dificultades [3]. Según [4] este cambio de paradigma ha cambiado la forma en la que las personas obtiene y analizan datos ya que al ser una gran cantidad de datos se deben tener en cuenta varios aspectos como:.
(13) 5 Estudios de mercado, prescindir del muestreo. Al no trabajar con un muestreo, se evitan los errores inherentes a este y se puede trabajar a nivel macro, viendo conexiones y agrupaciones que a primera vista pasan desapercibidas La causalidad de los hechos ya no es el objetivo del que interesa es saber qué está pasando mediante el descubrimiento de perspectivas nuevas que han pasado desapercibidas a primera vista, gracias al análisis de las conexiones entre datos, pautas y correlaciones [16] Los volúmenes de datos se caracterizan por: 1.5.1. Volumen El cual hace referencia al incremento exponencial de los datos, el cual es fruto y facilidad de generar datos de manera digital y la siguiente se refiere al reto que supone recoger, almacenar y guardar la información para ser utilizada después de haber procesado e integrado el volumen de datos. 1.5.2. Variedad Esto equivale a que los datos son muy variados, ya que cuentan con diferentes topologías, formatos y estructuras empleadas para presentar la información, lo cual deben adaptarse al requerimiento exigido como video, GPS, celulares, internet de las cosas etc. Con ello se comienza a hablar de los que son los datos estructuras, semiestructurados y no estructurados. 1.5.3. Estructurados Hace referencia a los datos almacenados en bases de datos relacionales, las cuales tienen longitudes fijas, y se realiza por medio del lenguaje SQL..
(14) 6 1.5.4. Semi-Estructurados No cuentan con una estructura fija, a pesa que los datos enviados ya vengan con alguna estructura predefinida y están encapsulados en ficheros semiestructurados. No estructurados Se documentan el formato con el que son creados, y no cuentan con una estructura predefinida, representada por datos elementales, los cuales tienen una complejidad más alta para la manipulación. 1.5.5. Velocidad El procesamiento se debe realizar en el menor tiempo posible, siendo en algunas ocasiones en tiempo real, lo cual es crítico cuando se tienen contextos como catástrofes, campañas, comentarios, entre otras. 1.5.6. Veracidad Dado que los datos masivos están vinculados a la extracción de información para tomar decisiones y crear conocimiento para la acción, es importante que sean fiables y que permanezcan siempre fieles a la realidad, debido a que las personas que toman las decisiones deben confiar en los datos, y asegurarse la veracidad de los mismo, es por ello por lo que se debe tomar precauciones para que no ocurren modificaciones en los datos en el tratamiento de los mismo. 1.5.7. Visualización Debe facilitar que los grandes volúmenes de datos se presenten visualmente de manera práctica, dinámica, interactiva y comprensible. 1.5.8. Valor.
(15) 7 El análisis de los datos y la extracción de información crean conocimiento, que es fuente de innovación, competitividad, productividad y ocupación. 1.5.9. Verificación Tiene relación con la seguridad de los datos y su integridad, especialmente cuando los datos tienen procedencia externa, como es el caso de los procedentes de la internet de las cosas. 1.5.10. Variabilidad Está relacionada con la velocidad con la que se producen los datos, ya que la generación de unos datos puede ocasionar la obsolescencia de otros. 1.5.11. Viabilidad Las plataformas y el software para gestionar datos tienen capacidades complejidades diferentes, y, por lo tanto, los presupuestos resultantes para comprar las tecnológicas necesarias pueden llegar a ser muy elevados [16] Al tener en cuenta las características que tienen cada uno se puede llevar lo que es la gestión eficiente de los datos masivos, el cual es a través de la cadena de valor, englobando los procesos de: Explotación, almacenamiento y producción [17]. Todo esto comienza desde la obtención de datos, para determinar desde que fuentes se tomara la información, evaluando la heterogeneidad, redundancia y parámetros de procedencia. Los datos al tener la complejidad de adquirirlos hay que trabajarlos con tres subprocesos: 1.5.12. Recogida Existen diferentes métodos para recoger información, enfoques pull (información extraída por medio de agentes), push (distribución selectiva de una fuente concreta),.
(16) 8 métodos como logs, sensores, ficheros. Sin embargo, los gobiernos han visto el gran valor de contar con datos que puedan ser utilizados para analizar y verificar información que puede ser usada para después, es por ello que existen diferentes bases de datos con datos abiertos para que las personas puedan investigar y usarlas para diferentes temas. 1.5.13. Transmisión Los datos que son obtenidos son llevados a centros de datos para su posterior análisis, por medio de un protocolo de transmisión, ya sea por servidor FTP, SFTP, entre otros. 1.5.14. Preprocesamiento Para lograr un procesamiento efectivo de los datos se deben realizar varios pasos para corregir duplicados, selección de información y algunas carencias de errores, por medio de: 1.5.14.1.. Integración. Herramientas de procesamiento de datos como ETL que es te integrado a in Datawarehouse, herramientas de procesamiento de datos en vivo (vía Streaming) Limpieza: Permite lograr una claridad de los datos, contar con la consistencia de los datos, actualización, identificar complementos, datos irracionales, indefinidos o inexistentes y de esta manera lograr pautas de revisión para confirmar el formato, racionalidad y límite Eliminar la redundancia: Repetición de datos comunes en diferentes conjuntos de datos, de forma que puede incrementar gastos innecesarios de transmisión de datos y causar.
(17) 9 defectos en los sistemas de almacenamiento (desaprovechamiento del espacio de almacenamiento, inconsistencia de los datos, reducción de su veracidad y daño de estos 1.5.14.2.. Almacenamiento de los datos. Una vez los datos son seleccionados y recogidos para su posterior análisis y extracción, el sistema debe asegurar la consistencia de los datos y poder reproducir la información en los servidores, explorando líneas de investigación como: los lenguajes controlados, usabilidad, visualización, esto debido a que se compone de infraestructura tecnológica para el desarrollo. 1.5.14.3.. Análisis de los datos. Encierra todos los datos, con el fin de crear conocimiento para la acción (toma de decisiones, dependiendo de los resultados), esto debido a que las organizaciones han dispuesto sus datos para tener plasmado toda la información estratégica, analizarla y convertirla en conocimiento para generar apoyo en herramientas cada vez más fuertes, mayor almacenamiento de servidores, los cuales engloban un conjunto de procedimientos y modelos estáticos, en este sentido hace referencia a modelos como Minería de Datos, factores, correlaciones, regresión A/B, estadística [17]..
(18) 10. Figura 1. Tipos de Datos tomado de [17]. Uno de los más utilizados para realizar este procedimiento es a través del análisis estadístico, ya sea descriptivo (resume y caracteriza el conjunto de datos que queremos analizar) o inferencial (conclusiones de los datos sujetos a variaciones aleatorias) [16] Para el caso de la Minería de Datos, los algoritmos pueden basarse en lo siguiente: . Algoritmos Supervisados. . Algoritmos no Supervisados. . Siendo estos los algoritmos más representativos:. . Redes Neuronales. . Regresión lineal.
(19) 11 . Arboles de decisión. . Agrupamiento. . Segmentación. . Reglas de Asociación. . Minería web. La minería web es una disciplina específica que desarrolla técnicas para extraer información y conocimiento de los enlaces, los contenidos de las páginas web y los logs de uso de los recursos de internet [8] . Técnicas para realizar minería web:. . Minería de la estructura web. . Minería del contenido web. . Minería del uso de la web. Existen otras diferentes, dependiendo del caso como es la minería de texto, la cual se mezcla con Opinion mining y sentiment analysis, análisis de redes sociales o social network analysis (SNA), gestión de la reputación, entre otras, para aclarar más el tema del lenguaje natural y las reglas de la lingüística, el cual se utiliza dependiendo de la situación que se presente en la empresa y los datos a modificar y explotar. “La minería de datos en la educación no es un tópico nuevo, tanto su estudio y aplicación han sido muy relevantes en los últimos años. El uso de estas técnicas permite entre otras cosas, predecir cualquier fenómeno dentro del ámbito educativo. De esta forma, utilizando las técnicas que ofrece la minería de datos, se puede predecir, con un porcentaje.
(20) 12 muy alto de confiabilidad, la probabilidad de desertar de cualquier estudiante, coinciden” [15]. 1.5.15. Fuentes de Información. Las fuentes de información, en este caso van a ser archivos planos que se encuentran en los repositorios gubernamentales, para el primer caso sería el servidor FTP del ICFES, en segundo lugar, los datos que se consideren paramétricos como lo son los municipios y departamentos serán seleccionados desde fuentes como el Departamento Administrativo Nacional de Estadística de Colombia (DANE) donde se encuentran dichas paramétricas. La siguiente fuente de información serán los datos que se obtienen por medio del programa datos abiertos del gobierno, estos permiten extraer la información en archivos planos 1.5.16. Procesos ETL. El proceso de Extraer, Transformar y Cargar datos, más conocido como ETL por sus siglas en ingles es un proceso que permite mover, limpiar y formatear grandes volúmenes de datos desde múltiples fuentes hacia otras bases de datos, datamarts o Data wharehouse. De esta forma pueden ser analizados desde otro sistema operacional y así prestar apoyo a procesos funcionales tal como se evidencia en [8]. 1.5.16.1.. Extracción (E). La primera parte del proceso de ETL es la extracción, en esta se deben realizar un análisis de la información que se va a extraer y los procesos que van pegados a ellas ya que se debe tener en cuenta los cierres de ciertos aplicativos por ello se va a observar cuando.
(21) 13 se debe ejecutar la ETL. Un punto a validar en el proceso de extracción es la metadata [9] de las fuentes ósea la descripción de los datos, teniendo en cuenta esto se puede iniciar a programar las extracciones de los datos en los aplicativos. 1.5.16.2.. Transformación (T). El proceso de transformación principalmente se ocupa de aplicar reglas de negocio de los datos obtenidos, estas reglas pueden ser tan simples como convertir un campo de minúscula a mayúscula, eliminar los espacios del campo o concatenar campos, pero también pueden aplicarse algoritmos y cálculos complejos que sean requeridos en una etapa posterior del proceso. Este proceso se programa dependiendo netamente del requerimiento que genere un área funcional o de negocio. 1.5.16.3.. Carga(L). En el proceso de carga se colocan el conjunto de datos obtenidos previamente en la etapa de transformación a un destino que puede ser un Datamart o un Data wharehouse. En este punto se valida si el proceso debe actualizar parte de la información que se obtiene en el destino, o realizar un truncamiento de lo existente e insertar la nueva información. Todo dependerá del requerimiento final, sin embargo, cuando es necesario almacenar información histórica de cierto proceso para análisis histórico siempre se va a insertar nuevos registros dentro de la bodega de datos. 1.5.17. Herramientas ETL Actualmente las empresas incluyen en sus departamentos de Tecnología de la Información y Comunicación (TI) un área especializada en Inteligencia de Negocios ya que anteriormente se tomaban las decisiones gerenciales de involucrando el instinto de un.
(22) 14 área o persona, sin embargo, hoy en día las decisiones son tomadas de acuerdo a reportes e indicadores que son generados por áreas especializadas en tratamiento de la información. Estos factores han impulsado que se desarrollen herramientas especializadas en la integración de la información y salgan al mercado hoy en día se tienen un gran número de alternativas.. Figura 2. Cuadrante mágico de Gartner para herramientas de integración de datos tomado de [22].. 1.5.18. Repositorio En inteligencia de negocios cuando los datos ya son tratados mediante una herramienta de integración, estos deben ser almacenados en un repositorio de datos. Para esto en primer lugar se define si es conveniente realizar un Datawarehouse o un Datamart. 1.5.18.1.. Data Wharehouse.
(23) 15 En español un Datawarehouse es un almacén de datos existen muchas definiciones para este tipo de sistemas sin embargo se va a partir de lo que Kimball definió: “Un Datawarehouse es un almacén de datos que extrae, limpia, conforma y entrega una fuente de datos dimensional para la consulta y el análisis” también definió que este sistema “la unión de todos los Datamarts de una entidad”. Un Datawarehouse o almacén de datos en si recopila los datos más valiosos de una organización o de una empresa. Los datos son integrados, variables en el tiempo y no son volátiles tal como lo muestran en [11]. Finalmente, la construcción del modelo de la Datawarehouse permite que los datos sean explotados por otros motores e incluso por el usuario directamente con consultas. 1.5.18.2.. Datamart. Un Datamart es una versión más pequeña del Datawarehouse, su función es la misma ya que almacena los datos de forma similar al Datawarehouse sin embargo su principal diferencia es que el Datamart se centra en un área específica del negocio. Un Datawarehouse puede estar conformado por un conjunto de Datamarts tal como lo definió Kimball en [2]..
(24) 16. Figura 3. Arquitectura de un Data Warehouse tomado de [23].. Delimitando la solución que se va a plantear es necesario ver que funcionalmente solo se va a trabajar con un área que sería la información generada por el ICFES referente a sus métricas de la evaluación que hace periódicamente en todo el país. Por ello se ve prudente únicamente utilizar un Datamart como repositorio para integrar esta información. En este Datamart se va a instalar en una base de datos para ello revisamos el cuadrante de Gartner de estas herramientas..
(25) 17. Figura 4. Cuadrante mágico de Gartner para herramientas de bases de datos [24].. 1.5.19. Modelo Dimensional El modelo dimensional DM por sus siglas en ingles es una técnica aplicada a las bases de datos pensada a nivel de usuario final ya que generalmente los modelos relacionales y entidad relación de las bases de datos, aunque son bastante útiles para sistemas transaccionales suelen ser complejos de comprender para un usuario final que no conoce de estos temas. Al construir un modelo dimensional en una bodega de datos las consultas sobre las bases de datos son fáciles de realizar y se pueden optimizar los tiempos de respuesta de estas. La construcción de una base de datos dimensional se puede formar como un cubo de tres o cuatro dimensiones donde el usuario es capaz de utilizar solamente una fracción.
(26) 18 de los datos mediante el uso de una dimensión. Por ejemplo, en un banco se van a analizar las transacciones que realizan los clientes por los diferentes canales en las regiones del país, para este caso se crean tres dimensiones una de clientes otra de canales la siguiente de ubicaciones las métricas serán la de transacciones [3].. Figura 5. Ejemplo de dimensiones fuente propia.. Las métricas se almacenan en tablas de hechos y realizan una apuntación al valor clave en el inferior de cada tabla de dimensiones. Los datos almacenados son de carácter cuantitativo. 1.5.19.1.. Esquema Dimensional. Los esquemas dimensionales permiten analizar que arquitectura de modelo de bases de datos es la coherente para el proyecto dependiendo de sus relaciones y de la cantidad de información a tratar para ello se van a analizar los siguientes:. 1.5.19.2.. Esquema Estrella. Un esquema de tipo estrella es aquel que tiene una única tabla de hechos y a esta está atada una serie de tabla de dimensiones..
(27) 19. Figura 6. Esquema de estrella fuente propia. 1.5.19.3.. Esquema Copo de Nieve. Un esquema copo de nieve está compuesto de una tabla de hechos que está conectada a muchas tablas de dimensiones, y estas pueden estar conectadas a otras tablas de dimensiones a través de una relación de muchos a uno.. Figura 7. Esquema de copo de nieve fuente propia.. 1.5.19.4.. Esquema Constelación. El esquema de tipo constelación, es la combinación entre un esquema copo de nieve y una estrella, difiere este esquema de los anteriores en que solamente se desnormalizan.
(28) 20 algunas tablas de dimensiones. La normalización de las dimensiones es necesaria para eliminar redundancias y se realiza usando tablas Outrigger.. Figura 8. Esquema constelación fuente propia. 1.5.20. Minería de Datos “La minería de datos engloba un conjunto de metodologías, procesos de modelización y técnicas matemáticas para analizar datos provenientes de diferentes fuentes con el objetivo de extraer información previamente desconocida. Se aplica a conjuntos de datos estructurados por atributos o valores. No es válida para documentos de texto; para estos se debe emplear minería de texto” La información se construye analizando las estructuras de los datos, de las cuales emergen patrones de comportamiento y tendencias. Los patrones están basados en la observación del pasado, y las técnicas predictivas nos dan información de tendencias futuras. La información extraída apoya la toma de decisiones y tiene que estar alineada con los objetivos organizativos [4]..
(29) 21 Para las empresas, una de las tareas más importantes es representar el Testeo de los datos, los factores que influyen en la colección, conocer los campos más importantes para la gestión del sistema y permitir que la ingeniería visualice y recolecte la información para su respectiva disponibilidad. Algunos de los campos cuentan con inconvenientes al realizar el mapeo de los datos, por lo que la asignación y el análisis de cada uno permite desarrollar un modelo de búsqueda y acomodarse al análisis para poder lograr un avance por medio de: celdas, memoria, búsqueda por cada bit y las características que lo acompañan, lo cual resulta bastante sencillo para el diseño y la alineación de los campos y determinar los factores que se desean convertir en conocimiento [5]. La extracción de conocimiento se conoce como un proceso iterativo e iterativo. “Es iterativo ya que la salida de alguna de las fases puede hacer volver a pasos anteriores y porque a menudo son necesarias varias iteraciones para extraer conocimiento de alta calidad. Es interactivo porque el usuario, o más generalmente un experto en el dominio del problema, debe ayudar en la preparación de los datos, validación del conocimiento extraído” [6]. Este compuesto de cinco fases para recopilar la información de la base de datos: Con esto se genera la interpretación, se evalúan patrones y es analizada por expertos y facilita resolver posibles inconvenientes en conocimiento. Al final se realiza la difusión para que el usuario haga participe del nuevo conocimiento..
(30) 22. Figura 9. Proceso de extracción Minería de Datos tomado de [26]. 1.5.21. Usuarios Los usuarios son el público en general quien tenga curiosidad de cómo ha evolucionado el sector educativo colombiano teniendo en cuenta que se va a analizar cifras que son del programa datos abiertos que impulso el gobierno de Colombia. 1.5.22. Marco Espacial El proyecto está delimitado a las regiones del país Colombia, teniendo en cuenta la zona cuya información esté disponible. 1.6.Metodología de la investigación La investigación debe permitir que se realice una indagación de si es posible mediante la aplicación de técnicas de minería de datos que permita integrar y analizar la información del sector educativo colombiano, por ello es de gran importancia poder en primer lugar investigar a fondo las características que tiene la información del sector.
(31) 23 educativo siendo la materia prima de la investigación y en segundo sentar unas bases teóricas relacionadas con las estrategias de integración de información y de minería de datos que son las herramientas que se van a utilizar durante la investigación. La información recopilada junto con las herramientas de integración van a permitir realizar en primer lugar la generación de modelos de análisis y finalmente la aplicación de algoritmos estadísticos cuyos modelos pueden ser analizados por un usuario final; por ello es necesario comprobar experimentalmente si toda el modelo teórico que se investigo acerca de las técnicas de minería de datos permite integrar información del sector educativo colombiano para realizar análisis cuantitativos de una forma que anteriormente no se había logrado. Teniendo en cuenta lo anterior y que se parte de que la hipótesis planteada requiere en cierta forma ser comprobada mediante pruebas experimentales, el método que se selecciona para desarrollar esta investigación es el método científico. 1.7.Organización del trabajo de grado . Capitulo: Desarrollo del prototipo funcional del sistema de información. o o o o o. . Diseño y desarrollo de la base de datos dimensional Reglas de implementación para la base de datos Diseño y desarrollo etapa de integración de datos Fuente de datos Diseño y desarrollo etapa de lfonso de datos. Capitulo: Resultados y discusión.
(32) 24 1.8.Estudio de sistemas previos Existen varios proyectos desarrollados con Minería de Datos en entornos educativos para el caso de descubrimiento de la deserción estudiantil tales como: Tabla 1. Estudios previos de proyectos de minería de datos.. Fuente del estudio previo Universidad Nacional de Misiones. Descripción del estudio Agrupación de estudiantes, dependiendo de sus características, factores sociales y demográficos, los cuales desertan la carrera en sistemas de computación. Universidad Nacional del Nordeste. Minería de datos basados en Clustering para búsqueda de perfiles de alumno en Licenciatura de Sistemas de información.. Universidad de la Matanza. Se aplicó la Minería para rendimiento académico y deserción de los estudiantes en el departamento de Ingeniería e investigaciones, aplicado con el software MS SQL Server para almacenamiento de datos y detectar patrones determinantes. Universidad Tecnológica de Izúcar de. Propuso investigar causas que motivan la. Matamoros. deserción de los estudiantes por medio de la herramienta WEKA para la clasificación y.
(33) 25 encontrar relaciones en los atributos académicos que predicen la probabilidad por cada alumno en cualquier instancia escolar Cada uno de ellas y otros elementos relacionados han sido implementados para la educación para encontrar factores que sean relevantes para los estudiantes, de modo que puedan detectar inconvenientes y soluciones para mejorar sus sistemas o la toma de decisiones, dependiendo de los inconvenientes que se estén presentando. Como se mencionada anteriormente en la Minería de Datos, se realiza una selección de los datos de diferentes fuentes o en este caso de las entidades que desean reconocer un patrón de los estudiantes, por medio de: Instituto Colombiano para el Fomento de la Educación Superior (ICFES), del Departamento Administrativo Nacional de Estadística (DANE), del Sistema para la Prevención de la Deserción en la educación superior (SPADIES), del Sistema de Identificación de Beneficiarios Potenciales de programas Sociales (SISBEN) e información.
(34) 26 de la Registradora Nacional del Estado Civil Colombiano..
(35) 27 Capítulo 2 2. Desarrollo del prototipo funcional de sistema de información El desarrollo del sistema de información consta de tres grandes partes que se van a detallar a continuación, la primera parte es el diseño de la base de datos dimensional, la segunda consta de los procesos de integración de datos y finalmente se realizara el proceso de minería de datos y análisis de información [21]. 2.1.Diseño de la arquitectura empresarial 2.1.1. Aplicación La estructura principal del concepto de la capa de Aplicación es el componente de la aplicación. Este concepto es usado para modelar cualquier entidad estructural en la capa de aplicación: no solo componentes de software (reutilizables) que pueden formar parte de una o mas aplicaciones, sino también software completo Aplicaciones, subaplicaciones, o sistemas de información. Aunque muy similar al UML 2.0 componente, nuestro concepto de componente modela estrictamente el aspecto estructural de una aplicación: su el comportamiento se modela mediante una relación explícita con los conceptos de comportamiento. También en la arquitectura de aplicaciones, las interrelaciones de componentes son un ingrediente esencial. Por lo tanto, también introducimos el concepto de colaboración de aplicaciones aquí, definido como un colectivo de componentes de aplicación que realizan interacciones de aplicación. En el sentido puramente estructural, una interfaz de aplicación es el canal (lógico) a través del cual se puede acceder a los servicios de un componente. En un sentido más.
(36) 28 amplio (como se usa en, entre otros, la definición de UML 2.0), una interfaz de aplicación define algunas características de comportamiento elementales: define el conjunto de operaciones y eventos que proporciona el componente, o aquellos que se requieren del entorno. Por lo tanto, se utiliza para describir la funcionalidad de un componente. Se puede hacer una distinción entre una interfaz proporcionada y una interfaz requerida. El concepto de interfaz de la aplicación se puede utilizar para modelar las interfaces de aplicación a aplicación, que ofrecen servicios de aplicación internos, y las interfaces de aplicación a empresa (y / o interfaces de usuario), en la cual pueden ofrecer servicios de aplicación externos [21]. 2.1.1.1.Punto de vista comportamiento de la aplicación El punto de vista Comportamiento de la aplicación describe el comportamiento interno de una aplicación; por ejemplo, cuando realiza uno o más servicios de aplicación. Este punto de vista es útil para diseñar el comportamiento principal de las aplicaciones o para identificar la superposición funcional entre diferentes aplicaciones. Anteriormente se ha menciona sobre las diferentes fases que se deben ejecutar e implementar cada paso para lograr una Minera de datos. Cada comportamiento de la aplicación debe tener en cuenta: . Evaluar los resultados académicos.. . Verificar el servicio de proveer información para no tener caídas de servicio..
(37) 29 . Medir la cantidad de resultados icfes para no saturar la cantidad de información, tanto almacenada como analizada.. . Explotación de datos y consolidación en un repositorio seguro cada patrón descubierto para su posterior uso.. Figura 10. Punto de vista comportamiento de la aplicación. 2.1.1.2.Punto de Vista de Cooperación de Aplicación El punto de vista de la cooperación de aplicaciones describe las relaciones entre los componentes de las aplicaciones en términos de los flujos de información entre ellos, o en términos de los servicios que ofrecen y utilizan. Este punto de vista se usa generalmente para crear una visión general del panorama de la aplicación de una organización. Este punto de vista también se usa para expresar la cooperación.
(38) 30 (interna) u orquestación de servicios que en conjunto respaldan la ejecución de un proceso comercial. Cada componente que se muestra en la siguiente gráfica, permite verificar la comunicación entre cada uno para lograr una buena cooperación de la aplicación, de modo que cada semestre se pueda ir actualizando, lograr Minería a de Datos, proveer una conexión a la comunidad educativa del Colegio Calansaz y generar la bodega de datos en la cual puedan buscar y obtener la información más relevante para tomar decisiones con respecto a la educación implementada.. Figura 11. Punto de vista cooperación de la aplicación. 2.1.1.3.Punto de vista de estructura de aplicación El punto de vista de la estructura de la aplicación muestra la estructura de una o más aplicaciones o componentes. Este punto de vista es útil para diseñar o comprender la estructura principal de las aplicaciones o componentes y los datos asociados; por ejemplo, para descomponer la estructura del sistema en.
(39) 31 construcción, o para identificar componentes de aplicaciones heredados que son adecuados para la migración / integración. Entre cada análisis de datos del Icfes se realizan diferentes funcionalidades, las cuales muestran la estructura de cómo debe ejecutar cada proceso de aplicación, como se muestra en los siguientes pasos: . Minera de Datos: Explotar la data.. . Generacion de Reportes de. . Analizar la comunidad educativa.. . Bodega de datos: Almacenamiento de la data de la prueba saber 11.. . Repositorio de datos: Consolidar todala informacion analizada para su. lfonso .. posterior toma de decisiones. Figura 12. Punto de vista estructura de la aplicación.
(40) 32 2.1.1.4.Punto de vista uso de la aplicación El punto de vista Uso de la aplicación describe cómo se usan las aplicaciones para admitir uno o más procesos comerciales y cómo otras aplicaciones los utilizan. Se puede usar para diseñar una aplicación identificando los servicios que necesitan los procesos de negocios y otras aplicaciones, o en el diseño de procesos comerciales mediante la descripción de los servicios que estrían disponibles. Además, dado que identifica las dependencias de los procesos comerciales sobre las aplicaciones, puede ser útil para los gerentes operativos responsables de estos procesos. Una vez que se realiza todo el proceso para que el colegio Calasanz pueda obtener toda la información que requiere, se procede a verificar el uso de cada componente de aplicación, el cual está basado para generar una buena educación con calidad, seguimiento del plan educativo y formulación para mejorar los procesos educativos. De esta forma cada uso de desglosa en: almacenamiento de información, generar estructuras de manera automática para explotar los datos y presentar los resultados sobre la información obtenida del icfes ante la institución..
(41) 33. Figura 13. Punto de vista uso de la aplicación. 2.1.2. Tecnología. La estructura principal del concepto de la capa de tecnología es el nodo. Este concepto se usado para modelar entidades estructurales en esta capa. Es idéntico al concepto de nodo de UML 2.0. Modela estrictamente el aspecto estructural de un sistema: su comportamiento esta modelado por una relación explícita con los conceptos de comportamiento. Una interfaz de infraestructura es la ubicación (lógica) donde las infraestructuras de servicios ofrecidos por un nodo se pueden acceder al nodo por otros nodos o por componentes de la aplicación desde la capa de aplicación. Los nodos vienen en dos versiones: dispositivo y software del sistema, ambos tomados de UML 2.0. Un dispositivo modela un recurso computacional físico, sobre el cual se pueden implementar artefactos para su ejecución. El software del sistema es un.
(42) 34 componente de software de infraestructura que se ejecuta en un dispositivo. Típicamente, un nodo consiste en una serie de subnodos; por ejemplo, un dispositivo como un servidor y un software del sistema para modelar el sistema operativo. Las interrelaciones de los componentes en la capa tecnológica están formadas principalmente por la Infraestructura de comunicación. La va de comunicación modela la relación entre dos o más nodos, a través de los cuales estos nodos pueden intercambiar información. La realización física de una ruta de comunicación se modela con una red; es decir, un medio de comunicación física entre dos o más dispositivos (u otras redes) [21]. 2.1.2.1.Punto de vista de infraestructura. El punto de vista de Infraestructura contiene los elementos de infraestructura de software y hardware, los cuales soportan la capa de aplicación, así como los dispositivos físicos, redes o software del sistema (por ejemplo, sistemas operativos, bases de datos y middleware). Para lograr una buena ejecución de obtener los resultados de icfes y poder realizar una buena minería de datos se tuvo en cuenta diferentes elementos para lograr una buena ejecución para poder aplicarse a instituciones educativas como es el caso del colegio Calasanz. Los elementos son los siguientes:. . Servidor de Aplicaciones: Internet, lan, cliente. . Analisis de la data del Icfes: Weka, Pentaho, Base de Datos Oracle. . Ubicación: Servidor FTP Icfes, plataforma de datos abiertos de Colombia. . Servidores externos.
(43) 35. Figura 14. Punto de vista infraestructura. 2.1.2.2.Punto de vista uso de la infraestructura. El punto de vista de Uso de infraestructura muestra como las aplicaciones son compatibles por el software e infraestructura de hardware: los servicios de infraestructura son entregados por los dispositivos; el sistema de software y redes son proporcionadas a las aplicaciones. Este punto de vista juega un papel importante en el análisis de rendimiento y escalabilidad, ya que relaciona la infraestructura física con la lógica mundo de aplicaciones. Es muy útil para determinar el rendimiento y los requisitos de calidad en la infraestructura basada en las demandas de la varias aplicaciones que lo utilizan. Para poder realizar toda la ejecución hasta llegar a cada componente y lograr un buen análisis de datos de las pruebas saber icfes, se toma el servidor de aplicaciones y se genera un almacenamiento masivo de datos para poder exportarlos por medio de FTP, y.
(44) 36 conexión entre las plataformas para que cada uno entienda en el mismo lenguaje la data y poder generar cada reporte, los cuales serán enviados o disponibles para las instituciones educativas.. Figura 15. Punto de vista uso de la infraestructura. 2.1.2.3.Punto de vista implementación y despliegue. El punto de vista Implementación y despliegue muestra como una o más aplicaciones son realizadas en la infraestructura. Esto comprende el mapeo de aplicaciones (lógicas) y componentes en artefactos (físicos), tales como Enterprise Java Beans, y el mapeo de información utilizada por estas aplicaciones y componentes en el almacenamiento subyacente infraestructura; por ejemplo, tablas de bases de datos u otros archivos. Las vistas de despliegue juegan un papel importante en análisis de rendimiento y escalabilidad, ya que relacionan la infraestructura física con la lógica en el mundo de aplicaciones. En el análisis de seguridad y riesgo, las vistas de despliegue se usan para identificar, por ejemplo, dependencias y riesgos críticos..
(45) 37 Por medio del servidor principal y las tablas de almacenamiento de cada semestre, se va realizando un despliegue, hasta llegar componente que es el análisis de información, se verifica cuáles son los más significativos, y de esta manera se genera los diferentes reportes para los cuales se genera la Minería de Datos para llegar a los patrones más importantes. Una vez logrado todo este proceso, se procede a implementar en servidores externos, los cuales serán catalogados como Bases de Datos Documentales para la consulta de información más relevante para la entidad educativa.. Figura 16. Punto de vista implementación y despliegue. 2.1.2.4. Punto de vista estructura de la información. El punto de vista de estructura de información es comparable a los modelos de información tradicionales creados en el desarrollo de casi cualquier sistema de información. Muestra la estructura de la información utilizado en la empresa o en un proceso o aplicación comercial específica, en términos de tipos de datos o (orientado a objetos) estructuras de clase. Además, puede mostrar como el de nivel información en el negocio se representa en el nivel de aplicación en la forma de las.
(46) 38 estructuras de datos utilizadas all, y como estos luego se asignan a la infraestructura subyacente; por ejemplo, por medio de un esquema de base de datos. Para destacar el tamaño entre cada estructura de información se ve desde los siguientes puntos de vista: . Información de la data de la Prueba saber 11. . Resultados y análisis sobre cada registro semestral. . Colegio Calasanz. . Ubicación y tiempo de muestra de información, con respecto al análisis y los patrones encontrados en la Base de Datos. Figura 17. Punto de estructura de la información. 2.1.2.5.Punto de vista realización del servicio. El punto de vista de realización del servicio es usado para mostrar como uno o más servicios comerciales son realizados por los procesos subyacentes (y a veces por los componentes de la aplicación). Por lo tanto, se forma el puente entre el punto.
(47) 39 de vista de los productos comerciales y la vista del proceso de negocios. Proporciona un “Vista desde el exterior. En uno o más procesos comerciales. Los procesos más grandes para analizar la data almacenada, cuenta con diferentes procesos subyacentes, los cuales permiten mostrar todos los servicios que usa cada paso para que pueda llegar toda la información que requieren las instituciones, los cuales son: Análisis de resultados de la data del icfes (Minera de cada registro) Ejecución de procesos de calidad, con base en la decisión de los entes Directivos de la institución Comunicación y aplicación de factores relevantes para mejorar la educación con calidad.. Figura 18. Punto de vista realización del servicio. 2.1.2.6.Punto de vista por capas. El punto de vista en capas representa varias capas y aspectos de una arquitectura empresarial en un diagrama. Hay dos categorías de capas, a saber capas dedicadas y capas de servicio. Las capas son el resultado del uso de la relación de “agrupamiento” para una partición natural del conjunto completo de objetos y.
(48) 40 relaciones que pertenecen a un modelo. La infraestructura, la aplicación, el proceso, y las capas de actores / roles pertenecen a la primera categoría. El principio estructural detrás de un punto de vista completamente en capas es que cada capa dedicada expone, por medio de la realización”, relacionar, una capa de servicios, la cual están más lejos en “ser utilizados” por la próxima capa dedicada. Por lo tanto, podemos separar fácilmente la estructura interna y la organización de una capa dedicada de su comportamiento externamente observable expresado como la capa de servicio que la capa dedicada se da cuenta. El punto de vista entre cada capa permite evidenciar la unión entre cada uno, para verificar la participación de los roles, como se relacionan entre sí, el agrupamiento entre cada conjunto de procesos, y por supuesto la estructura general que facilita la interacción entre cada uno, como es: . La educación con calidad.. . Plan educativo.. . Aplicación. de. servicios. tecnológicos. (Almacenamiento,. comunicación, entre otros). . Envío, comunicación y toma de decisiones de las entidades.. análisis,.
(49) 41. Figura 19. Punto de vista por capas.
(50) 42 2.1.3. Motivación. Los conceptos motivacionales se utilizan para modelar las motivaciones, o razones, que subyacen en el diseño o cambios de alguna arquitectura empresarial. Estas motivaciones influyen, guían y restringen el diseño. Es esencial comprender los factores, a menudo referidos como drivers, los cuales influyen en los elementos motivacionales. Ellos pueden ser originarios tanto adentro como afuera de la empresa. Los drivers internos, también llamados preocupaciones, están asociados con los Stakeholders, los cuales terminan siendo seres humanos o algunos grupos de seres humanos, tal como un equipo de trabajo, empresa, o sociedad. Ejemplos de dichos impulsores internos son la satisfacción del cliente, el cumplimiento de la legislación o rentabilidad. Es común que las empresas realicen una evaluación de estos impulsores; por ejemplo, usando un análisis FODA, para responder de la mejor manera. Las motivaciones reales están representadas por objetivos, principios, requisitos y restricciones. Metas representar algún resultado deseado, o fin, que un actor quiere lograr; por ejemplo, incrementando la satisfacción del cliente en un 10%. Los principios y requisitos representan las propiedades deseadas de soluciones – o medios – para realizar los objetivos. Los principios son pautas normativas que guían el diseño de todas las soluciones posibles en un contexto dado. Por ejemplo, el principio \Los datos deben ser almacenados solo una vez representa un medio para lograr el objetivo de consistencia de datos 2 se aplica a todos los posibles diseños de la arquitectura de la organización. Los requisitos representan declaraciones formales de necesidad, expresadas por las partes interesadas, que deben cumplir la arquitectura o las soluciones. Por ejemplo, el requisito.
(51) 43 Usar un solo sistema de “CRM” se ajusta al principio mencionado anteriormente. Aplicándolo a la arquitectura de la organización actual en el contexto de la gestión de datos de los clientes [21]. 2.1.3.1.Punto de vista de Stakeholders. El punto de vista de las partes interesadas le permite al analista modelar las partes interesadas, los impulsores internos y externos para el cambio y las evaluaciones (en términos de fortalezas, debilidades, oportunidades y amenazas) de estos impulsores. Además, se pueden describir los enlaces a los objetivos iniciales (alto nivel) que abordan estas inquietudes y evaluaciones. Estos objetivos forman la base del proceso de ingeniera de requerimientos, incluido el refinamiento de objetivos, el análisis de contribuciones y conflictos, y la derivación de requisitos que realizan los objetivos. Para el desarrollo del punto de vista de Stakeholders para el caso de Estudio del colegio Calasanz se tienen en cuenta diferentes partes involucradas para mejorar diferentes factores en la institución los cuales son: Prestar un servicio educativo y de calidad, implementar planes de estudiar y evaluar la calidad de la educación por medio de informes mensuales para determinar el nivel de los estudiantes y los docentes. Esto permite que cada objetivo del colegio sea cada vez mejor y pueda llegar a la visión de la institución, formando estudiantes competitivos para obtener buenos resultados en las pruebas saber 11, mejorando la alineación del plan estudio, con base en las políticas públicas y nuevos temas que se pueden enfrentar en la realidad. Con ello también se tiene la participación de los padres de familia para determinar cuál es el nivel, como el análisis.
(52) 44 de los resultados puede mejorar las fortalezas de cada estudiante y sobre todo para la institución.. Figura 20. Punto del stakeholder. 2.1.3.2. Punto de vista realización de objetivos. El punto de vista de la realización de objetivos le permite a un diseñador modelar el refinamiento de objetivos (de alto nivel) en objetivos más concretos, y el refinamiento de objetivos concretos en requisitos o restricciones que describen las propiedades que se necesitan para realizar los objetivos. El refinamiento de objetivos y sub-objetivos es modelado usando la relación de agregación. El refinamiento de objetivos en requisitos es modelado usando la relación de realización. Se pueden modelar los principios que guían el refinamiento de los objetivos hacia los requisitos..
(53) 45 Para poder refinar mejor los objetivos para la organización a la cual se desea realizar este proyecto, se dividieron en tres, de esta manera abarcar todos los requisitos necesarios, con base en la situación actual y los resultados obtenidos del icfes: . Implementar planes de estudio: Con base en los lineamientos, PEI y los resultados de sus estudiantes, verificando cuales son los factores u materias que deben mejorar. . Servicio de Calidad: Uno de los principales factores del colegio Calasanz es brindar la educación de calidad para cada estudiante, de modo que puedan desarrollarse de forma integra. . Evaluación: Cada vez que el tiempo pasa surgen nuevos temas, se deben mejorar el conocimiento y por supuesto los lineamientos, esto con base en seguir con buena educación y adaptarse a todos los planes para salir con buenas bases.
(54) 46. Figura 21. Punto de la realización de objetivos.. 2.1.3.3.Punto de vista contribución de los objetivos. El punto de vista de la contribución al objetivo permite a un diseñador o analista modelar las relaciones de influencia entre los objetivos y los requisitos. Las vistas resultantes se pueden utilizar para analizar el impacto que las metas tienen entre so para detectar conflictos entre las metas de las partes interesadas. Por lo general, este punto de vista se puede usar después de que tener los objetivos, algunos extendidos, siendo refinados en los sub-objetivos y, posiblemente, en los requerimientos. Por lo tanto, las relaciones de agregación y realización también se pueden mostrar en este punto de vista..
(55) 47 La mejor manera de modelar e influenciar los objetivos de cada organización, es a través de análisis de todos los procesos de la institución, para ello por medio de la aplicación, la cual provee toda la información con respecto a sus estudiantes, familia, puntaje, entre otros; contribuir en evaluar toda la calidad educativa, mejorar planes de estudio y por supuesto la aplicación de los mismo, teniendo en cuenta las fallas y los objetivos sobre a donde desean llegar.. Figura 22. Punto de la contribución de objetivos.. 2.1.3.4.Punto de vista principios. El punto de vista de los principios permite al analista o diseñador modelar los principios que son relevantes para el problema de diseño en cuestión, incluidos los objetivos que motivan estos principios. Además, se pueden modelar las relaciones entre los principios y sus objetivos. Por ejemplo, los principios pueden unirse entre sí de manera positiva o negativa..
(56) 48 Todo se relata a través de principios, son los puntos relevantes para poder diseñar y modelar las relaciones entre los objetivos del colegio Calasanz, para ello los desarrolladores de esta aplicación desean poner a la disposición tanto de los directivos como los diseñadores todos los factores claves que tienen la institución para lograr: . Información de calidad. . Políticas educativas. . Profesionales capacitados. . Plan de educativo con calidad. Figura 23. Punto de los principios.. 2.1.3.5.Punto de vista realización de los requerimientos. El punto de vista de la realización de requisitos le permite al diseñador modelar la realización de los requisitos por los elementos centrales, tales como actores de negocios, servicios de negocios, procesos de negocios, servicios de aplicaciones,.
Figure
Documento similar
Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan
Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción
No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado
Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:
[r]
[r]
Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..
La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de