146 xAtributos: primera letra en mayúscula
6.6. Modelo de datos del usuario con los indicadores obtenidos
6.6.1. Modelo de usuario
Para el diseño del modelado de los datos del usuario, se consideró representar los indicadores y atributos de las rutas de navegación de los estudiantes, las cuales se las estableció según el nivel de interacción, interés y colaboración que presenta el estudiante en cada una de las actividades a realizar dentro de las herramientas del EVA, el cual se lo representa de la siguiente manera:
Fig. 25. Modelo del usuario con los indicadores de los estudiantes en el EVA.
148
El modelado del estudiante encontrado con los resultados obtenidos del minado de los datos, presentado en la Fig. 25, muestra el nivel de interacción, participación y colaboración que tienen los estudiantes con las herramientas del EVA, a partir de los niveles de participación se determinó el nivel de interés y colaboración que tiene en cada una; y a partir del nivel de ingresos se determinó el nivel de interés que tiene el estudiante.
DISCUSIÓN:
En el desarrollo de esta tesis se ha podido demostrar la gran utilidad que tiene la minería de datos al aplicarla a un caso como el que fue presentado en este trabajo. Entre varias de las ventajas que tiene la minería de datos, ayuda a determinar las rutas de navegación en entornos virtuales, ya que es de suma ayuda para extraer aquella información que le es de utilidad al estudiante para su aprendizaje y de gran utilidad a los docentes para la toma de decisiones en cuanto a los indicadores obtenidos de las herramientas de interés en el EVA, saber sus preferencias y formas de aprender mediante plataformas de aprendizaje virtual; además sirve de ayuda para que el profesor puede utilizar esta información de los resultados obtenidos del análisis realizado, con la finalidad de agrupar a los estudiantes según sus características y preferencias. Además contribuye para el aprendizaje del estudiante que el profesor determine la mejor forma de trabajo de los estudiantes con las actividades en el sistema, y de esta manera seleccionar el conjunto de actividades, ya sean de conocimiento (foros, tareas, cuestionarios, etc.), Colaboración (chat, mensajería, twitter, etc.) de refuerzo o apoyo (recursos, descargas, videoconferencias, tutorías, etc.) o Informativas (noticias, eventos, calendario de evaluaciones, etc.) y de acuerdo a estos resultados determinar según la función de sus características las actividades con las que el estudiante se desenvuelve y desarrolla un mejor nivel de aprendizaje.
La identificación de patrones de navegación en los estudiantes que interactúan con las herramientas disponibles en el EVA, ayuda a descubrir las preferencias que los estudiantes tienen con respecto a las actividades de desarrollo que el profesor pone a disposición para su aprendizaje. Para obtener estos patrones que permitan descubrir la información oculta dentro de cada uno de los estudiantes que hacen uso de las herramientas de la plataforma y navegan con a través de la misma, existe una gran variedad de técnicas que permiten identificar y clasificarlos según sus características de navegación o preferencias, es por lo cual se experimento con varias técnicas de minería para determinar de los resultados obtenidos de cada uno de ellos, cual es la que más se adapta a nuestras necesidades.
Luego de una investigación profunda de cada una de las técnicas que existen de minería de datos para la obtención de patrones de navegación se vio conveniente trabajar con tres técnicas de minería (dos algoritmos por cada técnica), cuatro fueron con algoritmos supervisados Reglas de asociación (A priori, GSP) y Clustering, (Simple KMeans, EM) y un algoritmo supervisado Clasificación (Árboles de decisión: J48); además se realizó tres experimentos con cada uno de los algoritmos propuestos, con la finalidad de según los resultados obtenidos determinar cual de ellos es más preciso y eficiente para este tipo de estudio.
150
Una vez realizada la extracción de los datos dentro de la base de datos de la plataforma del EVA, con la ayuda de la herramienta de Navicat for MySQL, se procedió con el minado con cada uno de los algoritmos propuestos con la herramienta Weka la cual dispone de todos los algoritmos mencionados anteriormente dentro de su conjunto de técnicas, se puede decir que los algoritmos más aptos para este tipo de estudio son las reglas de asociación y los árboles de decisión. Las reglas de asociación prácticamente lo que hace es encontrar asociaciones dentro de los datos de entrada y luego genera todos los ítems-sets con un elemento, y estos los genera con los de dos elementos y luego a ese lo usa para generar los de tres elementos y así hasta que queden sólo las posibles combinaciones que cumplan con las medidas mínimas del valor de soporte, para luego generar estas reglas revisando que cumplan con el criterio mínimo de confianza. Los algoritmos de clustering permiten clasificar a los estudiantes según las características y similitudes entre ellos con la finalidad de agruparlos por sus preferencias dentro de las herramientas dentro de la plataforma del EVA.
x La mayor parte de los estudiantes que navegan en el EVA, interactúan principalmente con las páginas de los foros, cuestionarios, tareas e ingresan a revisar los recursos que el tutor facilita al estudiante dentro del curso.
x Si el estudiante ingresa a revisar los foros propuestos por el tutor/profesor, por lo general, tiende a revisar las respuestas ingresadas de los foros o posts de otros compañeros dentro de los foros.
x Cuando los estudiantes ingresan a las páginas de las respuestas elaboradas por otros estudiantes dentro de los foros, tienden a dar respuesta al foro en el cual se encuentra inscripto, no todos se inscriben en el foro al cual van a dar respuesta.
x Los estudiantes que ingresan a resolver los cuestionarios propuestos por el profesor en el curso, en su mayoría sólo realizan un sólo intento y luego terminar el cuestionario.
x Si el estudiante sube una tarea al EVA dentro del curso en el que se encuentra enrolado, en su mayoría primero ingresan a revisar las tareas propuestas por el tutor/profesor.
x La mayor parte de los estudiantes revisan, leen o descargan las actividades ingresadas dentro de los recursos por su profesor antes de ingresar a subir algún archivo dentro de las tareas.
x Los foros son la primera opción con la cual los estudiantes interactúan cuando navegan por el sistema.
x En cuatro de los cinco cursos los estudiantes navegan con mayor frecuencia en las páginas que tienen que ver con la revisión, inscripción y posteo dentro de los foros.
x Las herramientas y servicios con las que hay casi una nula interacción de parte de los estudiantes son en los blogs, el chat, la mensajería y el twitter.
x Las páginas con mayor navegación de los estudiantes dentro de las herramientas y servicios son las páginas de las actividades (foros, cuestionarios, tareas) en el orden respectivo y páginas de apoyo (recursos, subir archivos) respectivamente.
x Las páginas con minima o nula navegación de los estudiantes dentro del sistema son las páginas de información (noticias, eventos, calendario, etc.) y de colaboración (chat, mensajería y twitter). Como una evaluación general del minado realizado con los algoritmos, que de todos los cursos de noveno ciclo de Informática, modalidad Abierta, en su mayoría los estudiantes acceden a las páginas donde los profesores navegan e interactúan, es decir, los estudiantes interactúan sólo con las herramientas en las que el profesor propone alguna actividad que realizar. Además, no interactúan con las herramientas de colaboración y comunicación con su profesor y demás compañeros como son (chat, twitter, mensajería, etc.)
152
CONCLUSIONES
Las conclusiones obtenidas del análisis de los resultados a partir de los experimentos realizados para determinar las rutas de navegación de los estudiantes y la interacción con las herramientas del EVA, y hace uso el estudiante para su aprendizaje y comunicación con el profesor.
x La implementación de técnicas de minería de datos aplicados a la educación, los cuales se relacionen con la navegación ayudan a descubrir los intereses que tienen los estudiantes con las diferentes herramientas y servicios dentro de la plataforma del EVA, con la finalidad de saber cuáles son las preferencias de los estudiantes para su aprendizaje y colaboración con el profesor y además permite determinar el nivel de aporte que el estudiante tiene con cada una de las herramientas del sistema.
x Una vez realizados los experimentos de comparación con varios de los algoritmos aplicados de las diferentes técnicas de minería, se puede decir que cada una de las técnicas tienen tanto ventajas como desventajas con respecto al domino de aplicación. Es decir, en el caso de la técnica de Clasificación, con el algoritmo de árboles de decisión (J- 48) se obtuvo una excelente capacidad de clasificación de los datos de entrada en comparación a otros algoritmos, como son los de reglas de asociación.
x El algoritmo con resultados más óptimos y eficientes para realizar este tipo de análisis es el Algoritmo GSP y J48, ya que son algoritmos para determinar las rutas de navegación que tienen los estudiantes durante la interacción con las herramientas del EVA, además son algoritmos que determinan el número total de accesos que el estudiante realiza en cada una de las páginas de la plataforma.
x Con el algoritmo de árboles J-48, se obtuvieron reglas de clasificación según las acciones que el estudiante realiza en las herramientas dentro del conjunto de entrenamiento (archivos log); entre los cuales existen varios elementos en común, pero con variación en los tiempos de ejecución y la clasificación de los conjuntos. Este algoritmo es muy sensible en cuestión de los cambios que se realizan en los datos del conjunto de entrenamiento,
GHELGRDORFRPSOLFDGRTXHSXHGHVHUGHWHUPLQDUDSDUWLUGHOD³LQWHJUDFLyQ´GHPRGHORV
de minería de datos correspondientes a fuentes de datos homogéneas, un modelo de minería de datos válido para el conjunto formado por la unión de todas las fuentes de datos.
x En los resultados obtenidos de la implementación de la técnica de Clustering, se obtuvieron datos similares entre grupos, con la variación de un clúster y el tiempo de ejecución; en el
resultado de los algoritmos de las Reglas de asociación los resultados si variaron un poco más, a diferencia del algoritmo GSP, el cual devuelve todas las secuencias de ingreso por parte de los estudiantes en determinadas páginas, lo cual no pasa con el algoritmo de A- priori, ya que este algoritmo devuelve sólo la acción realizada pero no el total de accesos que el estudiante ha realizado en determinada página.
x Con el algoritmo A priori las reglas que se obtuvieron a partir de los conjuntos de entrenamiento disjuntos se los realizó con valores de soporte y confianza diferentes, para buscar los resultados más óptimos, en los experimentos realizados se obtuvieron similares características en los resultados obtenidos en el conjunto de datos centralizados. En estos experimentos es posible determinar un modelo de minería de datos válido para el conjunto formado por la unión de todas las reglas obtenidas.
x La técnica de Clustering ayuda a agrupar a los estudiantes con la finalidad de encontrar características similares en el comportamiento que tienen cuando interactúan con las herramientas del sistema, pero no ayuda a determinar las rutas de navegación que tienen los estudiantes dentro de la plataforma.
x El resultado obtenido con las técnicas de minería de datos y la herramienta Gephi en relación a los accesos, son similares en su mayoría, ambas metodologías arrojaron que el
FXUVR FRQ PD\RU QLYHO GH LQWHUDFFLyQ HV HQ OD DVLJQDWXUD µ0RGHODPLHQWR GH GDWRV >$@¶, además de determinar que las páginas con mayor nivel de frecuencia o accesos durante la navegación del estudiante en el sistema es en la categoría de páginas de Actividades correspondientes a los foros, cuestionarios y tareas.
x Los estudiantes con mayor número de interacciones en las herramientas de la plataforma son los enrolados en las materias de: Modelamiento de datos, Sistemas basados en el conocimiento y Teoría de colas.
x Los cursos con menor número de accesos e interacción con las herramientas de la plataforma son los estudiantes pertenecientes a las materia de Administración de herramientas CASE y Planeación estratégica.
x Las herramientas más utilizadas por los estudiantes cuando interactúan con la plataforma son: Foros, Cuestionarios, Recursos, Tareas, y Subida de archivos.
154
x Con la implementación de técnicas de minería Web en los datos de interacción de los estudiantes en la plataforma se puede determinar el nivel de aporte que brindan las herramientas y servicios en el aprendizaje, la comunicación y relación del estudiante con el profesor dentro de los cursos en los que se encuentran enrolados.
x Las técnicas visuales mediante grafos de la interacción que tienen los estudiantes con las herramientas de la plataforma del EVA, ayudan en la interpretación y análisis de los resultados obtenidos dentro de cada una de las herramientas para determinar el nivel de aporte que tienen los estudiantes en los cursos.
x Todos los algoritmos con los que se experimentó determinan que la herramienta con la cual los estudiantes tienen un nivel mayor de interacción y contribución es en los Foros, la cual corresponde a las páginas de actividades con un porcentaje total del 72%, seguido esta los cuestionarios (quiz) con un total del 27%, y luego esta la herramienta Recursos con un total del 15%, y finalmente están las tareas con un 8%, el blog con 0,7% y el twitter con el 0,3%.
RECOMENDACIONES
Las recomendaciones que se presentan a continuación, se las obtuvo a partir del análisis realizado en la presente tesis y según los resultados obtenidos de cada uno de los algoritmos implementados para el minado de los cursos.
x Las reglas de asociación clásicas son recomendadas para trabajarse en bases de datos transaccionales, y si es posible con atributos de tipo booleanas; sin embargo, los atributos de tipo categóricos o numéricos, en la minería Web presentan buenos resultados en cuestión de análisis de rutas de navegación o para determinar patrones de navegación o comportamiento de los estudiantes dentro de la plataforma, y a partir de ello si es necesario se puede reestructurar el contenido del sistema de acuerdo a la información obtenida del análisis.
x Del trabajo realizado se puede determinar que no es muy conveniente la aplicación de los algoritmos de reglas de asociación en bases de datos de gran tamaño; por lo menos en este tipo de estudios, o lo que se tenga que ver con búsqueda de patrones (navegación, acciones, interés, interacción, etc.), ya que esto puede resultar complejo y complicado en términos de tiempo y espacio; la obtención de un conjunto de reglas puede ser demasiado amplio y la interpretación de las reglas obtenidas para establecer su utilidad sería una labor muy dispendiosa inclusive para un experto en el tema, además que las reglas obtenidas no pueden ser muy claras y precisas.
x Las reglas de asociación difusas presentan algoritmos con los que se pueden alcanzar mejores representaciones, para obtener patrones de comportamiento de los usuarios durante su interacción con la plataforma del EVA.
x Se recomienda que el profesor interactúe con las diferentes herramientas y servicios de la plataforma del EVA, ya que se determinó que según el análisis de los resultados obtenidos los estudiantes acceden a las páginas e interactúan con las herramientas con las cuales el tutor trabaja; por lo cual se recomienda que el tutor trabaje con la mayor parte de la servicios disponibles para que el estudiante tenga un mayor nivel de aporte con las mismas en la plataforma.
x Según los resultados obtenidos con los algoritmos de Clustering (SimpleKMeans y EM) se pudo determinar que para realizar minería de datos aplicados a la educación es conveniente realizarlo por asignaturas, actividades o herramientas; ya que de esta manera se pueden obtener resultados más eficientes, debido a que el algoritmo implementado va a
156
agrupar a los estudiantes con mayor consistencia y similitud entre sus características e intereses; ya que al realizarlo por cursos no presentara datos muy consistentes debido a que no todos los estudiantes tienen un comportamiento de navegación similar, por ello el modelo presentara resultados poco confiables.
x Se recomienda trabajar con algoritmos de clustering (SimpleKMeans y EM) para agrupar a los estudiantes con características e intereses similares y con ello iniciar un aprendizaje colaborativo basado en grupos dentro de un determinado curso, ya que esta técnica permite descubrir patrones en los estudiantes que muestran comportamientos análogos.
x Ya que las técnicas de clasificación (J-48) permiten extraer reglas del árbol de decisión, y agrupar estudiantes con similares características, se recomienda utilizar este modelo para predecir el rendimiento de los estudiantes según la interacción con las herramientas y servicios disponibles dentro del curso, y con ello guiar la actividad del estudiante.