• No se han encontrado resultados

Recolección de datos de interacción de alumnos en una plataforma e learning para obtener indicadores de interes de su actividad aplicando técnicas de aprendizaje automático

N/A
N/A
Protected

Academic year: 2017

Share "Recolección de datos de interacción de alumnos en una plataforma e learning para obtener indicadores de interes de su actividad aplicando técnicas de aprendizaje automático"

Copied!
145
0
0

Texto completo

(1)

¿a Po%,7 u

w

_JpJ

/?P" ?4ytk JOI»C(J'C) ¿7OS. 7c/

(2)

ESCUELA DE CIENCIAS DE LA COMPUTACIÓN

TEMA:

"Recolección de datos de interacción de alumnos en una

plataforma E-learning para obtener indicadores de interés de su

actividad aplicando técnicas de aprendizaje automático"

TESIS PREVIA A LA OBTENCIÓN DEL TÍTULO EN INGENIERO EN SISTEMAS INFORMÁTICOS Y COMPUTACIÓN

Autor:

Juan Carlos Jiménez Lozano

Director:

Ing. Greyson Alberca

(3)

(ng. Greyson Alberca DIRECTOR DE TESIS

CERTIFICA:

Que ha dirigido investigación, y establecidas por pertinentes.

y supervisado todo el desarrollo del una vez que el mismo cumple con la Institución, autoriza su presentación

presente trabajo de todas Las exigencias para Los fines legales

Loja, Junio del 2007

(4)

CERTIFICA:

Que ha dirigido investigación, y establecidas por pertinentes.

y supervisado todo el desarrollo del una vez que el mismo cumple con la Institución, autoriza su presentación

presente trabajo de todas las exigencias para los fines Legales

Loja, Junio del 2007

Ing. José Luis Granda

(5)

AUTORÍA

Los resultados, análisis, conclusiones y recomendaciones que se presentan en éste trabajo son de exclusiva responsabilidad de[ autor.

(6)

Yo, Juan Carlos Jiménez Lozano declaro conocer y aceptar la disposición del, Art. 67 de[ Estatuto Orgánico de La Universidad Técnica Particular de Loja que en su parte pertinente textualmente dice: "Forman parte del patrimonio de la Universidad la propiedad intelectual de investigaciones, trabajos científicos o técnicos y tesis de grado que se realicen a través, o con el apoyo financiero, académico o institucional (operativo) de la Universidad".

(7)

AGRADECIMIENTO

Quiero dar gracias a mi vida en donde sociedad, te pido ç metas.

Dios, por permitirme llegar a esta etapa tan importante de empieza un nuevo reto, que es el de enfrentarme a la ue guíes mi camino para hacer realidad mis sueños y mis

A todos los profesionales, que con su conocimiento supieron guiar el desarrollo del presente proyecto, Les agradezco de todo corazón.

A la Universidad Técnica Particular de Loja por brindarme La formación académica durante todos estos años de educación.

A todos mis amigos por darme su apoyo día a día, porque sin ellos no Lo hubiera logrado, Les prometo que no les faltaré.

(8)

Este proyecto se Lo dedico a mis padres, con todo el cariño del mundo, porque ellos me apoyaron en cada etapa de mi vida con su constante sacrificio y dedicación, es por eso que ellos son lo más importante que tengo en la vida, es el momento de devolverles todo Lo que me han dado, y La culminación de este trabajo es solo el principio.

(9)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

INDICE DE CONTENIDOS

RESUMEN ...3

ORGANIZACIÓN DE LA MEMORIA ... ...4

INTRODUCCIÓN ... 5

FUNDAMENTOS Y TRABAJOS RELACIONADOS

...

6

OBJETIVOS ...11

CAPÍTULO I

I:

DESCRIPCIÓN DEL PROBLEMA

... . ... 13

1.1. ESTADO ACTUAL DEL CAMPUS VIRTUAL DE LA UTPL ...13

1.2. PLANTEAMIENTO DEL PROBLEMA

...

16

1.3. DESCRIPCIÓN DE LA SOLUCIÓN

...

17

1.4. CoNClusioNEs DEL CAPÍTULO

...

17

CAPÍTULO II: SOLUCIÓN DEL PROBLEMA

... . ...

19

2.1. INTRODUCCIÓN...19

2.2. METODOLOGÍA DE LA INVESTIGACIÓN ...19

2.3. PLANTEAMIENTO DE LA HIPÓTESIS

...

21

2.4. FASESDEL PROCESO

...

21

2.5. DESCRIPCIÓN DE LA SOLUCIÓN

...

.25

2.6. COMPONENTES DE LA SOLUCIÓN

... . ...

26

2.7. VENTAJAS DE LA SOLUCIÓN

...

31

2.8. ARQUITECTURA DE LA SOLUCiÓN...

...

32

2.9. LIMITACIONES

...

33

2.10. CONCLUSIONES DEL CAPÍTULO

...

34

CAPÍTULO III: DESARROLLO DE LA SOLUCIÓN Y RESULTADOS OBTENIDOS

... . ...

36

3.1 INTRODUCCIÓN

...

36

3.2 FASE 1: APRENDER EL DOMINIO DE LA APLICACIÓN

...

36

3.3 FASE II: MODELADO DEL USUARIO Y CREACIÓN DE LA BASE DE DATOS DE TRABAJO

...

47

3.4 FASE III: LIMPIEZA Y PRE-PROCESAMIENTO DE LOS DATOS

...

52

3.5 FASE IV: ELECCIÓN DEL ALGORITMO DE MINERÍA DE DATOS ... .

...

55

3.6 FASE V:MINERÍADE DATOS

...

58

3.7 FASE VI: INTERPRETACIÓN, PRESENTACIÓN DE RESULTADOS Y ANÁLISIS DE LOS INDICADORES DE INTERÉS 66 3.8 FASE Vil: UTILIZACIÓN DEL CONOCIMIENTO OBTENIDO

...

81

3.9 DISCUSIÓN SOBRE LOS INDICADORES DE INTERÉS

...

86

(10)

CONCLUSIONES... 91

RECOMENDACIONES Y TRABAJOS FUTUROS ... 94

BIBLIOGRAFÍA... . ... . ... 96

ANEXOS... 98

ANEXO 1: INSTALACIÓN Y PRUEBAS REALIZADAS EN LA PLATAFORMA DOTLRN ... 98

ANEXO 2: ANÁLISIS DE LA PLATAFORMA MOODLE Y OBTENCIÓN DE LOS DATOS DE INTERACCIÓN. ... 103

ANEXO 3: UTILIZACIÓN DE LA HERRAMIENTA WEKA PARA LA MINERÍA DE DATOS ... 107

(11)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

RESUMEN

(12)

ORGANIZACIÓN DE LA MEMORIA

(13)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

INTRODUCCIÓN

Desde la revolución industrial, la educación a distancia surge para facilitar (a especialización de las personas. Y así con el avanzar de los tiempos, La tecnología siempre ha presentado diferentes opciones para compartir información, desde material impreso, radio conferencias, tele conferencias, videos e incluso CD-ROMs apoyados por correspondencia postal y ((amadas telefónicas.

Con Internet se ha dado un nuevo paso en el tema de la educación a distancia convirtiéndola en una experencia virtual. El E . Leaming es La forma de designar a este tipo de educación que se brinda a través de Internet.

En un entorno de E-Learning la entidad educativa debe proporcionar información ya sea de texto, multimedia, video o audio a través de un sitio Web normalmente de acceso restringido. Al inicio se valida a cada usuario para ingresar y esto permite mantener reportes de sus avances en los ejercicios y material del curso. El soporte de parte de los instructores se da por medio de correo electrónico, chats de texto y vos, mensajeros (ej.: ICQ, MSN Messenger o propios), foros de discusión o incluso videoconferencias. Existe gran variedad de plataformas en el mercado que ofrecen todo este conjunto de herramientas, dejando la libertad al instructor de organizarlas según su preferencia para el curso.

(14)

FUNDAMENTOS Y TRABAJOS RELACIONADOS

Actualmente La educación a distancia ha experimentado un gran crecimiento, debido a La introducción de nuevas herramientas de Informática y telecomunicaciones de cobertura global, y se ha llegado a establecer que la educación basada en ambientes colaborativos a través de Internet resultan una forma válida de educación, muy económica y de alta calidad, que puede aumentar el valor del capital intelectual de Las personas a gran escala. Uno de los elementos más importantes de este crecimiento ha sido La rápida expansión del Internet, que combinada con el desarrollo de sofisticadas herramientas de aprendizaje a través de la red y facilidades de multimedia, produce un importante salto en La educación a distancia.

Todos estos adelantos han dado apertura a La tecnología e-learning, la cual se

puede definir como "aquella actividad que utiliza de manera integrada

recursos informáticos de comunicación y de producción para la formación de

un ambiente y una metodología de desarrollo del proceso de

enseñanza-aprendizaje, la cual tendrá como medio de transmisión el uso de las redes de

comunicación electrónicas públicas tales como la Internet, o redes

privadas"'.

El desarrollo actual de los sistemas de e-learning, se ha incrementado exponencialmente en los últimos años y ha motivado a la aplicación de técnicas de Minería de Datos o descubrimiento de conocimiento como herramientas para poder mejorar el aprendizaje en los sistemas de e-Learning.

La Minería de Datos

es

"el descubrimiento semi-automático de patrones,

asociaciones, cambios, anomalías y estructuras estadísticamente significantes

y eventos en los datos"2.

La minería de datos difiere de la estadística

1 Tomado de "Las Nuevas Tendencias del E-learning". [Cátedra Telefónica - UPC. 2004] [http: / /www. upc .edu/web/CatedraTetefonicauPcldocslworking%zoreport%2omjmo[.2oo4.. 01 .pdf].

(15)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

tradicional en cuanto a que en la estadística una hipótesis está formulada y validada en los datos, mientras que en el proceso de minería de datos Los patrones se extraen automáticamente de los datos, es decir, La Minería de Datos es un manejo de datos mientras que la estadística es un manejo más del hombre.

Las bases de La Minería de Datos se encuentran en la Inteligencia Artificial y en el Análisis Estadístico. Mediante los modelos extraídos utilizando técnicas de Minería de Datos se aborda La solución a problemas de predicción, clasificación y segmentación. Un proceso típico de Minería de Datos parte de la selección de[ conjunto de datos, tanto en lo que se refiere a las variables dependientes, como a Las variables objetivo, como posiblemente al muestreo de Los registros disponibles. [20]

Como consecuencia de este análisis, el conjunto de datos de entrada se le aplican una serie de transformaciones para prepararlo para aplicar la técnica de Minería de Datos que mejor se adapta, a Los datos y al problema.

Finalmente se selecciona la técnica de minería, se construye el modelo predictivo, de clasificación o segmentación, y se evalúan los resultados contrastando con un conjunto de datos previamente reservado para validar la generalidad del modelo.

Los modelos obtenidos por las técnicas de Minería de Datos se aplican incorporándolos en los sistemas de análisis de información, e incluso, en sistemas transaccionales, para con esto encontrar comportamientos interesantes ya sea por parte de Los usuarios o de la misma información que se encuentra almacenada dentro de estos sistemas.

(16)

centralizan información potencialmente útil de todas sus áreas de negocio, etc. No obstante, actualmente está cobrando una importancia cada vez mayor La Minería de Datos Desestructurada como información contenida en ficheros de texto, en Internet, etc. [20]

Las principales aplicaciones de Las técnicas de Minería de Datos en educación, son: sistemas de personalización, sistemas recomendadores, sistemas de modificación, sistemas de detección de irregularidades, etc. debido a sus capacidades para: el descubrimiento de patronés de navegación regulares e irregulares, realización de clasificaciones de alumnos y de los contenidos, construcción adaptativa de planes de enseñanza, descubrimiento de relaciones entre actividades, diagnóstico incremental de los estudiantes, etc.[1]

En la actualidad existen muchos proyectos de Minería de Datos orientados a la mejora de sistemas e-learning, entre algunos de estos proyectos se pueden destacar:

• Romero, Ventura y Hérvas (2002), desarrollaron una herramienta visual para el descubrimiento de conocimiento en forma de reglas de predicción para la mejora de sistemas hipermedia adaptativos educativos basados en web [23].

• Itmazi Jamill (2005), desarrolló un Sistema Flexible de Gestión del e-[earning para soportar el aprendizaje en las universidades tradicionales y abiertas.

• Magdalena Servente (2002), muestra una aplicación de los algoritmos TDIDT (Top-Down-Induction-Trees) orientados a la minería de datos inteligente, en donde se menciona un estudio completo del funcionamiento de los algoritmos basados en árboles de decisión [4].

(17)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

de aprendizaje automático, en donde se propone varios métodos y procedimientos para la creación de modelos de usuario, de los cuales se tomó en cuenta algunas recomendaciones que el autor proponía, para luego ser aplicadas en el presente proyecto.

. Asimismo en la UTPL existe un proyecto realizado por las ingenieras, Martha Agita y Priscila Valdivieso, cuyo tema muestra el modelado automático en sistemas interactivos de enseñanza aprendizaje [24].

Para el presente proyecto se pretende realizar un análisis de Minería de Datos a la plataforma e-learning (o Entorno Virtual de Aprendizaje) que posee la UTPL, esto con la finalidad de encontrar indicadores de interés que reflejen la manera en que los estudiantes interactúan con las herramientas de la plataforma, posteriormente a este análisis, se espera obtener un modelo de usuario, el cual sirva como base fundamental para el desarrollo de un sistema recomendador orientado hacia los estudiantes, esto con el fin de mejorar su proceso de aprendizaje y por otra parte determinar la efectividad de las herramientas de la plataforma en cuanto a su nivel de utilización por parte de los estudiantes.

De acuerdo a (a investigación realizada por [Romero, Ventura y Hervás. 2005], la aplicación de técnicas de Minería de Datos en educación se puede ver desde dos puntos de vista u orientaciones distintas:

(18)

• Orientado hacia los estudiantes: Con el objetivo de ayudar o realizar recomendaciones a los alumnos durante su interacción con el sistema de e-learning para poder mejorar su aprendizaje. Sus principales aplicaciones son: sugerir buenas experiencias de aprendizaje a los estudiantes, adaptación del curso según el progreso del aprendiz, ayudar a los estudiantes dando sugerencias y atajos, recomendar caminos más cortos y personaLizados, etc.

Como se menciona anteriormente luego de realizar el análisis de Minería de Datos y de los indicadores de interés, se tiene una base para construir un

sistema recomendador, el cual como su nombre lo dice presenta

recomendaciones, de acuerdo a una clase o tipo que es asignada por dicho

(19)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

OBJETIVOS

Objetivo General

Obtener indicadores de interés que permitan Ea toma de decisiones oportunas para el mejoramiento de Las herramientas de La plataforma E-Leaming de la UTPL a través de la aplicación de técnicas de Minería de Datos en conjunto con las técnicas de aprendizaje automático.

Objetivos Específicos

• Realizar un análisis comparativo entre La plataforma E-Learning que actualmente tiene la Universidad Técnica Particular de Loja y otras plataformas.

• Identificar y obtener los datos de los estudiantes que se encuentran registrados dentro de La plataforma E-leaming de la UTPL, Los cuales se incluirán dentro del modelo de usuario.

• Construir un modelo de usuario basado en los resultados obtenidos por La aplicación de técnicas de aprendizaje automático, para con esto realizar una clasificación de los estudiantes de acuerdo aL nivel de interacción dentro de la plataforma.

• Interpretar los resultados obtenidos del análisis de Minería de Datos para determinar cual es La técnica de aprendizaje automático que mejor se adapta al modelo de usuario propuesto.

(20)

Resultados Esperados

Una vez concluido el presente trabajo de investigación se pretende plantear un modelo de usuario basado en los datos obtenidos de La plataforma E-leaming que tiene la UTPL, para determinar el nivel de interacción del estudiante con las herramientas de la plataforma, con lo cual se presentará recomendaciones aL estudiante sobre cómo mejorar la utilización de las herramientas y así optimizar La manera en que el estudiante aprende al utilizar dichas herramientas.

(21)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

CAPÍTULO 1: Descripción del Problema

1.1. Estado Actual del Campus Virtual de la UTPL

Actualmente La Universidad Técnica Particular de Loja cuenta con un campus virtual el cual sirve como herramienta de apoyo académico para docentes y profesionales en formación; este campus cuenta con una variedad de utilidades en las que el docente está en La capacidad de realizar: anuncios sobre su asignatura(s), creación de foros de discusión sobre algún tema en particular, tener un portafolio virtual para almacenar documentos, presentaciones, un Chat interactivo, etc.

Asimismo el profesional en formación puede hacer uso de estas herramientas, con todo esto existe una interacción entre los docentes y sus alumnos creando así un ambiente enseñanza-aprendizaje colaborativo a través de Internet.

.3,505 It asiereSueSe rse

Universidad Técnica Particular de Loja OEeIrseee 0VO U3C '0.5

Actior edición No hay mensajes en espera

V er aojes

Acceso tirecto a

Bbhcteca -1uaj Siblicteca de

J j

'decccncerenaas Rocositsm it Obstas do aprenc ceje

AcOn,dade, Consultes Foros

Hola, Administrador AVE3 UTPL

Bienvanid@ al Ambiente Virtual de Apoyo al Aprendizaje AVE3.

Ø.e. osocuer ,lenoioae creso.rigaa5a. ae 4. iitt.de 4. derecha -3 Agre gar nuevo tema

Frase del ulla

de AOnjnis0000r A V E! JIEL . ester. 23 oeaaarodn 2057, ¶024

Maestro, quisiera saber cómo viven los peces en el mar. Como los hombres en la tierra: los grandes se comen a los pequeños.

CateQoflae

sos

° I9TRODUOTORIOS 'BIERT.'

',í 3ErtIPRESEtlCAL ;IFitliJ_ _ATIN EulERICAJs 3JMllERSCl-lOOL 7110DE1IIA JOILh

CuRSOS AbIERTOS

William Shakespeare

Página principal del Entorno Virtual de Aprendizaje (EVA) de la UTPL

(22)

Actualmente la UTPL cuenta con 2 campus virtuales: TeLeduc[8], el cual es el primer campus implementado en la universidad, y se Lo utiliza para Los cursos On-line dictados a través de Internet y Moodle[7] que en la actualidad se [o utiliza para Las modalidades presencial y a distancia, debido a que presenta mejores funcionalidades frente a Teleduc.

Como se menciona en los objetivos de la investigación se piensa construir un modelo de usuario basado en los resultados obtenidos por la aplicación de técnicas de aprendizaje automático y Minería de Datos, y para esto es necesario saber la forma en que se almacenan las actividades realizadas en la plataforma, cómo está estructurada la base de datos y cómo de qué forma la plataforma almacena las actividades realizadas dentro la misma.

1.1.1 Metodología y capacitación de los Facilitadores sobre el manejo del

Campus Virtual3

El cumplimiento del accionar docente dentro del Entorno Virtual de la UTPL, es verificado desde La Unidad de Virtualización a través del personal encargado de realizar un seguimiento. Para este proceso, el personal encargado tiene acceso directo a las aulas donde ofrece tutoría virtual el docente.

Es responsabilidad del personal encargado del seguimiento realizar sondeos en forma aleatoria a las carreras, asignaturas y docentes en forma

diaria, a fin de establecer un reporte semanal y io mensual. Concluido el

primer bimestre los reportes se hacen conocer a [os docentes a través del Director de La carrera respectiva; de igual manera, al finalizar el segundo bimestre, el personal encargado del seguimiento establece un informe final del desempeño docente. Estos datos constituyen indicadores de la responsabilidad con que la Universidad asume la actividad académica frente a sus estudiantes.

En tal virtud, es de suma importancia el grado de conciencia que tiene el docente frente a su responsabilidad como formador.

(23)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

EL proceso de capacitación sobre manejo del Entorno Virtual de Aprendizaje se realiza tomando en consideración el manual impreso denominado "Manual del Facilitador para el manejo del Entorno Virtual de Aprendizaje de La UTPL". La capacitación se realiza en dos fases: una presencial y otra a distancia.

En la fase presencial: la asistencia es fundamental, dado que ello

posibilita entablar una relación directa con el facilitador del curso y esclarecer las dudas e inconvenientes que se pudieren tener. El cumplimiento de esta fase requiere de un lugar adecuado, en nuestro caso de una Sala de la UPSI, implementado de un suficiente número de computadoras con conexión a Internet, donde cada participante contará con un computador personal.

En la fase a distancia /virtual: para esta fase se propone una serie de

ejercicios prácticos que se encuentran en las últimas páginas del Manual del Facilitador para el manejo del Entorno Virtual de Aprendizaje de la UTPL tiene una duración de cuatro días y tienen que desarrollarse a través del EVA.

Las fases previstas tienen una secuencia lógica dado que en la fase presencial el profesional en formación conoce y manipula las distintas herramientas del Entorno para pasar a La segunda fase donde, sin la asistencia del facilitador, debe cumplir con el desarrollo de las actividades a través del Entorno Virtual.

Criterios de evaluación y acreditación: el curso debe ser aprobado en sus

dos fases: en la fase presencial, se toma en cuenta la asistencia; y, en la fase a distancia, el cumplimiento de las actividades en un ciento por ciento.

(24)

• Colocar un anuncio de contenido por semana. • Establecer un foro por bimestre.

• Dar contestación de manera inmediata a los mensajes.

• Plantear, por Lo menos, un cuestionario sea de auto evaluación o de diagnóstico, durante el período académico.

• Agregar, por lo menos, cuatro recursos, durante el período académico.

Es necesario conocer las políticas que tiene La UTPL, para poder adaptar La construcción del modelo del usuario a Las necesidades que tiene la Universidad y sobretodo que los ejemplos estén basados en datos reales y se pueda identificar la interacción del estudiante con el campus virtual.

1.2. Planteamiento del Problema

En el apartado anterior se menciona cómo la Unidad de VirtuaUzación de La UTPL Lleva el control de Los docentes con respecto a la utiLización del entorno virtual de aprendizaje. Pero es muy importante saber "Cómo los estudiantes interactúan con el campus virtual?", para poder determinar que tan eficientes son estas herramientas, así como también presentar al estudiante recomendaciones para mejorar su experiencia como usuario dentro del campus virtual.

Es por eso que el objetivo de la presente investigación es el de obtener datos de interacción de los estudiantes dentro del campus virtual de la UTPL, para con esto aplicar técnicas de Minería de Datos en conjunto con Las técnicas de aprendizaje automático, para así determinar el nivel de participación de los estudiantes frente a las herramientas del campus virtual y así clasificarlos de acuerdo a su nivel de interacción.

(25)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

Este tipo de aplicaciones pertenecen a [a familia de los sistemas de hipermedia adaptativos4 (SHA5).

Estos sistemas no sólo proporcionan información sino que intentan adaptarse a las características del usuario de manera que la tarea con el ordenador sea mucho más sencilla y que éste aprenda mejor y más rápido [5].

1.3. Descripción de la Solución

• En primera instancia es preciso conocer el funcionamiento de la tecnología e-learning o sistemas adaptativos y colaborativos a través de Internet, esto con el objetivo de tener una correcta orientación y un soporte metodológico al momento de presentar los resultados.

• Obtención de datos de interacción para el modelado del usuario. Esto no es una tarea fácil, ya que se debe tener bien en claro qué atributos serán necesarios y bajo qué criterio serán seleccionados, después de esta fase se definirán las estrategias para la recolección de la información.

• Para la aplicación de las técnicas de Minería de Datos y técnicas de aprendizaje automático, se utilizará como herramienta la aplicación WEKA en su versión 3.4, aquí podremos encontrar los diferentes algoritmos de clasificación que servirán para el análisis de los datos.

• Finalmente se realizará la interpretación de los resultados del análisis de Minería de Datos para determinar cuales son los indicadores de interés y que datos importantes reflejan estos resultados, también se debe probar la efectividad del modelo del usuario frente a nuevos datos de interacción.

1.4. Conclusiones del Capítulo

En el presente capítulo se ha mostrado una descripción del estado actual del campus virtual que posee [a UTPL y cual es la metodología empleada para [a capacitación del personal docente en la utilización de las herramientas de la plataforma, esto con el objetivo de conocer las políticas que la Universidad tiene para vetar por el correcto proceso de aprendizaje de los estudiantes,

" Los SHAs son aquellos sistemas capaces de ajustar su presentación y navegación a las

(26)

utilizando el Entorno Virtual de Aprendizaje. Es de gran importancia conocer Las metodologías y políticas que tiene La UTPL ya que sirven como soporte metodológico en la fase del planteamiento del modelo del usuario.

De lo mencionado anteriormente, se puede concluir lo siguiente:

• La aplicación de las técnicas de Minería de Datos y los algoritmos de aprendizaje automático, serán [as herramientas utilizadas para construir el modelo del usuario, ya que el modelo deberá clasificar al estudiante de acuerdo a su nivel de interacción dentro del campus virtual, y en base a esta clasificación, presentar recomendaciones para el mejoramiento de la utilización de estas herramientas.

(27)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

CAPÍTULO II: Solución del Problema

2.1. Introducción

En este capítulo se describirá la estructura de la solución del problema, empezando con la definición de La metodología de la investigación que se utilizará para el desarrollo del proyecto, así como también el planteamiento de La hipótesis; esto es muy importante ya que en toda investigación se debe definir los métodos para orientar correctamente los objetivos de la misma. También se presentará las fases del proyecto, las cuales están orientadas hacia el proceso de extracción de conocimiento, esto con la finalidad de presentar los pasos a seguir, durante el desarrollo de La solución.

Luego de esto se presentará la descripción de la solución y cuales serán los componentes a utilizar para el cumplimiento de los objetivos, en donde se definirán las diferentes técnicas de aprendizaje automático y Minería de Datos que existen, para luego proceder a la descripción de la arquitectura de la solución.

Para la descripción de la arquitectura se presentará el estado actual de la arquitectura de la plataforma e-learning que posee la UTPL y se presentará una propuesta para la adaptación de un agente inteligente en la estructura de la misma, indicando Las ventajas y limitaciones en la aplicación de dicho agente.

2.2. Metodología de la Investigación

(28)

A continuación se presenta Los métodos utilizados durante el desarrollo del proyecto:

. Método Científico

EL método científico presenta diversas definiciones debido a La complejidad de una exactitud en su conceptualización: "Conjunto de pasos fijados de antemano por una disciplina con el fin de alcanzar conocimientos válidos mediante instrumentos confiables", "secuencia standard para formular y responder a una pregunta", "pauta que permite a los investigadores ir desde el punto A hasta el punto Z con la confianza de obtener un conocimiento

válido". Así el método es un conjunto de pasos que trata de protegernos de La

subjetividad en el conocimiento [21]. Este método se lo utiliza durante todas las fases del proyecto, ya que es importante conocer desde conceptos básicos de los sistemas e-learing, hasta la manera que se aplican los algoritmos de aprendizaje automático.

. Método Experimental

En este método el investigador interviene sobre el objeto de estudio modificando a esta directa o indirectamente para crear las condiciones necesarias que permitan revelar sus características fundamentales y sus relaciones esenciales bien sean [22]:

o Aislando al objeto y las propiedades que estudia de La influencia de otros factores.

o Reproduciendo el objeto de estudio en condiciones controladas.

o Modificando las condiciones bajo las cuales tiene lugar el proceso o fenómeno que se estudia.

(29)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

Durante la investigación se realizaron vanos experimentos con los campus virtuales que posee la UTPL, esto con el objetivo de conseguir la mejor fuente de datos de entrada para la construcción del modelo del usuario, además en el método experimental es necesario plantear una hipótesis, para poder definir el alcance del proyecto y en base a los resultados contrastar la validez de La hipótesis propuesta.

2.3. Planteamiento de la hipótesis

"La utilización de técnicas de aprendizaje automático nos permitirán obtener un modelo de usuario que esté en la capacidad de presentar las recomendaciones adecuadas, en base al nivel de interacción de los usuarios

con la plataforma e-learning"

2.4. Fases del Proceso

El proceso de búsqueda de conocimientos dentro de una plataforma e-learning

consiste de varias fases, a través de las cuales se creará un modelo para el análisis de la base de datos que esta contiene.

En la investigación realizada por Reyes y García se presentan las fases para el descubrimiento de información en bases de datos, las cuales se aplican en La mayoría de proyectos de Minería de Datos y descubrimiento del conocimiento, para la presente investigación se tomará algunas de estas fases. A continuación se muestra la descripción de las fases que se aplicarán durante el proyecto:

1. Aprender el dominio de la aplicación. Implica el adquirir

conocimiento del área de estudio del sistema y la meta a obtener. Se puede descomponer esta tarea en tres áreas:

a. Aprendizaje del tema. El analista debe conocer el proceso

detrás de la generación de la información para poder formular Las preguntas correctas, seleccionar las variables relevantes a

(30)

cada pregunta, interpretar los resultados y sugerir el curso de acción después de concluido el análisis. Es decir que se debe conocer el funcionamiento de La tecnología e-learning, su arquitectura, componentes y aspectos tecnológicos que ayuden a definir los objetivos del proyecto.

b. Recolección de datos. El analista debe conocer dónde se encuentran los datos correctos, cómo fueron obtenidos los datos de varias fuentes, cómo se pueden combinar estos datos y el grado de confianza de cada fuente. Para esto se debe acudir a las personas expertas en el tema, es decir buscar a los administradores de la plataforma e-learning, para saber la manera en que se almacenan los datos y así poder definir Los datos que se requieran obtener.

c. Experiencia en análisis de datos. El experto en DM6 debe tener conocimientos adecuados en el uso de la estadística. En el proyecto se aplican técnicas de análisis estadístico, para la inferencia de nuevos datos y descubrir la relación entre los datos recolectados.

2. Creación de la base de datos de trabajo. Consiste en elegir un subconjunto de variables o datos de muestra, de los cuales se obtendrá conocimiento. Esto con el fin de eliminar valores redundantes e inconsistencias en los datos de varias fuentes al juntarlos dentro de una sola base de datos. Para el presente proyecto nuestra base de datos de trabajo contiene un conjunto de variables elegidas en base a un criterio metodológico, las cuales conforman el modelo del usuario y contiene los datos del usuario y de su interacción con la plataforma, también con estos datos se infieren nuevos atributos para relacionar los datos y definir las clases.

3. Limpieza y pre-procesamiento de Los datos. El esquema general de un sistema de Aprendizaje Automático se lo realiza de La siguiente manera: Incluye operaciones básicas sobre los datos, como el filtrado

(31)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

para reducir ruido y decidir qué hacer con los datos faltantes. Otras tareas de pre-procesamiento no tan evidentes son:

a. Derivar nuevos atributos. Crear campos explícitos con relaciones entre los atributos conocidos, pueden hacer el análisis más sencillo. Como ya se mencionó, en la base de datos de trabajo se infieren nuevos datos, esto con el fin de encontrar relaciones entre los atributos que ya están definidos y encontrar un criterio de clasificación para distribuir cada una de las instancias.

b. Reducción de datos. En este paso el analista trata de buscar características útiles para representar los datos en función de las metas del proyecto y posiblemente también reducir Las dimensiones de la base de datos. En el proyecto se utilizó el análisis estadístico para elegir la muestra de los datos, es decir que cursos presentaban menos irregularidades en La distribución de los datos, esto con el fin de obtener un modelo confiable y con una variedad de ejemplos para conseguir óptimos resultados.

4. Elegir la función del algoritmo de Minería de Datos. El propósito del

modelo se decidirá en este paso. Usualmente los algoritmos de DM realizan una de las siguientes tareas:

a. Síntesis. Dados una gran cantidad de atributos, es necesario sintetizar los datos usando varias reglas características que simplificarán la construcción del modelo.

b. Asociación. Los algoritmos en esta clase generan reglas que asocian patrones de transacciones con cierta probabilidad.

c. Agrupamiento. Agrupar objetos dentro de clases, basados en sus características, maximizando la semejanza dentro de la misma clase, y minimizando la semejanza entre clases diferentes.

d. Clasificación y predicción. Categorizar datos basándose en un

(32)

Cabe mencionar que en el proyecto se utilizaron las técnicas de clasificación y predicción, ya que son técnicas de aprendizaje supervisado, las cuales parten de un modelo basado en ejemplos para luego probar su efectividad con nuevos datos, los cuales serán clasificados de acuerdo al modelo. Más adelante se explicará con detalle en qué consisten estas técnicas.

5. Elegir el algoritmo de Minería de Datos. La tarea consiste en seleccionar el método a ser usado para La búsqueda de patrones en los datos. Esto refina el alcance de la tarea anterior para utilizar el algoritmo más adecuado que ayude a alcanzar el objetivo final. Como se menciona en la fase 4, en el presente proyecto se utilizan las técnicas de clasificación y predicción, existen varios algoritmos de clasificación basados en modelos de aprendizaje supervisado, entre los más utilizados en proyectos de Minería de Datos, tenemos el algoritmo C4.5, redes neuronales, búsquedas heurísticas, etc.

6. Minería de Datos. Es el paso de análisis propiamente dicho. Para el análisis de Minería de Datos, se utilizará como herramienta WEKA, el cual es una aplicación libre, que contiene una variedad de algoritmos inteligentes para el procesado de la información. Una vez obtenidos los resultados se plantea el primer modelo del usuario.

7. Interpretación. Consiste en entender los resultados del análisis y sus implicaciones y puede llevar a regresar a alguno de los pasos anteriores. Hay técnicas de visualización que pueden ser útiles en este paso para facilitar el entendimiento. En el proyecto esto implica las pruebas realizadas al modelo del usuario, es decir ingresar nuevos datos para probar como el modelo clasifica La información nueva y así poder encontrar fallas o proponer nuevas reglas para optimizar el modelo propuesto.

8. Utilización del conocimiento obtenido. La aplicación de los patrones extraídos puede implicar uno de Los siguientes objetivos:

(33)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

b. Intervención. Los resultados pueden conducir a una intervención activa en el sistema modelado. Esto quiere decir que se puede definir las reglas necesarias, para implementar un sistema recomendador, el cual de acuerdo al nivel de interacción que posea el estudiante, el sistema sea capaz de presentar recomendaciones basadas en las reglas definidas en la base de conocimientos, y así ayudar al estudiante a mejorar su experiencia al utilizar las herramientas de la plataforma e-learning.

Evaluació presentac

Conocimiento /

" Minería de datos

/ Patrones

Selección y Transformación

Limpieza

II

Bases de datos Ficheros planos Datos externos

Características generales de un sistema de extracción del conocimiento

2.5. Descripción de la Solución

De acuerdo a las fases presentadas en el apartado anterior, se han definido las siguientes tareas:

. Conocimiento del funcionamiento de los sistemas e-Learning y la comparación de las tecnologías utilizadas en la UTPL frente a otras tecnologías similares.

• Utilización de la plataforma e-Eeaming que actualmente tiene la UTPL para la obtención de los datos.

(34)

. Combinación de Las técnicas de Minería de Datos con [as técnicas de aprendizaje automático, para realizar las tareas de preprocesado, visualización y clasificación de los datos.

• Identificación de Los algoritmos de aprendizaje automático, que presentan [os mejores resultados y una mejor clasificación de los datos. Así como también que algoritmos se adaptan mejor al modelo de usuario en el momento de trabajar con nuevos datos.

2.6. Componentes de la Solución

2.6.1. Aprendizaje Automático

El Aprendizaje Automático es una rama de la Inteligencia Artificial 7 cuyo objetivo es desarrollar técnicas que permitan a las computadoras aprender. De forma más concreta, se trata de crear programas capaces de generalizar comportamientos a partir de una información no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un proceso de inducción del conocimiento. En muchas ocasiones el campo de actuación del Aprendizaje Automático se solapa con el de la Estadística, ya que las dos disciplinas se basan en el análisis de datos. Sin embargo, el Aprendizaje Automático se centra más en el estudio de la Complejidad Computacional8 de los problemas [3].

2.6.2. Algoritmos de aprendizaje automático o de clasificación

Los diferentes algoritmos de Aprendizaje Automático se agrupan en una taxonomía en función de la salida de los mismos. Algunos tipos de algoritmos son [3]:

Aprendizaje supervisado

El algoritmo produce una función que establece una correspondencia entre las entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema de clasificación, donde el sistema de aprendizaje

' Se denomina inteligencia artificial a la ciencia que intenta la creación de programas para

Máquinas que imiten el comportamiento y la comprensión humana.

(35)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

trata de etiquetar (clasificar) una serie de vectores utilizando una entre vanas categorías (clases). La base de conocimiento del sistema está formada por ejemplos y datos de entrenamiento.

• Aprendizaje no supervisado

Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan sólo por entradas al sistema. No se tiene información sobre las categorías de esos ejemplos.

• Aprendizaje por refuerzo

El algoritmo aprende observando el mundo que le rodea. Su información de entrada es el feedback o retroalimentación 9 que obtiene del mundo exterior como respuesta a sus acciones.

Transducción

Similar al aprendizaje supervisado, pero no construye de forma explícita una función. Trata de predecir las categorías de los futuros ejemplos basándose en los ejemplos de entrada, sus respectivas categorías y los ejemplos nuevos al sistema.

Aprendizaje multi-tarea

Métodos de aprendizaje que usan conocimiento previamente aprendido por el sistema de cara a enfrentarse a problemas parecidos a los ya vistos.

2.6.3. Minería de Datos

La Minería de Datos es un caso especial de Aprendizaje Automático donde el escenario observado es una base de datos [4].

La Minería de Datos es un conjunto de técnicas para la inducción de conocimiento útil a partir de masas ingentes de datos. Tiene, por Lo tanto, un solapamiento importante con otras disciplinas como la estadística tradicional, el reconocimiento de patrones, la inteligencia artificial, etc.

(36)

Tradicionalmente, las técnicas de Minería de Datos se aplicaban sobre información contenida en almacenes de datos. De hecho, muchas grandes empresas e instituciones han creado y alimentan bases de datos especiaLmente diseñadas para proyectos de Minería de Datos en Las que centralizan información potencialmente útil de todas sus áreas de negocio, etc. No obstante, actualmente está cobrando una importancia cada vez mayor La Minería de Datos desestructurados como información contenida en ficheros de texto, en Internet, etc.

En la siguiente figura se muestra un diagrama clásico de Minería de Datos, el cual va a ser tomado para el desarrollo de La solución [4]:

- codifcac c.r de los

ejemplos ejemplos

BD • CM

Diagrama de Minería de Datos

Entorno (E)

'E' representa el entorno (el mundo real), sobre el cual se va a realizar el aprendizaje; asimismo representa un número finito de observaciones u objetos que son codificados en algún formato legible para el Aprendizaje Automático.

En este caso el entorno viene a representar el campus virtual de la UTPL en el cual se va a determinar la interacción entre los estudiantes y el campus virtual.

Base de Datos (BD)

(37)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

Minería de Datos (DM)

Finalmente el algoritmo utilizado para realizar La Minería de Datos construye un modelo a partir de la información en la base de datos. Los algoritmos utilizados para la clasificación de los datos son: el J48 (que es la implementación del algoritmo C4.5 en WEKA) y algoritmos para la generación de reglas de clasificación como el

PART y el NNge.

2.6.4. Técnicas de Minería de Datos

Cabe mencionar que las técnicas de aprendizaje automático se utilizan en la Minería de Datos y se clasifica en 2 grandes categorías10:

• Supervisadas o predictivas • No supervisadas o descriptivas.

Una técnica constituye el enfoque conceptual para extraer la información de los datos, y, en general es implementada por varios algoritmos. Cada algoritmo representa, en La práctica, la manera de desarrollar una determinada técnica paso a paso, de forma que es preciso un entendimiento de alto nivel de los algoritmos para saber cual es La técnica más apropiada para cada problema. Asimismo es preciso entender los parámetros y las características de los algoritmos para preparar los datos a analizar.

Las predicciones se utilizan para prever el comportamiento futuro de algún tipo de entidad mientras que una descripción puede ayudar a su comprensión. De hecho, los modelos predictivos pueden ser descriptivos (hasta donde sean comprensibles por personas) y los modelos descriptivos pueden emplearse para realizar predicciones. De esta forma, hay algoritmos o técnicas que pueden servir para distintos propósitos. Por ejemplo, las redes neuronales pueden servir para predicción, clasificación e incluso para aprendizaje no supervisado.

10 [Lopez. Herrero 2006 121 realizó un estudio de minería de datos para una muestra correspondiente a

(38)

Numérico

---:' Conceptual

I-'rODaDIIIStICO No Supervisadas

1 ( Apnori

Regresión

(Precciór)---- Arboles de Decisión

[image:38.569.64.486.48.729.2]

Estimador de Nucleos

Tabla de Desición

Arboles de Decisión

Inducción de Reglas ;:

Bayesiana

Basado en Ejemplares

' Redes Neuronales

Lógica Borrosa

icas

"idas

Técnicas Genéticas

(39)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

2.6.5. Datos de Entrada

Esta es la fase más importante en el diseño del modelado del usuario, porque se debe definir qué tipo de información vamos a obtener para crear el modelo, de acuerdo a [5] existen 3 tipos de datos:

. Los datos de usuario, que comprende a toda aquella información acerca de las características personales del usuario.

• Los datos de uso, se corresponden con toda aquella información acerca de (a interacción del usuario con el sistema, qué páginas ha visitado, qué mensajes o qué formularios ha enviado, etc. Estos datos pueden observarse directamente o bien pueden requerir un procesado a posteriori a partir de los datos que recoge el sistema.

• Los datos de entorno, comprenden todos aquellos aspectos del entorno del usuario, tanto hardware como software.

Para la recolección de estos datos es necesario comprender la estructura de la fuente de obtención de la información, en este caso conocer el modelo de la base de datos que posee la plataforma; para con esto saber qué atributos son los que se elegirán para la construcción del modelo. Existen algunas técnicas de recolección de datos (aplicaciones de administración de base de datos, logs de auditoría, scripts, etc.); en el capítulo 3 se mencionarán con mayor detalle la técnica utilizada para la obtención de los datos.

2.7. Ventajas de la Solución

La aplicación de las técnicas de aprendizaje automático en la construcción de un modelo de usuario inteligente nos brinda las siguientes ventajas:

• Clasificar a los estudiantes de acuerdo a su nivel de interacción con las herramientas de la plataforma e-learning.

• Motivar a los tutores a mejorar el modo en que se utilizan las herramientas de La plataforma.

(40)

• EL modelo propuesto puede de ser de utilidad para trabajos posteriores y son Las bases para la implementación de un sistema experto adaptativo.

2.8. Arquitectura de la solución

La arquitectura se basa concretamente en la aplicación de un agente inteligente dentro del modelo del usuario, es decir, que en base a los datos de interacción del usuario, el modelo sea capaz de asignar a dicho usuario a una clase predefinida por el agente, y a través de esta clasificación presentar las recomendaciones necesarias, acerca de su nivel de interacción con la plataforma.

ARQUITECTURA TRADICIONAL DE MOODLE

Herramientas Moodle Módulos en PHP

aveg

:

F

S

Recursos

Interacciones

Estudiante GNU/Linux

1 Base de Datos Moodle

Perfil de¡ MySQL

Apache Web Server L

—G;^l

Usuari

o

[image:40.569.75.519.290.452.2]

im

Figura que representa a la arquitectura de la plataforma elearning Moodle

En la figura anterior, se muestra La arquitectura que tiene la plataforma E-Learning Moodle, la cual consiste en una combinación de páginas Web dinámicas y módulos especializados en realizar operaciones sobre una base de datos, en donde el estudiante es registrado como un usuario del sistema y cualquier actividad que este realice dentro del sistema se almacena en un registro (log), para posteriormente ser utilizado para fines de auditoria o análisis de datos.

Para el proyecto, se hará uso de estos registros y otros datos del usuario para la construcción del modelo del usuario y la base de conocimientos. Esto permitirá definir las reglas de decisión e inferencia", para el diseño del agente inteligente, el cuál contiene los diferentes tipos de recomendaciones

(41)

Universidad Técnica ParticuLar de Loja Juan Carlos Jiménez Lozano

en base al nivel de interacción en La que el usuario será clasificado. El proceso para presentar tas recomendaciones consiste en: obtener los registros de Las interacciones del estudiante con Las herramientas y otros datos del usuario, obtenidos de la base de datos de la plataforma, para luego compararlos con las reglas de decisión definidas en el modelo del usuario y así clasificar al estudiante de acuerdo a su nivel de interacción general, y luego que el agente ubique al usuario en una clase predefinida, se presente las recomendaciones correspondientes a su nivel de interacción.

ARQUITECTURA MODIFICADA UTILIZANDO UN AGENTE INTELIGENTE

eta Remendacio

Herramientas Módulos en PHP

Ag~ Interacciones

Intekgente

—Almacena Interaccione

de Base de Datos Moodle

Usuario 1 MYSQL

-9

Estudiante GNU/Linux Apache Web Server

Implementación de un agente inteligente para la plataforma Moodle

2.9. Limitaciones

A continuación se presenta Las limitaciones que se dieron al momento de realizar La investigación:

(42)

. La UTPL cuenta con 2 plataformas e-learning, una para la modalidad a

distancia y virtual; y, otra para la modalidad presencial por Lo que se optó por utilizar La plataforma de la modalidad presencial debido a que existía mayor participación de Los estudiantes que en la otra plataforma, por lo que el modelo propuesto se adapta a los datos de esta plataforma.

• Es importante definir la población a ser anaLizada, por lo que se eligieron ciertos cursos de la carrera de "Sistemas informáticos y Computación" para realizar la obtención y el análisis de La información.

2.10. Conclusiones del capítulo

EL objetivo de este capítulo es el de presentar Las técnicas y herramientas para la construcción del modelo de usuario. Para el cumplimiento de los objetivos en primera instancia se debe definir la metodología de investigación, ya que representa un factor muy importante para el desarrollo de cualquier proyecto y ayudando a la persona a orientar correctamente las metas de la investigación, por esto se concluye que en el presente proyecto se utilizará el método científico y experimental, ya que el ámbito del proyecto pertenece a la rama de la inteligencia artificial y para la comprensión del tema se necesita realizar varias investigaciones y experimentos.

También se muestran las fases que se deben Llevar durante la elaboración de un proyecto de búsqueda de conocimiento dentro de una plataforma e-lea ming.

Luego de haber presentado Las técnicas de aprendizaje automático, se optó por tomar Las técnicas de aprendizaje supervisado como herramienta para La construcción del modelo de usuario, ya que de acuerdo a los objetivos del proyecto, se pretende clasificar a Los estudiantes de acuerdo a su nivel de participación, por lo tanto, se tiene que definir las categorías o clases en las cuales (os estudiantes van a ser correspondidos.

(43)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

(44)

CAPÍTULO III: Desarrollo de la Solución y Resultados

Obtenidos

3.1 Introducción

En el presente capítulo se describe tas experiencias que se tuvo durante las fases de desarrollo del proyecto, empezando con el aprendizaje del dominio de la aplicación, en donde se realiza el análisis comparativo de las plataformas que posee la UTPL y otras plataformas, esto con el fin de elegir la más adecuada para la recolección de Los datos de interacción. Una vez cumplida la fase de aprendizaje, se procede a determinar las técnicas de recolección de los datos y a la elaboración del modelo del usuario, donde se definen los atributos que éste poseerá, y que nuevos atributos es necesario inferir para encontrar relaciones entre las variables. Luego de realizar todas las tareas de recolección de datos, se procede a filtrar y eliminar datos que no son relevantes para la base de datos de trabajo, esto con el fin de tener los datos de entrada correctos para la realización del análisis de Minería de Datos.

Durante la fase de Minería de Datos, se presentará las experiencias en la aplicación de los algoritmos de Minería de Datos y técnicas de aprendizaje automático, para luego presentar los resultados obtenidos y la interpretación de los mismos.

Luego de la fase de interpretación de los resultados, se realizará el análisis de los indicadores de interés encontrados y qué datos importantes se pueden concluir de dicho análisis.

Finalmente se presentará la utilización del conocimiento obtenido, para la construcción del agente inteligente, propuesto en la arquitectura de la solución.

3.2 FASE 1: Aprender el dominio de la aplicación

(45)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

de[ análisis de Minería de Datos y que resultados se espera obtener. También se debe conocer cuales son los diferentes algoritmos de aprendizaje automático y cuales de estos se adaptan a los datos y a los objetivos que se quieran alcanzar.

Para el conocimiento de la tecnología e-learning a más de analizar las diferentes plataformas existentes, se realizaron pruebas con una plataforma piloto, para este caso elegimos la plataforma enseñanza aprendizaje dotLRN [6], los detalles técnicos se muestran con un mayor detalle en los anexos.

Una vez conocida esta tecnología se presentará las plataformas que utiliza la UTPL para las modalidades a distancia y presencial, asimismo se

realizará un estudio comparativo en estas plataformas y otras tecnologías.

3.2.1 Estado actual de la tecnología e-learning

El e-learning es un término que procede del inglés, y puede definirse

como "el uso de las ventajas del aprendizaje a través de Internet

(Educación. Virtual)".19]

En otras palabras, es La adaptación del ritmo de aprendizaje al alumno y la disponibilidad de las herramientas de aprendizaje independientemente de límites horarios o geográficos.

Las herramientas que componen esta estrategia de educación son, por un Lado, diferentes utilidades para La presentación de los contenidos (textos, animaciones, gráficos, vídeos) y por otro, herramientas de comunicación entre alumnos o entre alumnos y tutores de los cursos (correo electrónico, chat, foros). Pero, más allá de Las herramientas ocupadas, el e-leaming, como todo proceso educativo, requiere de un diseño instructivo sólido y que tome en cuenta, además de las consideraciones pedagógicas, Las ventajas y limitaciones de Internet y el comportamiento de los usuarios de la misma.

(46)

adaptada, etc. Cada uno de ellos utiliza un sistema o plataforma de enseñanza basado en Web que puede ser: o bien un sistema propio desarrollado específicamente por ellos mismos, o bien uno de Los múltiples sistemas comercial existentes corno: Web-CT, Virtual-U, TopCiass, etc. o de libre distribución como: ATutor, dotLRN, Moodle, etc.

Un problema de la mayoría de Los sistemas para La enseñanza basados en Web anteriores es que los cursos que proporcionan no son más que una red de páginas Web estáticas a través de las que navegan todos los estudiantes. Para solucionar este problema se han desarrollaron los Sistemas Hipermedia Adaptativos Basados en Web que son un nuevo tipo de sistemas educativos que provienen de la evolución de los Sistemas Tutores Inteligentes (STI) y de los Sistemas Hipermedia Adaptativos (SHA), y que comparten con ellos características tales como: aumento de la interacción con los usuarios y adaptación de los contenidos a las necesidades de estos. Para ello, construyen un modelo del alumno y lo utilizan durante la interacción con dicho usuario para adaptarse a sus necesidades [1].

3.2.2 Comparación entre las diferentes plataformas e-learning

A continuación se presenta un análisis comparativo entre las diferentes plataformas e-Learning, actualmente existen muchos tipos de plataformas algunas de tipo comercial y otras de libre distribución, la UTPL ha optado por elegir plataformas open source y no solo por el simple hecho de que sean gratuitas, sino por la cantidad de información sobre soporte y mantenimiento de estas plataformas.

(47)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

o dotLRN [10]

D0tLRN es una de Las plataformas más populares, por sus características para manejar comunidades virtuaLes y cursos adaptativos a través de Internet. Sus principales características son:

Nombre LMS 1I.LRN (dotLRN)

LRN fue desarrollado originalmente por el MIT (Massachussets 1 nstitute of Technology, USA). EL desarrollo del software y eL control de calidad y certificación está hoy en día coordinado por el Consorcio .LRN, una

Equipo de corporación sin ánimo de lucro y exenta de impuestos. Las instituciones desarrollo miembro establecen colectivamente las prioridades y también ofrecen ingresos o contribuciones en especie, según sea su elección, para las actividades y fines del Consorcio. Lista de miembros del consorcios en http: /Jwww. dottrn. or/about-us/

Tecnología .LRN está basado en Opon ACS (Opon Architecture Community System - un

utilizada conjunto de herramientas para construir aplicaciones Web escalables yorientadas a comunidades) que a su vez se basa en AOLserver.

Sistemas OpenACS está diseñado para sistemas tipo Unix. Está desarrollado

Operativos básicamente en Linux. Puede correr en Mac OS X y en Windows con

soportados VMWare.

Requisitos de

Bases de Oracle o PostgreSQL y AOLserver

Datos/Software Estandares de

E-Learning Hay módulos compatibles .LRN basados en Los estándares IMS y SCCRM. soportados

• La continuidad del desarrollo y (a calidad está asegurada por el Consorcio .LRN

• .LRN está basado en Opon ACS un conjunto de herramientas de Aspectos positivos • Foro, almacenamiento de ficheros, calendario, noticias,software Libre para construir aplicaciones Web escalables encuestas, FAQ, buzón de entrega de trabajos y e-maiL de grupo son aplicaciones "certificadas . LRN".

• Weblogs, evaluación, news aggregator, html editor, Web powerpoint, encuestas complejas, photo album y objetos de

Aspectos a aprendizaje son compatibles .LRN compatible (no "certificado mejorar .LRN") y se incluirán en futuras versiones.

• La instalación manual de .LRN es compleja.

Perfiles de .LRN posee un administrador principal, el cual tiene la capacidad de crear

Usuarios --

li

comunidades, cursos, asignar estudiantes y profesores.

Seguimiento de! Posee una herramienta (UserTracking), la cual presenta cuadros

estudiante estadísticos sobre (a tendencia de navegación que tienen los estudiantes.

(48)

una instalación piloto para conocer de manera rápida la tecnología utilizada y las herramientas que esta posee.

TelEduc [8]

TeLEduc es La plataforma que anteriormente la UTPL utilizaba como su Entorno Virtual de Aprendizaje (EVA) y que ahora se utiliza únicamente para la modalidad a distancia y virtual (pero próximamente los cursos serán migrados a La plataforma Moodle). Sus características principales son:

Nombre LMS Equipo de desarrollo Número de la versión evaluada Tecnología utilizada Sistemas Operativos

Teleduc

Desarrollada por investigadores del Nied (Núcleo de Informática ApI a la Educación) de la Unicamp.

0.7

LAMP (Linux, Apache, MySQL, PHP)

Requisitos de Bases IIPHP version 4.1.0. o mayor. Servidor Web Apache. Base de datos, de Datos/Software MySQL, herramienta gcc (para la compilación de módulos), Sendmail

1 (Para enviar correo electrónico), Navegador Lynx para uso de scripts.

Estandares de

E-Learning N se encontró información relacionada con este tema

• Es un sistema con una interfaz fácil e intuitiva al usuario • Se puede integrar con WebmaiL para la utilización del cor positivos electrónico.

• Capacidad para almacenar grandes cantidades de estudiantes.

• Existe escasa información para soporte y mantenimiento de es plataforma y la poca información que existe esta en portugués. • Únicamente soporta 3 idiomas: ingles, español y portugués. a mejorar • Cada curso posee una base de datos individual por lo qi

dificulta la administración de los cursos.

EL sistema posee cuatro roles predefinidos: administradore Perfiles de coordinadores de cursos, profesores, estudiantes.

Usuarios Los administradores pueden configurar los cursos y asignar estudiantes

profesores a dichos cursos.

IlTeleduc posee una sección para presentar de forma detallada 1 Seguimiento del interacción de los estudiantes con las diferentes herramientas que 1 Estudiante Iplataforma tiene; mostrando así la fecha, hora y número de accesos e

(49)

Universidad Técnica ParticuLar de Loja Juan Carlos Jiménez Lozano

Moodle[1O]

Moodle, es la plataforma que actualmente la UTPL está utilizando como herramienta de aprendizaje para la modalidad presencial, a continuación se presenta las características más importantes:

Nombre LMS IIMood1e

Em 1999 Martin Dougiamas (Australia) inició el proyecto Moodle. Equipo de desarrollo Actualmente colaboran en él alrededor de 100 personas entre

desarrolladores (cerca de 50), traductores (otros 40), beta-testers Tecnología utilizada PHP

Sistemas Operativos Unix, Linux, Windows, Mac OS X, Netware y cualquier otro sistema que soportados soporte PIIP.

PHP version 4.1.0. o mayor. Cualquier servidor Web que soporte PHP Requisitos de Bases (la mayoría de las instalaciones usan Apache). Una base de datos, de Datos/Software MySQL y PostgreSQL especialmente, pero también pueden usarse

Oracle, Access, Internase, ODBC y otras. res de E- 1

soportados Importación SCORM 1.2 y IMS-QTI

positivos

a mejorar

• El sistema es muy intuitivo y fácil de usar • Está traducido a más de 40 lenguas

• Se aøova en una øran comunidad de usuarios y desarroltadores • Está en marcha el proyecto de mejora de la documentaciór

MoodLe Documentation Project basado en Wiki.

• Se está trabajando en un repositorio de módulos desarrollados. • Se está trabajendo en el nivel de personalización de la

apariencia del sistema mediante plantillas.

• Moodte no soporta las especificaciones de accesibilidad (ej. W3C WAI)

• Moodle no soporta La exportación SCORM 1.2. y otros estandares de elearning

El sistema posee cuatro roles predefinidos: administradores, de Usuarios profesores, estudiantes e invitados.

Los administradores pueden configurar Los privilegios de Los usuarios. Los profesores pueden conseguir informes que muestren información rito del sobre el número de veces, hora, fecha y frecuencia de cada estudiante te que accede al contenido de un curso, al foro de discusión, evaluaciones

del curso y ejercicios.

(50)

servicios que posee La plataforma) y finalmente el grado de dificultad del administrador para el manejo de los cursos y usuarios de La plataforma. Con respecto a este último punto, se definen Los siguientes niveles: usual,

si La plataforma presenta funciones usuales de administración de( grupo (permisos de acceso, añadir usuarios, etc.) y avanzada, si La administración incluye funciones más complejas como es el de incluir o deshabiLitar servicios.

Plataforma Licencia Adaptación Datos Accesibles Flexibilidad Funciones del Admi Moodle GPL (Libre) Sencilla Base de Datos Si Avanzada

DotLRN GPL (Libre) Compleja Logs y Base de Datos Si Avanzada Teleduc GPL (Libre) Sencilla Base de Datos No Usual

Comparativa de plataformas a nivel de servicios y administración

3.2.3 Elección de la plataforma E-learning

Luego de La comparación realizada entre Las diferentes tecnologías e-Leaming, y el análisis de sus características, se eligió La plataforma Moodle para realizar el análisis y aplicación de Las técnicas de aprendizaje automático, debido a sus diferentes capacidades relacionadas a: La accesibilidad de La información; que tiene que ver con La estructura de La base de datos12, La posibilidad de adaptación de nuevas funcionaLidades;

esto se relaciona con La facilidad de incorporación de bloques dinámicos en La estructura de La plataforma, y finalmente La flexibilidad de La plataforma, en La implementación del agente propuesto en La arquitectura de La solución.

3.2.4 Elección de las técnicas de aprendizaje automático

En el capítulo 2 se presentó Las distintas técnicas de aprendizaje automático que existen, y de acuerdo a Las características que presentaban, se optó por utilizar Las técnicas de aprendizaje supervisado.

12 En el Anexo 2 se encuentra La descripción de las tablas de La plataforma MoodLe, que se

(51)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

En el aprendizaje supervisado existe un atributo especial, normalmente denominado clase, presente en todos los ejemplos que especifica si el ejemplo pertenece o no a un cierto concepto, que será el objetivo del aprendizaje. El atributo clase normalmente toma los valores + y -, que significan La pertenencia o no del ejemplo al concepto que se trata de aprender; es decir, que el ejemplo ejemplifica positivamente al concepto -pertenece al concepto- o bien lo ejemplifica negativamente-que no pertenece al concepto. Expresado en una forma breve, el objetivo del aprendizaje supervisado es: a partir de un conjunto de ejemplos, denominados de entrenamiento, de un cierto dominio D de ellos, construir criterios para determinar el valor del atributo clase en un ejemplo cualquiera del dominio. Esos criterios están basados en los valores de uno o varios de los otros pares (atributo; valor) que intervienen en La definición de Los ejemplos [12].

Experiencias en la recolección de datos en las plataformas e-learning que posee la UTPL

• Experiencias en la plataforma Teleduc

En La etapa inicial de La investigación, se tomó como muestra los cursos On-Line de la modalidad virtual de UTPL.

Los cursos que se tomaron para el análisis fueron:

• Programación Orientada a Objetos en C++ (40 estudiantes) • Desarrollo de Páginas Web dinámicas en PHP (36 estudiantes) o Legislación de proyectos informáticos (30 estudiantes)

(52)

En La base de datos de La plataforma TeLeduc se encontraban Los datos de interacción de Los estudiantes, por Lo que se pLanteó un modelo de usuario que contenía los siguientes datos:

Datos de Usuario: - Asignatura - Periodo

- Nombre del Curso

- Nombres y Apellidos del usuario - Sexo

- Localidad

Datos de Uso: Se tomó en cuenta únicamente el número de accesos a las

siguientes herramientas: - Foros

- Mensajes

- Preguntas Frecuentes - Consultas al profesor

En Las siguientes tablas se muestra el resultado de( análisis de Las interacciones de Los estudiantes con las herramientas de La plataforma Teleduc, en donde se especifica La asignatura, el número de estudiantes en dicha asignatura y la frecuencia de acceso a las herramientas:

Promedio de # de estudiantes # de estudiantes

-recuencia accesos en todo con accesosmenores al con accesosmayores al EstudiantesNúmero de

:Asgnatur. el ciclo promedio promedio

Programación 23 Accesos 29 11 40

Orientada a Objetos en C++

Desarrollo de 22 Accesos 20 16 36

Páginas Web dinámicas en PHP

Legislación de 13 Accesos 19 11 30

[image:52.573.87.475.529.664.2]

Proyectos Informáticos

Tabla # 1 - Frecuencia de interacción en los Foros

(53)

Universidad Técnica Particular de Loja Juan Carlos Jiménez Lozano

del promedio lo cual implica que únicamente se utiliza Los foros como herramienta de consulta, mas no de interacción o participación.

En La tabla #2, tenemos que el promedio de accesos a Los mensajes es bajo, por (o que se puede concluir que esta herramienta casi no es utilizada por los estudiantes, por Lo que la presencia de accesos nulos o vacíos daría problemas al momento de construir el modelo.

Promedio de # de estudiantes # de estudiantes

Frecuencia Accesos en todo con accesos con accesos Número de menores al mayores al Estudiantes Asignatura"-. el OCIO promedio promedio

Programación 5 accesos 29 11 40

Orientada a Objetos en C++

Desarrollo de 5 accesos 29 7 36

Páginas Web dinámicas en PHP

Legislación de 2 accesos 23 7 30

[image:53.572.88.486.603.739.2]

Proyectos Informáticos

Tabla # 3 - Frecuencia de interacción en los Preguntas Frecuentes

Figure

Tabla de Desición
Figura que representa a la arquitectura de la plataforma elearning Moodle
Tabla # 1 - Frecuencia de interacción en los Foros
Tabla # 3 - Frecuencia de interacción en los Preguntas Frecuentes
+5

Referencias

Documento similar

[r]

[r]

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

dente: algunas decían que doña Leonor, "con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Entre nosotros anda un escritor de cosas de filología, paisano de Costa, que no deja de tener ingenio y garbo; pero cuyas obras tienen de todo menos de ciencia, y aun

diabetes, chronic respiratory disease and cancer) targeted in the Global Action Plan on NCDs as well as other noncommunicable conditions of particular concern in the European

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de