16 xUn modelo matemático que predice las ventas.
2. Herramientas para el análisis de Logs.
Con el crecimiento explosivo de las fuentes de información disponibles en Internet, se hace cada vez más necesario que los investigadores utilicen herramientas automatizadas para el hallazgo de los recursos deseados de la información, y así poder rastrear y analizar sus patrones de uso.
Para realizar el proceso de extraer conocimiento del contenido de documentos y de sus descripciones o lo que también se conoce como explotación minera para extraer patrones interesantes en registros de acceso de Internet existen muchas herramientas.
Según el estudio realizado por [Sánchez, 2008] Estas herramientas son sistemas inteligentes que trabajan tanto del lado del servidor, como del lado del cliente, para poder minar toda la información que se genera con el uso de Internet y su análisis se realiza a partir de la información que hay en los Log del servidor de Internet y el servidor de correo:
2.1. Logs.
La entidad que contiene los Logs son una grabación de las acciones actividad y eventos dentro del servidor Web a lo largo de un periodo de tiempo determinado. Los Logs van guardando información acerca de cada una de las visitas de los usuarios al sitio [Sánchez, 2008]:
x A qué hora un usuario navega por el sitio,
x Qué acciones realiza y qué archivos entra a visitar dentro del sitio,
x cuánto dura la visita y cuánto tiempo pasa en cada uno de los eventos dentro del sitio,
x de qué carrera es, qué navegador usa, y qué sistema operativo,
x El número de veces que accede al sistema,
x El número de veces que realiza determinada acción, etc.
La información de acciones y eventos realizados por el usuario presentada por las herramientas de la Web Mining, y en especial el sistema inteligente de los ficheros Log, analizan y procesan estos Logs para producir información significativa, clara y detallada; y es por tal motivo, que se decidió trabajar con esta herramienta para el descubrimiento de patrones. Parte de la información presentada es; la navegación del estudiante durante la interacción con el EVA, y los patrones que tiene cuando realiza una petición en el sistema. Debido a que los contenidos de Internet consisten en varios tipos de datos, como texto, imagen, video, metadatos o hiperligas, investigaciones recientes usan el término multimedia data mining (minería de datos multimedia) como una instancia del Web mining para tratar ese tipo de datos.
El detalle de las acciones que realiza el usuario cuando interactúa con el EVA, que se encuentran dentro de los ficheros Log; son necesarios para la inferencia de patrones de navegación, ya que estas acciones del estudiante nos ayudan a determinar la manera de navegación del estudiante y de cómo los estudiantes aprenden y realizan sus tareas dentro del EVA, cuando navegan por el mismo; y de esta manera poder descubrir y predecir los patrones de navegación que tiene el estudiante cuando interactúa con el EVA de la manera más acertada.
La información almacenada dentro de los archivos Logs, también puede ser procesada por programas de estadísticas como son: awstats, webtrends o clicktracks, que, a pesar de ser limitados en cuanto al proceso de la información, nos ofrecen pistas para la mejora del entorno, ya que devuelven información estructurada y significativa acerca de la navegación, por ejemplo:
x Cantidad de visitas por hora, por día, por mes, etc.,
x horas pico y horas de baja audiencia,
x acciones hechas con mayor frecuencia,
x acciones de entrada y salida más frecuentes dentro del entorno virtual,
x uso del buscador, ranking de palabras clave usadas para llegar,
x herramientas utilizadas durante la navega del usuario,
x servicios visitados por el usuario,
24
2.2. Herramientas incorporadas al servidor.
Estas son aplicaciones del lado del servidor, que corresponden a programas que procesan en tiempo real los datos que van almacenando en los archivos Log. Corren en el servidor, y el acceso a la información del tráfico, tanto estadística, como gráfica es mediante una interface en línea. Generalmente, este tipo de soluciones vienen incluidas en las ofertas de alojamiento Web, ya sea un servidor dedicado o compartido. [Sánchez, 2008].
2.3. Herramientas en máquinas personales.
Son un software que se instala de manera independiente en máquinas de escritorio y su objetivo es hacer de igual manera análisis de Logs, pero no en tiempo real. Esta opción consiste en la descarga de los Log, para el posterior procesamiento de los mismos, por lo tanto, es necesario tener acceso a estos registros, cuestión que debe consultarse con el proveedor de alojamiento Web. Luego, mediante uno de este software especializado que se utiliza en una típica PC de escritorio, y sin requerir acceso a Internet, se desarrollan informes sobre estadísticas a fondo, en poco tiempo. Este es uno de los modos más atractivos y productivos de análisis para investigadores [Sánchez, 2008].
Para el análisis de los datos dentro de la presente tesis se consideraran dos de las herramientas de trabajo, las cuales son los Logs que son las acciones que realizan los estudiantes dentro de la plataforma, y además la herramienta en máquinas personales que será la herramienta de Weka, la cual permitirá realizar la minería en los archivos Log; los cuales serán extraídos de la base de datos del EVA mediante consultas en lenguaje SQL, y de esta manera poder posteriormente realizar un análisis de las técnicas aplicados para descubrir con ellas los patrones de navegación en los estudiantes, cuando interactúan con las herramientas del EVA.