• No se han encontrado resultados

Propuesta entrega definitiva noviembre 25

N/A
N/A
Protected

Academic year: 2020

Share "Propuesta entrega definitiva noviembre 25"

Copied!
22
0
0

Texto completo

(1)

Página 1 de 22 FACULTAD DE INGENIERÍA

UNIDAD DE POSGRADOS

PRESENTACIÓN PROPUESTA

TESIS DE MAESTRÍA:

TRABAJO FINAL DE ESPECIALIZACIÓN:

1.

PROPONENTE: Gilberto Dulcey Caballero

2.

CÓDIGO:

3.

CORREO: [email protected]

4.

PROGRAMA: MAESTRÍA EN INGENIERIA DE

SISTEMAS Y COMPUTACIÓN

5.

DIRECTOR PROPUESTO: Fabio A. Gonzalez

DEPARTAMENTO: Ingeniería de Sistemas e Industrial

TÍTULO:

Modelo para la predicción de la deserción estudiantil en formación

virtual basado en Minería Datos.

LÍNEA DE INVESTIGACIÓN: Minería de datos.

6. ANTECEDENTES Y JUSTIFICACIÓN:

6.1 INTRODUCCIÓN

(2)

Página 2 de 22 La enseñanza a distancia a través de Internet es uno de los cambios considerados por las universidades para así poder llegar a aquellas personas que tienen dificultades para llevar a cabo una enseñanza de forma presencial.

Infortunadamente aparece el fenómeno de la deserción estudiantil en formación virtual que atenta contra esta modalidad. La presente investigación utilizando la herramienta de minería de datos analizará el problema con el objetivo de encontrar los patrones ocultos que nos permita sugerir estrategias con el fin de combatir este flagelo.

Podemos definir un modelo predictivo en minería de datos como: proceso por el que se crea un modelo para intentar predecir mejor la probabilidad de un resultado [1]. Los modelos predictivos analizan el desempeño pasado para evaluar la probabilidad de que ocurra un evento o comportamiento específico en el futuro.

La presente investigación utilizará un modelo predictivo de minería de datos, ya que se parte de resultados ocurridos en el pasado (datos sobre formación virtual años 2007 – 2011) analizando su desempeño para evaluar las probabilidades del comportamiento estudiantil en el futuro con el fin de sugerir estrategias a partir de los resultados obtenidos para disminuir la deserción estudiantil en formación virtual. También se utilizará la metodología de investigación Cross Industry Standard Process for Data Mining – CRISP-DM[2].

PALABRAS CLAVES

MD: Minería de datos.

MDE: Minería de datos aplicada en la educación. MEN: Ministerio de Educación Nacional

TICs: Tecnologías en información y comunicaciones

6.2 MD APLICADA A LA DESERCIÓN ESTUDIANTIL EN FORMACIÓN VIRTUAL.

(3)

Página 3 de 22 En un artículo de los profesores Mtra. Sonia Verónica Mortis Lozoya, Mtro. José Fernando Lozoya Villegas, del Instituto Tecnológico de Sonora, México del 2005[3], estudiaron la alta deserción estudiantil que llegó a ser del 52%. Fueron múltiples las causas de tan alta deserción, entre las vitales figuran:

 Se detectó que en la publicidad de la institución no se aclaró que el programa educativo era bajo la modalidad virtual presencial en los diferentes medios en que se dio a conocer.

 No se realizaron los filtros que se establecieron como requisitos de ingreso.  No hubo información de los costos.

 Equivocación del departamento de tesorería al momento del cobro de las materias, donde se cometió el error de cobrar las materias de este programa educativo al valor de las materias presenciales.

 La desmotivación que causo en los estudiantes el hecho de que por el error de tesorería y por el poco margen que se dio a los estudiantes para pagar el costo real, se les cancelo el acceso a la plataforma de SAETI (Aula virtual).

 El elevado costo de las materias virtuales en relación a las materias presenciales.  Las deficiencias mostradas por SAETI para responder a las necesidades de un

curso virtual de acuerdo con comentarios de los propios estudiantes.

 La falta de planeación de los estudiantes en relación a su trabajo y el tiempo de estudio.

 Falta de un sistema de tutorías especial para estudiantes virtuales que apoye su proceso educativo online.

 Insuficiente cultura educativa para llevar a cabo un proceso de aprendizaje autónomo y auto dirigido por parte de los estudiantes inscritos.

 Material de estudio demasiado amplio y con falta de interactividad virtual en todas las materias.

 Insuficiente experiencia para atender un programa educativo virtual en toda su magnitud.

(4)

Página 4 de 22 El desarrollo de este trabajo permitió consolidar en el DIIT, un grupo de investigación en las técnicas de MD y además la implementación de un almacén de datos que permitirá tomar decisiones con menor incertidumbre. Si bien no se logró encontrar un clasificador del rendimiento académico y de la deserción estudiantil con un alto grado de precisión y compresibilidad, se adquirió experiencia en el uso de los programas SPSS y Weka que permitirá que el grupo avance en esta línea de investigación.

Universidades como Oberta de Catalunya[5], Barcelona España, tiene programas especialmente maestrías totalmente virtuales en convenio con universidades nacionales de diferentes países. La misma modalidad es utilizada por el Instituto Tecnológico de Monterrey

[6] en México. En Estados Unidos hay varias universidades que ofrecen programas directamente como es el caso de la Phoenix[7], que cuenta con más de 200 universidades en todo el mundo y ofrece más de 100 programas de grado en licenciaturas, maestrías y doctorados virtuales. En el 2010 logró una inscripción máxima de 600.000 estudiantes en todo el mundo.

La universidad de Stanford[8], ofrece cursos virtuales gratis donde el alumno se matricula y puede realizar los que le interesen. La deserción en estos casos es alta a pesar de la metodología utilizada y de la calidad de los mismos. El Instituto Tecnológico de Massachusetts MIT[9], tiene a disposición de la comunidad mundial 2100 cursos para el año 2012 en modalidad virtual.

La formación virtual también contribuye a disminuir la deserción escolar en formación presencial. Un estudio realizado en el Estado de la Florida[10], Estados Unidos, utilizando MD, se pudo demostrar que incluyendo cursos virtuales en los pensum, aumentaba la rata de graduados. Es decir los cursos virtuales servían a los estudiantes presenciales como agentes motivadores en sus carreras.

El profesor Delavari N. de la facultad de Información Tecnológica y Multimedia de la Universidad Cyberjaya, Malasia [11], sostiene la importancia de la MD aplicada a la educación superior con el fin de mejorar su calidad.

(5)

Página 5 de 22 Harrell Ivon L, de la Florida State University [13], en un artículo sostiene que los conocimientos básicos en informática, internet, estilo de aprendizaje auditivo, contribuyen a la persistencia del estudiante en los cursos en línea.

Un artículo escrito en el 2009 sobre la importancia de la formación virtual y sus causas de deserción, sostiene que: “La formación virtual también puede causar ansiedad en los alumnos que no tienen confianza en sus habilidades tecnológicas y no es apropiado para todo el contenido de la formación” (Mathis & Jackson, 2006). Se requiere una gran cantidad de apoyo de la alta dirección.

Miguel Morales, director del área de e-learning de la universidad Galileo, Guatemala, en un artículo [14], sostiene que para evitar la deserción en formación virtual se deben tener presente las siguientes estrategias desde el punto de vista de diseño e implementación:

 Curso de inducción.  Ruta de aprendizaje.  Aspecto social.

 Monitoreo y seguimiento.  Modelo de implementación.  Estilos de aprendizaje.  Analogía de una capsula.  Rubrica de evaluación.

Existen algunas aplicaciones en MDE aplicadas a la educación superior:

 Análisis del rendimiento académico en los estudios de informática de la Universidad Politécnica de Valencia [15] aplicando MD. España.

 MDE superior aplicada a un modelo de alerta académica. Chile.

(6)

Página 6 de 22 6.2.1 IMPORTANCIA DE LA MD CON RELACION A LA DESERCIÓN ESTUDIANTIL EN FORMACIÓN VIRTUAL

La MD, es un área de estudio científico con grandes expectativas para la comunidad investigadora, principalmente por las expectativas de transferencia a la sociedad que plantea. Desde hace más de 50 años se han publicado infinidad de artículos en conferencias y revista destacadas sobre la materia Sin embargo queda por delante un campo fértil y prometedor con muchos retos de investigación [17].

Se puede observar que la formación virtual de la educación superior en los diversos países tienen un factor común: la alta tasa de deserción causada por factores muy similares. A través de técnicas de MD, herramienta útil y muy aplicada actualmente para descubrir información previamente desconocida y oculta nos permite extraer patrones con el fin de sugerir estrategias para ser aplicadas y poder disminuir la rata de deserción en formación virtual.

6.3 ANTECEDENTES AMBITO NACIONAL

La deserción estudiantil es uno de los fenómenos que más preocupa al sistema educativo colombiano. Este es un problema sobre el que las instituciones educativas también se pronuncian permanentemente, y es una preocupación general en virtud a que la educación, además de que se consagra como un derecho fundamental para el estado colombiano, es un indicador de desarrollo tanto de los países como de las personas. De modo que la deserción educativa afecta directamente todas las necesidades de desarrollo individuales y del país. Es por todo lo anterior que la lucha contra la deserción estudiantil ha de ser un reto para todo aquel que esté inmerso en el sistema de educación.

(7)

Página 7 de 22 De acuerdo con esto, todo tutor o profesor virtual debe ocuparse permanentemente de los siguientes aspectos: ofrecer frecuentes palabras de aliento a los estudiantes, ofrecer mecanismos de incentivo para que los estudiantes se interesen más por alcanzar sus logros, hacer reconocimientos oportunos a los aciertos que tengan los estudiantes y establecer espacios de comunicación orientados a conocer y atender las diversas necesidades de los estudiantes que pueden moverlos a alejarse del proceso educativo. Estas recomendaciones al ser atendidas por los tutores o profesores virtuales, seguramente les reducirá el número de estudiantes que desertan. Aparte de lo anterior, que debe ser parte de la actuación docente, muchas universidades cuenta con algunos mecanismos orientados a la prevención de la deserción de los estudiantes tanto virtuales como tradicionales: Sistemas de consejerías virtuales, identificación y revisión de alertas tempranas, etc. Hay que tener en cuenta que el riesgo de deserción es permanente y se debe trabajar para prevenirlo y reducirlo.

6.3.1 MD APLICADA A LA DESERCIÓN ESTUDIANTIL AMBIENTE NACIONAL.

En Colombia son muy pocos los estudios realizados sobre deserción estudiantil en formación virtual. A finales de la década de los noventa algunas universidades nacionales comenzaron a ofrecer capacitación en esta modalidad, destacándose la Universidad Escuela de Administración y Negocios “EAN” [18], donde ofrecían cursos a nivel de diplomados como “Diseño, orientación y desarrollo de cursos en internet – Aula Virtual”. Hoy en día es una exigencia del MEN, que toda institución de educación dedicada a la formación superior contemple cursos virtuales en sus diferentes programas. Hay universidades que están ofreciendo programas de pregrado y posgrado virtuales y a distancia. Por ejemplo, la Universidad Abierta y a Distancia–UNAD [19], la Universidad Autónoma de Bucaramanga – UNAB [20], que ofrece maestrías en Software Libre, E-Learning y Tecnología Educativa y Medios de Innovación para la educación, en convenio con la Universidad Oberta de Catalunya, España y el Instituto Tecnológico de Monterrey, México.

El doctor Angel H. Facundo1, realiza un estudio detallado sobre el problema de la

deserción estudiantil en la formación virtual y a distancia. [21].

El doctor Angel H. Facundo sostiene: “La deserción es quizás uno de los fenómenos que más están afectando los sistemas de educación y, en especial, el esfuerzo por elevar los niveles de formación de los recursos humanos para mejorar la

1 Angel H. Facundo,

(8)

Página 8 de 22 competitividad e ingresar plenamente a la sociedad del conocimiento. Por supuesto, Colombia no es la excepción”.

La apertura del país a la globalización y el ingreso a la sociedad de la información y el conocimiento no sólo coincidió con un período de bajo crecimiento económico, sino de un bajo nivel educativo de la población. No obstante los avances, ésta continúa aún en niveles que no superan los promedios regionales.

Por ejemplo, en el año 2007 2 de acuerdo con datos de la UNESCO, mientras en la

región latinoamericana los promedios de matrícula de educación básica y media llegaban al 95%, la tasa Colombiana de escolaridad neta alcanzaba el 89,38% de acuerdo con la información oficial del MEN, siendo la escolaridad aún más baja en las zonas rurales. Y, en determinadas cohortes de edad, por ejemplo en niños de 3-4 años, cuando el estímulo y el alistamiento son tan necesarios, la escolaridad promedio no superaba el 40% mientras en el promedio latinoamericano llega al 60%.

Dentro de este panorama, la deserción estudiantil en cualquiera de los niveles del sistema educativo colombiano, es decir, el abandono del proceso educativo formal antes de haber culminado el ciclo educativo al cual aspiraba, ha sido y continúa siendo un fenómeno muy elevado. No obstante, las investigaciones sistemáticas al respecto sobre deserción son reciente dentro de este panorama, la deserción estudiantil en cualquiera de los niveles del sistema educativo colombiano, es decir, el abandono del proceso educativo formal antes de haber culminado el ciclo educativo al cual aspiraba, ha sido y continúa siendo un fenómeno muy elevado, así como las estrategias y mecanismos institucionales que – a todos los niveles- han comenzado a implementarse.

Las estadísticas del MEN son preocupantes. De acuerdo con datos del año 2004, de cada 100 estudiantes que ingresaron a la escuela, sólo 47 lograron terminar bachillerato. De éstos, sólo 27 ingresaron a la educación superior. Y, del escaso número de quienes ingresaron, sólo un poco más de la mitad terminaron exitosamente sus estudios y se titularon en cualquiera de las modalidades de educación superior (técnica, tecnológica o universitaria).

La deserción3 es un fenómeno complejo, cuyos factores deben ser tratados de

manera integral. Son diversas las perspectivas desde las cuales se puede analizar el

2 Estadísticas del Ministerio de Educación Nacional. 3

Los teóricos diferencian diversos tipos de deserción: la “primera deserción” (first drop out) o el abandono de la carrera o

(9)

Página 9 de 22 fenómeno: desde la psicológica y sociológica, pasando por la económica, hasta la institucional. Desde el punto de vista de la política educativa (único aspecto al cual se hará referencia en este trabajo), el MEN y las instituciones educativas han puesto en marcha las más variadas estrategias y mecanismos en los diversos niveles y atendiendo a los diversos factores asociados con este fenómeno.

A nivel de educación superior, se han diseñado estrategias y mecanismos relacionados con algunos de los principales factores asociados. Entre otros, la introducción de mejoras en la adaptación de los nuevos estudiantes a la vida universitaria; las consejerías estudiantiles; campañas de planificación familiar; y la prohibición del expendio de licores en zonas aledañas a las instituciones. Entre las principales acciones dirigidas hacia los factores académicos se ha promovido la introducción de programas de orientación profesional; de tutoría; talleres de nivelación y mejoramiento de competencias básicas; foros y mecanismos de divulgación de experiencias exitosas. Un amplio programa de crédito académico focalizado en estudiantes en riesgo, busca superar los factores económicos.

Sin duda, el más novedoso mecanismo ha sido el reciente diseño y puesta en funcionamiento de una herramienta informática, denominada SPADIES (Sistema de Prevención y Análisis de la Deserción en las Instituciones de Educación Superior)[22], como programa institucional para identificar y hacer seguimiento a los posibles desertores. El sistema toma en consideración la que se denomina como “primera deserción” (first drop out); es decir, a quienes por dos períodos académicos consecutivos no asisten a la institución.

Para algunos, las anteriores medidas no están lo suficientemente articuladas en una verdadera política educativa. Con todo, es evidente que, de acuerdo con la información oficial, han tenido resultados positivos. A nivel de educación básica, la cobertura neta subió del 84,39% en el 2002 al 89,38% en el 2008, y la deserción se redujo al 5% anual. En este nivel, Colombia se encuentra en un lugar intermedio en la región. Y, en educación superior, la tasa de cobertura con relación a la cohorte de 18-23 años subió del 20,5% en el 2002 al 24,6% en el 2006, y las tasas de deserción bruta anual, según cálculos de la subdirección de Desarrollo Regional del MEN, ha descendido del 16.5% en el 2003 al 12.9% en el 2006, mientras que la deserción general acumulada por cohorte habría bajado del 51.6% en el 2003 al 47.5% en el año 2006 (Ver gráfico nro 1 UNAD. Histórico en relación con la denominada primera

(10)

Página 10 de 22 deserción). Con todo, todavía las tasas de deserción siguen siendo elevadas, y no obstante estas últimas cifras se encuentran dentro de los promedios latinoamericanos que oscilan entre 40% en Argentina y el 59% en Brasil. Según datos del Instituto Internacional de Educación Superior para América Latina y el Caribe (IESALC) de UNESCO, la deserción educativa general y, en especial, la deserción estudiantil a nivel superior continúa siendo un problema preocupante, y por resolver.

Gráfico No. 1 UNAD. Histórico en relación con la denominada “primera deserción” (dos semestres consecutivos de abandono) 1999-I a 2007-2

Fuente: UNAD. Oficina de Registro y Control Académico

La tabla nro 1 hace una comparación de primera deserción entre la Universidad Abierta y a Distancia- UNAD y el resto del país. Se puede observar que a medida que avanza el tiempo la diferencia se hace más pequeña.

Tabla nro. 1 Comparación UNAD – País, en relación con la denominada “primera deserción” (abandono por dos semestres consecutivos)

2003 2004 2005 2006 2007

PAIS 51.6 50.2 48.4 47.5 40.0

UNAD 62,0 59.0 52.0 51.0 42.3

(11)

Página 11 de 22 El doctor Ricardo Timaran Pereira, docente de la universidad de Nariño [23], aplicando MD hace un estudio sobre la deserción estudiantil en la formación superior, aplicada a los estudiantes de dicha universidad. El artículo se llama: “Una lectura sobre deserción universitaria en estudiantes de pregrado desde la perspectiva de la minería de datos”, 2009. Este proceso se apoyó con TariyKDD, una herramienta de MD de distribución libre, desarrollada en los laboratorios KDD del grupo de investigación Grias, del Departamento de Sistemas de la Facultad de Ingeniería de la Universidad.

Es significativo el aporte de esta investigación con relación a la deserción estudiantil en educación superior utilizando MD.

La doctora Adelaida Salcedo Escarria [24], asesora pedagógica de la universidad Militar Nueva Granada en un artículo publicado en marzo del 2010, sostiene que la deserción universitaria se debe a las siguientes causas:

 Problemas externos a la universidad.  Problemas internos a la universidad.  Problemas intrínsecos al estudiante.  Otras causas

Sin embargo hay una institución pública dedicada a la formación del trabajador colombiano que no pertenece al MEN si no al Ministerio del Trabajo y Seguridad Social, Servicio Nacional de Aprendizaje – Sena, que abrió la modalidad de la educación virtual en el año 2002 con el fin de poder cumplir sus metas y ampliar cobertura. Hoy es la entidad que más utiliza esta modalidad a nivel nacional, siendo las metas para el año 2012 capacitar a 4.169.051 personas. En la tabla nro 2 podemos observar la línea de tiempo de la formación virtual del Sena en sus 55 años de existencia.

Tabla nro 2. Línea de tiempo de la formación virtual del Sena en sus 55 años de existencia

1957 2002 2003 2009 2010 2011 2012

(12)

Página 12 de 22 Fuente: Autoría propia, datos Dirección Planeación.

Los diferentes programas tienen materias transversales que son dictadas bajo este formato. Además los programas de bilingüismo, principalmente el de inglés son ofertados en forma virtual. El Sena utiliza las plataformas Blackboard y Moodle.

El Sena no tiene un estudio serio sobre las causas de la deserción estudiantil en formación virtual, pero si hay estadísticas que nos permiten medirla, donde se comprueba la alta tasa de abandono estudiantil sobre todo en formación no titulada donde puede en algunos casos llegar hasta un 80% o 90%. La formación titulada (técnicos y tecnologías) tienen una deserción más baja fluctuando entre un 15% y 30%.

Consultado un grupo de instructores encargados de dar formación virtual, sostienen que las causas principales de la deserción son las siguientes:

 Escasos o nulos conocimientos con el contenido del curso.  Conectividad.

 Falta del recurso computador.  Falta de tiempo del alumno.  Falta de motivación del docente

.

El estudio debe tener en cuenta muchos factores como los socio-económicos, ubicación geográfica, estado del curso, estrato del alumno, etc., además puede influir factores como: idiosincrasia del estudiante, costumbres, conectividad, escasez de recursos computacionales. Los resultados deben ser tabulados en forma clara y precisa de tal forma que permita su fácil entendimiento y que los patrones los podamos convertir en conocimiento.

La MD es una tecnología emergente muy valiosa hoy en día y de gran utilidad y aplicabilidad en la educación. Su uso permite tomar decisiones pertinentes que contribuyen al desarrollo y a la optimización de los recursos. Nos da a conocer los principales patrones de la deserción estudiantil en la educación virtual para poder sugerir las estrategias correspondientes con el fin de disminuir la deserción en este campo.

(13)

Página 13 de 22 6.4 JUSTIFICACIÓN PROBLEMA DE LA DESERCIÓN VIRTUAL.

Independiente de la institución de orden superior y del país donde se encuentre ubicada, la deserción estudiantil es un problema grave ocasionando perdidas de recursos. Existen una gran cantidad de estudios relacionados con este fenómeno, muchos de los cuales utilizan MD con el fin de encontrar sus causas.

Un caso particular de la deserción en la formación superior, es la deserción en formación virtual. Por lo general la mayoría de instituciones de formación superior utilizan esta modalidad por diversos motivos como por ejemplo para ampliar cobertura, para que la comunidad pueda tener acceso independiente del lugar donde se encuentre. La deserción en formación virtual es un flagelo que ocasiona perdidas en recursos principalmente en centros de formación del estado. En Colombia este fenómeno es muy acentuado principalmente cuando el estudiante hace cursos no titulados en instituciones públicas que por lo general no tienen ningún costo. Un caso particular es el Sena, que en una política para que todo colombiano hable inglés como una segunda lengua, diseñó una salida no titulada que está compuesta por nueve (9) niveles, cada uno con una duración de 40 horas. Infortunadamente la deserción ha alcanzado niveles del 80%. Los cursos virtuales titulados de la Entidad alcanzan niveles de un 30%. Esto ocasiona pérdidas en recursos, ampliación de cobertura, imagen institucional, etc., De ahí la importancia de realizar un estudio que nos permita sugerir estrategias con el fin de contrarrestar este fenómeno.

6.5 RESUMEN DE LA DESERCIÓN ESTUDIANTIL EN FORMACIÓN VIRTUAL.

(14)

Página 14 de 22 Al crecer la modalidad de formación virtual también crece su deserción, siendo comunes sus causas independiente del lugar, tipo de formación, idiosincrasia del estudiantado, su cultura, y formación académica.

Se cree que los siguientes factores o características son causas en la deserción estudiantil en formación virtual en la educación superior:

 Falta de conocimientos básicos del alumno en informática, dificultándose la entrada a las plataformas tecnológicas.

 Acceso a internet.

 Falta de conocimientos básicos del alumno referente al curso que va a realizar.

 Falta de información y planeación de los cursos.  Falta de motivación del docente.

 Falta de tiempo del alumno.  Falta de computador.

7. IDENTIFICACIÓN DEL PROBLEMA

Deserción estudiantil en la formación virtual de la educación superior.

Los avances tecnológicos en el presente siglo (XXI), han facilitado el acceso a las grandes bases de datos pudiendo utilizarlas de la mejor forma, contando con una tecnología muy poderosa llamada MD, utilizada actualmente en el campo de la educación.

(15)

Página 15 de 22 del alumno, desconocimiento básico del curso a realizar, falta de planeación de los cursos por parte de la institución, conectividad, falta del recurso computador por parte del alumno.

Esta investigación pretende encontrar los patrones existentes en las bases de datos relacionadas con esta clase de formación para poder sugerir estrategias con el fin de que sean aplicadas por las diferentes autoridades para reducir la tasa de deserción.

Los datos ha utilizar son suministrados por una entidad pionera en Colombia en formación virtual, tomando como referencia los utilizados en los años 2007 hasta 2011 inclusive.

¿Desarrollando un modelo predictivo para afrontar la deserción estudiantil en la formación virtual mediante la minería de datos se encontrará los patrones para sugerir estrategias que al ser aplicadas por las autoridades se reducirá la tasa de deserción?

8. OBJETIVO GENERAL Y OBJETIVOS ESPECÍFICOS

8.1 OBJETIVO GENERAL.

Desarrollar un modelo predictivo para afrontar la deserción estudiantil en la formación virtual mediante la minería de datos.

8.2 OBJETIVOS ESPECÍFICOS.

• Diseñar un modelo predictivo basado en técnicas de Minería de Datos. • Implementar el modelo predictivo a la población específica.

• Evaluar los resultados obtenidos para proponer estrategias con el fin de

(16)

Página 16 de 22 9. METODOLOGIA.

En el desarrollo del presente proyecto se utilizará la metodología CRISP-DM pertinente con la tecnología minería de datos, utilizada en la elaboración del proyecto. CRISP-DM está descrita en términos de modelo de proceso jerárquico, consistente en un conjunto de tareas la cual establece:

Comprensión del negocio

Esta fase inicial se enfoca en la comprensión de los objetivos de proyecto y exigencias desde una perspectiva de negocio, luego convirtiendo este conocimiento de los datos en la definición de un problema de MD y en un plan preliminar diseñado para alcanzar los objetivos.

Comprensión de los datos

La fase de entendimiento de los datos comienza con la colección de datos inicial y continua con las actividades que le permiten familiarizar primero con los datos, identificar los problemas de calidad de datos, descubrir los primeros conocimientos en los datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la información oculta.

Preparación de los datos

La fase de preparación de los datos cubre todas las actividades necesarias para construir el conjunto de datos final de los datos en brutos iniciales. Las tareas de preparación de datos probablemente van a ser realizadas muchas veces y no en cualquier orden prescripto. Las tareas incluyen la selección de tablas, registros, y atributos, así como la transformación y la limpieza de datos para las herramientas que modelan.

Modelado

(17)

Página 17 de 22 Evaluación

En esta etapa en el proyecto se construye un modelo (o modelos) que parece tener la alta calidad de una perspectiva de análisis de datos.

Antes del proceder al despliegue final del modelo, es importante evaluar a fondo ello y la revisión de los pasos ejecutados para crearlo, para comparar el modelo correctamente obtenido con los objetivos de negocio. Un objetivo clave es determinar si hay alguna cuestión importante de negocio que no ha sido suficientemente considerada. En el final de esta fase, una decisión en el uso de los resultados de minería de datos debería ser obtenida.

Desarrollo

La creación del modelo no es generalmente el final del proyecto. Incluso si el objetivo del modelo es de aumentar el conocimiento de los datos, el conocimiento ganado tendrá que ser organizado y presentado en el modo en el que el cliente pueda usarlo. Dependiendo de los requerimientos, la fase de desarrollo puede ser tan simple como la generación de un informe o tan compleja como la realización repetida de un proceso cruzado de minería de datos a través de la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva el paso de desarrollo. Sin embargo, incluso si el analista realizara el esfuerzo de despliegue, esto es importante para el cliente para entender de frente que acciones necesita para ser ejecutadas en orden para hacer uso de los modelos creados actualmente.

9.1 COMPONENTES DEL DISEÑO METODOLÓGICOS

Cosmovisión: Acción /participación. Tipo estudio: Exploratorio.

(18)

Página 18 de 22 10. ACTIVIDADES A DESARROLLAR.

Fases Actividades Negocio Descripción Resultados

Compresión del negocio

Misión Entendimiento de la Formación

virtual

Entendimiento del

negocio y definición del problema MD

Nnn Conocimiento del negocio. PPlll Plan preliminar.

Definición del

problema. Ppp Visión Principios Valores Naturaleza

Objetivos del negocio Funciones

Plan preliminar Compresión

de los datos

Recolección datos Análisis cursos formación

virtual

Conocimientos iniciales

de los datos

V Conocimiento de P los datos

Calidad de los datos Preparación

de los datos

Limpieza de datos. Análisis de los datos de los

cursos formación virtual con énfasis en la deserción.

Datos deben quedar listos para ser modelados.

Datos limpios y transformados Transformación datos.

Selección tablas,

registros

Modelado Aplicar técnicas de

modelado

Buscar patrones de los datos Modelamiento de datos

calibrando parámetros a valores óptimos

Técnicas aplicadas con parámetros óptimos. Calibrar parámetros de

las diversas técnicas

Evaluación Creación del modelo Extracción del conocimiento Modelamiento Cre Modelo creado

Análisis de resultados

aplicando diferentes

parámetros

Desarrollo Desarrollo del plan Revisión proyecto y

mantenimiento y monitoreo

Estrategias sugeridas para ser aplicadas. Informes

Estrategias Sugeridas. Informes definitivos,

documentación. Informes

Revisión proyecto

(19)

Página 19 de 22 11. CRONOGRAMA

Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Fases Actividades

Compresión del

negocio Misión, visión, principios, valores

Naturaleza, funciones

Objetivos del negocio, plan preliminar

Compresión de

los datos Recolección datos

Calidad de los datos

Preparación de

los datos Limpieza de datos.

Transformación datos Selección tablas, registros

Modelado Aplicar técnicas de modelado

Calibrar parámetros de las

diversas técnicas

Evaluación Creación del modelo

Análisis de resultados aplicando diferentes parámetros

Desarrollo Desarrollo plan

Informes

Revisión proyecto

12. BIBLIOGRAFÍA BÁSICA.

[1]. Nyce, Charles (2007), Predictive Analytics White Paper, American Institute for Chartered Property

Casualty Underwriters/Insurance Institute of America, p. 1,

http://www.aicpcu.org/doc/predictivemodelingwhitepaper.pdf

[2]. Cross Industry Standard Process for Data Mining CRISP-DM http://www.crisp-dm.org

[3]. Instituto Tecnológico Sonora, México. Causas de tipo académico y no académico de la deserción estudiantil en el primer módulo de la Licenciatura en Dirección de la cultura Física y el Deporte Modalidad Virtual Presencial.

http://www.itson.mx

[4]. Osvaldo M. Spossito, Martín E. Etcheverry, Hugo L. Ryckerboer y Julio Bossero.

Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil, Universidad Nacional de la Matanza San Justo, provincia de Buenos Aires. http://www.unlam.edu.ar

(20)

Página 20 de 22

http://www.uoc.edu

[6]. Instituto Tecnológico de Monterrey, México. http://www.itesm.edu

[7]. University Phoenix , EE.UU. http://www.phoenix.edu

[8]. University Stanford, California, EE.UU. http://www.stanford.edu

[9]. Massachusetts institute of Technology http://www.mit.edu

[10]. University of Florida http://www.ufi.edu

[11]. Information technology based higher education and training 2005. Ithet 2005 – 6th International

Conference, 9 july 2005.

[12]. Michael Simonson and Charles Schlosser Nova. (2004). Quarterly review of distance education. Southeastern University. http://www.onfoagepub.com/index

[13]. Harrell Ivan L., Using student characteristic to predict the persistence of Community college students in on line courses., Florida State University, EE.UU

http://www.ufi.edu

[14]. Miguel Morales., 8 buenas prácticas para evitar la deserción en un curso virtual, universidad Galileo, Guatemala.

http://www.galileo.edu

[15]. Universidad Politécnica, Valencia España.

http://www.upv.es

[16]. Universidad Tecnológica de Izucar, Matamoros, México. http://www.uti.edu.mx

[17]. José C. Riquelma, Roberto Ruiz, Karina Gilbert. (2006). Minería de Datos:Conceptos y Tendencias. Departamento de Lenguajes y Sistemas Informáticos, Universidad de Sevilla.

http://www.us.edu.es.

[18]. Escuela de Administración y Negocios, EAN, Bogotá, Colombia http://www.ean.edu.co

[19]. Universidad Abierta y a Distancia – UNAD. http://www.unad.edu.co

[20]. Universidad Autónoma de Bucaramanga-UNAB.

http://www.unab.edu.co

[21]. Angel H. Facundo. Análisis sobre la deserción en la educación superior a distancia y virtual: caso de la UNAD – Colombia.

http://www.unad.edu.co

[22]. Spadies, Ministerio de Educación Nacional.

http://www.mineducacion.gov.co

[23]. Ricardo Timaran Pereira. (2009). Una lectura sobre deserción universitaria en estudiantes de pregrado desde la perspectiva de la minería de datos, Universidad de Nariño.

http://www.udenar.edu.co

[24]. Adelaida Salcedo Escarria. (2010). Deserción universitaria en Colombia, universidad Militar Nueva Granada.

http://www.umng.edu.co

[25]. Carolina Guzman Ruiz, Diana Duran Muriel, Jorge Franco Gallego, Elkin Castaño Velez, Santiago Gallon Gomez, Karoll Gomez Portilla, Johanna Vasquez Velasquez Deserción estudiantil en la educación superior colombiana. Ministerio de Educación Nacional, Colombia.

http://www.mineducacion.gov.co

[26]. Pixel-Bit Revista de medios y educación, número 33 página 155 -163. (2008). Formación en línea en la universidad. Universidad Sevilla, España.

(21)

Página 21 de 22

[27]. Carmen Ruiz Bueno, Oscar Mas Torello y José Tejada Fernandez., El uso de un entorno virtual en la enseñanza superior: Una experiencia en los estudios de pedagogía de la Universidad Autónoma de Barcelona (UAB) y la Universidad Rovira i Virgili (URV), España.

http://www.uab.es

[28]. Ramiro Aduviri Velasco. (2007). Soledad, frustración y deserción virtual. Formación en tutoría virtual OEA.

[29]. Mercedes Torrado. (2011). Taller de Minería de Datos aplicada a la educación. Departamento de Métodos de investigación y diagnostico en la educación (MIDE). Universidad de Barcelona – España.

[30]. Halkidi M.; Spinellis D.; Tsatsaronis G.

Web of Science: Title: Data mining in software engineering

Source: INTELLIGENT DATA ANALYSIS Volume: 15 Issue: 3 Pages: 413-441 DOI: 10.3233/IDA-2010-0475 Published: 2011

[31]. Aggarwal Charu C. Web of Science: Title: A segment-based framework for modeling and mining data streams

Source: KNOWLEDGE AND INFORMATION SYSTEMS Volume: 30 Issue: 1 Pages: 1-29

[32]. Coenen Frans. Data mining: past, present and future http://dl.acm.org/citation.cfm?id=1972812.1972817

[33]. Lee Sang Jun, Siau Keng. A review of data mining techniques

http://www.mendeley.com/research/web-mining-applications-and-techniques

13. RECURSOS FÏSICOS.

Recurso Cantidad

Computador 1

Conexión internet 1

Impresora 1

(22)

Página 22 de 22 14. COSTOS DEL TRABAJO Y FUENTES DE FINANCIACION.

CONCEPTO FUENTE COSTO

UNITARIO

COSTO MES

TIEMPO MESES

COSTO TOTAL

Recurso humano

Investigador(160h/mes) Estudiante $50.000/hora $8.000.000 8 $64.000.000 Director(4h/mes) U.

Nacional

$100.000/hora $400.000 8 $3.200.000

Recursos Físicos

Computador Estudiante $2.500.000 $2.500.000

Conexión a Internet Estudiante 100.000/mes $1.200.000

Impresora Estudiante $200.000 $200.000

Elementos de papelería Estudiante $800.000 $800.000

Costo total Proyecto $71.900.000

15. COMENTARIO CON VISTO BUENO DEL DIRECTOR

16. FIRMA DEL PROPONENTE. __________________________________ Gilberto Dulcey Caballero

17.FIRMA DEL DIRECTOR. ___________________________________ Fabio A. Gonzalez

Referencias

Documento similar

If certification of devices under the MDR has not been finalised before expiry of the Directive’s certificate, and where the device does not present an unacceptable risk to health

In addition to the requirements set out in Chapter VII MDR, also other MDR requirements should apply to ‘legacy devices’, provided that those requirements

The notified body that issued the AIMDD or MDD certificate may confirm in writing (after having reviewed manufacturer’s description of the (proposed) change) that the

quiero también a Liseo porque en mi alma hay lugar para amar a cuantos veo... tiene mi gusto sujeto, 320 sin que pueda la razón,.. ni mande

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

 Tejidos de origen humano o sus derivados que sean inviables o hayan sido transformados en inviables con una función accesoria..  Células de origen humano o sus derivados que

Jordi Cano Ochando Centro Nacional de Microbiología. Isidoro Martínez

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que