Mapas del porcentaje de beneficiarios sin módulos aprobados y de aquellos acreditados únicamente por equivalencia o diagnóstico por coordinación de áreas.53 Figura 6. Distribución porcentual de beneficiarios por nivel educativo, según tengan o no registro en el variable ocupacional 37 Tabla 7.
Descripción del problema y su relevancia
Actualmente, Guanajuato, al igual que el resto de los estados, tiene acceso a los informes en línea de SASA para monitorear la atención educativa. Estos avances se centraron en el software en sí, pero hoy la promesa de nuevas tecnologías requiere que la inversión se centre en la disponibilidad y calidad de los datos [8].
Identificación, Limpieza y Transformación de Datos
Delimitación de datos a considerar en el estudio
A dicha información se integra la información relativa al progreso académico del beneficiario en el plan de estudios del Modelo de Educación para la Vida y el Trabajo (MEVyT). Para ello, se tuvo en cuenta que en 2012 se llevó a cabo la reestructuración normativa del Instituto de Alfabetización y Educación Básica para Adultos (INAEBA), mediante la cual el organismo asumió de manera única y universal la educación básica para adultos en el estado de Guanajuato. Sin embargo, en la práctica se encontró que esta reestructuración se dio hasta 2015, cuando el INAEBA ofreció exclusivamente el modelo educativo federal y donde el personal y la división territorial-administrativa del instituto se consolidaron en una sola estructura organizacional.
Base de datos inicial, limpieza y transformación
- Revisión y eliminación de registros duplicados
- Normalización de la base de datos
Entre las primeras variables del expediente se encuentran el código único del beneficiario, la coordinación de la zona donde fue visitado, fecha de nacimiento, género, antecedentes escolares, número de hijos, profesión, estado civil, lugar de nacimiento, ciudad, municipio y estado. de residencia del beneficiario. La única variación de los registros de beneficiarios que tienen más de un registro en SASA en diferentes secciones es la situación en la que se encuentran y la etapa o nivel en el que se encuentran acreditados y dónde se encuentran en último lugar en el sistema.
Grado de Rezago Social (GRS). Variable para caracterizar el entorno en el que
En el caso de los beneficiarios que viven en zonas rurales, se decidió utilizar el grado de rezago social también calculado por el CONEVAL, pero en esos casos a nivel local. De esta manera, luego se realizó el cruce correspondiente para sumar el GRS de los beneficiarios que viven en zonas rurales, más aquellos cuya AGEB urbana no se encontró en el Estudio CONEVAL 2010 sobre Retrasos Sociales en la AGEB Urbana.
Integración del GRS en la tabla de Beneficiarios y recodificación de variables
Para la variable ocupación, simplificamos las categorías según análisis de frecuencia a: tareas domésticas, trabajo, desempleados u otros.
Limpieza y Consolidación de la tabla Resumen del Avance Académico
- Extracción del tipo, nivel y área de conocimiento de la clave del módulo
- Binarización de las variables forma de acreditación, tipo de módulo y nivel del módulo
- Resumir la tabla para obtener un solo registro por alumno
En este estudio, por motivos prácticos, se decidió clasificar solo aquellos que varían del 1 al 6 para que, independientemente de la elección del destinatario, pudiéramos medir su progreso académico y la finalización de sus estudios. En el caso de diversificado, el proceso anterior daría una D en el tipo de módulo, una I en el nivel y una V en el campo de conocimiento, por lo que se puede entender en todo caso que se trata de este tipo. del módulo. Así, una variable pasó de 1 a 3 donde cada módulo cursado por un estudiante se identifica con un 1 en el tipo de formulario de acreditación que aprobó y un 0 en el resto de formularios de acreditación.
Se utilizó la misma metodología para pasar de variable tipo módulo a módulo básico y variables de módulo misceláneo, y la misma forma para pasar de variable módulo.
Creación de nuevas variables
- Región
- Nivel
- Tiempo para aprobar primer módulo a partir del registro
- Promedio de días por módulo entre la primera y la última aprobación
- Porcentaje de módulos acreditados por final
El primero de ellos es crear la variable Región a partir de la variable Coordinación de Zona según la división administrativa geográfica del instituto (Mapa 1). Por otro lado, los datos fuente incluyeron 9 casos de beneficiarios que no tenían antecedentes escolares, por lo que, a la inversa… para la imputación de valores se utilizó la información de la variable nivel, de tal manera que la categoría sin antecedentes escolares educación cuando el beneficiario pasó a ser identificado como nivel 0; primaria incompleta cuando el beneficiario estaba identificado en el nivel 1 o 2, y primaria completa cuando el beneficiario estaba en el nivel 3. 2.6.3 Tiempo para aprobar el primer módulo después de la inscripción. Entre todos los beneficiarios, hay dos casos en los que la información no es consistente porque la fecha de registro es posterior a la primera acreditación.
Para estos dos registros se toma como fecha de registro la fecha de la primera acreditación.
Estructura de la base de datos
En este estudio resulta de interés la caracterización de los estudiantes según el porcentaje de módulos que fueron aprobados en el examen final, por lo que la variable se construye dividiendo el número de módulos que fueron aprobados en el examen final entre el número total de módulos aprobados. . Las variables de la categoría de resultados son aquellas que toman en cuenta si el estudiante ha logrado algún avance en su trayectoria educativa dentro del INAEBA, es decir, si ha completado al menos un módulo en el INAEBA (AproboMod); la variable %acreFin toma en cuenta si los módulos acreditados por el beneficiario efectivamente han sido cursados y aprobados mediante examen final de módulo o si sus conocimientos han sido confirmados mediante acreditación con equivalencia o mediante diagnóstico; El tiempo transcurrido desde la postulación del estudiante hasta la acreditación del primer módulo se registra en la variable reg_ini, mientras que el promedio de días que cada beneficiario necesitó para la acreditación del módulo se mide en la variable díasXmodul. Cabe señalar que, como muestran los datos del Cuadro 3, la variable educación y nivel están altamente correlacionadas.
La correlación de Spearman entre estas dos variables ordinales indica una relación positiva de 0.924, por lo que en adelante se utilizará la variable educación ya que es la variable original, mientras que la otra se obtuvo de una combinación de la información del primer módulo acreditado. para aquellos beneficiarios que fracasaron, se utilizó la variable educación para atribuir los valores como se describe en la sección 2.8.2.
Análisis exploratorio
- Análisis de calidad de los datos
- Distribución de las variables
- Creación de variable trayectoria, resumen de las variables de resultado
- Principales hallazgos del análisis exploratorio
En el caso de valores faltantes de las variables reg_ini, días por módulo, . Distribución porcentual de beneficiarios adscritos a cada coordinación de área, según tengan o no registro en la variable ocupación. Distribución porcentual de beneficiarios por nivel de educación, según tengan o no registro en la variable ocupación.
El Cuadro 12 muestra estas 4 clases y la distribución de beneficiarios por tipo de trayectoria.
Análisis multivariado mediante técnicas de aprendizaje automático
Influencia de las características sociodemográficas y administrativas en el tipo de
- Resultados para el subconjunto de beneficiarios que no aprobaron ningún módulo
- Resultados observados para el subconjunto de beneficiarios que sólo módulos aprobados por
- Resultados observados para el subconjunto de beneficiarios que sólo módulos aprobados por
Para determinar la significancia y la relación que tienen las distintas variables consideradas con la trayectoria lograda por los beneficiarios, los datos fueron modelados con un modelo de regresión logística multinomial (MLR por sus siglas en inglés), ya que en general los modelos de regresión logística son útiles. para determinar el poder o la relación entre la variable dependiente y una o más variables independientes cuando se utilizan datos categóricos. Los coeficientes del modelo de aprendizaje supervisado para cada una de las clases estudiadas, presentados en el Cuadro 14, muestran principalmente que junto con la edad y la escolaridad, los factores geotemporales administrativos son los determinantes de la trayectoria de los beneficiarios, confirmando los hallazgos observados en el estudio. análisis para caracterizar la coordinación regional y demostrar la dependencia de la trayectoria según el trimestre en el que ingresó el beneficiario. Además de las variables mencionadas, si el beneficiario de los considerados en el estudio se registró en el primer trimestre de 2019, esta condición es un factor que incide en la observación de una persona en esta categoría, es decir, por las limitaciones del estudiar. el corte transversal de información es de febrero de 2019.
La probabilidad de que los beneficiarios de los previstos en este estudio acrediten todos sus módulos con equivalencia o diagnóstico está determinada principalmente por la edad de la persona, por lo que cuanto más joven mejor.
Caracterización de los trimestres de acuerdo a las atributos de los beneficiarios
El gráfico 12 muestra que la selección de tres componentes principales explicó el 95,7% de la varianza de los datos. Por lo tanto, consideramos los primeros tres componentes que representan la variabilidad de los datos entre trimestres de registro como validación interna. El gráfico 13 muestra el diagrama de dispersión de los trimestres y cluster asignado (diferenciados por cada uno con un color diferente).
Cuatro tipos de trimestres resultan del análisis: los dos primeros trimestres de 2017; que en el tercer y cuarto trimestre de 2017 junto con el primero y cuarto trimestre de 2018; el segundo y tercer trimestre de 2018 y finalmente el primer trimestre de 2019 son diferentes a todos los demás.
Caracterización de los beneficiarios, mediante mapas auto-organizados
La variable que distinguía a los estudiantes que no aprobaron ningún módulo (ModAprob) se consideró como distinción dentro de la variable media con el valor de 5 para los beneficiarios sin módulos aprobados. Partes del mapa autoorganizado de los beneficiarios que han acreditado algunos módulos mediante el examen final. El mapa también nos muestra que los beneficiarios de mayor edad se encuentran en los conglomerados 1 y 4 en las esquinas superiores del gráfico, mientras que la mayoría de los beneficiarios más jóvenes se encuentran en los conglomerados 8, 9, 13 y 14.
En otros casos, el éxito de la evaluación está relacionado con la condición de aprobar o suspender todos los módulos con un examen de equivalencia o diagnóstico.
Principales hallazgos de la aplicación de técnicas de aprendizaje automático
Además, la caracterización de los barrios incluidos en el límite temporal de este estudio demuestra los efectos en la atención de la población educativamente desfavorecida de las políticas y estrategias explícitas a nivel estatal y federal para alcanzar las metas planteadas. La caracterización de las coordinaciones zonales, realizada a través del método de aprendizaje no supervisado, muestra que las características sociodemográficas de los beneficiarios no son homogéneas entre las coordinaciones, ni las formas de atención y los resultados alcanzados son los mismos. Los resultados del modelo de aprendizaje supervisado por regresión logística muestran que, además de la edad y la educación de los beneficiarios, factores geotemporales administrativos determinan la trayectoria de los beneficiarios, confirmando los hallazgos revelados en el análisis para mejorar la coordinación de caracterización de la zona.
De la misma manera, exponen la dependencia de los logros y el tipo de atención a los beneficiarios, a medida que fueron cambiando las estrategias y prioridades de las administraciones estatal y federal.