• No se han encontrado resultados

XI Evaluación de CALLIE-EXPERT

Paso 2 Tipo de calibración a llevar a cabo Expertos Expertos

Paso 3

Tipo de reparto inicial de los ítems Continuo Alterno (por defecto) Administración de ítems mediante CALLIE-MOODLE Sí No (por defecto)

Datos de acceso experto expXXX -

Tamaño homogéneo de ítems en cada cuestionario No Sí (por defecto)

Nº Cuestionarios, bloques y asignación de ítems

Según documentación

proporcionada (ver Anexo A2)

6 cuestionarios, 42 ítems por cuestionario

y asignación alterna (por defecto)

Número de expertos disponibles 8 116

Paso 4

Num. niveles de dificultad (mínimo 2) 11 12

Permitir dejar el nivel en blanco Sí No (por defecto) Obligar a dar la respuesta correcta No Sí (por defecto) % respuestas correctas para mantener el ítem (0-100) 70 (por defecto) 50 Núm. de niveles en horquilla (de 1 a número de niveles) 3 (por defecto) 4

% de opiniones de nivel en la horquilla (0-100) 85 (por defecto) 75 Permitir eliminar administraciones No Sí (por defecto) Tabla 11 – Características de cada una de las calibraciones a diseñar.

Por su parte, la Tabla 12 resume las tareas involucradas en esta prueba y los resultados relevantes.

Tareas diseño Respons1 Respons2 Alu1 Alu2 Alu3 Alu4 Alu5

Realización / punt. media Pasos 1 a 4 Hezinet - - Sel. banco Sel. banco prueba Ítems Sel. banco prueba Ítems 100% Pasos 1, 2 y 4 IRALE Ok Ok Ok Ok Ok Ok Ok 100% Reparto inicial IRALE Continuo Continuo Continuo Alterno Continuo Alterno Alterno 57,14%

Resto paso 3 IRALE Ok Ok Ok Ok Ok Ok Mal 85,71% Confirmar Petición Ok Ok Ok Ok Ok Ok Ok 100%

Puntuación Menú 9 9 8 8 9 9 9 8,71

Tabla 12 – Resumen de resultados de las pruebas para el diseño del experimento.

Como se refleja en las dos tablas anteriores, estas pruebas de diseño del experimento han abarcado la utilización del menú de cuatro pasos de CALLIE-ESKARI

Capítulo XI – Evaluación de CALLIE-EXPERT

- 137 -

para: (1) seleccionar un banco de ítems ya creado, (2) calibrar un banco de ítems mediante el juicio de expertos con varios de los supuestos que permite la herramienta como son, por ejemplo, emplear expertos disponibles escasos o de sobra, utilizar una administración de ítems con CALLIE-MOODLE o una administración de otro tipo, usar un diseño de cuestionarios homogéneos o usar un diseño no homogéneo, (3) elegir el tipo de reparto inicial más adecuado para asignar los ítems a los cuestionarios, (4) tomar distintas decisiones de filtrado y administración y (5) ver resumen, corregir y confirmar petición comprobando que está en CALLIE-PRO.

Todos los participantes han considerado que el componente es adecuado para su propósito y funciona correctamente. Han valorado positivamente el cálculo automático de datos y las alertas sobre posibles errores que aparecieron durante el diseño de la calibración de los ítems de IRALE. No hubo comentarios negativos. En cuanto a los resultados, todo participante excepto un alumno realizó su tarea correctamente (85,71%) y dentro del tiempo establecido para la prueba. El único alumno que no consiguió terminar la tarea, fracasó debido a una mala distribución de los ítems en los distintos bloques para cuestionarios no homogéneos, puesto que no los redistribuyó acorde a la tabla proporcionada. Los participantes otorgaron a este componente una puntuación media de 8,71.

XI 1.3

Pruebas con CALLIE-MOODLE

Para probar la administración de ítems con CALLIE-MOODLE se ha pedido a los 8 integrantes del grupo de profesores de la UPV/EHU para la calibración automatizada del tema IRALE (inexpertos en la funcionalidad de cuestionarios de la plataforma Moodle) que realicen la administración de los ítems de la calibración IRALE con este componente. Con objeto de evaluar la funcionalidad de la plataforma CALLIE- MOODLE tanto desde el punto de vista del responsable como desde el punto de vista del experto, la prueba se ha dividido en dos partes. Por un lado, dos personas (los responsables) han conducido la administración de los ítems y han dado un plazo para dar por concluida esa administración. Por otro lado, los 8 integrantes del grupo han participado como expertos cumplimentando y enviando los cuestionarios. Para ello, se les ha proporcionado acceso a un curso en CALLIE-MOODLE asociado a la calibración diseñada por IRALE tal y como lo generaría la propia herramienta CALLIE-EXPERT.

La Tabla 13 resume las tareas involucradas para los responsables en esta prueba y los resultados relevantes.

Tareas administración responsables Respons1 Respons2

Realización / punt. media Tareas básicas (avisos cumplimentación, administración,

revisión datos) Moodle Moodle 100% Tareas no básicas (instrucciones, resolución de consultas) email, teléfono email, teléfono 100% Puntuación CALLIE-MOODLE Responsables 9 9 9

Tabla 13 – Resumen de la prueba CALLIE-MOODLE parte responsables de la calibración.

Por su parte, la Tabla 14 resume las tareas involucradas para los expertos en esta prueba y los resultados relevantes.

Parte Cuarta – La herramienta de ayuda CALLIE

- 138 -

Tareas administración expertos Exp1 Exp2 Exp3 Exp4 Exp5 Exp6 Exp7 Exp8

Realización / punt. media Rellenar cuestionario Ok Ok Ok Ok Ok Ok Ok Ok 100%

Enviar cuestionario Ok Ok Ok Ok Ok Ok Ok Ok 100% Puntuación CALLIE-MOODLE Expertos 9 9 8 8 8 8 9 7 8,25

Tabla 14 – Resumen de la prueba CALLIE-MOODLE parte expertos participantes.

Como se refleja en las dos tablas anteriores, estas pruebas de administración de ítems han abarcado la utilización de CALLIE-MOODLE para: (1) realizar las tareas básicas del responsable en la administración de ítems como avisos sobre la cumplimentación de cuestionarios, la propia administración de los ítems y la revisión de los datos aportados por los expertos, (2) ofrecer al responsable la posibilidad de usar Moodle en otras tareas no básicas como adjuntar documentación con instrucciones, enviar y resolver consultas, etc., y (3) realizar las tareas básicas del experto en la administración de ítems: rellenar y enviar los cuestionarios dentro del plazo definido.

Todos los participantes han considerado que CALLIE-MOODLE es una plataforma adecuada tanto para administrar los ítems y seguir el progreso de los expertos como para la cumplimentación de los cuestionarios. Se registraron algunos problemas, que no eran debidos a un mal funcionamiento del componente sino al desconocimiento de las distintas opciones de la plataforma. A pesar de ello, todo participante realizó sus tareas correctamente y dentro del tiempo establecido para la prueba. Sin embargo, la revisión de la utilización o no de Moodle en las tareas que realizaron los responsables reveló que solamente se empleó Moodle cuando era estrictamente necesario, seguramente debido a su inexperiencia con esta plataforma. Los participantes otorgaron a este componente una puntuación media de 9 para las tareas de administración de los responsables y una puntuación media de 8,25 para las de los expertos.

XI 1.4

Pruebas con Excel para PRO-C

Para probar la recogida de datos para PRO-C desde un sistema de administración de ítems distinto a CALLIE-MOODLE se ha pedido a 5 personas inexpertas en temas de calibración (los cinco alumnos) que transformen los datos de una muestra de datos procedente de una administración externa para recogerla mediante CALLIE-PRO. Para ello se les ha proporcionado un documento con los datos recabados de una administración con 11 niveles que siguen la escala dada por el CEFR y cuya petición de calibración está preparada en CALLIE-EXPERT para que pueda recogerlos. La Tabla 15 resume las tareas involucradas en esta prueba y los resultados relevantes.

Tareas recogida datos Excel Alu1 Alu2 Alu3 Alu4 Alu5 Realización / punt. media Encontrar la ayuda Ok Ok Ok Ok Mal 80%

Modificar escalas Ok Mal Ok Ok Mal 60% Formato Ok Ok Ok Ok Mal 80% Nombre y ubicación Ok Ok Ok Ok Ok 100% Recoger datos desde Excel a la petición de prueba Ok Mal Ok Ok Mal 60%

Puntuación PRO-C Excel 7 6 6 7 6 6,4

Capítulo XI – Evaluación de CALLIE-EXPERT

- 139 -

Como se refleja en la tabla anterior, estas pruebas de recogida de datos con Excel han abarcado la utilización de las opciones de la interfaz inicial de PRO-C para: (1) encontrar la ayuda sobre el formato que debe tener el fichero Excel a recoger, el nombre y la ubicación en la que se debe colocar, (2) cambiar la escala de niveles de dificultad a la requerida por CALLIE-EXPERT y (3) recoger los datos formateados.

Todos los participantes han considerado que el componente es adecuado para su propósito y funciona correctamente. Han valorado positivamente que exista una utilidad de estas características pero la juzgan excesivamente rudimentaria a la hora de ayudar a crear y cargar el fichero Excel en el sistema. De hecho, solamente tres de los cinco participantes (60%) terminaron estas tareas correctamente y dentro del tiempo establecido para la prueba. Los participantes otorgaron a este componente una puntuación media de 6,4.

Debido a esta media tan baja y a los malos resultados obtenidos con los usuarios, una vez concluidas estas pruebas, en las que se usaba la interfaz inicial, se mejoró este componente como se ha indicado en la sección IX 3.5.

XI 1.5

Pruebas con PRO-C

Para probar el funcionamiento del componente PRO-C del sistema CALLIE- EXPERT mediante la interfaz CALLIE-PRO se ha pedido a 7 personas, con distintos grados de conocimientos en informática y en temas de evaluación y calibración, que calibren y discutan los resultados. Concretamente, se ha pedido a los dos profesores de la UPV/EHU que actuaban como responsables y a los cinco alumnos que tomen los datos de CALLIE-MOODLE, que calibren y discutan los resultados partiendo del diseño/especificación de dos peticiones de calibración en estado aceptada ya generadas con ESKARI y de los datos dados por los expertos en sus administraciones. Para ello, se les ha proporcionado la petición inicial correspondiente a IRALE introducida con CALLIE-ESKARI en estado aceptada y lista para recoger los datos de sus administraciones desde un curso de CALLIE-MOODLE. A continuación, se les ha pedido a estas 7 personas que discutan los resultados iniciales obtenidos para IRALE y que obtengan resultados alternativos sobre los mismos datos. Por otro lado, a los 5 alumnos se les ha proporcionado la petición inicial correspondiente a Hezinet introducida con CALLIE-ESKARI en estado aceptada y se les ha pedido que suban los datos desde un libro Excel que contiene las administraciones Hezinet y realicen los pasos de la calibración hasta obtener el informe de resultados.

La Tabla 16 resume las tareas involucradas en esta prueba sobre el progreso del proceso y los resultados relevantes.

Tareas Respons1 Respons2 Alu1 Alu2 Alu3 Alu4 Alu5

Realización / punt. media Recoger datos desde Excel - - Ok Ok Ok Ok Ok 100% Recoger datos desde Moodle Ok Ok Ok Ok Ok Ok Ok 100% Depurar y calibrar Ok Ok Ok Ok Ok Ok Ok 100% Ver resultados Ok Ok Ok Ok Ok Ok Ok 100% Puntuación PRO-C progreso calibración 9 9 9 9 9 10 8 9

Parte Cuarta – La herramienta de ayuda CALLIE

- 140 -

Por su parte, la Tabla 17 resume las tareas involucradas en esta prueba sobre la discusión de resultados y los resultados relevantes.

Tareas Respons1 Respons2 Alu1 Alu2 Alu3 Alu4 Alu5

Realización / punt. media Ver resultados detallados Ok Ok Ok Ok Ok Ok Ok 100%

Simular Ok Ok Ok Ok Ok Ok Ok 100% Responder preguntas - - Ok Ok Ok Ok Ok 100% Puntuación PRO-C discusión resultados 9 9 8 9 8 8 8 8,43

Tabla 17 – Revisión de la prueba PRO-C sobre la discusión de resultados.

Como se refleja en la Tabla 16 y la Tabla 17, las pruebas del componente PRO- C han abarcado la utilización de las distintas opciones de su interfaz CALLIE-PRO para: (1) recoger los datos de las administraciones desde el fichero Excel proporcionado y desde el curso de CALLIE-MOODLE asociado a la petición, (2) analizar y calibrar, (3) ver resultados detallados, (4) discutir resultados y (5) simular resultados con otros filtros. Cabe destacar que las dos primeras tareas son totalmente automáticas para una petición aceptada.

Todos los participantes han considerado que PRO-C es un componente adecuado y que funciona correctamente, tanto para controlar el progreso de la calibración como para discutir los resultados que se obtienen. Han valorado positivamente la información que proporciona la herramienta en cada momento, la automatización de los sucesivos pasos una vez aceptada la petición de calibración y la posibilidad de ordenar los resultados. El único inconveniente que se ha registrado es que la lista de peticiones no se puede ordenar, lo que no es un problema grave porque un usuario normalmente no tendrá tantas calibraciones en curso como para tener que ordenarlas. Los participantes otorgaron a este componente una puntuación media de 9 para el control del progreso de la calibración y una puntuación media de 8,43 para la discusión de los resultados.

XI 1.6

Resultados globales para los componentes

En cuanto a las opiniones de los participantes sobre las funcionalidades de los distintos componentes de CALLIE-EXPERT para la calibración de ítems vía expertos, los dos grupos consideraron que todos son adecuados para este propósito y que funcionan correctamente.

Los resultados globales que se obtuvieron para las funcionalidades de CALLIE- EXPERT evaluadas se reflejan en la Figura 50. Se obtuvo una media de 6,88 como puntuación para la introducción de ítems mediante ESKARI (ESKARI Introducción

ítems), 8,71 para el diseño del experimento mediante el menú de ESKARI (ESKARI

Menú), 9 para las tareas de administración de los responsables mediante CALLIE-

MOODLE (CALLIE-MOODLE Responsables), 8,25 para las tareas de los expertos durante la administración de ítems mediante CALLIE-MOODLE (CALLIE-MOODLE

Expertos), 6,4 para la recogida de datos desde Excel mediante PRO-C (PRO-C Excel), 9 para el control y seguimiento del progreso del proceso de calibración mediante PRO-C (PRO-C Progreso calibración) y 8,43 para la discusión de los resultados obtenidos mediante PRO-C (PRO-C Discusión resultados).

Capítulo XI – Evaluación de CALLIE-EXPERT

- 141 -

Figura 50 – Resultados globales por funcionalidad.

Los resultados por funcionalidad y grupo de participantes para los distintos componentes de CALLIE-EXPERT se recogen en la Tabla 18. Aunque no existen grandes diferencias entre ambos grupos, en todos los casos los usuarios conocedores de los temas de evaluación y calibración han dado una puntuación más alta.

GrupoIRALE GrupoAlumnos ESKARI Introducción ítems 8 6,4

ESKARI Menú 9 8,6

CALLIE-MOODLE Responsables 9 -

CALLIE-MOODLE Expertos 8,5 -

PRO-C Excel - 6,4

PRO-C Progreso calibración 9 9

PRO-C Discusión resultados 9 8,2

Tabla 18 – Puntuaciones medias por funcionalidad y grupo para CALLIE-EXPERT.

Como resultados globales por componente de CALLIE-EXPERT (Figura 51) se ha obtenido una puntuación media de 7,8 para ESKARI, de 8,62 para CALLIE- MOODLE y de 7,97 para PRO-C.

Figura 51 – Resultados globales por componente.

0 1 2 3 4 5 6 7 8 9 10 ESKARI Introducción Items

ESKARI Menú CALLIE-MOODLE Responsables

CALLIE-MOODLE Expertos

PRO-C Excel PRO-C Progreso calibración

PRO-C Discusión resultados

Resultados globales por funcionalidad

7 7,5 8 8,5 9

ESKARI CALLIE-MOODLE PRO-C

Parte Cuarta – La herramienta de ayuda CALLIE

- 142 -

XI 2

Resultados obtenidos por CALLIE-EXPERT

Tanto la autora como los cinco alumnos participantes en el experimento 2, han replicado con CALLIE-EXPERT las calibraciones de los dos bancos de ítems citados a lo largo de la memoria, con lo que se han obtenido 6 réplicas de cada calibración, todas ellas con idénticos resultados. En este apartado se reflejan estos resultados obtenidos por la herramienta. Los informes de resultados detallados obtenidos por CALLIE- EXPERT en estas dos calibraciones se pueden consultar en los Anexos A4 y A5 respectivamente.

XI 2.1

Réplica de la calibración de los ítems de Hezinet

Como en este caso se trataba de reproducir una calibración ya realizada, se hizo la especificación de la calibración de los ítems aplicando las mismas restricciones que se impusieron en la calibración original. Por otro lado, los ítems del banco, los datos de los expertos y la muestra recogida con las valoraciones de estos expertos sobre los ítems se hallaban almacenados en una base de datos MS Access, por lo que dicho contenido se tomó para alimentar al sistema CALLIE.

Al preparar el experimento 2 se ha creado en CALLIE-EXPERT un tema denominado EUSK con los 252 ítems del banco Hezinet. Asímismo, mediante el componente ESKARI de la herramienta se ha diseñado el experimento en CALLIE- EXPERT y se ha generado una petición de calibración utilizando el menú de cuatro pasos de CALLIE-ESKARI con el código REQE_EUSK_20130501_121159 y las características originales de Hezinet que se muestran en la Tabla 19.