2 Métodos de Evaluación de la Aprendibilidad

La Aprendibilidad ha sido considerada como un muy importante atributo tanto de la usabilidad como de la calidad del software; su evaluación ha ayudado a comprender el comportamiento de los usuarios durante el periodo de aprendizaje de productos de software, formalmente desde la década de los 80’s; encontrando información relevante sobre los primeros pasos que el usuario da en el uso del software.

Hasta hoy en día no existe una única definición de Aprendibilidad aceptada por toda la comunidad de Interacción Humano-Computadora (HCI). El término se hizo popular desde 1980 en el ámbito de las ciencias computacionales; fue definido como la capacidad de un sistema computacional de ser fácil de aprender para el grupo de usuarios para quienes fue creado, e incluido como una de las nueve características de la ingeniería del software (Confiabilidad, Exactitud, Aprendibilidad, Usabilidad, Flexibilidad, Desempeño, Aplicabilidad, Seguridad y protección, y Costo-beneficio) por (Michelsen, Domminick, & Urban, 1980). Casi una década después, la Aprendibilidad fue definida como la facilidad de uso que nuevos usuarios tienen con cierto diseño hasta que alcanzan un nivel óptimo de desempeño (Dix, Finlay, Abowd,

& Beale, 2010). Nielsen incluyó a la Aprendibilidad como uno de los cinco componentes de la usabilidad (Aprendibilidad, eficiencia, facilidad de memorizar, errores y satisfacción subjetiva) y se refiere a ella como qué tan fácil es para los usuarios completar tareas básicas la primera vez que se encuentran con cierto diseño (Nielsen, 2016).

De acuerdo con el estándar internacional ISO 25010, la Aprendibilidad es el grado con que un producto o sistema puede ser utilizado, por un grupo específico de usuarios, para alcanzar un conjunto específico de objetivos de aprendizaje para usar el producto o sistema con efectividad, eficiencia, libertad de riesgo y satisfacción objetiva en un contexto específico de uso ( International Organization for Standardization, Geneva, Switzerland., 2011). La Aprendibilidad también ha sido definida desde dos puntos de referencia: la del software y la del usuario. Desde la perspectiva del software, la Aprendibilidad se define como la capacidad del software para permitir a los usuarios un rápido comienzo del trabajo con el sistema (Holzinger, 2005). Desde el punto de vista del usuario, la Aprendibilidad se define como la habilidad del usuario para alcanzar un nivel de trabajo productivo utilizando cierto producto de software (Rodriguez, Borges, & Sands, 2002).

Por su parte, Santos y Badre definen la Aprendibilidad como la medida del esfuerzo requerido por un usuario típico para ser capaz de realizar un conjunto de tareas utilizando un sistema interactivo con un nivel predefinido de habilidad (Santos &

Badre, 1995).

En cuanto a Letho y Buck, definen Aprendibilidad de una manera más general, como una característica del software donde el desempeño del usuario se mejora con la experiencia (Letho & Buck, 2012). Los usuarios agregan que, durante el periodo de aprendizaje, las habilidades del usuario se refinan, la coordinación ojo-mano se hace más exacta, permitiendo mejores tiempos de desempeño, se cometen menos errores y se requiere menor esfuerzo, lo que permite una mejor satisfacción subjetiva del usuario.

Debido a ésta gran diversidad de definiciones, Grossman propuso una muy útil taxonomía para la Aprendibilidad, con el propósito de aislar áreas específicas en su estudio (Grossman, Fitzmaurice, & Ramtin, 2009). El autor comienza con la definición de dos categorías de Aprendibilidad: Aprendibilidad Inicial y Aprendibilidad Extendida. La Aprendibilidad inicial aplica para el desempeño que el usuario obtiene en el uso de un sistema interactivo durante un único periodo de tiempo (tiempo de uso).

Mientras que la extendida, aplica para el progreso en el desempeño que un usuario tiene

conforme pasa el tiempo. El autor agrega cuatro dimensiones basándose en el nivel de experiencia del usuario, es decir en sus habilidades actuales: nivel de experiencia con computadoras, nivel de experiencia con la interface, calidad del dominio del conocimiento y experiencia con software similar. De ésta manera el autor no únicamente da la oportunidad de definir el termino Aprendibilidad más adecuado para el estudio que se esté realizando, sino que ésta taxonomía permite definir las primeras pautas para un estudio más formal. La taxonomía completa propuesta por Grossman se muestra en la siguiente figura:

Fig. 1. Taxonomía de Grossman para la Aprendibilidad.

Hablando de manera muy general, la Aprendibilidad de un producto de software puede ser medida analizando el tiempo y el esfuerzo que requiere un usuario común para volverse profesional, posteriormente experto, en su uso (Tullis & Albert, 2013).

(Tullis & Albert, 2013) presentan una metodología de evaluación de la Aprendibilidad basada en la realización de pruebas con usuarios, analizando su desempeño con respecto al tiempo de interacción. Indican además condiciones iniciales y métodos de análisis de datos, que resultan ser muy útiles para éste tipo de estudios. Los autores mencionan que la primera decisión que se debe tomar al evaluar la Aprendibilidad es elegir el tipo de métricas que se utilizarán en el estudio, para lo cual se puede hacer uso de casi cualquier métrica que mida el desempeño de los usuarios respecto al tiempo de interacción con un producto de software, sin embargo las más comunes son aquellas que se enfocan en la eficiencia, tales como el tiempo que toma al usuario completar una tarea, la tasa de errores cometidos al realizar una tarea, el número de pasos que sigue el

usuario para completar una tarea o la tasa de tareas completadas exitosamente por minuto (Tullis & Albert, 2013).

El aprendizaje sucede a lo largo de un periodo de tiempo, en el que el desempeño de los usuarios mejora; es por eso que la evaluación de la Aprendibilidad debe realizarse en varias pruebas durante éste periodo. Después de decidir qué métricas utilizar en la evaluación de la Aprendibilidad, (Tullis & Albert, 2013) sugieren definir el tiempo que separará a las pruebas, el cual debe basarse en la frecuencia de uso esperada.

Cuando se espera que los periodos de tiempo en los que el usuario no interactúa con el software sea muy grande, por ejemplo, si se espera que el usuario interactúa con el producto de software una vez cada año, o una vez cada semestre, resulta impráctico tener ésta misma frecuencia en las sesiones de evaluación, por lo que (Tullis & Albert, 2013) recomiendan tres alternativas:

• Pruebas durante la misma sesión: Los participantes realizan las tareas una tras otra sin descanso entre ellas. A pesar de ser muy fácil de administrar, éste protocolo no toma en cuenta la pérdida de memoria que ocurre al dejar de usar un producto.

• Pruebas durante la misma sesión, con descanso entre cada tarea. Para que tenga mayor sentido, el descanso debe implicar situaciones distractoras o cualquier actividad que haga olvidar al usuario la tarea anterior.

• Pruebas entre sesiones. Los participantes realizan las mismas tareas durante múltiples sesiones con al menos un día entre ellas. A pesar de ser más impráctico que los anteriores, éste protocolo es más realista cuando el producto es utilizado esporádicamente.

Respecto al análisis de los datos (Tullis & Albert, 2013) mencionan que la manera más común de analizar y presentar datos sobre Aprendibilidad es mediante la examinación de métricas específicas de desempeño, tales como el tiempo en completar una tarea, número de paso y número de errores, para cada tarea o para todas ellas; esto permitirá mostrar cómo las métricas de desempeño cambian con respecto al tiempo.

Aplicada al diseño de una herramienta web para el desarrollo de actividades escolares, en (Zbick, Nake, Milrad, & Jansen, 2015) se presenta una metodología que incluye la aplicación de pruebas con usuarios en un ambiente semi-informal, y la aplicación de un cuestionario de usabilidad a los usuarios. Con el propósito de conocer la Aprendibilidad de ésta plataforma, los autores diseñaron éste método de evaluación que implicó la realización de dos sesiones y la participación de 13 académicos que fungieron como usuarios del sistema. Los autores describen que cada sesión tuvo una duración de 2 horas, y comenzaron con una breve presentación de la herramienta y sus principales funcionalidades, así como el diseño de una actividad escolar, a manera de ejemplo.

Posteriormente se dejó a los usuarios diseñar sus propias actividades y comprobar su funcionamiento en un dispositivo móvil. Finalmente, se dio a los usuarios tres cuestionarios: el primero, compuesto por cinco preguntas generales sobre su experiencia en la enseñanza y el uso de nuevas tecnologías en el aula; el segundo cuestionario, cuyas preguntas se basaron en el Modelo de Aceptación de la Tecnología (TAM, por su nombre en inglés Technology Acceptance Model) que es un método para identificar cómo el usuario acepta nueva tecnología, mediante el análisis de la utilidad

percibida y la facilidad de uso percibida (Venkatesh, Morris, Davis, & Davis, 2003) , el cual se aplicó para evaluar la herramienta de desarrollo y la aplicación móvil donde se probaron las actividades desarrolladas por los participantes; y finalmente, se aplicó el cuestionario de usabilidad SUS (System Usability Scale), que permite conocer, mediante diez ítems, la apreciación global de la facilidad de uso por parte del usuario (Brooke, 1996); el cual se modificó para centrar su foco en la evaluación de la Aprendibilidad.

A pesar de que algunas preguntas de los dos primeros cuestionarios permiten conocer información general acerca de la Aprendibilidad, la evaluación formal de ésta se llevó a cabo únicamente con el cuestionario SUS, a partir del cual se generan datos cuantitativos sobre la Aprendibilidad de la herramienta de desarrollo. En (Mihajlov &

Law, 2015) se evalúa la Aprendibilidad de interfaces naturales en adultos mayores mediante estudios empíricos aplicados a usuarios sin experiencia en dicha tecnología.

La evaluación incluyó la evaluación del desempeño del usuario sobre un conjunto de tareas, midiendo tiempo de aprendizaje, errores cometidos y aciertos; y de la calidad de uso, comparando la calidad de uso con respecto al tiempo y la usabilidad de usuarios novatos y expertos. Las métricas se eligieron tomando como base el conjunto de métricas categorizadas por Grossman (Grossman, Fitzmaurice, & Ramtin, 2009) de las categorías de Desempeño en Tareas y Usabilidad.

Mediante la aplicación de 17 sesiones individuales de evaluación, de 20 minutos cada una se evaluaron tres mini juegos simples en una mesa digital, cuya interacción se basaba en gestos sobre una pantalla táctil.Los autores decidieron no aplicar ningún tipo de cuestionario a los usuarios debido a que lo adultos mayores son propensos a la fatiga y al estrés provocados por actividades realizadas durante un largo periodo de tiempo.

A pesar de sus buenos fundamentos, éste método de evaluación de Aprendibilidad carece de técnicas que permitan obtener información subjetiva.

Basándose en las métricas de Aprendibilidad definidas en el estándar ISO IEC 9126- 2: facilidad de aprendizaje funcional, accesibilidad de la ayuda, efectividad de la documentación o ayuda del sistema, efectividad de la documentación o ayuda del sistema durante su uso y frecuencia de uso; en (Shamsuddin, Syed-Mohamad, &

Sulaiman, 2014) se propone la evaluación de Aprendibilidad mediante la generación automática de árboles de decisión que permiten identificar las acciones que deben ocurrir en la interfaz para permitir a los usuarios realizar una función en particular exitosamente.

La evaluación se realizó mediante la aplicación de experimentos controlados en un laboratorio, con pruebas con usuarios, sobre un sistema de correo electrónico web llamado my@arms. Luego de una breve introducción al objetivo de la investigación, para que los participantes comprendieran el sentido de su presencia en el laboratorio, se le pidió a cada participante completar las tareas; posteriormente los participantes contestaron un cuestionario.

La evaluación de la Aprendibilidad fue complementada mediante el análisis del tiempo que toma a los participantes completar cada una de las tareas dadas my@RMS permite medir el tiempo entre diferentes acciones del usuario por la definición de marcadores en su uso.

En (Chimbo, Gelderblom, & de Villiers, 2011) se propone evaluar la Aprendibilidad midiendo los atributos definidos por (Nielsen, 2016) (Dix, Finlay, Abowd, & Beale, 2010) en un entorno de la vida real. Para la evaluación se realizó una serie de experimentos controlados dentro de un laboratorio de usabilidad, cada uno de los cuales involucraba a un usuario aprendiendo a utilizar una nueva aplicación móvil. Cuatro tipos de usuarios fueron involucrados: Adultos expertos, adultos novatos, niños expertos y niños novatos.

Las pruebas con usuarios fueron realizadas tanto de manera individual como en parejas. Las parejas involucraban diferentes tipos de interacción entre usuarios: Un adulto experto enseñando a un niño novato, un adulto experto enseñando a un adulto novato, un niño experto enseñando a un adulto novato y un niño experto enseñando a un niño novato. Las pruebas individuales solo involucraron dos casos: un adulto novato aprendiendo por el mismo y un niño novato aprendiendo por el mismo.

Los datos fueron recolectados de tres maneras diferentes: observación (in-situ y análisis de video-grabación), seguimiento ocular y entrevistas. La utilización de video- grabaciones permitió a los autores analizar repetidamente a los usuarios y darse cuenta de detalles en el comportamiento del usuario que difícilmente se notarían in-situ. La aplicación de seguimiento ocular fuer realizada únicamente en las pruebas individuales.

Las entrevistas aplicadas fueron informales, semi-estructuradas tanto con usuarios adultos como con niños (expertos y novatos en ambos casos) y después de las pruebas individuales y en parejas.

La aplicación de dichas entrevistas permitió, entre otras cosas, discutir acerca de sus emociones y reacciones durante el experimento, lo que ayudó a comprender de una manera más clara el comportamiento de los usuarios ante las diferentes situaciones a las que se enfrentaron. Los autores proponen incluir en la evaluación de la Aprendibilidad un extensivo análisis de datos basándose en el proceso de Terre Blanche y Kelly, el cual comprende los siguientes pasos:

1. Familiarización e inmersión 2. Identificación de temas 3. Codificación

4. Elaboración

5. Interpretación y validación

In document Avances en Tecnologías Interactivas Aplicadas a la Discapacidad (página 79-84)