LA CA LILIA D DE LOS FRO( RAMAS DE EVALUACION

LA CALIDAD DE LOS PROGRAMAS DE EVALUAC' Y

LA CA LILIA D DE LOS FRO( RAMAS DE EVALUACION

encontrar una nueva modalidad de evaluación que permita tr adecuadamente con un número muy superior de alumnos al < acostumbraba atender en la institución. En ese caso, se tr; encontrar un programa e instrumentos más prácticos pero mente válidos que los que se empleaban con anterioridac resultados obtenidos con los nuevos programas deberán se traslados, en consecuencia, con los obtenidos por medio aplicación de los usados antes. La validez de convergen apreciará analizando las coincidencias entre ambas series de tados de la eval uación. Pero si, encambio, se procura obtener i información acerca de un aspecto significativo del aprern profundizando el examen de los logros obtenidos por los ah en competencias o ejecuciones específicas que hasta ese monx evaluaban de manera más general, en situaciones diferente tipos de expresión distintos, la elección de los nuevos ínsirun deberá ser sometida a un análisis de convergencia para establ los resultados de unas y otras series son coincidentes o conl torios. Sí ocurriera esto último, habría que reexaminar tar instrumentos empleados previamente como los nuevos, an adoptarlos y dar estabilidad al nuevo programa de evaluad

Validez man ifiesta

Esta modalidad de la validez no se refiere a la validez intr del programa o del conjunto de las pruebas o de cada prueb al modo en que ellos se presentan, aparecen, ante el público

Su significatividad deriva de que los programas y los instr tos de evaluación deben ser percibidos por los alumnos, sus y el público como instancias adecuadas para la evaluacic pueden ser vistos como absurdas carreras de obstáculos ni simples o complejos filtros que tienen el único fin de produ< selección, más o menos azarosa y más o menos injusta, en alumnos. La razonabilidad de los instrumentos debe ser vi explicable. Los instrumentos deben ser vistos como formas c de dar cuenta de los aprendizajes necesarios de los alumno; en lo que respecta a la forma como a los contenidos evaluac

La validez manifiesta exige, entonces, que los instruí evalúen de manera verosímil los aprendizajes. Sin esto la eval

ALICIA R. W. DE CAMILLONJ

msparencía y no puede convertirse en autoevaluación. A] la confianza en ella, pierde de este modo su sentido co y se requiere efectuar ias correcciones y operaciones que .ecesarias para lograr restablecerlo.

significado

Hermán y Rnuth (1991) añaden a los distintos tipos de e se describen habitualmente, la validez de significado, ie en respuesta a la siguiente pregunta: ¿las tareas de tienen significado para los estudiantes y los motivan ;ar su mejor rendimiento?

te a la modalidad de validez manifiesta que hemos validez de significado se centra, en particular, en la e se establece desde la perspectiva de los estudiantes, jrama y los instrumentos de evaluación, por un lado, y de enseñanza y de aprendizaje, por el otro. La evalua- iversos efectos sobre ei aprendizaje. Entre los efectos encuentra el de proveer información al alumno sobre s y los obstáculos que encuentra en el proceso de su / sobre los errores que debe superar, dándole indicios de cuál puede ser el origen de sus dificultades. Pero ía mbién tiene el efecto de incentivar la motivación del prender. La superación de dificultades constituye un el aprendizaje, así como la reiteración de los fracasos interés, si se perciben las dificultades como insupera- ;pacio de dimensiones variables para cada alumno, y ce entre los problemas demasiado difíciles para ser problemas demasiado fáciles en los que no se puede entra el punto adecuado en el que debe ubicarse la presenta la prueba de evaluación para que tenga a el estudiante y constituya un desafío en el que éste r esfuerzo de producción.

LA CALIDAD DE 1 ,OS PROGRAMAR DE EVALUACION

Validez de retroacción

La evaluación tiene un efecto de retroacción sobre la ense. Un caso clásico es el que se presenta en las evaluaciones ex • que ejercen una influencia normativa sobre lo que se enseña, cidos los contenidos y las técnicas empleadas en las evaluad ellas se convierten para los docentes en los modelos de lo que s» enseñar y aprender. Lo mismo ocurre, con frecuencia, con los i dizajes encarados por los alumnos, que se conforman a las p establecidas por los docentes en las evaluaciones que admini Es un efecto, en este caso no deseado, de la evaluación, por ci1 _{en vez de ocupar el} lugar de un apoyo para el mejoramien; aprendizaje y de la enseñanza, la evaluación se convierte verdadera reguladora de esos procesos. Cuando esto ocur’ peligro es grande, ya que, como dijimos antes, el dominio c* aprendizajes en la educación es mucho más amplio que el q‘ puede cubrir mediante la evaluación.

La validez de retroacción, que debe ser medida al igual qu: _otros tipos de validez, impone la realización de acciones de co‘ ción con el fin de restablecer el verdadero sentido didáctico d pi'ocesos de evaluación.

CONFIA BIUDAD

Se dice que un instmmento de evaluación es confiable cua' une exactitud en 1a medición y sensibilidad para la apreciación c» presencia y ias diferencias de magnitud de los rasgos que mide

Para que los resultados obtenidos mediante la administraciói* un instrumento de evaluación puedan ser considerados digL de confianza, deben ser estables, permaneciendo semejantes'' todas las ocasiones en que se administre ese instrumento u C similar. Si, por ejemplo, se administra una prueba o se emplea alg otro tipo de instrumento de evaluación y se obtienen ciertos res fados, el instrumento es confiable si, unas semanas después, ; ministrado nuevamente se obtienen resultados similares. I constancia de los resultados demostraría, primero, que el papel < azar es muy pequeño y no distorsiona de modo significativo

ALICIA R. W. DE CAMILLOA] 1 A t.Al.luAi) DELOSI-’RUUKAM.AS DE EVALE ACíOi\

>s obtenidos. í, además, que la administración del instru- podido dejar de lado la influencia de factores transitorios iberían tener relevancia en la consideración de ios resulta- orendizaje que se quieren evaluar, frumento confiable permite aislar los aspectos que mide de cara el caso se consideren irrelevantes. Así, por ejemplo, una óigante puede servir para detectar un sismo cercano, pero ser considerada un instrumento confiable pues, ai no en- iislada de otros factores, el viento o una mano, por ejemplo, accionada por otras fuerzas que falsearían la interpre- u movimiento pendular. De la misma manera, un insrru- zado en la escuela con fines de evaluación de ios aprendi- zados por los alumnos debe permitir la consideración de dizajes separándolos de otros factores que pueden incidir uestas de ¡os alumnos, tales corno el azar, la fatiga o los tensión nerviosa de los alumnos o de los docentes, abilidad depende, también, de la exactitud y precisión de el instrumento. En primer lugar, debe detectar si el o el rasgo que es evaluado está presente o ausente ) saben x?, ¿tienen y destreza o no la tienen?, ¿quieren z •en?, etcétera). Pero debe hacerlo con sensibilidad y sin i ante las variaciones de intensidad, profundidad y ÍS conductas

observadas o inferidas, ailidad de un instrumento depende,

pues, de su estabi- :titud y su sensibilidad. Agregamos a estas condiciones i, que supone que la evaluación es independiente de la evalúa, esto es, que los resultados reciben una interrilar tanto de diferentes docentes como de un misino Istintos momentos.

actores que afectan la confiabilidad se encuentran los longitud y duración de la prueba, ya que cuando es e breve su capacidad de cobertura de contenido es le estar muy distorsionada por factores de azar. "La ida de conducta puede dar como resultado una puníale y poco confiable" (Thomdike y Hagen, 1989). a prueba es excesivamente larga, la duración prolon- roporcionar información afectada por la fatiga de! nbargo, señala Groníund (1973) que es preferible el

riesgo de diseñar pruebas más largas para que tenganmayoi de contenido, siempre que se añadan contenidos diferentes se superpongan con los que va presenta ia prueba. Cuaric trata de instrumentos para medir velocidad sino de pru competencia o capacidad, el tiempo debe ser suficiente realización del trabajo, incluso para estudiantes lentos.

Otro factor que incide sobre la confiabilidad son las cono de administración deí instrumento. En situaciones puntu evaluación formal, la tensión de ios alumnos suele ser mayoi las informales, y ía manera en que son tratados por el exair puede favorecer o perjudicar su desempeño. También tiei fluencia sobre los rendimientos las condiciones materiales y de administración de las evaluaciones tales como iiumii silencio, mobiliario, equipamiento adecuado y comodidad ex ral de alumnos y docentes.

Alamos ele la conñuathdaJ

La confiabilidad de un instrumento debe permitir cubrir piadamente las necesidades planteadas por el programa de es ción. No todos 3os instrumentos tienen la misma exactitud y blindad, ya que ella depende de la forma técnica que adoptan y características propias que les otorga su construcción espe< Así, en otro orden de mediciones, por ejemplo, un barór doméstico puede ser aceptablemente confiable porque las lee que permite efectuar brindan la información que, con márgen error adecuados a ese uso doméstico, le permiten cumplir o función a la que está destinado. En una estación meteorológic cambio, esas mediciones serían consideradas insuficienterr confiables, pues la sensibilidad y exactitud requeridas para cun su función son mucho mayores. Los instrumentos de medició precisión son ios que tienen mayor estabilidad, exactitud, sensi dad y objetividad. Pero se debe recordar siempre que todaí mediciones no son absolutas, sino que son relativas a los ínstrun tos de medición que se emplean.

En cada caso, en consecuencia, habrá de determinarse cuáles los grados de eonfiabiiidad que resultan necesarios para cum

ALICIA R. W. DE CAMILLONÍ

>ósitos que el programa de evaluación asigna a cada ede confundir confiabilidad con validez. Es frecuente res de libros sobre este tema afirmen que la confiabili- lición necesaria, aunque no suficiente, de la validez 16; Gronlund, 1973; Popham, 1983; Ebel, 1963; Sachs 3; Pidgeon y Yates, 1979). Veamos algunas de estas

1983): "Un test carente de (con)fiabilidad no puede ser fin alguno". Ebel (1963): "Para que una prueba sea >er confiable". Pidgeon y Yates (1979): "Un examen no álido a menos que sea (con)fiable; pero puede ser in ser válido". Karmel (1986): "Recuerde que ningún do a menos que sea confiable. Por otra parte, un test nfiable y carecer de validez". Esta exigencia de confia- > condición para hacer posible la validez ha tenido mucha la teoría y la práctica de la evaluación. Consideramos, sin 3 es un principio que debe ser examinado y modificado, z y la confiabilidad de un instrumento de evaluación usolutas. Hemos visto que para la validez los criterios írven de pauta y, del mismo modo, que la confiabilidad rgenes de aceptabilidad según el uso que se le quiera mentó.

otra parte, en los instrumentos de evaluación de los , cuando se exige confiabilidad como primera condi- ;rar cumplir con la exigencia de validez del instrumen- gia un cierto tipo de instrumentos en los que el peso de id desaparece. Esos instrumentos de alta confiabilidad ra evaluar un cierto tipo de aprendizajes o rasgos pero uar todos. Las llamadas "pruebas subjetivas" o "tra- exámenes o cuestionarios orales, pruebas escritas de ertación o de respuesta extensa; pruebas de respuesta i de cuestionario; monografías, tesinas y tesis; evalua- tfolio; estudios de casos, entre otras) están destinadas a oducción del alumno sin pautas totalmente estructu- ■ le dan libertad para escoger la información, organi- arla y presentarla. En estos casos la validez aumenta a La confiabilidad. Esta última no es, entonces, condición

In document 12.- La Evaluacion de Los Aprendizajes en El Debate Didactico Contemporaneo (página 41-44)