LA EVALUACIÓN - Planeación de la Enseñanza y Evaluación del Aprendizaje

La evaluación es <<la cola que menea el perro>> del currículum (Hargreaves, 1989).

A menudo vemos la evaluación como algo que sigue al aprendizaje, que aparece después de la enseñanza (Burgess y Adams,1985). Sin embargo y según argumenta Broadfoot (1979), la evaluación suele tener un efecto de

<<rechazo>> sobre el currículum y los procesos de la enseñanza y del aprendizaje que lo acompañan. En consecuencia, la evaluación es tanto el mecanismo que hace funcionar nuestros objetivos educativos como un reflejo de los mismos (Murphy y Torrance, 1989). En este sentido, cualquier cambio en la evaluación educativa debería planificarse en consonancia con los cambios que se propongan para el currículum. La reforma del currículum y de la evaluación es una labor que debería emprenderse de forma conjunta, coherente y previamente planificada. De otro modo, la reforma de la evaluación se limitará a configurar el currículum por defecto (Hargreaves, 1989).

Si nuestros objetivos educativos promueven una amplia gama de resultados y reconoce una amplia variedad de logros educativos, esos objetivos deberían quedar reflejados en una política de evaluación que contara con la misma amplitud (Leithwood et al., 1988).

Dado el poder de la evaluación para configurar el currículum, la enseñanza y el aprendizaje, los desequilibrios de ésta crearán muy probablemente desequilibrios en los tres últimos aspectos nombrados. Algunos tipos de evaluación, como los exámenes escritos y las pruebas estandarizadas, son comúnmente criticados por sus efectos negativos sobre el currículum, la enseñanza y el aprendizaje (véase, por ejemplo, Hargreaves, 1982;

Haney y Manaus, 1989). Esto ha inducido a algunos a defender la abolición de estrategias concretas de evaluación que parecen ejercer estos efectos (véase, por ejemplo, Whitty, 1985). Pero la evaluación, como concepto general, no puede ser eliminada. Es una parte constitutiva de la enseñanza. Los profesores evalúan continuamente. Controlan el progreso y la respuesta de sus estudiantes durante el transcurso de los acontecimientos que tienen lugar en el aula. Al escudriñar las expresiones faciales, al comprobar el trabajo de los estudiantes, al hacer preguntas para comprobar el nivel de comprensión, los profesores emprenden una tarea de evaluación informal como parte rutinaria de su trabajo (Jackson, 1988). Si no lo hicieran así, no estarían enseñando. La evaluación, pues, no se puede suprimir, pero sí reformar. A la

vista de nuestra argumentación anterior, parece sensato sugerir que la fuerza impulsora que anima la reforma de la valoración debería ser el propósito de satisfacer de un modo más efectivo los objetivos de nuestro currículum y nuestra enseñanza.

La evaluación cumple muchas funciones. Entre ellas se incluyen fomentar la responsabilidad, la titulación, el diagnóstico y la motivación del estudiante. Todas estas metas no pueden abarcarse con una sola estrategia de evaluación (ese sería el caso de las pruebas estandarizadas o los portafolios) (Haney, 1991; Hargreaves, 1989; Broadfoot, 1979).

Algunas estrategias de evaluación, por ejemplo los portafolios, útiles para estimular la motivación del estudiante, resultan poco eficientes como instrumentos para satisfacer las exigencias de responsabilidad pública. Del mismo modo, algunas estrategias, como las pruebas o exámenes nacionales que proporcionan datos asequibles y concisos a audiencias externas, no resultan de gran ayuda a la hora de diagnosticar los problemas del estudiante. En consecuencia, es más probable que podamos satisfacer los diversos propósitos de la evaluación mediante el empleo de una extensa gama de estrategias de evaluación. El objetivo último de todo esto es que si invertimos en una serie limitada de estrategias de valoración, sólo cumpliremos algunos de nuestros propósitos en ese ámbito, a expensas del resto.

Desarrollar y desplegar una amplia gama de estrategias de evaluación es una práctica habitualmente criticada ya que, según sus detractores, ocupa una porción importante del tiempo asignado al profesor para realizar sus funciones (Stiggins y Bridgeford, 1985;

Broadfoot et al., 1988). Las demandas de evaluación adicional planteadas al profesor pueden representar una carga considerable allí donde las tareas de evaluación, como las pruebas escritas, son administradas por separado con respecto al resto del currículum.

Sabemos, sin embargo, que los profesores valoran continuamente a sus estudiantes de modo informal, como parte integral de su enseñanza. Si queremos desarrollar y desplegar una gama más amplia de estrategias de evaluación, y que éstas no mantengan ocupado un tiempo excesivo al profesor, deberán ser incluidas en el aprendizaje que se imparte en el aula, y dejar de ser algo a lo que se aplica un criterio o clasificación similares a los utilizados para ordenar las estanterías que contienen los libros de texto, una vez que haya terminado el

aprendizaje. La integración de las nuevas estrategias de evaluación en el currículum y el aprendizaje es uno de los mayores avances prácticos y conceptuales que precisa la reforma de la evaluación. En resumen, basamos nuestra revisión de la evaluación educativa en los siguientes principios:

• La reforma de la evaluación y la reforma del currículum están estrechamente relacionadas y deberían emprenderse juntas.

• Los amplios objetivos del currículum deberían tener su reflejo en objetivos de evaluación a su vez más amplios.

• No se puede abolir la evaluación educativa, sino sólo reformarla.

• La evaluación educativa cumple diversos propósitos que no pueden ser abarcados adecuadamente por una sola estrategia de evaluación, sino por una amplia gama de estrategias.

• La evaluación debería constituir una parte integral del proceso de aprendizaje, y no algo que se pone en práctica una vez terminado éste.

En el resto del capítulo ampliaremos estos puntos, clarificando la naturaleza de la evaluación educativa, perfilando sus propósitos principales y describiendo los tipos específicos de evaluación que los profesores pueden utilizar y practican en sus aulas.

Examinaremos después las pautas tradicionales de evaluación y sus implicaciones en la enseñanza y el aprendizaje. Finalmente, analizaremos una gama de estrategias alternativas de evaluación, junto con algunas posibilidades y problemas que pueden surgir en su aplicación.

DEFINICIONES DE LA EVALUACIÓN Según Bloom (1970), la evaluación es uno de los tres aspectos de labor examinadora, siendo los otros dos la medición y la valoración, Bloom definió la evaluación como

<<un intento de valorar las características de los individuos respecto a un ambiente, tarea o situación de carácter particular>>. Satterly (1981) definió la evaluación más ampliamente como <<un término que incluye todos los procesos y resultados que describen el aprendizaje de los estudiantes>>, y Wo y Power (1984) expresaron la necesidad de separar el término <<evaluación>> del de

<<medición>>. La evaluación se define por otro lado como el proceso que valora la

evolución del estudiante hacia los objetivos educativos establecidos, e incluye juicios de valor (Stenne, 1987). En este capítulo, la evaluación será definida como los métodos utilizados para describir y diferenciar lo aprendido por los estudiantes en la escuela.

Es razonable que aquellos que están implicados en el proceso de aprendizaje quieran comprender sus resultados (Murphy y Torrance 1988). En consecuencia, y por definición, la buena evaluación no solo forma una parte esencial de la enseñanza y el aprendizaje, sino que es inherente a la propia enseñanza (Shipman, 1983).

La valoración puede ser diferenciada atendiendo a aquellos aspectos que los profesores valoran: el proceso de trabajo (de qué manera el estudiante asimila, organiza e interpreta la información), o el producto (la presentación de las ideas y la calidad y cantidad del trabajo). Por lo general, se da preferencia a la evaluación del producto terminado, puesto que, comúnmente, se la considera un intento por cuantificar rendimientos, dentro de una visión del aprendizaje orientada hacia el producto (Shipman, 1983).

La evaluación puede ser diagnóstica, formativa o recopiladora, dependiendo del motivo que requiera su aplicación. La evaluación inicial se lleva a cabo para descubrir si un estudiante tiene dificultades o para identificar la naturaleza de su comprensión, con objeto de tomar decisiones acerca de posibles modificaciones en cuanto a su asignación a un grupo o al programa.

Buena parte de este tipo de valoraciones se hace de modo informal y continuado. La evaluación informal tiene lugar al interactuar el profesor con los estudiantes en el aula, interpretar las respuestas de éstos y responder a ellas mediante la modificación de su estilo de enseñanza, ya sea adaptando el tema o cambiando el currículum.

Los términos de evaluación formativa y recopiladora se utilizan, respectivamente, para distinguir entre evaluación continuada a lo largo del curso, cuyo propósito fundamental será mejorar la enseñanza y el aprendizaje, y la evaluación que se produce una vez terminada la enseñanza y cuyo objetivo consiste en valorar los logros del alumno. Tal y como sucede con la distinción entre proceso y producto, se pone especial énfasis en determinar en qué medida la evaluación ayuda al profesor a identificar los problemas del que aprende, proporcionándole apoyo

75 inmediato, en comparación con la descripción

del rendimiento final (Scriven, 1978).

Finalmente, la evaluación también se puede diferenciar en lo que respecta a su punto de referencia, evaluación basada en el criterio o en el resultado, y que registra el logro de objetivos curriculares específicos alcanzados por el estudiante. Esta evaluación equipara a los estudiantes con un nivel. La ventaja de este método es que permite a los profesores identificar hasta qué punto un estudiante ha alcanzado un nivel de rendimiento predeterminado, de modo que se les pueda ofrecer la ayuda apropiada (Rowntree, 1980).

Cuando la comparación se establece con los compañeros y no con niveles específicos, la evaluación pasa a tomar como referencia la norma. Broadfoot (1979) argumenta que el predominio de la evaluación que toma como referente la norma es de poca ayuda para los profesores a la hora de mejorar su enseñanza y refleja la competitividad que caracteriza nuestra sociedad. Además de estos dos puntos de referencia ampliamente discutidos en la evaluación, hay un tercero, analizado de forma más superficial: la evaluación

<<ipsativa>> o autoreferenciada. Derivada del latín ipse (que significa <<uno mismo>>), esta pauta de valoración es aquella en la que el rendimiento y los logros propios no se miden atendiendo a ninguna norma o promedio, ni respecto a ningún criterio preestablecido, sino tomando como referencia los rendimientos y logros del alumno en el pasado.

Uno de los problemas del tránsito a la escuela secundaria es el desconcertante descenso que se produce en las notas de algunos estudiantes cuando pasan de ser valorados por referencia <<ipsativa>> en la escuela elemental, a serlo atendiendo a normas o criterios establecidos en la escuela secundaria (ILEA, 1984). Este problema generalizado indica la importancia de procurar una coherencia según el punto de referencia adoptado en la práctica de la evaluación, dado que los estudiantes pasan de una institución a otra. En síntesis:

• La evaluación ha sido definida como los procesos utilizados para describir y diferenciar los conocimientos adquiridos por los estudiantes en la escuela.

• La evaluación puede valorar el proceso de trabajo o su producto.

• La evaluación puede ser de naturaleza diagnóstica, formativa o recopiladora.

• La evaluación puede tomar como punto de referencia criterios y normas, o ser de carácter <<ipsativo>> autoreferencial.

• Puesto que la incoherencia en la práctica de la evaluación puede conducir a confusión y desilusión, a medida que los estudiantes efectúan el tránsito entre las escuelas (primaria a secundaria), es prioritario para la evaluación establecer con claridad y coherencia su punto de referencia.

OBJETIVOS DE LA EVALUACIÓN La evaluación educativa cubre una serie de objetivos diferentes. Cuatro de ellos se analizan ampliamente en la bibliografía:

responsabilidad, titulación, diagnóstico y motivación.

Responsabilización

Para el público, en general, la evaluación puede legitimar la existencia de un sistema educativo dado y comunicar a la sociedad hasta qué punto se están satisfaciendo las expectativas que ésta tiene depositadas en la escolarización. Puesto que los contribuyentes invierten dinero en la educación, quieren estar seguros de que su dinero se emplea bien. A medida que aumenta la proporción de contribuyentes que no tienen hijos e hijas en edad escolar, también aumenta la demanda pública de rendimiento de la responsabilidad educativa. La calidad del trabajo que los propios estudiantes llevan consigo a casa o describen no es suficiente para este público más amplio, que exige criterios de responsabilidad generalizados y perceptibles.

Según este punto de vista, las escuelas tienen que producir <<bienes>> lo que, en términos educativos, equivale a conseguir que los estudiantes alcancen un cierto nivel (Broadfoot, 1984).

Esta presión que exige dar cuentas a la sociedad no es nada nuevo. Ya se daba, por ejemplo, en la Inglaterra del siglo XIX, cuando se pagaba a las escuelas <<según los resultados>>, es decir, si los estudiantes obtenían niveles específicos y perceptibles.

Incluso en la actualidad, en Holanda, las becas estatales sólo se conceden a aquellas escuelas cuyos estudiantes pueden demostrar un mínimo de competencia en habilidades numéricas y básicas de carácter general (Maguire, 1976).

Titulación

Éste es quizá el propósito más comúnmente reconocido de la evaluación escolar, sobre todo en los últimos años de la educación secundaria (Broadfoot, 1979). La titulación constata la competencia de los estudiantes en un ámbito particular del aprendizaje, una vez han terminado su trayectoria escolar o un tramo importante de la misma. Esta competencia se demuestra en pruebas o exámenes en apariencia imparciales y objetivos, confeccionados habitualmente por los profesores. Los resultados de esta evaluación se comparan con el rendimiento de otros estudiantes, clasificando por tanto a los estudiantes atendiendo a unos criterios predeterminados y, en ocasiones, estableciendo comparaciones entre sí. El objetivo principal de esta clasificación es el de permitir que los dos <<principales consumidores>> del sistema educativo, es decir, los empresarios y las instituciones de educación superior, seleccionen a aquellos que, en su opinión, han tenido un rendimiento satisfactorio (McLean, 1985).

Al igual que sucede con el precepto de responsabilidad, la titulación ha crecido en importancia a lo largo de los años al ser considerado un propósito clave de la evaluación. Su creciente influencia sobre los sistemas de evaluación y los sistemas educativos puede ser atribuida en general a lo que Dore (1976), en su revisión internacional de las tendencias de la evaluación, califica como <<inflación de calificaciones>>, <<la enfermedad del diploma>> o <<titulitos>>.

Este proceso ha supuesto, a lo largo del tiempo, una escalada en las exigencias de calificación para un mismo puesto de trabajo, aun cuando las habilidades requeridas para realizar la tarea se hayan mantenido relativamente estáticas. En la búsqueda de equidad dentro de un sistema donde prevalece la igualdad formal de oportunidades, aumenta el número de estudiantes que se someten a exámenes, pruebas y otras valoraciones, en niveles cada vez superiores, con objeto de sacar el máximo rendimiento a sus posibilidades de éxito. A medida que un mayor número de estudiantes alcanza con éxito el nivel exigido en los centros educativos y aumenta la reserva de candidatos aptos para puestos de trabajo concretos, aquellos que abren las puertas de acceso a dichos puestos elevan sus estándares de admisión para reducir la reserva y conseguir aspirantes mejor calificados. Por su parte, los que abren las puertas de acceso a otros trabajos paralelos hacen lo mismo para no rebajar su

posición, lo que da como resultado una inflación. El efecto inmediato de dicha inflación es la creación de programas de nivel más elevado para satisfacer la demanda de un creciente número de estudiantes, y la dependencia de otros programas a titulaciones que antes no tenían, con objeto de dotarlos de mayor credibilidad pública. En general, la titulación acaba por ejercer una influencia cada vez más amplia, lo que la convierte en uno de los propósitos más poderosos de la valoración educativa.

Diagnóstico educativo

La evaluación permite al profesor valorar el proceso de aprendizaje, identificar los niveles de comprensión de los estudiantes, localizar problemas y ofrecer ayuda individualizada o ajustar el programa en consecuencia. Este tipo de evaluación no sólo es ventajosa para el público externo, obsesionado por la responsabilidad, o el reclutamiento de personal competente, sino también para los propios profesores, ya que de este modo pueden ayudar a sus estudiantes ajustando su programa y mejorando su enseñanza. En este sentido, la evaluación mejora la calidad de la enseñanza y el aprendizaje (Rowntree,1980).

Motivación del estudiante

Es evidente, la evaluación motiva, según el principio del <<palo y la zanahoria>>, allí donde los estudiantes están dispuestos a realizar el esfuerzo necesario para llevar a cabo una tarea por la que van a ser recompensados (Natriello, 1987). También se estimula la motivación cuando el logro del estudiante es oficialmente registrado y reconocido (Munby, 1989). En aquellos casos en que los estudiantes participan en el proceso de evaluación, ésta puede resultar un acicate porque ayuda a fomentar entre los estudiantes un sentido de responsabilidad sobre su propio aprendizaje (Burgess y Adams, 1985). La valoración también puede ejercer un efecto positivo en la motivación del estudiante de forma indirecta, al conllevar mejoras en el currículum y la enseñanza, así como en la calidad del aprendizaje que experimentan los estudiantes (Hargreaves, 1989). Utilizar la valoración en beneficio de la motivación es, sin embargo, una espalda de doble filo. Stiggins (1988) señala que las puntuaciones o categorías no son motivadores para los que rinden poco, que se protegen a sí mismos mostrándose menos persistentes y poco motivados.

77 En un sentido general, la responsabilidad y la

titulación son propósitos importantes e inevitables dentro de la evaluación educativa.

Pero, desde nuestro punto de vista, los propósitos clave de la evaluación son aquellos que abordan las necesidades de los preadolescentes durante los años de transición. El diagnóstico y la motivación son, por lo tanto, propósitos fundamentales de la evaluación si atendemos a las necesidades del estudiante. Si estas necesidades predominan realmente en un sentido tanto práctico como retórico, entonces la prioridad principal en la reforma de la evaluación sería el cumplimiento adecuado a los propósitos del diagnóstico y la motivación.

Este sería el criterio seguido en nuestra revisión de las estrategias de evaluación. No se trata de un análisis sobre las ventajas y desventajas que presentan las diferentes pautas de evaluación en un sentido amplio.

Abordaremos la evaluación como un aspecto a tener en cuenta a la hora de satisfacer las necesidades de los preadolescentes. En consecuencia, se considerarán diferentes pautas de evaluación, atendiendo a su capacidad para intensificar o disminuir la motivación del estudiante, de mejorar o inhibir el diagnóstico efectivo, y de reconocer y estimular una gama amplia o limitada de logros y experiencias educativas.

PAUTAS TRADICIONALES DE EVALUACIÓN

Históricamente, las formas de evaluación dominantes y públicamente visibles han sido las pruebas estandarizadas, los exámenes externos y las pruebas y exámenes supervisados por los profesores. En una revisión de la bibliografía sobre los procesos de evaluación en las escuelas y aulas, Natriello (1987) llegó a la conclusión de que

<<la técnica dominante para reunir información sobre el rendimiento del estudiante es siempre algún tipo de examen>>, ya sea nacional, estatal, de distrito o de aula, en el que los profesores confían ampliamente (Herman y Dorr- Bremme, 1984; Wilson, 1989).

Efectos de la evaluación tradicional

En todas las sociedades industriales occidentales, los exámenes se iniciaron como un medio de asegurar el ingreso en ciertas profesiones de élite, controlando así el reclutamiento de sus miembros (Broadfoot, 1979). Ya desde el principio, por tanto, los

exámenes formaron parte de un proceso de clasificación y selección que puso de relieve los frutos concretos de la educación. Dos tipos de exámenes han prevalecido en la bibliografía de los últimos años: de competencia mínima y exámenes específicos de grado (Nagy, Traub y MacRury, 1986). Las pruebas de competencia han sido muy utilizadas en Estados Unidos. Aunque fueron introducidas originalmente para proteger los intereses de estudiantes cuyas necesidades estaban siendo descuidadas, han provocado innumerables debates sobre su imparcialidad y el impacto que tienen sobre los programas educativos (Corcoran, 1985).

Además de exámenes y pruebas estandarizadas confeccionados fuera de la escuela, los profesores también se han valido, en gran medida, de sus propias pruebas escritas, como base para calificar el rendimiento del estudiante (Gullickson, 1982).

De hecho, Stiggins y sus colaboradores (1989) descubrieron que los profesores consideran las evaluaciones de aula hechas por ellos mismos como la fuente fundamental de información sobre el logro del estudiante, y manifiestan su preferencia por desarrollar sus propias evaluaciones. Varios estudios sobre las prácticas de evaluación realizados en escuelas canadienses han descubierto que los profesores prefieren ser ellos los que preparen sus pruebas (Wahlstrom y Daley, 1976;

Anderson, 1989; Wilson et al., 1989).

Las pautas tradicionales de examen y evaluación tienen en común las siguientes características:

• Se aplican predominantemente fuera de contexto, una vez completado el aprendizaje requerido.

• Suelen ser pruebas escritas.

• Suelen tomar como referentes normas o criterios.

• Proporcionan la base para las puntuaciones o notas, que pueden utilizarse como mediciones del rendimiento individual, de la escuela, del distrito, del estado/provincia o del plano nacional.

Los argumentos a favor y en contra de los exámenes públicos ya fueron planteados hace casi ochenta años de modo elocuente, aunque un tanto singular, por parte del Consejo de Educación (1911), en Inglaterra. Análisis más recientes sobre los efectos de los exámenes y otras pautas similares de evaluación han

In document Planeación de la Enseñanza y Evaluación del Aprendizaje (página 73-90)