¿Le ha ocurrido a usted que alguna vez, a pesar de sacar reiteradas veces mala nota en una determinada asignatura (es decir, sin haber obtenido reforzamiento), continúa estudiando con mucha dedicación “para la próxima prueba?” ¿Tal vez usted o una persona conocida juegan al Loto todas las semanas, a pesar de que “por lo general” no ganan nada?
Ello nos lleva a la conclusión de que no siempre el reforzamiento necesita ser aplicado de forma continua para que el sujeto aprenda alguna conducta. Existen incluso comportamientos que son mejor aprendidos con reforzamientos ocasionales que con reforzamientos continuos ¿o acaso no nos enamoramos a veces, de alguien que sólo muy de cuando en cuando nos dedica una sonrisa?). Cuando nos referimos a la frecuencia así como a los factores temporales que están asociados al reforzamiento que sigue al comportamiento deseable, estamos hablando de los programas de reforzamiento.
El comportamiento que es reforzado todas las veces que se manifiesta, se encuentra bajo un programa de reforzamiento continuo; si, en cambio, se le refuerza sólo en algunas oportunidades, no en todas, se encuentra sometido a un programa de reforzamiento parcial. Si bien el aprendizaje es más rápido con un programa de reforzamiento continuo, el comportamiento es más duradero
una vez que termina el reforzamiento, si es que se ha aprendido un programa de reforzamiento parcial.
¿Por qué los programas de reforzamiento parcial conducen a un aprendizaje más firme y duradero que los programas de reforzamiento continuo? Podemos responder a la pregunta examinando cómo nos comportaríamos al utilizar una máquina expendedora de refrescos en comparación con una máquina “tragamonedas” en un casino. Cuando usamos la máquina de refrescos, ya hemos aprendido por experiencia que cada vez que ponemos monedas, la máquina debe entregarnos el reforzamiento, es decir, la botella de bebida. O sea, el reforzamiento es de tipo continuo. En cambio, la máquina tragamonedas nos presenta un reforzamiento de tipo parcial. No siempre que introducimos las monedas podemos ganar... pero sabemos que algunas veces ganaremos algo.
Supongamos ahora que, sin que nosotros lo sepamos, ambas máquinas están descompuestas, de manera que ninguna de ellas puede entregarnos el reforzamiento. Con seguridad que no estaremos mucho rato poniendo monedas en la expendedora de refrescos y que nos iremos molestos a buscar otra que funcione. Sin embargo, con la máquina tragamonedas seremos capaces de estar mucho más tiempo sin recibir respuesta antes de darnos por vencidos.
En términos formales, podemos ver la diferencia entre ambos programas de reforzamiento: los programas de reforzamiento parcial mantienen la ejecución por períodos más largos que los programas de reforzamiento continuo antes de que se produzca la extinción, o sea, la desaparición de la respuesta condicionada.
(Adaptado de Feldman, 1998) Algunos programas de reforzamiento parcial producen respuestas más fuertes y duraderas que otros programas Esencialmente hay dos categorías para agrupar los diferentes programas de reforzamiento parcial: 1) los programas que consideran el número de respuestas antes de presentar el reforzador y 2) los programas que toman en cuenta la cantidad de tiempo transcurrido antes de proporcionar el reforzador.
Los programas que consideran el número de respuestas pueden ser: a) de razón fija y b) de razón variable. En un programa de razón fija, el reforzador se presenta sólo después de la realización de un determinado número de respuestas. Por ejemplo, una paloma recibe una bolita de alimento la décima vez que picotea una tecla. En un programa de razón variable, el reforzamiento ocurre después de un número variable de respuestas y no después de un número fijo. Así, en una sesión de entrenamiento la paloma puede recibir el alimento
después de ocho veces que picotea la tecla y en la siguiente sesión, después de la undécima vez.
Los programas que consideran la cantidad de tiempo, pueden ser: a) de intervalo fijo o b) de intervalo variable. En los programas de intervalo fijo, el reforzamiento se entrega a intervalos de tiempo establecidos. Por ejemplo, cada 8 minutos la paloma recibe la bolita de comida. En los programas de intervalo variable, el tiempo transcurrido entre los reforzamientos varía alrededor de un promedio determinado, en lugar de ser fijo.
La discriminación y la generalización en el condicionamiento operante El proceso por el cual los individuos aprenden a distinguir estímulos se llama entrenamiento de control de estímulos. En el entrenamiento de control de estímulos, se refuerza un comportamiento en presencia de un estímulo específico, pero no en su ausencia.
Considere por un momento una situación de la vida cotidiana: Un estudiante empieza a advertir ciertas formas de comportamiento no verbal que señalan un interés romántico por parte de la compañera de curso con quien hasta ahora le ha unido sólo una amistad. Aumentan, por ejemplo, las miradas o los contactos corporales. Empieza a darse la “química” del romanticismo. El estudiante empieza a prestar atención a esas claves no verbales, porque ha aprendido a discriminar esos estímulos. En consecuencia, empieza también a demostrar su interés por la muchacha y, si las claves continúan presentándose, persistirá en su comportamiento. Si las claves están ausentes, el estudiante sabe que no existe el interés romántico por parte de su compañera y, por lo tanto, no desarrollará intentos de aproximación a ella.
En el condicionamiento operante también se presenta el fenómeno de la generalización de estímulos. En la generalización, el organismo aprende a responder a un estímulo y luego aplica una respuesta a otros estímulos similares. Si un niño ha aprendido que “hacerse el taimado” le rinde resultados positivos al pretender conseguir algo de su madre, posiblemente presentará esa misma conducta frente al profesor en el colegio.
EL APORTE DEL CONDICIONAMIENTO OPERANTE A LA