PROGRAMA CONCURRENTE ENCADENADO
4. REGLAS DE EJECUCIÓN OPERANTE
4.1. Teoría de la probabilidad diferencial
Premack (1965) señaló que las respuestas que acompañan a los estímu- los reforzadores son actividades altamente probables, mientras que las acti- vidades instrumentales son menos probables. La razón de que una respues- ta se convierta en reforzadora viene determinada por su probabilidad de ocurrencia en la línea de base: «Dadas dos respuestas en un procedimiento de condicionamiento instrumental, la respuesta más probable reforzará a la menos probable y la respuesta menos probable no reforzará a la más probable» (Premack, 1959, 1965).
El principio del reforzamiento de Premack puede considerarse un
desarrollo de la idea de que los reforzadores no tienen características in- trínsecas en sí mismos sino que derivan su efecto de las disposiciones expe- rimentales en forma de relaciones de contingencia y que cualquier evento, sea un estímulo o una respuesta, potencialmente puede convertirse en un re- forzador eficaz. El principio de Premack tiene dos supuestos fundamentales para que una actividad pueda convertirse en un reforzador. Primero, dicha actividad debe ser preferida en la línea de base, y segundo, la probabilidad de ocurrencia de la actividad preferida debe restringirse y ocurrir de forma contingente con la realización de una actividad menos preferida, fruto de lo cual la actividad menos preferida se convierte en instrumental. Como resultado de la operación de reforzamiento, la actividad reforzadora ocurre a menor probabilidad que en condiciones de libre acceso y la actividad ins-
PSICOLOGÍADELAPRENDIZAJE
trumental aumenta su probabilidad de ocurrencia. Esto es de hecho lo que normalmente ocurre en los experimentos de condicionamiento operante. En una situación típica, animales que tienen un cierto nivel de hambre deben accionar un operando de respuesta para conseguir una pequeña cantidad de comida. En condiciones de acceso ilimitado a la comida y de disponibilidad continuada del manipulando, los animales que tienen hambre dedicarán la mayor parte del tiempo a comer y muy de vez en cuando pueden presionar una palanca o picar una tecla iluminada. Para que la operación de reforza- miento pueda tener lugar, hay que restringir el acceso a la comida y hacerlo contingente con la emisión de la respuesta instrumental (la de menor proba- bilidad de ocurrencia en la línea de base), que en consecuencia aumentará su frecuencia de aparición o su probabilidad de ocurrencia. De lo anterior también se concluye que las actividades con una menor probabilidad de ocurrencia en las situaciones de libre acceso nunca podrán reforzar a las actividades con una mayor probabilidad de ocurrencia.
Premack y sus colaboradores llevaron a cabo muchos experimentos para comprobar su teoría. En uno de los experimentos, Premack (1962) alteró las probabilidades de las respuestas cambiando las condiciones de privación. En un estudio, las ratas fueron privadas de agua, pero no de la oportunidad de correr por una rueda de actividad. En esas circunstancias beber era más probable que correr, y la oportunidad de beber pudo reforzar el correr por la rueda. En un segundo estudio, las ratas no fueron privadas de agua, y así, en esas circunstancias, correr era más probable que beber. Correr podía utilizarse para reforzar la bebida. Así pues, correr y beber podían usarse indistintamente como respuestas reforzadoras e instrumen- tales, dependiendo del estado de privación de agua del animal.
En un experimento con niños, tras una línea de base donde se midieron las preferencias individuales por comer golosinas o jugar a las maquinitas del millón, se realizaron dos fases en las que cada actividad se hizo con- tingente a la otra. Los niños que preferían comer golosinas, aumentaron su tasa de jugar a las maquinitas para conseguir dulces, mientras que los niños que preferían jugar con las maquinitas no incrementaron su tasa de jugar por el hecho de que esta actividad fuera seguida de comer dulces. Cuando las contingencias se invirtieron haciendo dependiente el jugar a las maquinitas de haber comido una cantidad de dulces, sólo los niños que prefirieron aquella actividad en la línea de base aumentaron su consumo de golosinas (Premack, 1965).
PROGRAMASYTEORÍASDELREFORZAMIENTO
Premack complementó el principio del reforzamiento con otro para- lelo sobre el castigo. En esta ocasión, Premack argumentó que la activi- dad de más baja probabilidad puede castigar a la de mayor probabilidad siempre y cuando se aumente su probabilidad de ocurrencia y suceda contingentemente con la actividad más preferida, que como resultado de dicha operación disminuirá su frecuencia de aparición en relación con su ocurrencia en la línea de base. De aquí también se desprende que las actividades más preferidas nunca podrán castigar a las actividades menos preferidas.
La posición teórica de Premack es plenamente conductual y se deriva de la tradición skinneriana, cuyo eje central es la ley empírica del efecto en oposición a la ley teórica del efecto defendida por Thorndike. Traslada el problema del reforzamiento a un plano diferente que el resto de las teorías consideradas en el apartado anterior. Esta forma de concepción teórica siempre estará limitada por no saber la razón última de por qué los sujetos prefieren una actividad más que otra en la prueba de libre elección, pero la contestación a esta pregunta puede que resulte innecesaria para la psi- cología del aprendizaje, siendo la respuesta de corte más bien biológico y no necesariamente incompatible con concepciones como la defendida por Premack.
La teoría de la probabilidad diferencial es simple a la vez que compleja. Por un lado es simple y tiene un gran poder predictivo. Para predecir si una conducta reforzará a otra, simplemente basta con medir sus probabilidades bajo una condición de línea de base, donde las dos conductas estén libre- mente disponibles en ausencia de limitación alguna. Evaluadas después en un programa de reforzamiento, una actividad reforzará a la otra si, y solo si, ésta era más probable que la otra en la situación de línea de base. No importa si la conducta provoca placer, reduce una necesidad, provoca una activación fisiológica, o simplemente es característica de la especie, lo úni- co importante es que sea más probable que la otra conducta en condiciones de libre acceso.
Por otro lado, es compleja en cuanto a la medida de la probabilidad de la respuesta. Una posible medida es la frecuencia con la que ocurre dicha respuesta. Esa medida es buena siempre que comparemos respuestas pare- cidas, por ejemplo las presiones a dos palancas (véanse los programas con- currentes), pero ¿cómo comparar las frecuencias de actividades tan distin-
PSICOLOGÍADELAPRENDIZAJE
tas como hacer un crucigrama o comer? ¿cuál es la unidad conductual, dar un bocado o tomarse la ración entera?, ¿resolver una palabra del crucigra- ma o el crucigrama entero? Para solventar este problema, Premack sugirió que la probabilidad de la respuesta debía de considerarse en una dimensión temporal, de forma tal que pudiera definirse como el tiempo dedicado a una actividad particular sobre el tiempo total. El periodo de observación en la línea de base es, por consiguiente, crucial para valorar la probabilidad de las respuestas que ocurran sólo periódicamente. Por ejemplo, aunque en un día dedicamos mucho tiempo a comer, la actividad de comer no se distri- buye uniformemente a lo largo del día. Es altamente probable a unas horas determinadas. Dado que las probabilidades de las respuestas varían con el tiempo, Premack sugirió que la medida de la respuesta más apropiada es la probabilidad momentánea.