Ley generalizada de la igualación - CONDUCTA DE ELECCIÓN

P ROGRAMAS Y TEORÍAS DEL REFORZAMIENTO

2. CONDUCTA DE ELECCIÓN

2.4. Ley generalizada de la igualación

Al comienzo del Apartado 2 se ha hecho referencia a dos formas de medir la elección, los premios concurrentes y las respuestas instrumentales concurrentes, y también se ha hecho referencia a las limitaciones que presentaba el primero de estos métodos. El procedimiento de las respuestas instrumentales concurrentes supera las dificultades impuestas por el procedimiento de los premios concurrentes, pero, sin embargo, hay que considerar algunas influencias no deseables que intervienen en la elección de los sujetos entre respuestas instrumentales concurrentes. En primer lugar, cuando se tiene que elegir entre dos o más alternativas de respuesta se suele producir un tipo de comportamiento denominado de alternancia, caracterizado por el cambio intermitente de una alternativa de respuesta a otra sin que guarde relación con los reforzadores asociados a cada una de dichas alternativas de respuesta. En las situaciones de la vida en libertad, los animales tienden a cambiar el lugar donde consiguen sus alimentos, y la alternancia es en este sentido un comportamiento reminiscente de esta tendencia natural de los animales. Además, en algunos programas de reforzamiento, principalmente los programas de intervalo, el animal puede ser reforzado por la primera respuesta que da después de pasar de una alternativa a otra. Este reforzamiento «accidental» puede fortalecer aún más el comportamiento natural

PROGRAMASYTEORÍASDELREFORZAMIENTO

de alternancia. Dado que en las situaciones de elección en los laboratorios de psicología del aprendizaje interesa que el comportamiento de elección se guíe simplemente por las consecuencias de reforzamiento en las diferentes alternativas de respuesta (y no por otras variables que podrían ser también importantes pero no relevantes al caso), se tiene que controlar la influencia extraña que se introduce con este comportamiento alternante de los animales experimentales. Para ello los investigadores añaden la limitación de que no se refuerce la respuesta de cambio de alternativa por un tiempo. Este procedimiento se denomina demora por el cambio (DPC), y consiste en

introducir un periodo temporal breve, de aproximadamente 2 ó 3 segundos, después de la primera respuesta a una de las alternativas para que pueda entrar en funcionamiento el programa de reforzamiento asociado a dicha alternativa de respuesta. En otras palabras, si los sujetos experimentales persisten en su comportamiento de alternancia, y se ha introducido la contingencia de DPC, no podrían obtener ningún reforzador en ninguna de las alternativas de respuesta. La consecuencia normal de haber introducido la contingencia de DPC es que los sujetos enfrentados con una situación de elección abandonan su comportamiento de alternancia y realizan la elección en base exclusivamente a las contingencias de reforzamiento aso- ciadas con cada una de las alternativas de respuesta. Además de prevenir el reforzamiento inmediato de la conducta de alternancia, la DPC garantiza la independencia de los operandos de respuesta.

Existen muchas otras fuentes potenciales de influencias no deseables en los experimentos de elección, y genéricamente estas influencias se han denominado sesgos. Los sesgos pueden ser de muchos tipos, pero los más

frecuentes en los experimentos de elección realizados en los laboratorios de conducta animal pueden ser, además de la conducta de alternancia descrita anteriormente, la disposición espacial de las alternativas de respuesta (izquierda frente a derecha), el color y la iluminación de dichas alternativas, o la fuerza requerida para responder en cada una de las alternativas. En un programa concurrente de reforzamiento se requiere que las alternativas de reforzamiento difieran exclusivamente en base a las características de reforzamiento, y que todos los demás factores permanezcan iguales. Como esto no es siempre posible, Baum (1974) ideó un método para corregir la influencia de los sesgos, por definición fuentes de influencia desconocida. Partió de la idea conceptual de que los sesgos influyen en la elección de forma idéntica a los factores de reforzamiento (frecuencia, magnitud, de-

PSICOLOGÍADELAPRENDIZAJE

mora), y formuló la ley generalizada de la igualación (véase posteriormente la Ecuación 5.5 para una formalización más ajustada de la ley). Para el caso de la frecuencia de reforzamiento (pero podría hacerse para cualquier otro factor de reforzamiento, o para todos juntos), la tasa relativa de respuesta se iguala a un factor multiplicativo de la tasa relativa de reforzamiento y de los sesgos relativos, y se puede expresar matemáticamente como se sigue por la Ecuación 5.4: = + × + Ra Ra + Rb Fa Fa Fb Sa Sa Sb

donde Ra y Rb son las tasas de respuesta en las alternativas a y b respectivamente; Fa y Fb son las frecuencias (tasas) de reforzamiento en las alternativas a y b respectivamente; y Sa y Sb son los sesgos en las alternativas a y b respectivamente.

El método de Baum (1974) para corregir los sesgos consiste en tres pasos. En primer lugar, se deben equiparar los factores de reforzamiento entre las alternativas de respuesta. Por ejemplo, la frecuencia, magnitud y demora del reforzador deben ser iguales. En segundo lugar, se deben medir las preferencias relativas de los sujetos. Si los sujetos distribuyen las respuestas de forma igual entre las alternativas de respuesta, entonces no hay influencia de sesgos. Si, por el contrario, existe una desviación hacia una preferencia mayor por una de las alternativas, dicha elección indicaría la contribución de los sesgos, que se puede determinar cuantitativamente por el valor de la tasa relativa de respuesta. En tercer lugar, una vez conocido el valor de los sesgos relativos, se deben variar los factores de reforzamiento asociados con las alternativas de respuesta. Por ejemplo, se puede programar el doble de reforzamiento en una de las alternativas y comprobar si los sujetos eligen dicha alternativa el doble del valor de los sesgos relativos (hay que recordar que, según Baum, los sesgos influyen de forma multiplicativa). Si esto es así, a medida que se vayan variando los factores de reforzamiento entre las alternativas de respuesta se debería observar una desviación paralela a la igualación en la dirección del sesgo. Como la desviación producida por el sesgo es constante a cualquier valor relativo del reforzamiento, se puede corregir dicho valor en los resultados obtenidos. Gráficamente quedaría como en la Figura 5.6, donde se ve que el valor de los sesgos relativos se multiplica por cada valor de la tasa relativa de reforzamiento corrigiéndose el resultado sobre el eje de las abscisas.

PROGRAMASYTEORÍASDELREFORZAMIENTO

Ya se ha visto que hay sesgos de respuesta que pueden incidir en la elección y que conviene corregir cuando no evitar (por imposible), aun así se parte de la situación ideal de que los animales (y nosotros) somos ca- paces de hacer cálculos exactos sobre las cualidades de los reforzadores y elegir proporcionalmente en consecuencia. Es considerar que el cálculo es puramente matemático, como si el cerebro, o las relaciones conducta-consecuencia, reflejasen una suerte de computación exacta. No es de extrañar que ajustes tan exactos como los predichos por la ley de igualación de Herr- nstein en realidad no se cumplan (McDowell, 2005) y que las estimaciones en cuanto a las ventajas de reforzamiento de las alternativas de respuesta conduzcan a errores de estimación que es lo genuinamente psicológico. Ya se ha visto con anterioridad (Capítulo 4) que la estimación del valor de un reforzador depende mucho de la experiencia previa o simultánea con otros reforzadores, de manera que el valor no es algo que provenga exclusiva-

Figura 5.6. Ejemplo de corrección de sesgo en la igualación. Los círculos negros señalan los datos antes de corregir los sesgos. Los círculos blancos señalan lo que sucede cuando cada valor de la abscisa se multiplica por el sesgo. Nótese la escala logarítmica de los ejes.

PSICOLOGÍADELAPRENDIZAJE

mente de unos rasgos estrictamente objetivos sino que pueden ser relacio- nales, en comparación con otras alternativas o con experiencias previas. En el caso de los programas concurrentes sucede exactamente lo mismo. Es posible que la valoración de una de las alternativas de respuesta dependa no sólo de su valor objetivo, sino del valor que se ofrece en la otra alternativa. Y esto es así, habiéndose demostrado repetidamente. A veces la alternativa de respuesta es sobrevalorada (si la otra alternativa es significativamente peor) y a veces es infravalorada (si la otra alternativa es manifiestamente mejor). Y este cálculo del valor de los reforzadores es la generalidad, lejos de la excepción. Existe sobreigualación cuando la mejor alternativa es va-

lorada por encima de la preferencia establecida por la igualación perfecta; existe infraigualación cuando la mejor alternativa es valorada por debajo

de la preferencia establecida por la igualación perfecta. Es más común encontrar infraigualación que sobreigualación (Baum, 1974), debido principalmente a la tendencia a cambiar de alternativa cuando se ha obtenido reforzamiento en una de ellas (el comportamiento de alternancia descrito anteriormente), lo que disminuye el ajuste perfecto a la igualación.

Cuando se habla de sobreigualación y de infraigualación, siempre se hace referencia a la tasa de respuesta en la alternativa más favorable (con mayor frecuencia de reforzamiento) en el contexto de las predicciones de la ley de igualación. Ello implica que las dos alternativas de respuesta no son iguales, siempre tiene que haber una más favorable. En estas circunstancias, la ley de igualación hace unas predicciones cuantitativas sobre las preferencias relativas de los sujetos basadas en la frecuencia relativa de reforzamiento. Por ejemplo, dado un programa concurrente IV 30-seg IV 60-seg, los organismos siguiendo la igualación responderán el doble al programa IV 30-seg (porque ofrece el doble de frecuencia de reforzamiento). Si la relación de igualación se desviara hacia valores superiores al doble, tendríamos un ejemplo de sobreigualación. Si, por el contrario, la relación de igualación fuera menor del doble, sería un caso de infraigualación (asu- miendo que el numerador en la ley de la igualación fuera el programa más favorable). Si entre dos alternativas igualmente favorables, los animales eligen más una que la otra, entonces esa aparente desviación de la ley de igualación puede ser debida a sesgos de respuesta (véase más arriba), pero no podría concluirse que fuera un caso de sobreigualación o de infraigua- lación. Por otra parte, los sesgos también pueden intervenir en facilitar la sobreigualación y la infraigualación.

PROGRAMASYTEORÍASDELREFORZAMIENTO

En la Figura 5.7 se dibujan curvas hipotéticas de sobreigualación (curva de puntos) e infraigualación (curva de guiones), junto con la relación lineal de la igualación perfecta. Dado que los ejes son proporciones de respuesta y de reforzamiento entre las alternativas a y b, se debe entender que el valor de 1 se corresponde con la situación en que ambas alternativas de respuesta ofrezcan el mismo reforzamiento. En este caso, y si no hubiera sesgos, las respuestas se deberían distribuir por igual entre las dos alternativas. Cuan- do la proporción de reforzamiento (Fa/Fb) sea mayor que 1, la alternativa a ofrecerá un mejor reforzamiento que la alternativa b. En este caso, si existiese sobreigualación se debería elegir la alternativa a proporcionalmente más de lo que se predice por la igualación perfecta. La proporción de respuestas (Ra/Rb) debería estar por encima de la igualación (curva de puntos en la parte derecha de la figura). Por el contrario, si existiese infrai- gualación se debería elegir la alternativa a proporcionalmente menos de lo que se predice por la igualación perfecta. Aquí la desviación de la iguala- ción debería estar por debajo de la igualación (curva de guiones en la parte derecha de la figura).

Figura 5.7. La diagonal representa la igualación, la curva a puntos la sobreigualación y la curva a guiones la infraigualación. Nótese la escala logarítmica de los ejes.

PSICOLOGÍADELAPRENDIZAJE

Lo más complejo es quizás entender la parte izquierda de la Figura 5.7, el caso en el que los valores de las tasas relativas de respuesta y de reforzamiento sean menores que 1. Lo más importante es darse cuenta que si la proporción de reforzamiento (Fa/Fb) es menor que 1, el programa b es mejor que el a (el denominador tiene que ser mayor que el numerador). La igualación predice que aquí b se debe elegir proporcionalmente más que a. Si existiese sobreigualación, dicha preferencia por b debería exagerarse en relación a lo predicho por la igualación perfecta. Al aumentar la propor- ción de respuestas en b sobre las de a, la tasa relativa de respuesta (Ra/Rb) debería disminuir. Eso es justamente lo que se representa por la curva de puntos en la parte izquierda de la figura. En el caso de infraigualación, por el contrario, el programa más favorable b se debería elegir en una propor- ción menor que la predicha por la igualación perfecta. La curva en este caso sería como la de los guiones en la parte izquierda de la figura, desviada por encima de la igualación.

Si volvemos la vista por un momento a los resultados originales de Herrnstein (1961) representados en la Figura 5.5, ninguna de la palomas realmente se ajustó a la igualación perfecta, notándose que la paloma 231 (y quizás la 645) mostró sobreigualación y la paloma 055 infraigualación.

Baum (1974, 1979) amplió la ley de igualación de Herrnstein para incor- porar las desviaciones por sobreigualación o infraigualación, además de la influencia multiplicativa de los sesgos en la elección (como en la Ecuación 5.4), resultando en la Ecuación 5.5: = × _ _ Ra Rb k Fa Fb s

siendo k la constante que representa los sesgos relativos (una constante cal- culada por el método explicado más arriba) y s un exponente que representa la sensibilidad hacia los programas de reforzamiento. Cuando k y s sean igual a 1, la ecuación se reduce a la de Herrnstein (con el cambio de que en los denominadores no se consideran el total de respuestas y de reforzamiento, sólo la tasa de respuesta y de reforzamiento de la alternativa b). Los valores de s inferiores a 1se corresponderían con la infraigulación, los valores de s superiores a 1 con la sobreigualación. La sobreigualación sería más frecuente cuando se utilice una contingencia de DPC relativamente larga o cuando resulte muy costoso el cambio de una a otra alternativa de respuesta (p. ej.,

PROGRAMASYTEORÍASDELREFORZAMIENTO

Aparicio, 2001); en otras circunstancias resulta más frecuente obtener infrai- gualación. En el caso extremo en que s sea igual a 0, las tasas de respuesta en las alternativas a y b serán siempre las mismas independientemente de las tasas de reforzamiento que acompañen dichas alternativas de respuesta, reflejando una completa insensibilidad a las contingencias de reforzamien- to. Esto podría ocurrir cuando los sujetos obtuviesen todos los reforzadores respondiendo simplemente a las dos alternativas de respuesta en estricta alternancia, o de acuerdo a cualquier otro patrón de comportamiento que fuese independiente de los valores de los programas de reforzamiento. En relación con el cómputo de las tasas relativas de respuesta y de reforzamiento en base al total o sólo en relación a la otra alternativa de respuesta, la lógica de la igualación no cambia pero se ha visto que mantener la proporción de conducta y de reforzamiento sólo de una alternativa sobre la otra (como en la ley generalizada de la igualación) se ajusta mejor a los resultados experimentales. Las Figuras 5.6 y 5.7 ya reflejaban este cambio.

In document Libro Psicología Del Aprendizaje 2014 Es El (página 121-124)