• No se han encontrado resultados

thorndike y la Ley del Efecto

In document APRENDIZAJE 2014 (página 157-163)

Fase 1 Fase 2 Prueba Resultado

4. Fenómenos del condicionamiento operante 189 1 La conducta supersticiosa

1.1. thorndike y la Ley del Efecto

El abordaje científico del condicionamiento instrumental comienza con los trabajos de Thorndike. Las aportaciones de Edward Lee Thorndike (1874-1949) a la psicología del aprendizaje tienen que ver tanto con su acer- camiento teórico como metodológico al estudio de la investigación animal. Es considerado como el primer científico que estudió la conducta operante, aunque él lo llamó aprendizaje por ensayo y error (Thorndike, 1898). El con- ductismo de Watson centró su atención en los reflejos condicionados foca- lizando el análisis en los eventos que preceden a la respuesta, aproxima- ción conocida como paradigma E-R. Sin embargo, el interés de Thorndike se centró en cómo los aciertos y fracasos afectaban a la conducta de los organismos. Para este autor, el aprendizaje ocurre porque se fortalecen las conexiones que se forman entre los estímulos y las respuestas cuando dan lugar a un estado de satisfacción para el animal. Esta aproximación fue denominada por él mismo como conexionismo y estaría también encuadra- da dentro de lo que se conoce como paradigma E-R.

PrinciPiosbásicosdelcondicionamientooPerante

En sus experimentos más conocidos, Thorndike utilizó gatos como sujetos. Colocaba los animales en diferentes «cajas problema», artilugios que consistían en una especie de jaula de la que los animales podían salir activando algún tipo de resorte desde su interior (Figura 4.1). Cuando el gato accionaba dicho mecanismo la puerta de la caja se abría y, al salir, el investigador le entregaba cierta cantidad de comida.

Figura 4.1. Caja Problema utilizada por Thorndike en sus experimentos.

La primera vez que los animales eran introducidos en la caja problema tardaban un tiempo considerable en descubrir y poner en marcha el meca- nismo que abría la puerta y salir de la caja. En esos primeros intentos, el sujeto se movía por la caja de forma aparentemente azarosa e iba exploran- do distintos puntos, hasta que en un determinado momento por casualidad activaba el mecanismo de apertura. Según transcurrían los ensayos en los que el sujeto repetía la tarea, el tiempo que empleaba en accionar el meca- nismo y, por tanto, el tiempo que tardaba en salir de la caja era mucho menor. Como vemos, la medida que Thorndike utilizó para la evaluación de la ejecución del aprendizaje era la latencia de escape, definida como el tiempo que pasa desde que comienza el ensayo hasta que el sujeto consigue salir de la caja y recibir el reforzador programado. Según sus observacio- nes, la latencia de escape disminuía de forma muy notable a lo largo de los ensayos. La figura 4.2 muestra los resultados de un experimento típico:

PsicologíadelaPrendizaje

162

como se puede observar en la figura, a lo largo de los ensayos el animal tar- daba menos tiempo en accionar el mecanismo y salir de la caja problema.

Figura 4.2. En la figura se muestran los resultados obtenidos en un animal tipo utilizado por Thorndike en sus experimentos. El eje de abscisas representa el número de ensayos y el eje de ordenadas el tiempo que tardaban (latencia) los animales en descubrir el mecanismo que abría la caja problema. Se puede ver con claridad cómo el animal en los primeros ensayos emplea más tiempo que en los ensayos sucesivos. (Adaptado de Thorndike, 1898).

A partir de los resultados obtenidos mediante este procedimiento, Thorndike estableció que la entrega de comida fortalecía la conexión entre la situación (en este caso los estímulos situados en el entorno de la caja) y la respuesta del animal, lo denominó Ley del Efecto:

«De las muchas respuestas dadas en la misma situación, las que vayan acompañadas o inmediatamente seguidas de satisfacción para el animal, en igualdad de condiciones, se conectarán más firmemente con la situación; de manera que cuando ésta vuelva a presentarse, volverán a presentarse con gran probabilidad»

Edward L. ThorndikE, 1911 (pág. 244)

De este modo, Thorndike da una explicación sencilla a este tipo de aprendizajes. Cuando en una determinada situación una conducta va seguida de algo agradable para el animal, al volver de nuevo a esa misma situación será más probable que la conducta se vuelva a repetir. Así, desa- rrolló un sistema de aprendizaje basado en una concepción hedonista: las conductas cuyo resultado fuese algo placentero serían fortalecidas y las conductas cuyo resultado fuese algo desagradable serían eliminadas.

150 100 50 0 1 10 20 ensayos l

atencia de escape (segundos)

PrinciPiosbásicosdelcondicionamientooPerante 1.2. El análisis experimental del comportamiento de skinner

Burrhus Frederic Skinner (1904-1990) ha sido, si no el investigador más importante, el principal responsable del aumento del interés en relación con la problemática del reforzamiento. Además de realizar una extensa investi- gación sobre los principales fundamentos del condicionamiento operante, su trabajo académico dio lugar a la formación de un gran número de investiga- dores que siguieron desarrollando de forma muy intensa estos principios. En The Behavior of Organisms (1938) desarrolla la idea de que los reflejos podrían ser estudiados como conducta más que como un reflejo del sistema nervioso o de la mente: es aquí donde ya Skinner distingue entre el condicionamiento de los reflejos de Pavlov y el tipo de aprendizaje que había propuesto Thorndike, lo que le llevó a formular que la conducta se regula tanto por el condiciona- miento de los reflejos o condicionamiento respondiente como por el operante. A su vez, mientras Thorndike trataba de explicar su aprendizaje por ensayo y error mediante asociaciones de «naturaleza interna», Skinner se centró en las relaciones funcionales entre la conducta y sus consecuencias. Para él, tanto el condicionamiento operante como el respondiente debían sólo prestar aten- ción al estudio de las relaciones entre los eventos observables y la conducta.

Para describir los procedimientos que dan lugar al reforzamiento de conductas utilizó los términos condicionamiento operante y condiciona- miento instrumental. El término operante refleja la capacidad que tiene el individuo para operar sobre su ambiente, mientras que el término instru- mental tiene en cuenta el hecho de que la conducta del sujeto es el instru- mento para obtener el reforzador. La innovación técnica más importante que introdujo Skinner con respecto a Thorndike fue utilizar en sus experi- mentos una respuesta que el sujeto podía ejecutar repetidamente sin inter- vención del experimentador. En el caso de los experimentos con ratas esta respuesta fue la presión de palanca (Figura 4.3), mientras que en los experi- mentos con palomas utilizó el picoteo del animal sobre una tecla. Este tipo de procedimientos experimentales son conocidos como de operante libre para distinguirlos de los de ensayo discreto que utilizaba Thorndike en sus trabajos. En ellos, la respuesta puede ocurrir en cualquier momento y de forma repetida mientas el sujeto permanezca en la caja de condicionamien- to. La variable dependiente medida y analizada en este modelo es la tasa de respuesta o número de respuestas emitidas por unidad de tiempo, en lugar de la latencia, utilizada por Thorndike como medida del aprendizaje.

PsicologíadelaPrendizaje

164

Figura 4.3. Caja de Skinner.

Antecedentes históricos (Resumen)

Para entender las leyes y procedimientos del condicionamiento operante hay que tener en cuenta la influencia de autores como Thorndike, así como de la teoría de la evolución de Darwin en la obra de Skinner. Mediante sus experi- mentos Thorndike enunció su conocida Ley del efecto que señala que cuando en una determinada situación una conducta va seguida de algo agradable para el animal, al volver de nuevo a esa misma situación será más probable que la conducta se vuelva a repetir. Skinner, es considerado por muchos como el autor más relevante en el estudio del condicionamiento operante. Para Skinner, el término operante refleja la capacidad que tiene el individuo para operar sobre su ambiente, mientras que el término instrumental tiene en cuenta el hecho de que la conducta del sujeto es el instrumento para obtener el reforzador. Además de sus teorías, este autor desarrolló la caja de skinner que posibilita el registro

de forma continua del comportamiento del animal sin necesidad de interven- ción por parte del experimentador. La variable dependiente medida y analizada siguiendo este modelo es la tasa de respuesta o número de respuestas emitidas por unidad de tiempo, en lugar de la latencia, utilizada por Thorndike como medida del aprendizaje.

PrinciPiosbásicosdelcondicionamientooPerante 2. DEFiniCión DE ConDiCionAmiEnto oPERAntE

Las leyes del condicionamiento clásico establecidas por Pavlov utiliza- ban como base los reflejos. Sin embargo, para muchas de las conductas que realizan los organismos complejos no es posible identificar un estímu- lo evocador. Es muy fácil especificar el estímulo que produce la salivación en el perro, pero es mucho más difícil detallar cuál es el estímulo que inicia la conducta de tocar el piano o incluso el de otras conductas más simples como que una rata presione una palanca para obtener comida. La conducta que ocurrirá en el futuro está determinada principalmente por las consecuencias de la conducta pasada y las conductas operantes están más relacionadas con lo que sucede después de que ocurran que con estímulos que las provoquen, es decir, son más bien el resultado de las consecuencias que han tenido en el pasado. Por tanto, estas conductas no son elicitadas sino que son emitidas. Por todo esto, fueron necesarios otro tipo de principios para explicar el desarrollo y mantenimiento de este tipo de comportamientos.

Por condicionamiento operante entendemos el proceso que da lugar a que la probabilidad de una respuesta se vea modificada por sus conse- cuencias, es decir, por los efectos que tiene el ambiente sobre ella. Veamos esto con el ejemplo más común: un investigador coloca una rata en una caja de Skinner en la que dispone de una palanca que está conectada a un dispensador de comida. Para este animal el entorno de la caja de Skinner con sus dispositivos será las circunstancias o el ambiente. Si la rata, cuando está explorando la caja por casualidad presiona la palanca, ésta activará el comedero y se liberará una bolita de comida. La liberación de la bolita de comida aumenta la probabilidad de que el animal accione de nuevo la palanca para conseguir una nueva bolita de comida. Como vemos, el con- dicionamiento operante dispone al sujeto en unas circunstancias en las que alguna de sus conductas da lugar a la aparición de un evento; como consecuencia de la manifestación de este evento, se produce en el sujeto, en nuestro caso la rata, un cambio en la probabilidad de la emisión de dicha respuesta. El término «operante» se utiliza para caracterizar este tipo de condicionamiento porque, y a diferencia del «condicionamiento clásico», el sujeto interviene u «opera» en el medio, lo modifica a la vez que este modifi- ca el organismo. En estos casos si el resultado de dicho comportamiento es beneficioso para el animal la conducta se fortalecerá, siendo más probable

PsicologíadelaPrendizaje

166

que se emita de nuevo en circunstancias parecidas, sin embargo, si el resul- tado de la conducta es perjudicial, dicha conducta tenderá a desaparecer del repertorio de conductas del sujeto. Así, podemos decir de forma general que con el condicionamiento operante, los organismos aprenden a obtener consecuencias favorables y a eliminar consecuencias desfavorables del ambiente. Este tipo de condicionamiento es tan poderoso que los sujetos no sólo aprenden a responder ante una nueva circunstancia con una respuesta que formaba parte de su repertorio anterior, sino que además puede dar lugar a la aparición de respuestas nuevas.

In document APRENDIZAJE 2014 (página 157-163)