1.3. Teoría de la cooperación
1.3.4. La cronología de la cooperación
Después de ese enfoque biológico de las estrategias de la anterior sección, se presenta que todos en el futuro usarán TIT FOR TAT, porque es la mejor. Sin embargo, puede alguien de la sociedad darse cuenta que existe una estrategia mejor y probarla, y entonces al largo plazo ésta será la más usada. Así solo una estrategia que no puede ser invadida puede mantenerse como una estrategia usada por todos.
31
Para los objetivos actuales, es suficiente con tomar una estrategia particular y ver bajo qué condiciones ésta puede resistir la invasión de cualquier otra. Por supuesto, una buena estrategia para investigar es TIT FOR TAT. ¿Qué tipo de estrategia sería capaz de obtener más que ésta? La primera cosa que hay que decir es que tal estrategia debe traicionar en algún punto, porque de otra forma obtendrá R por cada movimiento al igual que el otro. Cuando traiciona ganará el pago más grande. Pero luego TIT FOR TAT traicionará. Consecuentemente, TIT FOR TAT puede evitar ser invadido por tal regla solo si es probable que el juego dure lo suficiente para que exista la represalia en contra de dicha traición. De hecho, ninguna regla puede invadir TIT FOR TAT si el parámetro de descuento, w, es suficientemente grande.
Para demostrar esto recordemos que TIT FOR TAT tiene memoria de un solo movimiento. Por tanto, un efecto retador puede tomar máxima ventaja de ella repitiendo cualquiera de la secuencia de elecciones de cooperación y traición que funcione mejor. Como no hay, esto nos lleva a la segunda proposición.
Proposición 2: TIT FOR TAT es colectivamente estable si y solo si, w es lo suficientemente grande. Este valor crítico de w es una función de los 4 parámetros de pagos, T, R, P y S.
Por ejemplo, tomando en cuenta la matriz de pagos de la figura 1. Así, TIT FOR TAT es colectivamente estable si el siguiente movimiento es al menos 2/3 tan importante como el movimiento actual. Bajo estas condiciones, si todos los demás están usando TIT FOR TAT, no se puede hacer más que hacer lo mismo y cooperar con éstos. Por otro lado, si w cae por debajo de ese valor crítico y si todos los demás están usando TIT FOR TAT, valdrá la pena traicionar en movimientos alternativos. Si w es menor a ½ incluso es mejor siempre traicionar.
Hay muchos ejemplos de la importancia de la interacción de largo plazo para la estabilidad de la cooperación. Es más fácil mantener normas de reciprocidad en un pequeño pueblo o vecindario estable. Al contrario, probablemente un profesor eventual recibirá un mal trato por sus compañeros comparada con la manera en que esta misma gente trata a sus colegas regulares.
Proposición 3: Cualquier estrategia que pueda ser la primera en cooperar puede ser colectivamente estable solo cuando w es lo suficientemente grande (Axelrod, 1984).
Proposición 4: Para que una estrategia agradable sea colectivamente estable, tiene que ser provocada por la primera traición del otro jugador (Axelrod, 1984).
La razón es simple. Si una estrategia agradable no fuese provocada por una traición en el movimiento n, entonces no sería colectivamente estable porque podría ser invadida por una regla que solo traiciona en el movimiento n.
Proposición 5: ALL D (SIEMPRE TRAICIÓN) es colectivamente estable siempre (Axelrod, 1984).
Si será seguro que el otro jugador traicionará, no hay punto para cooperar. Una población de jugadores usando ALL D obtendrá P por cada movimiento. No hay una manera de que un jugador se desempeñe bien si ningún otro jugador va a cooperar. Después de todo, cualquier elección cooperativa producirá el peor resultado, S, con ninguna posibilidad de una compensación futura.
32
Esta proposición tiene importantes implicaciones para la evolución de la cooperación. Si uno imagina un sistema que comienza con individuos que no pueden ser motivados a cooperar, la estabilidad colectiva de ALL D implica que ningún individuo singular puede esperar desempeñarse mejor que
sie do ta ié o oope ati o. U u do de al ados puede esisti la i asi de ual uie ot o
usando cualquier otra estrategia –dado que los recién llegados llegan uno a la vez. El problema, por supuesto, es que el solitario recién llegado en un mundo malvado no tiene a nadie que reciprocará ninguna cooperación. No obstante, si los recién llegados llegan en pequeños grupos podrían tener una oportunidad de comenzar la cooperación.
Para ver como esto puedo pasar, consideremos un ejemplo numérico. Los mismos pagos hasta ahora utilizados y con una probabilidad de que los otros jugadores se encuentren de nuevo de w=9. Por tanto, la población de malvados usando ALL D, cada uno ganará un pago de P=1 en cada turno que dará un puntaje acumulado de 10 puntos.
Ahora supongamos que algunos jugadores usan TIT FOR TAT. Cuando un TIT FOR TAT interactúa con un ALL D, el TIT FOR TAT será explotado en el primer movimiento, y luego no cooperará de nuevo con un malvado. Esto le da 0 en el primer movimiento y uno en los subsiguientes, para un puntaje acumulado de 9 puntos. Este puntaje es un poco menor que los 10 puntos que los malvados obtienen entre ellos. Sin embargo, si TIT FOR TAT interactúa con otro TIT FOR TAT, logran tener mutua cooperación desde el inicio y ambos obtienen 3 puntos en cada movimiento acumulando 30 puntos, lo cual es mucho mejor que los 10 puntos que los malvados obtienen.
Si los recién llegados TIT FOR TAT son una proporción despreciable de la población entera, los malvados casi siempre interactuarán con otros malvados obteniendo solo 10 puntos. Entonces si los jugadores TIT FOR TAT pueden interactuar con otro TIT FOR TAT lo suficiente, pueden obtener un mayor puntaje promedio que aquellos 10 puntos. Pueden hacer esto teniendo suficientes oportunidades para ganar 30 puntos con alguien que será recíproco con su cooperación en lugar de 9 puntos con alguien que no lo hará. ¿Cuánto tomará esto? Si un TIT FOR TAT tiene alguna proporción, p, de sus interacciones con otro TIT FOR TAT, tendrá 1-p con los malvados. Entonces su puntaje promedio será 30p + 9(1-p). Si este puntaje es más de 10 puntos, vale la pena usar TIT FOR TAT en lugar de ser un malvado como la mayor parte de la población. Y esto será verdad incluso si solo el 5% de las interacciones de los TIT FOR TAT son con otros jugadores TIT FOR TAT. Así, incluso un pequeño grupo de jugadores TIT FOR TAT puede obtener un puntaje promedio mayor que la gran población de malvados que hay. Dado que los jugadores TIT POR TAT se desempeñan bien cuando se encuentran, ellos no tienen que encontrarse tan a menudo para hacer de su estrategia la mejor para usar.
Incluso menos agrupación es necesaria cuando las interacciones se espera que sean de larga duración o el factor de descuento no es tan grande. Supongamos que la mediana de la duración del juego es 200 movimientos (correspondiente a un w=.99654). En este caso incluso una interacción de mil con un jugador afín al TIT FOR TAT es suficiente para que una estrategia invada el mundo de los ALL D. Incluso con una mediana de la duración del juego de solo 2 movimientos (w=.5), nada más que la quinta parte de las interacciones de los jugadores TIT FOR TAT con sus otros tipos afines es suficiente para que la invasión tenga éxito y la cooperación surja.
Los resultados siguientes muestran cuáles estrategias son las más eficientes invadiendo a ALL D con la menor cantidad de grupos. Estas son las estrategias que son las más capaces de discriminar entre
33
ellas y ALL D. Una estrategia es máximamente discriminadora si va a cooperar incluso si la otra nunca ha cooperado todavía, y una vez que coopera nunca volverá a cooperar otra vez con ALL D pero siempre cooperara con otro jugador usando la misma estrategia que ella usa.
Proposición 6: Las estrategias que pueden invadir ALL D en grupos con el menor valor de p son aquellas que son máximamente discriminadoras, como TIT FOR TAT.
Proposición 7: Si una estrategia agradable no puede ser invadida por un individuo singular, no puede ser invadida por ningún grupo de individuos tampoco.
El puntaje obtenido por una estrategia que entra en grupo es un promedio ponderado de dos componentes: cómo le va con otras de su clase y cómo le va con la estrategia predominante. Ambos componentes son menores o iguales al puntaje obtenido por la estrategia agradable predominante. Por tanto, si la estrategia agradable predominante no puede ser invadida por un individuo singular no puede ser invadida por un grupo tampoco. Lo que pasaba con ALL D es que si se intentaba ser invadida por una sola estrategia agradable no se lograba. Pero en pequeños grupos sí.
Por tanto la cooperación puede surgir incluso en un mundo de traición incondicional. El desarrollo no puede tomar lugar si es intentado solo por individuos dispersos que no tienen posibilidad de interactuar entre ellos. Sin embargo, la cooperación puede surgir de pequeños grupos de individuos, siempre y cuando estos individuos tengan incluso una pequeña proporción de su interacción entre ellos. Por otra parte, si las estrategias agradables son adoptadas por todos, entonces esos individuos pueden darse el lujo de ser generosos en el trato con los demás. Haciendo bien esto, una población de reglas agradables puede protegerse a sí misma de grupos de individuos usando cualquier otra estrategia, así como también pueden protegerse contra individuos singulares. Pero para que una estrategia agradable sea estable en sentido colectivo, debe ser fácil de provocar. Entonces la cooperación mutua puede surgir en un mundo de egoístas sin un control central comenzando con un grupo de individuos que se basan en la reciprocidad.