1
Conducta y Teoría de
Juegos:
¿Cómo psicólogos y economistas se unen para explicar
nuestra conducta frente a problemas sociales?
Profesor: Pavel Gómez
Email: [email protected] / [email protected] Marzo 2019 Facultad de Psicología 1
Contenido – Sesión 2
§
Ejercicios: Estrategias dominantes y Equilibrio de
Nash
§
Repaso conceptos clave
§
Principales desafíos de los juegos simultáneos
§ Dilemas sociales: el dilema del prisionero § Desafíos de coordinación
§ Riesgo y Estrategia Maximín
§
Estrategias mixtas en juegos simultáneos
2
4
Conceptos relevantes para el análisis de los
dilemas sociales
• Equilibrio de estrategias dominantes: cada jugador juega su
estrategia dominante
• Equilibrio de Nash: cada jugador juega su mejor estrategia dada la
estrategias de los demás jugadores
• Solución cooperativa de un juego: lista de estrategias que los
participantes elegirían si pudiesen comprometerse con una elección coordinada (ej. Si pudieran firmar un contrato obligante)
• Solución no-cooperativa de un juego: lista de estrategias que los
participantes elegirán si no es posible comprometerse con una elección coordinada y por ende cada jugador elige la estrategia correspondiente a su mejor respuesta
• Resultado de un juego: el conjunto de pagos (pay-offs) que recibe
cada jugador en la intersección de las estrategias elegidas © 2019 Pavel Gómez
5
El dilema del prisionero como metáfora de los
dilemas sociales
Para ilustrar el concepto de los dilemas sociales,
comenzaremos viendo un extracto del capítulo 8
(temporada 1) de la serie de TV alemana
“Perros de Berlín”
6
El dilema del presionero
-20, -20 -40, 0 -2, -2 0, -40 Confesar No confesar No confesar Confesar Pr isi on er o 1 Prisionero 2 ¿Cuál es el Equilibrio de Nash de este juego?Se ha cometido un delito. La policía sospecha de dos personas, pero no tiene pruebas. La única prueba sería la confesión de uno o ambos. Se les interroga en habitaciones separadas (sin comunicación entre ellos) y se les ofrece el siguiente esquema de pagos:
7
Características clave del Dilema del Prisionero
1. Cada jugador tiene una estrategia dominante
2. El equilibrio de estrategias dominantes es
sub-óptimo, desde el punto de vista social (ambos
pudieran estar mejor)
3. Ambos jugadores conocen el juego y saben que si
ambos cooperan obtienen un mejor resultado
4. El esquema de pagos implica que si un jugador
coopera, el otro tiene incentivos a comportarse de
manera oportunista
8
¿A qué llamamos comportamiento oportunista?
© 2019 Pavel Gómez
Por “comportarse de manera oportunista” nos referimos a que un jugador juegue de manera de tomar ventaja de una situación determinada o aprovecharse de una oportunidad (ej.: asimetría de información) para obtener un beneficio extra individual, a expensas de otro(s) jugador(es).
-20, -20 -40, 0 -2, -2 0, -40 Confiesa No confiesa No confiesa Confiesa Pr isi on er o 1 Prisionero 2 Ejemplo: Si P1 No confiesa, entonces P2 Confiesa...
• P2 sale libre inmediatamente (saca provecho de la actitud cooperativa de P1)
• P1 sufre un alto costo por confiar en la posible
9
Los dilemas sociales
Decimos que hay un dilema social cuando un juego tiene un equilibrio de estrategias dominantes que es subóptimo, en comparación con la solución cooperativa.
Este es uno de los temas más interesantes de los juegos simultáneos, el cual es descrito de manera muy elocuente por el juego clásico denominado “El Dilema del Prisionero”.
El dilema social descrito por el Dilema del Prisionero es muy frecuente , en los equipos de trabajo, en las comunidades, en los mercados y, por supuesto, en la política.
Dos profesores deciden el número de páginas de su
próximo libro de teoría de juegos
10 © 2019 Pavel GómezProfesor B
Pr
of
es
or
A
400p 600p 800p 400p 45, 45 15, 50 10, 40 600p 50, 15 40, 40 15, 45 800p 40, 10 45, 15 35, 35• ¿Hay alguna estrategia dominada?
• ¿Cómo varía el juego si eliminamos las estrategias dominadas? • ¿Este juego muestra un dilema social?
Aplicaciones del dilema del presionero:
La Delación Compensada
11
“Colusión de papel higiénico: Fiscalía Nacional Económica presenta requerimiento por colusión contra CMPC
y SCA”
Experta en libre competencia: “Sin la delación
¿ES POSIBLE SUPERAR EL DILEMA DEL
PRISIONERO?
Ejemplos: Escena 1 – The Dark Knight
13
¿Cómo superar el Dilema del Prisionero?
14
¿Cómo superar el Dilema del Prisionero?
Los dilemas sociales semejantes al dilema del prisionero son bastante comunes en las relaciones interpersonales, en la política, al interior de los equipos de trabajo y en los mercados. Esto se expresa como una tensión
entre la cooperación y el comportamiento oportunista. ¿Qué elementos facilitan su superación?
• La perspectiva de largo plazo, cuando los juegos son repetidos
• La existencia de variables éticas o valóricas en la función de utilidad de las personas (la cooperación genera utilidad “en sí misma”)
• El uso sistemático de señales (ej.: reputación cooperativa)
• El uso de estrategias que premian la cooperación y penalizan el comportamiento oportunista (Gatillo; ojo-por-ojo)
15
Estrategias para la cooperación:
Gatillo (trigger) y Ojo-por-ojo (Tit-for-tat
)
Estrategia Gatillo (trigger)
§ Empezar Cooperando
§ Seguir cooperando mientras el otro jugador lo haga, si el otro jugador no coopera, jugar el equilibrio de Nash de ahí en adelante
Estrategia Ojo-por-Ojo (tit-for-tat)
§ Empezar Cooperando
§ Luego cooperar si el otro jugador cooperó el periodo anterior § No Cooperar si el otro jugador no cooperó el periodo anterior § Retomar la cooperación en cualquier momento “sin rencor”
16
Gatillo y Ojo por ojo
Dos objetivos contrapuestos:
§
Castigo debe ser lo suficientemente fuerte como para
mantener la cooperación
§
Desde la perspectiva de quien castiga, es mejor que el
castigo sea lo menor posible: Quien castiga también
es castigado (Ventaja de Ojo-por-Ojo sobre Gatillo)
17
Ojo-por-ojo
Ojo-por-Ojo ha resultado preferida a Gatillo en experimentos
La estrategia Ojo-por-Ojo es:
§
Simple (total claridad)
§
Bondadosa (nunca ataca primero ni busca el
enfrentamiento)
§
Provocable (nunca deja una ofensa sin castigo)
§
Indulgente (no es rencorosa, olvida rápido)
18
Variables éticas o valóricas en la función de
utilidad de las personas
La existencia de variables éticas o valóricas en la
función de utilidad de las personas:
La cooperación genera utilidad “en sí misma”
Recordemos la escena de “Batman – El Caballero de la
Noche”
20
Recordemos el juego del cap. 4 del
Arte de la Estrategia
• Fred y Barney son cazadores de conejos de la Edad de Piedra.
• Mientras estaban carreteando, caen en cuenta que si cooperan pueden cazar algo más sustancioso, como un ciervo o un bisonte.
• Acuerdan hacerlo, pero el carrete fue largo y olvidaron ponerse de acuerdo. Ciervos y bisontes se encuentran en direcciones opuestas, así como las cuevas de Fred y Barney. (Y, obvio, no hay celulares)
• Cada uno debe decidir unilateralmente hacia qué dirección se dirigirá, pensando en lo que hará el otro.
El juego de Fred y Barney
21 © 2019 Pavel GómezElección de Barney
El
ec
ci
ón
d
e
Fr
ed
Ciervo Bisonte ConejoCiervo 3, 3 0, 0 0, 1
Bisonte 0, 0 3, 3 0, 1
Conejo 1, 0 1, 0 1, 1
• ¿Hay algún Equilibrio de Nash? • Interprete el resultado
Otro juego:
Dos emisoras de radio eligen su posicionamiento
22 © 2019 Pavel GómezEmisora B
Em
iso
ra
A
Rock Pop Opinión
Rock 35, 35 50, 40 80, 10
Pop 40, 50 20, 20 40, 10
Opinión 10, 80 10, 40 5, 5
• ¿Hay algún Equilibrio de Nash? • Interprete el resultado
• ¿Coordinación?
23
Los desafíos de coordinación
Decimos que hay un desafío de coordinación cuando un juego tiene varios equilibrios de Nash y existe el riesgo de incurrir en pérdidas debido a una falla de coordinación.
En este caso, los jugadores se enfrentan al reto de “adivinar” a cuál equilibrio de Nash le apuestan los demás jugadores.
Thomas Schelling, premio Nobel de Economía por su contribución a la teoría de juegos (aplicada a la guerra fría), propuso que cuando hay dos o más equilibrios de Nash, los jugadores usan pistas o
señales para inferir cuál equilibrio es más probable.
El equilibrio de Nash más probable es desde entonces denominado el “Punto focal” o “Punto de Schelling”.
Analicemos los siguientes juegos
25 © 2019 Pavel Gómez Individuo B In di vi du o A Altoesfuerzo esfuerzoBajo Alto
esfuerzo 7, 7 -10, 3 Bajo
esfuerzo 3, -10 1, 1
• Para cada uno, evalúe si hay algún Equilibrio de Nash
Jugador B Jug ado r A Esperar Avanzar Esperar 0, 0 1, 5 Avanzar 5, 1 -100,-100 Jugador 2 Ju ga do r 1 C D A 20, 0 -90, 5 B 5, 2 30,-75
Ahora evaluemos qué ocurriría si a los jugadores
les preocupa el riesgo
26 © 2019 Pavel Gómez Individuo B In di vi du o A Altoesfuerzo esfuerzoBajo Alto esfuerzo 7, 7 -10, 3 Bajo esfuerzo 3, -10 1, 1 Jugador B Jug ado r A Esperar Avanzar Esperar 0, 0 1, 5 Avanzar 5, 1 -100,-100 Jugador 2 Ju ga do r 1 C D A 20, 0 -90, 5 B 5, 2 30,-75
27
La respuesta estratégica al riesgo:
Estrategia Maximín
Cuando los jugadores son sensibles al riesgo, suelen protegerse usando las estrategias que minimizan las pérdidas posibles.
Se denomina “Estrategia Maximín” a aquella estrategia que permite a un jugador maximizar su ganancia mínima.
Una estrategia maximín es entonces aquella que contiene a los mayores payoffs mínimos. Esta permite minimizar el riesgo asociado con errores estratégicos de los demás jugadores o con estrategias dirigidas a “causar daño al rival”.
En los juegos anteriores, ¿cuál sería una estrategia maximín para el jugador de arriba? ¿Cuál sería el resultado si ambos jugadores adoptan estrategias Maximín?
Juegos Clásicos:
Ejemplos, interpretación y
utilidad estratégica
28
29
Juegos clásicos
100,100 200, 2 5, 5 2, 200 C NC NC C Pr is io n er o 1 Prisionero 2El dilema del prisionero
1,2 0, 0 2, 1 0, 0 Ópera Cine Cine Ópera Ju g ad o r A Jugador B
La “batalla de los sexos”
0,0 1, 3 2, 2 3, 1 ND D D ND Co n d u ct o r 1 Conductor 2
30
Juegos clásicos
2,2 0, 0 1, 1 0, 0 A B B A Ju g ad o r 1 Jugador 2 Pareto-Coordinación 1,-1 -1, 1 1, -1 -1, 1 I D I D Di sp ar ad o r ArqueroEl juego del penal
1,1 0, 0 1, 1 0, 0 A B B A Ju g ad o r 1 Jugador 2 Coordinación
JUEGOS SIMULTÁNEOS CON
ESTRATEGIAS MIXTAS
32
© 2019 Pavel Gómez
En algunos juegos, los jugadores desean o requieren hacer un
uso estratégico de la incertidumbre. Esto ocurre cuando
deseamos sorprender a otros jugadores:
•
Cuando jugamos cachipún
•
Cuando un jugador de fútbol cobra un penal
•
Cuando una empresa realiza promociones o rebajas
anuales, pero desea que que los consumidores no esperen
sistemáticamente por las rebajas
33
© 2019 Pavel Gómez
En todos estos casos, uno o más jugadores adoptan estrategias
mixtas, esto es, juegan sus estrategias discretas con una cierta
probabilidad:
•
En cachipún, juegan piedra, papel o tijera con una
probabilidad igual a 1/3, y ademas de manera no regular
•
En el cobro del penal, cada jugador se lanza en una
dirección con igual probabilidad
•
En la realización de las promociones, la probabilidad de
realizar una promoción en un momento debe ser la misma
que realizarla en otro momento.
En todos los casos, la idea es maximizar la incertidumbre de los
demás jugadores
Equilibrio de Nash con estrategias mixtas
34
El objetivo es explotar la incertidumbre del rival.
Para que una estrategia mixta del jugador i sea parte de un equilibrio de Nash, el otro jugador debe ser indiferente entre sus distintas alternativas.
Veamos una versión del juego del penal:
5, -5 -5, 5 5, -5 -5, 5 I D I D Ju ga do r 1 (D is pa ra do r) Jugador 2 (Arquero) © 2019 Pavel Gómez
Estrategias mixtas: Definiciones formales
35
Una
estrategia mixta (σ) corresponde a aquella
que asigna una función de probabilidad
p sobre un
conjunto de estrategias puras S.
Un conjunto de estrategias σ
icorresponde a un
Equilibrio de Nash en estrategias mixtas si para
cada jugador i,
σ
ies una mejor respuesta.
Equilibrio de Nash con estrategias mixtas
(Material opcional)
36
Estrategias mixtas óptimas:
Llamaremos p a la probabilidad de que el Disparador elija disparar hacia la Izquierda.
Luego, debe cumplirse que:
VE
2D= VE
2Iè
(p)-5 + (1-p)5 = (p)5 + (1-p)-5
è
p = ½
Estrategias mixtas óptimas
(Material opcional)
37
El mismo procedimiento es usado para encontrar la estrategia óptima para el jugador 2.
Sea q la probabilidad de que el Arquero elija lanzarse hacia la Derecha. Luego debe cumplirse que:
VE
1I= VE
1D(q)5 + (1-q)-5 = (q)-5 + (1-q)5
è
q = ½
Entonces, el equilibrio de Nash de este juego es
(
σ
1*= (1/2; 1/2),
σ
2*
= (1/2; 1/2))
Estrategias mixtas óptimas
(Material opcional)38
Para evitar confusiones, se sugiere que el equilibrio sea expresado de manera exhaustiva y explícita:
EN
M= (P
1I
= ½; P
1D= ½; P
2D= ½; P
2I= ½)
donde:
ENM: Equilibrio de Nash en estrategias mixtas
P1I: Probabilidad de que el Jugador 1 juegue I
P1D: Probabilidad de que el jugador 1 juegue D
P2D: Probabilidad de que el jugador 2 juegue D
P2I: Probabilidad de que el jugador 2 juegue I
39
Juegos simultáneos con estrategias mixtas:
Aplicación
40
Juegos simultáneos con estrategias mixtas:
Aplicación
“Carlos Bonet, investigador y parte del proyecto, explicó que “la Teoría de Juegos es una ciencia que busca ver cómo interactúan diferentes agentes. Cada uno tiene objetivos individuales que son afectados por los objetivos del resto”.
En este caso, existen dos agentes con dos objetivos diferentes: “El primero, es la persona
que evade y cuyo objetivo es que el viaje tenga el menor costo posible, en tanto que el
segundo es el fiscalizador que quiere que el pasaje sea pagado”, explica Bastián Bahamondes académico de la Universidad de Chile.
Según explican los expertos, hoy día para evitar la evasión, se eligen las calles con mayor
evasión, donde los fiscales están por un largo periodo, lo que provocaría que “se pierda el factor sorpresa“, ya que “los evasores saben por experiencia dónde se ubican los fiscalizadores, por lo que fácilmente pueden evitar el control de pago”.
Por lo que este nuevo modelo, estaría basado en un sistema aleatorio.
“Como contraparte surge naturalmente la idea de que el sistema de fiscalización debería ser aleatorio, por lo que estamos creando un sistema basado en el azar que proponga los lugares que serán fiscalizados y que, además, no tenga un patrón que los evasores puedan identificar”, afirma Bonet.
“Existen calles o sectores más peligrosos que otros, por lo que incluimos este factor a la hora de diseñar el sistema”, concluye el investigador.