MASTER EN INGENIERÍA DE LA
DECISIÓN
ANÁLISIS DE NEGOCIACIONES.
2 CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS (NO COOPERATIVOS)
EQUILIBRIOS DE NASH
Objetivo
En esta sesión introducimos los dos
conceptos básicos de la teoría de juegos no
cooperativos:
dominacia (tal vez iterada),
equilibrio de Nash
Tiempo esperado: 4 horas (incluida la
actividad).
Plan
El plan para esta sesión es el siguiente
Descripción básica de juegos
Conceptos de dominancia
Concepto de equilibrio de Nash no cooperativo
Cálculo de equilibrios de Nash
Contexto básico
El tipo de problemas que consideramos tienen estos rasgos:
Hay varios decisores
El pago que recibe cada decisor depende no sólo de su decisión,
sino también de las de los demás
Puede tener lugar tanto en situación de conflicto como de
cooperación
Los participantes o decisores se denominan
jugadores
Los pagos a los jugadores en función de sus acciones se
denominan
las funciones de pagos
Un
juego
es un conjunto de reglas conocidas por los
jugadores que determinan qué
pueden hacer y las
consecuencias y los pagos asociados a sus decisiones
Posibilidades
Hay varios tipos de juegos en función de:
Número de jugadores: 2, 3, …, n,…
∞
Número de estrategias disponibles: Finitas,
Infinitas
Función de pagos: Juegos de suma nula,
(Juegos bipersonales de suma nula), Juegos de
diferencia constante. Juegos de suma no nula
Situación previa al juego: Cooperativos, no
cooperativos
Ejemplos. Posibilidades.
El conocido juego Piedra-papel-tijera es un ejemplo de
Juego bipersonal
Juego de suma nula (si uno gana el otro pierde)
Finito (cada uno tiene 3 alternativas para elegir: piedra, papel,
o tijera)
Ejemplos. Posibilidades.
Partir una herencia de 500000 pesos en tres partes (x,
y, 500000-x-y) con x, y entre 0 y 500000, y x+y menor
que 500000
Es un juego tripersonal
Es un juego de suma constante
Con un número de estrategias infinito
Es un juego no cooperativo, si no se permite la comunicación.
Conceptos básicos de Teoría de Juegos
Vamos a introducir brevemente los
conceptos de la Teoría de Juegos. Para
ello:
Juntaos por parejas!!!!
Presentamos varias situaciones que nos
ayudarán a introducir algunos conceptos
básicos…
Conceptos básicos de Teoría de Juegos
Las reglas serán:
Tienes que actuar
Tus consecuencias dependen de lo que
hagas tú y los demás
No sabes lo que harán, pero sabes lo que
podrían hacer
Reglas básicas
Dos jugadores, dos alternativas
•
Estrategias fijas
•
Información perfecta
•
Selección simultánea, salvo que se indique lo contrario
Matriz del juego
Izda. Dcha. Arriba A,I A,D
Debajo D,I D,D
La forma normal de un juego es una matriz
que muestra
los jugadores, las estrategias,
y las recompensas (ver el ejemplo a la
derecha).
Hay dos jugadores:
uno elige la fila y otro la columna.
En el ejemplo, cada jugador tiene dos
estrategias:
las estrategias del jugador 1 (o sea, el jugador
de las filas) se denominan “Arriba” y “Debajo”,
las del jugador 2 (o sea, el jugador de las
Matriz del juego
Izda. Dcha.
Arriba 3,2 1,5
Debajo 4,7 3,1
Las recompensas se especifican en el interior:
el primer número es la recompensa recibida por
el jugador 1 (fila);
el segundo es la recompensa del jugador 2.
(columna)
Por ejemplo, si el jugador 1 elige “arriba” y el
jugador 2 elige “izda.” entonces sus recompensas son 3 y 2, respectivamente.
Cuando un juego se presenta en forma normal,
se presupone que todos los jugadores actúan simultáneamente, o sea, sin saber la elección que toma el otro.
Matriz del juego: suma nula
Izda. Dcha.
Arriba 3,-3 -2,2
Debajo -4,4 1,-1
En los juegos de
suma nula
el
beneficio total para todos los
jugadores del juego, en cada
combinación de estrategias,
siempre suma cero (en otras
palabras, un jugador se
beneficia solamente a expensas
del otro).
Matriz del juego: suma nula
Izda. Dcha.
Arriba 3 -2
Debajo -4 1
El juego del ejemplo anterior tiene
información redundante (siendo de
suma nula). Puede simplificarse y
transformarse en esta otra que
representa tan solo las ganancias
del jugador 1, teniendo en cuenta
que las ganancias del opositor son
cantidades opuestas.
Ejemplo. Juego suma nula.
Piedra
Papel
Tijera
Piedra
0
-1
1
Papel
1
0
-1
Tijera
-1
1
0
Tenéis aquí
representado el juego de
Piedra-papel-tijera en forma normal.
(
Lee el material adicional de la Wikipedia
)
Considera este juego…
Izda. Dcha. Arriba 4,5 10,-6
Debajo 12,7 5,9
Piensa que harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Indeterminación
Izda. Dcha. Arriba 4,5 10,-6
Debajo 12,7 5,9
Denominemos
J1 al Jugador de las filas (J1) y J2 al Jugador de las columnas.
Podría ocurrir la siguiente situación…
J1 ha elegido “Debajo”, porque ha pensado que
J2 elegirá “Izda.” para evitar la posibilidad de “ganar” -6.
Supongamos que J2 ha elegido “Dcha.”, porque ha pensado que
J1 ha pensado que J2 elegiría “Izda.” y, por eso,
J1 elegirá “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2
será “Dcha”, pues gana 9.
Pero podría ocurrir que J1 pensase que J2 elíjese “Dcha”, porque
J2 habría pensado que J1 habría pensado que J2 elegiría “Izda.” y, por eso,
J1 elegiría “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2 será
Indeterminación
El problema es que:
“Debajo” (para J1) es la mejor respuesta contra
“Izda” (de J2)
“Izda” es la mejor respuesta contra “Arriba” “Arriba” es la mejor respuesta contra “Dcha.” “Dcha.” es la mejor respuesta contra “Debajo”
…
Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…
Izda. Dcha. Arriba 4,5 10,-6
Debajo 12,7 5,9
Para algunos juegos no existen prescripciones simples...
Esto es, necesitamos suponer no sólo que los jugadores son racionales, sino también que todos los jugadores saben que todos los jugadores son racionales, y que todos los jugadores saben que todos los jugadores saben que todos los jugadores son
racionales, y así ad infinitum…
Este juego tal y como está formulado queda indeterminado… lo podremos resolver más adelante
Indeterminación
El problema es que:
“Debajo” (para J1) es la mejor respuesta contra
“Izda” (de J2)
“Izda” es la mejor respuesta contra “Arriba” “Arriba” es la mejor respuesta contra “Dcha.” “Dcha.” es la mejor respuesta contra “Debajo”
…
Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…
Izda. Dcha. Arriba 4,5 10,-6
Debajo 12,7 5,9
¿por qué no simplemente suponer que todos los jugadores saben que todos los jugadores son racionales? Cuando un jugador conoce las reglas no emprende o
asume algunos comportamientos. Sin embargo, si ese mismo jugador no está seguro de que los demás jugadores saben que él conoce las reglas, no estará seguro de que los demás jugadores sepan que él no emprenderá ni asumirá dichas
comportamientos. Este tipo de incertidumbre genera dudas en la mente de los
jugadores y modifica dramáticamente lo que cada uno termina por hacer. De aquí la
importancia de suponer información de dominio público en todos los niveles (ad
Considera este juego…
Piensa que harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Izda. Dcha.
Arriba 4,3 3,0
Dominancia
Izda. Dcha.
Arriba 4,3 3,0
Debajo 12,8 5,4
Para el jugador 1 la estrategia “Debajo” domina
la “Arriba” (tachada) porque 12 > 4 y 5 > 3.
Para el jugador 2 la “Izda.” domina “Dcha.”
(tachada) porque 3 > 0 y 8 > 4.
La única celda no tachada es la que corresponde a
las estrategias “Debajo” y “Izda.” Entonces, las recompensas de los jugadores son 12 y 8
respectivamente.
Una estrategia domina estrictamente a otra cuando es mejor elección
independiente de la elección del otro jugador.
Un jugador siempre elige estrategia no dominada y tacha las
Considera este juego…
Piensa que harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8
Dominancia iterada
Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8
Cada jugador predice que el otro seguirá
estrategias no dominadas
Es fácil comprobar que el jugador de las filas
no tiene estrategia no dominada
La estrategia dominante del jugador de las
Dominancia iterada
Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8
Cada jugador predice que el otro seguirá
estrategias no dominadas
Es fácil comprobar que el jugador de las filas
no tiene estrategia no dominada
La estrategia dominante del jugador de las
columnas es “Dcha.”
Sin embargo, el jugador de las filas elegirá
“Arriba” ya que el sabe que “Dcha.” es la estrategia dominante del jugador de las columnas, y así maximizará su ganancia
Considera este juego…
Piensa qué harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Izda. Dcha.
Arriba 4,3 10,6
Equilibrio
Izda. Dcha.
Arriba 4,3 10,6
Debajo 12,8 5,4
En este ejemplo ninguno de los dos
jugadores tiene una estrategia dominante:
Si el jugador 1 uno elige “Arriba” es conveniente al 2 eligir “Dcha.” y viceversa: si el 2 elige “Dcha.” el 1 tiene que eligir “Arriba”.
Si el 1 elige “Debajo” el 2 tiene que eligir “Izda.” y viceversa.
Asimismo, “Debajo”- “Izda.” y “Arriba”-”Dcha.” son aquellas combinaciones de
estrategias en las cuales ningún jugador pueda mejorar cambiando de estrategia, supuesto que el otro jugador elija su estrategia.
Por tanto, es probable que elijan los jugadores las combinaciones de estrategias. Estas estrategias se llaman equilibrios (de Nash, no cooperativos).
Considera este juego…
Hasta ahora hemos analizado los juegos bajo la
condición de que ambos jugadores tomen sus decisiones simultáneamente.
Ahora supongamos que uno de los dos
elige primero.
Piensa qué harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Izda. Dcha. Arriba 0,0 1,2
La ventaja de elegir primero
Hay dos equilibrios: {Arriba, Dcha.} y
{Debajo, Izda.}.
Cada jugador prefiere uno de estos
equilibrios:
El jugador de las filas prefiere “Debajo” y El jugador de las columnas – “Dcha.”
El jugador que elige el segundo no tiene
otra elección salvo acceder a la elección
del jugador que ha elegido el primero…
Izda. Dcha. Arriba 0,0 1,2
Considera este juego…
Piensa qué harías si fueras el jugador
por filas. ¿Qué estrategia elegirías?
¿Y si fueras el jugador por columnas? Una vez has hecho este ejercicio abre la
siguiente transparencia y mira nuestra interpretación…
Izda. Dcha.
Arriba 5,5 -5,10
Los peligros de la racionalidad
Izda. Dcha.
Arriba 5,5 -5,10
Debajo 10,-5 -2,-2
En este ejemplo,
1, como jugador racional, tachará la
estrategia “Arriba” como dominada
2 tachará como dominada la estrategia
“Izda.”
Los jugadores acabarán con una solución
ineficiente
, pues (5, 5) es mejor que (-2, -2)…
Es este un ejemplo del dilema del prisionero
El dilema del prisionero
Dos delincuentes son detenidos y
encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.
El alguacil sospecha que han participado en
el robo del banco, delito cuya pena es 10 años de cárcel, pero no tiene pruebas.
Sólo tiene pruebas y puede culparles de un
delito menor, tenencia ilícita de armas, cuyo castigo es de 2 años de cárcel.
Promete a cada uno de ellos que reducirá su
condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco... No Conf Conf No Conf 2,2 10,0 Conf 0,10 5,5
Mira a la derecha la tabla de decisión con el dilema que se le plantea a cada uno de los prisioneros que, ahora, quieren minimizar la
El dilema del prisionero
Como en el ejemplo
anterior el juego resulta en
una decisión
socialmente
ineficiente,
pues a los
delincuentes les conviene
confesar. Cada uno busca
su bien de forma egoísta,
lo que les lleva a una mala
decisión social. Caen en
una trampa (una trampa
social o dilema social)
No
Conf Conf
No
Conf 2,2 10,0
Dilemas sociales en contexto de riesgos
adversarios
B invierte en
seguridad IT B no invierte en seguridad Compañía A invierte en seguridad IT Ambos incurren en costes Bajo riesgo A incurre en costes Riesgo relativamente alto A no invierte en seguridad B incurre en costes Riesgo relativament e alto Equilibrio: A,B evitan costes Riesgo alto
Considerad un contexto en el que hay dos
compañías interconectadas que deben decidir si invierten o no en seguridad IT. La situación queda descrita
cualitativamente en la tabla adjunta. A escala global, las compañías prefieren no cooperar en las cuestiones de la
seguridad jugando sus estrategias
egoístas. Es otro ejemplo de dilema del prisionero.
La carrera de armamento (60-80)
Considerad la relación que se formó entre la ex-URSS y EE.UU. en los años 60:
Cada país puede optar por continuar
armándose o reducir su armamento
Ambos países se dan cuenta de que
las dificultades económicas
producidas por la carrera hacen más deseable el desarme conjunto a la carrera
Ambos países preferirían su
superioridad militar a su paridad militar… ordenando las cuatro
situaciones posibles (1 peor, 4 mejor)
URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar
2. Carrera (igualdad, con penurias) 3. Desarme mutuo
La carrera de armamento (60-80)
URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar2. Carrera (igualdad, con penurias) 3. Desarme mutuo
4. Superioridad militar
De nuevo, el comportamiento racional egoísta llevará a la decisión (armar, Armar) ie la carrera de armamento
Formalización de conceptos
Formalizamos ahora los conceptos anteriores suponiendo
que hay
n
jugadores en el juego:
Espacio de alternativas para cada jugador:
Si – el conjunto de estrategias con que cuenta el jugador i, donde i ∈{1,…, n} y n es el número de los jugadores
Alternativas para cada jugador
Sea si ∈ Si una estrategia arbitraria del espacio de estrategias del jugador i
Evaluación para cada jugador
Sea (s1,…, si ,…, sn) una combinación de estrategias, y sea
ui la función de ganancias para el jugador i :
ui (s1,…, si ,…, sn) es la ganancia del jugador i si los jugadores eligen las alternativas (s1,…, si ,…, sn)
Formalización de conceptos
Juego en forma normal
: La representación en
forma normal de un juego con
n
jugadores especifica
los espacios de estrategias de los jugadores
S
1, ... ,
S
ny sus funciones de ganancias
u
1, . . . ,
u
n.
Denotamos este juego mediante
G
= {
S
1, ... ,
S
n;
u
1,…
,
u
n}.
Ejemplo de juego en forma normal
Consideremos el juego de la transparencia 12.
Hay 2 jugadores (F y C)
Los espacios de estrategias son
S
f={A,D}, S
c={I,D}
Las funciones de pago son
u
f(A,I)=3, u
f(A,D)=1,u
f(D,I)=4, u
f(D,D)=3
Ejemplo de juego en forma normal
Consideremos un juego en forma normal con tres
jugadores 1, 2, 3. Sus conjuntos estratégicos son
S
1=S
2=S
3=[0, 1].
Sus funciones de pago son:
u
1
(x,y,z)=x+y-z, u
2
(x,y,z)=x-yz,
and
u
3
(x,y,z)=xy-z,
donde para simplificar
s
1=
x
,
s
2=
y
,
s
3
=
z.
Si los jugadores anuncian las estrategias
x
= ½,
y
Formalización. Estrategia no dominada
Solución no dominada:
En el juego en forma normal, sean
s
i’ y
s
i’’
posibles estrategias del jugador
i
. La estrategia
s
i’ está
dominada
por la estrategia
s
i’’
si para cada combinación
(
s
1, ... ,
s
i -1,
s
i +1, ... ,
s
n) que puede ser construida a partir de
los espacios de estrategias de los otros jugadores
S
1, ... ,
S
i -1,
S
i +1, ... ,
S
n,
la ganancia de
i
por utilizar
s
i’
es estrictamente
menor que la ganancia de
i
por utilizar
s
i’’
:
u
i(
s
1, ... ,
s
i -1,
s
i’,
s
i +1, ... ,
s
n) <
u
i(
s
1, ... ,
s
i -1,
s
i’’,
s
i +1, ... ,
s
n)
Los jugadores racionales no utilizan estrategias estrictamente
dominadas, debiendo centrarse en las estrategias no
dominadas.
Formalización. Equilibrio de Nash
Equilibrio de Nash:
En el juego en forma normal de
n
jugadores las estrategias
s
1*, …,
s
n*
forman un equilibrio de Nash si, para cada jugador
i
,
s
i*es la mejor
respuesta del jugador
i
(o al menos una de ellas) a las estrategias de los
otros
n
-
1 jugadores, (
s
1*, ... ,
s
i*-1
,
s
i*+1, ... ,
s
n*):
u
i(
s
1*, ... ,
s
i*-1
,
s
i*,
s
i*+1, ... ,
s
n*)
≥
u
i(
s
1*, ... ,
s
i*-1,
s
i,
s
i*+1, ... ,
s
n*)
para cada posible estrategia
s
i∈
S
i; esto es, si es una solución de
max
u
i(
s
1*, ... ,
s
i*-1
,
s
i,
s
i*+1, ... ,
s
n*)
s.a.
s
i∈
S
iFunción de mejor respuesta
Un concepto clave aquí
es el de mejor respuesta: Supuesto que conozco
las decisiones tomadas por las otras partes, cuál es mi mejor alternativa,
mi mejor respuesta?
La correspondiente función se denomina función de respuesta
Un equilibrio de Nash se corresponde al cruce de funciones de respuesta:
Una estrategia es un equilibrio si para cada jugador, toda estrategia en el
soporte del equilibrio es una mejor respuesta a la estrategia
Función de mejor respuesta
Para buscar los equilibrios de Nash
en juegos de forma normal se usan
las funciones de mejores
respuestas, construidas para cada
jugador. Hazlo antes de pasar
C1 C2 C3
F1 1,4 2,2 2,3
F2 3,1 1,5 4,1
F3 2,0 3,4 1,2
Considerad el ejemplo adjunto
Observad que ninguna estrategia de
ninguno de los jugadores es dominada
Calculad las mejores respuestas del
jugador de filas y del jugador de
columnas, antes de pasar a la siguiente transparencia
Función de mejor respuesta
Para buscar los equilibrios de Nash
en juegos de forma normal se usan
las funciones de mejores
respuestas, construidas para cada
jugador.
Equilibrio de Nash. Otro
ejemplo
C1 C2 C3
F1 1,4 2,2 2,3
F2 3,1 1,5 4,1
F3 2,0 3,4 1,2
Observad que ninguna estrategia de
ninguno de los jugadores es dominada
Denotamos la función de mejor respuesta
del jugador 1 cuando el jugador 2 elige Ci como r1(Ci), de manera que
F2 = r 1(C1) F3 = r 1(C2) F2 = r 1(C3)
(las mejores respuestas del J1 marcamos
con ×)
×
×
Función de mejor respuesta
Equilibrio de Nash. Otro
ejemplo C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2 × × × ×
Análógamente, construimos la función de
mejor respuesta del jugador 2:
C1 = r 2(F1) C2 = r 2(F2) C2 = r 2(F3)
(las mejores respuestas del J2 marcamos
con ×)
Vemos que F3 = r 1(C2) y C2 = r 2(F3), es
decir (F3, C2) es el equilibrio de Nash. No hay otras celdas con dos cruces ⇒ no hay más equilibrios…
× ×
Función de mejor respuesta
Equilibrio de Nash
C1 C2
F1 -1,1 1,-1
F2 1,-1 -1,1
Considerad ahora este ejemplo. Calculad el equilibrio de Nash y las funciones de mejor respuesta
Función de mejor respuesta
Equilibrio de Nash
C1 C2
F1 -1,1 1,-1
F2 1,-1 -1,1
Consideramos otro ejemplo
Aquí, como en el ejemplo anterior las
mejores respuestas
del jugador “filas” marcamos con ×, y las del jugador “columnas” - con ×
No existe celda que contenga dos cruces,
así que no existe el equilibrio de Nash en
estrategias puras…
×
×
×
Estrategia pura, estrategia mixta
Hasta ahora nos hemos fijado sólo en estrategias puras: I, D, A, D,…. Pero es concebible (y en cierta forma necesario) considerar estrategias mixtas que son distribuciones de probabilidad sobre las estrategias puras. Por ejemplo, el jugador por filas podría considerar una estrategia mixta que fuese (2/3, 1/3) que se interpreta como: Juego A con probabilidad 2/3 y Juego D con probabilidad 1/3.
En particular la estrategia (1,0) del jugador por filas (Juego A con
probabilidad 1, Juego D con probabilidad 0) coincide con la estrategia A: Las estrategias puras son casos particulares de las estrategias mixtas
Estrategia pura, estrategia mixta
C1 C2
F1 -1,1 1,-1
F2 1,-1 -1,1
A partir de la matriz de pagos, construimos los pagos de las
estrategias mixtas, como ilustramos en el ejemplo último. Consideramos las estrategias mixtas (p,1-p) para el jugador por filas y (q,1-q) para el
jugador por columnas. ×
×
×
×
Lo ilustramos para el jugador por filas:
•Con probabilidad p juega F1 y espera ganar ( q * (-1))+((1-q) *1)
•Con probabilidad (1-p) juega F2 y espera ganar (q* 1)+ ((1-q) * (-1)) En total espera ganar p*(1-2q)+(1-p)*(2q-1)=2p+2q-4pq-1
Formalización de conceptos
Derivemos de forma más general la mejor respuesta del jugador i a la
estrategia mixta del jugador j.
Sea J el número de estrategias puras en S1 y K el número de estrategias puras
en S2
Escribimos S1= { s11, ... ,s1J} y S2 = { s21, ... ,s2K}, y utilizamos s1j y s2k para
denotar las estrategias puras s de S1 y S2 respectivamente.
Si el jugador 1 cree que el jugador 2 utilizará las estrategias (s21, ... ,s2K) con
probabilidades p2 = (p21, ... ,p2K), la ganancia esperada del jugador 1 por utilizar la estrategia mixta p1 = (p11, ... ,p1J) es
donde p1j p2k es la probabilidad de que 1 utilice s1j y 2 utilice s2k.
Para que la estrategia mixta (p11, ... ,p1J) sea mejor respuesta del jugador 1 a la
Formalización de conceptos
Hacemos el mismo análisis para el jugador 2, cuya ganancia
esperada por utilizar la estrategia
mixta (p21, ... ,p2K)cuando el
cree que el jugador 1 utilizará la estratégia mixta
(p11, ... ,p1J), es
Para que el par de estrategias mixtas
(p
1*,p
2*)
forme un
equilibrio de Nash
,
p
1*debe cumplir
para cada distribución de probabilidad
p
1sobre
S
1,
y
p
2debe
cumplir
para cada distribución de probabilidad
p
2sobre
S
2.(1)
Formalización de conceptos. Resultados
En un juego en forma normal de con
n
jugadores
G ={
S
1, ... ,
S
n;
u
1, ... ,
u
n}, si
n
es un número finito y
S
ies finito para cada
i
, existe al menos un equilibrio de
Nash, que posiblemente incluye estrategias mixtas.
Cálculo de equilibrio de Nash
Supongamos que jugador
1 cree que jugador 2
elegirá C1 con
probabilidad
q
y C2 con
probabilidad 1-
q.
y que jugador 2 cree que
jugador 1 elegirá F1 con
probabilidad
p
y F2 con
probabilidad 1-
p.
C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1 Ilustramos los cálculosCon el siguiente ejemplo
Cálculo de equilibrio de Nash
Supongamos que jugador 1
cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.
y que jugador 2 cree que
jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1
La ganancia esperada del jugador 1 será:
u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
La ganancia esperada del jugador 1 será:
u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),
Cálculo de equilibrio de Nash
Supongamos que jugador 1
cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.
y que jugador 2 cree que
jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1
La ganancia esperada del jugador 1 será:
u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
o sea, la ganancia u1(p,q) es creciente en p si q > 2/3 y decreciente si q <2/3. Así, la mejor respuesta del jugador 1 es F1 si q > 2/3 y F2 si q <2/3.
La ganancia esperada del jugador 1 será:
u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),
o sea, la ganancia u2(p,q) es creciente en q si p < 1/2 y decreciente p > 1/2. Así, la mejor respuesta del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2.
Cálculo de equilibrio de Nash
Las mejores
respuestas se
puede representar
gráficamente.
C1 C2 F1 2,2 3,4 F2 1,3 5,1 La estrategia del jugador 1 es
F1 si q > 2/3 y F2 si q <2/3. F1 o F2 (cualquiera estrategia) si q =2/3 q 2/3 p 1
Cálculo de equilibrio de Nash
Las mejores
respuestas se
puede representar
gráficamente
C1 C2 F1 2,2 3,4 F2 1,3 5,1 q 1/2 p 1 La estrategia del jugador 2 es
C1 si p < 1/2 , C2 si p > 1/2 y C1 o C2 si p = 1/2.
Cálculo de equilibrio de Nash
Las mejores respuestas se
puede representar
gráficamente. En esta
representación a los
equilibrios de Nash les
corresponden las cruces de
las funciones de respuestas
C1 C2
F1 2,2 3,4
F2 1,3 5,1
La estrategia del jugador 1 es
F1 si q > 2/3 y F2 si q <2/3. F1 o F2 si q =2/3
La estrategia del jugador 2 es
C1 si p < 1/2 y C2 si p > 1/2. C1 o C2 si p = 1/2. q 2/3 1 q 1/2 p 1 El punto (q, p) = (2/3, 1/2) es el equilibrio de Nash en estrategias mixtas
Cálculo de equilibrio de Nash
El razonamiento se podría
generalizar a este caso.
C1 C2F1 a1,b1 a2,b2
F2 a3,b3 a4,b4
Calculamos utilidades esperadas para cada agente
Calculamos mejores respuestas para cada agente
Buscamos cruces de las funciones de respuesta
Pero para matrices 3x3 se empieza a complicar…
Test Equilibrio de Nash (para el caso
continuo)
Y si aprovechamos las condiciones de optimalidad
(Recuerda la asignatura de Métodos de Optimización)?
Sea G un juego en forma estratégica cuyos conjuntos de estrategias son los intervalos abiertos con las funciones de pago dos veces
diferenciables.
Supongamos que el perfil estratégico (
s
1*, …,
s
n*) satisface:
para cada jugador i, cada
s
1* es el único punto estacionario de la funciónu
i(
s
1*, ... ,
s
i*-1
,
s
i,
s
i*+1, ... ,
s
n*)
, si ∈Si . Si,para cada i. Entonces (
s
1*, …,
s
n*) es el equilibrio de Nash del juego G.
0
)
,...,
(
* * 1=
∂
∂
i n is
s
s
u
0
)
,...,
(
2 * * 1 2<
∂
∂
i n is
s
s
u
Consideremos un juego en forma estratégica con tres jugadores 1,
2, 3.
Los conjuntos estratégicos son
S
1=S
2=S
3=[0, +
∞
]
.
Sus funciones de pago son:
Para encontrar el equilibrio de Nash debemos resolver el sistema
de ecuaciones:
Al calcular las derivadas obtendremos:
De manera que tenemos que resolver el sistema de ecuaciones:
Resolviéndola, obtendremos
x
=
y
=
z
=1.
Al calcular las segundas derivadas obtendremos:
Para cualquiera elección
x
,
y
,
z
> 0.
Entonces, (1, 1, 1) es el equilibrio de Nash (único).
Ejemplo Test Equilibrio de Nash
Ejemplo Test Equilibrio de Nash
Ejemplo Test equilibrio de Nash
Supongamos que jugador 1
cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.
y que jugador 2 cree que
jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1
La ganancia esperada del jugador 1 será:
u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
La ganancia esperada del jugador 1 será:
u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),
El punto estacionario de la derivada primera de u1 es 2/3 El punto estacionario de la derivada segunda de u2 es ½ Y comprobáis que es equilibrio de Nash
Aplicad el test introducido para calcular el
equilibrio de Nash en el ejemplo de la
transparencia 46. Podéis hacerlo por
parejas.
Envíanos la solución por email (puedes
hacerlo a mano y escanearlo) antes del
día 23 de Febrero a las 18.00 hora de
Madrid.
Ejemplo Test Equilibrio de Nash
Ejemplo Test Equilibrio de Nash
Aplicación Política
Puedes saltar esta sección, aunque es muy interesante. Ponemos uno de
los ejemplos de uso político del concepto de equilibrio de Nash: El
teorema del votante de la mediana. Viene a explicar por qué
el
centro político es tan codiciado en unas elecciones.
Para más información véase
Aplicación: Por qué
el centro político es
tan codiciado
Supongamos que
las preferencias de los votantes se distribuyen uniformemnte en una sola dimensión, a lo largo del espectro ideológico de izquierda (0) a derecha (1).
Hay dos candidatos
Cada votante vota al candidato que esté más cercano a su posición ideológica
Bajo estas condiciones, predeciremos la posición ideológica de los
candidatos…
Podemos ver la situación como un juego estratégico entre dos
jugadores – los candidatos
El conjunto de las estrategias de cada jugador es [0, 1]
Las función de pago para cada jugador es la parte del electorado que le vota.
Aplicación: Por qué
el centro político es
tan codiciado
⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + = < + − = . si 2 si 5 . 0 si 2 1 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 2 a a a a a a a a a a a a u Las funciones de pago de los jugadores son las siguientes:
⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + − = < + = . si 2 1 si 5 . 0 si 2 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 1 a a a a a a a a a a a a u En efecto,
Consideremos el perfil estratégico (a1, a2), con a1 < a2
Las ideologías más cercanas a a1 que a2 se representan con el
intervalo [0, (a1+a2)/2]. Eso quiere decir que (a1+a2)/2 -ecima parte del electorado votará por el candidato 1.
Análogamente, [ (a1+a2)/2, 1] representa las ideologías más cercanos
al a2 que al a1. Asimismo, 1 - (a1+a2)/2 -ecima parte votará por el candidato 2.
Aplicación: Por qué
el centro político es
tan codiciado
El teorema del votante de la mediana dice:
Se puede mostrar que el único equilibrio de Nash de este juego
es (1/2, 1/2).
De manera que, en las condiciones mencionadas, cada candidato
intenta atraer al votante que está en el centro de la distribución del espectro ideológico.
El resultado se debe a Anthony Downs
Aplicación: Duopolio de Cournot
Puedes saltar esta parte, aunque es interesante.
Explicamos una importante aplicación económica del
concepto de equilibrio de Nash
Cournot introdujo este ejemplo de mercado en 1838 y
descubrió
su equilibrio, muchos años antes que Nash
introdujese su concepto.
Es un modelo fundamentl
en teoría de la organización
industrial
Mira sobre el modelo del duopolio de Cournot en Wikipedia
Aplicación: Duopolio de Cournot
Dos empresas producen un mismo producto y compiten
por un mercado. Sean
q1 y q 2 las cantidades producidas,
P(Q) = a – Q es el precio del producto, donde Q = q1 +
q 2.
ciqi el coste de producción por la empresa i, suponemos que ci < a.
Las empresas eligen sus producciones de forma
simultánea.
Cuánto debe producir cada empresa para maximizar
beneficio
Aplicación: Duopolio de Cournot
Traducimos el problema a un juego en forma normal:
Dos jugadores – dos empresas Espacio de estrategias: Si = [0,∞) (el producto es continuamente divisible)
Las ganancias de las empresas son:
ui(q i, q j ) = q i (P(q i + q j ) – ci)= q i (a - (q i + q j ) – ci)
El par de estrategias (
s
1*,
s
2*) forma un equilibrio de
Nash si,
para cada jugador
ui (si*, sj*) ≥ ui (si , sj*) para cada posible estrategia si de Si .
para cada jugador s*i es una solución del problema max ui (si, sj) (*) s.a. si ∈Si
Aplicación: Duopolio de Cournot
La condición de primer orden del problema (*) es
necesaria y suficiente ,con lo que se obtiene:
q
1* = 1/2(a-
q
2* -
c1
)
Y
q
2* = 1/2(a-
q
1* -
c2
)
de donde obtenemos:
q
1* = (a+c2-2c1)/3
q
2* = (a +c1-2c2)/3
Críticas
Indudablemente, el concepto de equilibrio de Nash es muy importante, ha
conllevado importantes aplicaciones políticas, económicas, biológicas,…. pero tiene sus críticas
Hipótesis de conocimiento común: la hemos formulado aquí. Equilibrios múltiples
A veces hay más de un equilibrio y puede ser difícil elegir entre ellos. Dilemas sociales
El dilema de prisionero tiene muchas “implicaciones prácticas” donde los
jugadores acaban con unas estrategias socialmente ineficientes.
No ‘sirven’ para dar consejo a una de las partes
En algunos juegos sería útil comunicarse antes de empezar el juego; en
otros no, para no estar amenazado; en algunos juegos mejor esperar al otro jugador para que sea el primero, en otros mejor dar el primer paso… En general, sirven más bien para hacer una predicción del juego,
Análisis asimétrico presc/desc
Izda. Dcha. Arriba 4,-100 10,6
Debajo 12,8 5,4
Este juego es “casi como” el juego de
la transparencia “Equilibrio”,
pero en este juego el jugador de las
columnas (J2) arriesga “ganar” -100.
Por eso, J2 podrá pensar elegir “Dcha”
para protegerse
J1 podrá intuir lo que piensa J2 y
elegir “Arriba”…
pero, ¿Hay alguna posibilidad de
cuantificar las dudas de los jugadores?
Análisis asimétrico presc/desc
Izda. Dcha. Arriba 4,-100 10,6
Debajo 12,8 5,4
Consideremos el problema del jugador J2
desde el punto de vista del análisis de decisiones
Supongamos que J1 elige
“Arriba” con una probabilidad p, y “Debajo” con 1-p.
Entonces, la utilidad esperada del J2 es -100p + 8(1-p) = 8 – 108p para “Izda.” y 6p + 4(1-p) = 4 – 2p para “Dcha.”
Así que, la probabilidad de equilibrio se encuentra al resolver la ecuación
8 – 108p = 4 – 2p, o p = 0.036.
Así que J2 debe elegir “Dcha.” si el piensa que la probabilidad de que J1 elija “Arriba”
es más que 0.036
Un análisis similar se puede efectuar para J1
J1 debe elegir “Abajo” si el piensa que la probabilidad de que J2 elija “Dcha.” es más
Actividad
Para el juego de piedra papel tijera en forma
normal
Calcula equilibrio de Nash.
Interpretar solución.
Podéis hacerlo por parejas.
Envíanos la solución por email (puedes hacerlo a
mano y escanearlo) antes del día 23 de Febrero
a las 18.00 hora de Madrid.