MASTER EN INGENIERÍA DE LA DECISIÓN

(1)

MASTER EN INGENIERÍA DE LA

DECISIÓN

ANÁLISIS DE NEGOCIACIONES.

2 CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS (NO COOPERATIVOS)

EQUILIBRIOS DE NASH

(2)

Objetivo

En esta sesión introducimos los dos

conceptos básicos de la teoría de juegos no

cooperativos:

dominacia (tal vez iterada),

equilibrio de Nash

Tiempo esperado: 4 horas (incluida la

actividad).

(3)

Plan

El plan para esta sesión es el siguiente

Descripción básica de juegos

Conceptos de dominancia

Concepto de equilibrio de Nash no cooperativo

Cálculo de equilibrios de Nash

(4)

Contexto básico

El tipo de problemas que consideramos tienen estos rasgos:

Hay varios decisores

El pago que recibe cada decisor depende no sólo de su decisión,

sino también de las de los demás

Puede tener lugar tanto en situación de conflicto como de

cooperación

Los participantes o decisores se denominan

jugadores

Los pagos a los jugadores en función de sus acciones se

denominan

las funciones de pagos

Un

juego

es un conjunto de reglas conocidas por los

jugadores que determinan qué

pueden hacer y las

consecuencias y los pagos asociados a sus decisiones

(5)

Posibilidades

Hay varios tipos de juegos en función de:

Número de jugadores: 2, 3, …, n,…

∞

Número de estrategias disponibles: Finitas,

Infinitas

Función de pagos: Juegos de suma nula,

(Juegos bipersonales de suma nula), Juegos de

diferencia constante. Juegos de suma no nula

Situación previa al juego: Cooperativos, no

cooperativos

(6)

Ejemplos. Posibilidades.

El conocido juego Piedra-papel-tijera es un ejemplo de

Juego bipersonal

Juego de suma nula (si uno gana el otro pierde)

Finito (cada uno tiene 3 alternativas para elegir: piedra, papel,

o tijera)

(7)

Ejemplos. Posibilidades.

Partir una herencia de 500000 pesos en tres partes (x,

y, 500000-x-y) con x, y entre 0 y 500000, y x+y menor

que 500000

Es un juego tripersonal

Es un juego de suma constante

Con un número de estrategias infinito

Es un juego no cooperativo, si no se permite la comunicación.

(8)

Conceptos básicos de Teoría de Juegos

Vamos a introducir brevemente los

conceptos de la Teoría de Juegos. Para

ello:

Juntaos por parejas!!!!

Presentamos varias situaciones que nos

ayudarán a introducir algunos conceptos

básicos…

(9)

Conceptos básicos de Teoría de Juegos

Las reglas serán:

Tienes que actuar

Tus consecuencias dependen de lo que

hagas tú y los demás

No sabes lo que harán, pero sabes lo que

podrían hacer

(10)

Reglas básicas

Dos jugadores, dos alternativas

•

Estrategias fijas

• Información perfecta

• Selección simultánea, salvo que se indique lo contrario

(11)

Matriz del juego

Izda. Dcha. Arriba A,I A,D

Debajo D,I D,D

La forma normal de un juego es una matriz

que muestra

los jugadores, las estrategias,

y las recompensas (ver el ejemplo a la

derecha).

Hay dos jugadores:

uno elige la fila y otro la columna.

En el ejemplo, cada jugador tiene dos

estrategias:

las estrategias del jugador 1 (o sea, el jugador

de las filas) se denominan “Arriba” y “Debajo”,

las del jugador 2 (o sea, el jugador de las

(12)

Matriz del juego

Izda. Dcha.

Arriba 3,2 1,5

Debajo 4,7 3,1

Las recompensas se especifican en el interior:

el primer número es la recompensa recibida por

el jugador 1 (fila);

el segundo es la recompensa del jugador 2.

(columna)

Por ejemplo, si el jugador 1 elige “arriba” y el

jugador 2 elige “izda.” entonces sus recompensas son 3 y 2, respectivamente.

Cuando un juego se presenta en forma normal,

se presupone que todos los jugadores actúan simultáneamente, o sea, sin saber la elección que toma el otro.

(13)

Matriz del juego: suma nula

Izda. Dcha.

Arriba 3,-3 -2,2

Debajo -4,4 1,-1

En los juegos de

suma nula

el

beneficio total para todos los

jugadores del juego, en cada

combinación de estrategias,

siempre suma cero (en otras

palabras, un jugador se

beneficia solamente a expensas

del otro).

(14)

Matriz del juego: suma nula

Izda. Dcha.

Arriba 3 -2

Debajo -4 1

El juego del ejemplo anterior tiene

información redundante (siendo de

suma nula). Puede simplificarse y

transformarse en esta otra que

representa tan solo las ganancias

del jugador 1, teniendo en cuenta

que las ganancias del opositor son

cantidades opuestas.

(15)

Ejemplo. Juego suma nula.

Piedra

Papel

Tijera

Piedra

0 -1

1 Papel

1

0 -1

Tijera

-1

1

0 Tenéis aquí

representado el juego de

Piedra-papel-tijera en forma normal.

(

Lee el material adicional de la Wikipedia

)

(16)

Considera este juego…

Izda. Dcha. Arriba 4,5 10,-6

Debajo 12,7 5,9

Piensa que harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

¿Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

(17)

Indeterminación

Debajo 12,7 5,9

Denominemos

J1 al Jugador de las filas (J1) y J2 al Jugador de las columnas.

Podría ocurrir la siguiente situación…

J1 ha elegido “Debajo”, porque ha pensado que

J2 elegirá “Izda.” para evitar la posibilidad de “ganar” -6.

Supongamos que J2 ha elegido “Dcha.”, porque ha pensado que

J1 ha pensado que J2 elegiría “Izda.” y, por eso,

J1 elegirá “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2

será “Dcha”, pues gana 9.

Pero podría ocurrir que J1 pensase que J2 elíjese “Dcha”, porque

J2 habría pensado que J1 habría pensado que J2 elegiría “Izda.” y, por eso,

J1 elegiría “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2 será

(18)

Indeterminación

El problema es que:

“Debajo” (para J1) es la mejor respuesta contra

“Izda” (de J2)

“Izda” es la mejor respuesta contra “Arriba” “Arriba” es la mejor respuesta contra “Dcha.” “Dcha.” es la mejor respuesta contra “Debajo”

…

Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…

Debajo 12,7 5,9

Para algunos juegos no existen prescripciones simples...

Esto es, necesitamos suponer no sólo que los jugadores son racionales, sino también que todos los jugadores saben que todos los jugadores son racionales, y que todos los jugadores saben que todos los jugadores saben que todos los jugadores son

racionales, y así ad infinitum…

Este juego tal y como está formulado queda indeterminado… lo podremos resolver más adelante

(19)

Indeterminación

El problema es que:

“Debajo” (para J1) es la mejor respuesta contra

“Izda” (de J2)

“Izda” es la mejor respuesta contra “Arriba” “Arriba” es la mejor respuesta contra “Dcha.” “Dcha.” es la mejor respuesta contra “Debajo”

…

Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…

Debajo 12,7 5,9

¿por qué no simplemente suponer que todos los jugadores saben que todos los jugadores son racionales? Cuando un jugador conoce las reglas no emprende o

asume algunos comportamientos. Sin embargo, si ese mismo jugador no está seguro de que los demás jugadores saben que él conoce las reglas, no estará seguro de que los demás jugadores sepan que él no emprenderá ni asumirá dichas

comportamientos. Este tipo de incertidumbre genera dudas en la mente de los

jugadores y modifica dramáticamente lo que cada uno termina por hacer. De aquí la

importancia de suponer información de dominio público en todos los niveles (ad

(20)

Considera este juego…

Izda. Dcha.

Arriba 4,3 3,0

(21)

Dominancia

Izda. Dcha.

Arriba 4,3 3,0

Debajo 12,8 5,4

Para el jugador 1 la estrategia “Debajo” domina

la “Arriba” (tachada) porque 12 > 4 y 5 > 3.

Para el jugador 2 la “Izda.” domina “Dcha.”

(tachada) porque 3 > 0 y 8 > 4.

La única celda no tachada es la que corresponde a

las estrategias “Debajo” y “Izda.” Entonces, las recompensas de los jugadores son 12 y 8

respectivamente.

Una estrategia domina estrictamente a otra cuando es mejor elección

independiente de la elección del otro jugador.

Un jugador siempre elige estrategia no dominada y tacha las

(22)

Considera este juego…

Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

(23)

Dominancia iterada

Cada jugador predice que el otro seguirá

estrategias no dominadas

Es fácil comprobar que el jugador de las filas

no tiene estrategia no dominada

La estrategia dominante del jugador de las

(24)

Dominancia iterada

Cada jugador predice que el otro seguirá

estrategias no dominadas

Es fácil comprobar que el jugador de las filas

no tiene estrategia no dominada

La estrategia dominante del jugador de las

columnas es “Dcha.”

Sin embargo, el jugador de las filas elegirá

“Arriba” ya que el sabe que “Dcha.” es la estrategia dominante del jugador de las columnas, y así maximizará su ganancia

(25)

Considera este juego…

Piensa qué harías si fueras el jugador

Izda. Dcha.

Arriba 4,3 10,6

(26)

Equilibrio

Izda. Dcha.

Arriba 4,3 10,6

Debajo 12,8 5,4

En este ejemplo ninguno de los dos

jugadores tiene una estrategia dominante:

Si el jugador 1 uno elige “Arriba” es conveniente al 2 eligir “Dcha.” y viceversa: si el 2 elige “Dcha.” el 1 tiene que eligir “Arriba”.

Si el 1 elige “Debajo” el 2 tiene que eligir “Izda.” y viceversa.

Asimismo, “Debajo”- “Izda.” y “Arriba”-”Dcha.” son aquellas combinaciones de

estrategias en las cuales ningún jugador pueda mejorar cambiando de estrategia, supuesto que el otro jugador elija su estrategia.

Por tanto, es probable que elijan los jugadores las combinaciones de estrategias. Estas estrategias se llaman equilibrios (de Nash, no cooperativos).

(27)

Considera este juego…

Hasta ahora hemos analizado los juegos bajo la

condición de que ambos jugadores tomen sus decisiones simultáneamente.

Ahora supongamos que uno de los dos

elige primero.

Izda. Dcha. Arriba 0,0 1,2

(28)

La ventaja de elegir primero

Hay dos equilibrios: {Arriba, Dcha.} y

{Debajo, Izda.}.

Cada jugador prefiere uno de estos

equilibrios:

El jugador de las filas prefiere “Debajo” y El jugador de las columnas – “Dcha.”

El jugador que elige el segundo no tiene

otra elección salvo acceder a la elección

del jugador que ha elegido el primero…

Izda. Dcha. Arriba 0,0 1,2

(29)

Considera este juego…

por filas. ¿Qué estrategia elegirías?

¿Y si fueras el jugador por columnas? Una vez has hecho este ejercicio abre la

Izda. Dcha.

Arriba 5,5 -5,10

(30)

Los peligros de la racionalidad

Izda. Dcha.

Arriba 5,5 -5,10

Debajo 10,-5 -2,-2

En este ejemplo,

1, como jugador racional, tachará la

estrategia “Arriba” como dominada

2 tachará como dominada la estrategia

“Izda.”

Los jugadores acabarán con una solución

ineficiente

, pues (5, 5) es mejor que (-2, -2)…

Es este un ejemplo del dilema del prisionero

(31)

El dilema del prisionero

Dos delincuentes son detenidos y

encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.

El alguacil sospecha que han participado en

el robo del banco, delito cuya pena es 10 años de cárcel, pero no tiene pruebas.

Sólo tiene pruebas y puede culparles de un

delito menor, tenencia ilícita de armas, cuyo castigo es de 2 años de cárcel.

Promete a cada uno de ellos que reducirá su

condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco... No Conf Conf No Conf 2,2 10,0 Conf 0,10 5,5

Mira a la derecha la tabla de decisión con el dilema que se le plantea a cada uno de los prisioneros que, ahora, quieren minimizar la

(32)

El dilema del prisionero

Como en el ejemplo

anterior el juego resulta en

una decisión

socialmente

ineficiente,

pues a los

delincuentes les conviene

confesar. Cada uno busca

su bien de forma egoísta,

lo que les lleva a una mala

decisión social. Caen en

una trampa (una trampa

social o dilema social)

No

Conf Conf

No

Conf 2,2 10,0

(33)

Dilemas sociales en contexto de riesgos

adversarios

B invierte en

seguridad IT B no invierte en seguridad Compañía A invierte en seguridad IT Ambos incurren en costes Bajo riesgo A incurre en costes Riesgo relativamente alto A no invierte en seguridad B incurre en costes Riesgo relativament e alto Equilibrio: A,B evitan costes Riesgo alto

Considerad un contexto en el que hay dos

compañías interconectadas que deben decidir si invierten o no en seguridad IT. La situación queda descrita

cualitativamente en la tabla adjunta. A escala global, las compañías prefieren no cooperar en las cuestiones de la

seguridad jugando sus estrategias

egoístas. Es otro ejemplo de dilema del prisionero.

(34)

La carrera de armamento (60-80)

Considerad la relación que se formó entre la ex-URSS y EE.UU. en los años 60:

Cada país puede optar por continuar

armándose o reducir su armamento

Ambos países se dan cuenta de que

las dificultades económicas

producidas por la carrera hacen más deseable el desarme conjunto a la carrera

Ambos países preferirían su

superioridad militar a su paridad militar… ordenando las cuatro

situaciones posibles (1 peor, 4 mejor)

URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar

2. Carrera (igualdad, con penurias) 3. Desarme mutuo

(35)

La carrera de armamento (60-80)

URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar

2. Carrera (igualdad, con penurias) 3. Desarme mutuo

4. Superioridad militar

De nuevo, el comportamiento racional egoísta llevará a la decisión (armar, Armar) ie la carrera de armamento

(36)

Formalización de conceptos

Formalizamos ahora los conceptos anteriores suponiendo

que hay

n

jugadores en el juego:

Espacio de alternativas para cada jugador:

S_i– el conjunto de estrategias con que cuenta el jugador i, donde i ∈{1,…, n} y n es el número de los jugadores

Alternativas para cada jugador

Sea s_i ∈ S_iuna estrategia arbitraria del espacio de estrategias del jugador i

Evaluación para cada jugador

Sea (s₁,…, s_i ,…, s_n) una combinación de estrategias, y sea

u_i la función de ganancias para el jugador i :

u_i (s₁,…, s_i ,…, s_n) es la ganancia del jugador i si los jugadores eligen las alternativas (s₁,…, s_i ,…, s_n)

(37)

Formalización de conceptos

Juego en forma normal

: La representación en

forma normal de un juego con

n

jugadores especifica

los espacios de estrategias de los jugadores

S

₁

, ... ,

S

_n

y sus funciones de ganancias

u

₁

, . . . ,

u

_n

.

Denotamos este juego mediante

G

= {

S

₁

, ... ,

S

_n

;

u

₁

,…

,

u

_n

}.

(38)

Ejemplo de juego en forma normal

Consideremos el juego de la transparencia 12.

Hay 2 jugadores (F y C)

Los espacios de estrategias son

S

f

={A,D}, S

c

={I,D}

Las funciones de pago son

u

f

(A,I)=3, u

f

(A,D)=1,u

f

(D,I)=4, u

f

(D,D)=3

(39)

Ejemplo de juego en forma normal

Consideremos un juego en forma normal con tres

jugadores 1, 2, 3. Sus conjuntos estratégicos son

S

₁

=S

₂

=S

₃

=[0, 1].

Sus funciones de pago son:

u

₁

(x,y,z)=x+y-z, u

₂

(x,y,z)=x-yz,

and

u

₃

(x,y,z)=xy-z,

donde para simplificar

s

₁

=

x

,

s

₂

=

y

,

s

₃

=

z.

Si los jugadores anuncian las estrategias

x

= ½,

y

(40)

Formalización. Estrategia no dominada

Solución no dominada:

En el juego en forma normal, sean

s

_i

’ y

s

_i

’’

posibles estrategias del jugador

i

. La estrategia

s

_i

’ está

dominada

por la estrategia

s

_i

’’

si para cada combinación

(

s

₁

, ... ,

s

_i_-1

,

s

_i₊₁

, ... ,

s

_n

) que puede ser construida a partir de

los espacios de estrategias de los otros jugadores

S

₁

, ... ,

S

_i_-1

,

S

_i₊₁

, ... ,

S

_n

,

la ganancia de

i

por utilizar

s

_i

’

es estrictamente

menor que la ganancia de

i

por utilizar

s

_i

’’

:

u

_i

(

s

₁

, ... ,

s

_i_-1

,

s

_i

’,

s

_i₊₁

, ... ,

s

_n

) <

u

_i

(

s

₁

, ... ,

s

_i_-1

,

s

_i

’’,

s

_i₊₁

, ... ,

s

_n

)

Los jugadores racionales no utilizan estrategias estrictamente

dominadas, debiendo centrarse en las estrategias no

dominadas.

(41)

Formalización. Equilibrio de Nash

Equilibrio de Nash:

En el juego en forma normal de

n

jugadores las estrategias

s

₁*

, …,

s

n*

forman un equilibrio de Nash si, para cada jugador

i

,

s

_i*

es la mejor

respuesta del jugador

i

(o al menos una de ellas) a las estrategias de los

otros

n

-

1 jugadores, (

s

₁*

_{, ... ,}

s

i*-1

,

s

i*+1

, ... ,

s

n*

):

u

_i

(

s

₁*

_{, ... ,}

s

i*-1

,

s

i*

,

s

i*+1

, ... ,

s

n*

)

≥

u

i

(

s

1*

, ... ,

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

para cada posible estrategia

s

_i

∈

S

_i

; esto es, si es una solución de

max

u

_i

(

s

₁*

_{, ... ,}

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

s.a.

s

_i

∈

S

_i

(42)

Función de mejor respuesta

Un concepto clave aquí

es el de mejor respuesta: Supuesto que conozco

las decisiones tomadas por las otras partes, cuál es mi mejor alternativa,

mi mejor respuesta?

La correspondiente función se denomina función de respuesta

Un equilibrio de Nash se corresponde al cruce de funciones de respuesta:

Una estrategia es un equilibrio si para cada jugador, toda estrategia en el

soporte del equilibrio es una mejor respuesta a la estrategia

(43)

Función de mejor respuesta

Para buscar los equilibrios de Nash

en juegos de forma normal se usan

las funciones de mejores

respuestas, construidas para cada

jugador. Hazlo antes de pasar

C1 C2 C3

F1 1,4 2,2 2,3

F2 3,1 1,5 4,1

F3 2,0 3,4 1,2

Considerad el ejemplo adjunto

Observad que ninguna estrategia de

ninguno de los jugadores es dominada

Calculad las mejores respuestas del

jugador de filas y del jugador de

columnas, antes de pasar a la siguiente transparencia

(44)

Función de mejor respuesta

Para buscar los equilibrios de Nash

en juegos de forma normal se usan

las funciones de mejores

respuestas, construidas para cada

jugador.

Equilibrio de Nash. Otro

ejemplo

C1 C2 C3

F1 1,4 2,2 2,3

F2 3,1 1,5 4,1

F3 2,0 3,4 1,2

Observad que ninguna estrategia de

ninguno de los jugadores es dominada

Denotamos la función de mejor respuesta

del jugador 1 cuando el jugador 2 elige Ci como r1_{(Ci), de manera que}

F2 = r 1(C1) F3 = r 1(C2) F2 = r 1(C3)

(las mejores respuestas del J1 marcamos

con ×)

×

(45)

Función de mejor respuesta

Equilibrio de Nash. Otro

ejemplo C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2 × × × ×

Análógamente, construimos la función de

mejor respuesta del jugador 2:

C1 = r 2(F1) C2 = r 2(F2) C2 = r 2(F3)

(las mejores respuestas del J2 marcamos

con ×)

Vemos que F3 = r 1(C2) y C2 = r 2(F3), es

decir (F3, C2) es el equilibrio de Nash. No hay otras celdas con dos cruces ⇒ no hay más equilibrios…

× ×

(46)

Función de mejor respuesta

Equilibrio de Nash

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

Considerad ahora este ejemplo. Calculad el equilibrio de Nash y las funciones de mejor respuesta

(47)

Función de mejor respuesta

Equilibrio de Nash

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

Consideramos otro ejemplo

Aquí, como en el ejemplo anterior las

mejores respuestas

del jugador “filas” marcamos con ×, y las del jugador “columnas” - con ×

No existe celda que contenga dos cruces,

así que no existe el equilibrio de Nash en

estrategias puras…

×

(48)

Estrategia pura, estrategia mixta

Hasta ahora nos hemos fijado sólo en estrategias puras: I, D, A, D,…. Pero es concebible (y en cierta forma necesario) considerar estrategias mixtas que son distribuciones de probabilidad sobre las estrategias puras. Por ejemplo, el jugador por filas podría considerar una estrategia mixta que fuese (2/3, 1/3) que se interpreta como: Juego A con probabilidad 2/3 y Juego D con probabilidad 1/3.

En particular la estrategia (1,0) del jugador por filas (Juego A con

probabilidad 1, Juego D con probabilidad 0) coincide con la estrategia A: Las estrategias puras son casos particulares de las estrategias mixtas

(49)

Estrategia pura, estrategia mixta

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

A partir de la matriz de pagos, construimos los pagos de las

estrategias mixtas, como ilustramos en el ejemplo último. Consideramos las estrategias mixtas (p,1-p) para el jugador por filas y (q,1-q) para el

jugador por columnas. ×

×

Lo ilustramos para el jugador por filas:

•Con probabilidad p juega F1 y espera ganar ( q * (-1))+((1-q) *1)

•Con probabilidad (1-p) juega F2 y espera ganar (q* 1)+ ((1-q) * (-1)) En total espera ganar p*(1-2q)+(1-p)*(2q-1)=2p+2q-4pq-1

(50)

Formalización de conceptos

Derivemos de forma más general la mejor respuesta del jugador i a la

estrategia mixta del jugador j.

Sea J el número de estrategias puras en S₁ y K el número de estrategias puras

en S₂

Escribimos S₁= { s₁₁, ... ,s_1J} y S₂ = { s₂₁, ... ,s_2K}, y utilizamos s_1j y s_2k para

denotar las estrategias puras s de S₁ y S₂ respectivamente.

Si el jugador 1 cree que el jugador 2 utilizará las estrategias (s₂₁, ... ,s_2K) con

probabilidades p₂= (p₂₁, ... ,p_2K), la ganancia esperada del jugador 1 por utilizar la estrategia mixta p₁= (p₁₁, ... ,p_1J) es

donde p_1j p_2k es la probabilidad de que 1 utilice s_1j y 2 utilice s_2k.

Para que la estrategia mixta (p₁₁, ... ,p_1J) sea mejor respuesta del jugador 1 a la

(51)

Formalización de conceptos

Hacemos el mismo análisis para el jugador 2, cuya ganancia

esperada por utilizar la estrategia

mixta (p₂₁, ... ,p_2K)

cuando el

cree que el jugador 1 utilizará la estratégia mixta

(p₁₁, ... ,p_1J), es

Para que el par de estrategias mixtas

(p

₁*

,p

₂*

)

forme un

equilibrio de Nash

,

p

₁*

_{debe cumplir}

para cada distribución de probabilidad

p

₁

sobre

S

₁

,

y

p

₂

debe

cumplir

para cada distribución de probabilidad

p

₂

sobre

S

_2.

(1)

(52)

Formalización de conceptos. Resultados

En un juego en forma normal de con

n

jugadores

G ={

S

₁

, ... ,

S

_n

;

u

₁

, ... ,

u

_n

}, si

n

es un número finito y

S

_i

es finito para cada

i

, existe al menos un equilibrio de

Nash, que posiblemente incluye estrategias mixtas.

(53)

Cálculo de equilibrio de Nash

Supongamos que jugador

1 cree que jugador 2

elegirá C1 con

probabilidad

q

y C2 con

probabilidad 1-

q.

y que jugador 2 cree que

jugador 1 elegirá F1 con

probabilidad

p

y F2 con

probabilidad 1-

p.

C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1 Ilustramos los cálculos

Con el siguiente ejemplo

(54)

Cálculo de equilibrio de Nash

Supongamos que jugador 1

cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.

y que jugador 2 cree que

jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1

La ganancia esperada del jugador 1 será:

u₁(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

u₂(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

(55)

Cálculo de equilibrio de Nash

u₁(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

o sea, la ganancia u₁(p,q) es creciente en p si q > 2/3 y decreciente si q <2/3. Así, la mejor respuesta del jugador 1 es F1 si q > 2/3 y F2 si q <2/3.

u₂(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

o sea, la ganancia u₂(p,q) es creciente en q si p < 1/2 y decreciente p > 1/2. Así, la mejor respuesta del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2.

(56)

Cálculo de equilibrio de Nash

Las mejores

respuestas se

puede representar

gráficamente.

C1 C2 F1 2,2 3,4 F2 1,3 5,1

La estrategia del jugador 1 es

F1 si q > 2/3 y F2 si q <2/3. F1 o F2 (cualquiera estrategia) si q =2/3 q 2/3 p 1

(57)

Cálculo de equilibrio de Nash

Las mejores

respuestas se

puede representar

gráficamente

C1 C2 F1 2,2 3,4 F2 1,3 5,1 q 1/2 p 1

C1 si p < 1/2 , C2 si p > 1/2 y C1 o C2 si p = 1/2.

(58)

Cálculo de equilibrio de Nash

Las mejores respuestas se

puede representar

gráficamente. En esta

representación a los

equilibrios de Nash les

corresponden las cruces de

las funciones de respuestas

C1 C2

F1 2,2 3,4

F2 1,3 5,1

F1 si q > 2/3 y F2 si q <2/3. F1 o F2 si q =2/3

C1 si p < 1/2 y C2 si p > 1/2. C1 o C2 si p = 1/2. q 2/3 1 _q 1/2 p 1 El punto (q, p) = (2/3, 1/2) es el equilibrio de Nash en estrategias mixtas

(59)

Cálculo de equilibrio de Nash

El razonamiento se podría

generalizar a este caso.

C1 C2

F1 a1,b1 a2,b2

F2 a3,b3 a4,b4

Calculamos utilidades esperadas para cada agente

Calculamos mejores respuestas para cada agente

Buscamos cruces de las funciones de respuesta

Pero para matrices 3x3 se empieza a complicar…

(60)

Test Equilibrio de Nash (para el caso

continuo)

Y si aprovechamos las condiciones de optimalidad

(Recuerda la asignatura de Métodos de Optimización)?

Sea G un juego en forma estratégica cuyos conjuntos de estrategias son los intervalos abiertos con las funciones de pago dos veces

diferenciables.

Supongamos que el perfil estratégico (

s

₁*

, …,

s

n*) satisface:

para cada jugador i, cada

s

₁* _{es el único punto estacionario de la función}

u

_i

(

s

₁*

_{, ... ,}

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

, si ∈Si . Si,

para cada i. Entonces (

s

₁*

, …,

s

n*) es el equilibrio de Nash del juego G.

0 )

,...,

(

* * 1

=

∂

i n i

s

u

0 )

,...,

(

2 * * 1 2

<

∂

i n i

s

u

(61)

Consideremos un juego en forma estratégica con tres jugadores 1,

2, 3.

Los conjuntos estratégicos son

S

₁

=S

₂

=S

₃

=[0, +

_∞

]

.

Sus funciones de pago son:

Para encontrar el equilibrio de Nash debemos resolver el sistema

de ecuaciones:

Al calcular las derivadas obtendremos:

(62)

De manera que tenemos que resolver el sistema de ecuaciones:

Resolviéndola, obtendremos

x

=

y

=

z

=1.

Al calcular las segundas derivadas obtendremos:

Para cualquiera elección

x

,

y

,

z

> 0.

Entonces, (1, 1, 1) es el equilibrio de Nash (único).

Ejemplo Test Equilibrio de Nash

(63)

Ejemplo Test equilibrio de Nash

u₁(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

u₂(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

El punto estacionario de la derivada primera de u1 es 2/3 El punto estacionario de la derivada segunda de u2 es ½ Y comprobáis que es equilibrio de Nash

(64)

Aplicad el test introducido para calcular el

equilibrio de Nash en el ejemplo de la

transparencia 46. Podéis hacerlo por

parejas.

Envíanos la solución por email (puedes

hacerlo a mano y escanearlo) antes del

día 23 de Febrero a las 18.00 hora de

Madrid.

Ejemplo Test Equilibrio de Nash

(65)

Aplicación Política

Puedes saltar esta sección, aunque es muy interesante. Ponemos uno de

los ejemplos de uso político del concepto de equilibrio de Nash: El

teorema del votante de la mediana. Viene a explicar por qué

el

centro político es tan codiciado en unas elecciones.

Para más información véase

(66)

Aplicación: Por qué

el centro político es

tan codiciado

Supongamos que

las preferencias de los votantes se distribuyen uniformemnte en una sola dimensión, a lo largo del espectro ideológico de izquierda (0) a derecha (1).

Hay dos candidatos

Cada votante vota al candidato que esté más cercano a su posición ideológica

Bajo estas condiciones, predeciremos la posición ideológica de los

candidatos…

Podemos ver la situación como un juego estratégico entre dos

jugadores – los candidatos

El conjunto de las estrategias de cada jugador es [0, 1]

Las función de pago para cada jugador es la parte del electorado que le vota.

(67)

Aplicación: Por qué

el centro político es

tan codiciado

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + = < + − = . si 2 si 5 . 0 si 2 1 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 2 a a a a a a a a a a a a u

Las funciones de pago de los jugadores son las siguientes:

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + − = < + = . si 2 1 si 5 . 0 si 2 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 1 a a a a a a a a a a a a u En efecto,

Consideremos el perfil estratégico (a₁, a₂), con a₁ < a₂

Las ideologías más cercanas a a₁ que a₂se representan con el

intervalo [0, (a₁+a₂)/2]. Eso quiere decir que (a₁+a₂)/2 -ecima parte del electorado votará por el candidato 1.

Análogamente, [ (a₁+a₂)/2, 1] representa las ideologías más cercanos

al a₂que al a₁. Asimismo, 1 - (a₁+a₂)/2 -ecima parte votará por el candidato 2.

(68)

Aplicación: Por qué

el centro político es

tan codiciado

El teorema del votante de la mediana dice:

Se puede mostrar que el único equilibrio de Nash de este juego

es (1/2, 1/2).

De manera que, en las condiciones mencionadas, cada candidato

intenta atraer al votante que está en el centro de la distribución del espectro ideológico.

El resultado se debe a Anthony Downs

(69)

Aplicación: Duopolio de Cournot

Puedes saltar esta parte, aunque es interesante.

Explicamos una importante aplicación económica del

concepto de equilibrio de Nash

Cournot introdujo este ejemplo de mercado en 1838 y

descubrió

su equilibrio, muchos años antes que Nash

introdujese su concepto.

Es un modelo fundamentl

en teoría de la organización

industrial

Mira sobre el modelo del duopolio de Cournot en Wikipedia

(70)

Aplicación: Duopolio de Cournot

Dos empresas producen un mismo producto y compiten

por un mercado. Sean

q₁ y q ₂las cantidades producidas,

P(Q) = a – Q es el precio del producto, donde Q = q₁ +

q _2.

ciq_i el coste de producción por la empresa i, suponemos que ci < a.

Las empresas eligen sus producciones de forma

simultánea.

Cuánto debe producir cada empresa para maximizar

beneficio

(71)

Aplicación: Duopolio de Cournot

Traducimos el problema a un juego en forma normal:

Dos jugadores – dos empresas

Espacio de estrategias: S_i = [0,∞) (el producto es continuamente divisible)

Las ganancias de las empresas son:

u_i(q _i, q _j) = q _i(P(q _i + q _j) – ci)= q _i(a - (q _i + q _j) – ci)

El par de estrategias (

s

₁

*,

s

₂

*) forma un equilibrio de

Nash si,

para cada jugador

u_i (s_i*, s_j*) ≥ u_i (s_i, s_j*) para cada posible estrategia s_ide S_i.

para cada jugador s*_ies una solución del problema max u_i (s_i, s_j) (*) s.a. s_i ∈S_i

(72)

Aplicación: Duopolio de Cournot

La condición de primer orden del problema (*) es

necesaria y suficiente ,con lo que se obtiene:

q

₁

* = 1/2(a-

q

₂

* -

c1

)

Y

q

₂

* = 1/2(a-

q

₁

* -

c2

)

de donde obtenemos:

q

₁

* = (a+c2-2c1)/3

q

₂

* = (a +c1-2c2)/3

(73)

Críticas

Indudablemente, el concepto de equilibrio de Nash es muy importante, ha

conllevado importantes aplicaciones políticas, económicas, biológicas,…. pero tiene sus críticas

Hipótesis de conocimiento común: la hemos formulado aquí. Equilibrios múltiples

A veces hay más de un equilibrio y puede ser difícil elegir entre ellos. Dilemas sociales

El dilema de prisionero tiene muchas “implicaciones prácticas” donde los

jugadores acaban con unas estrategias socialmente ineficientes.

No ‘sirven’ para dar consejo a una de las partes

En algunos juegos sería útil comunicarse antes de empezar el juego; en

otros no, para no estar amenazado; en algunos juegos mejor esperar al otro jugador para que sea el primero, en otros mejor dar el primer paso… En general, sirven más bien para hacer una predicción del juego,

(74)

Análisis asimétrico presc/desc

Izda. Dcha. Arriba 4,-100 10,6

Debajo 12,8 5,4

Este juego es “casi como” el juego de

la transparencia “Equilibrio”,

pero en este juego el jugador de las

columnas (J2) arriesga “ganar” -100.

Por eso, J2 podrá pensar elegir “Dcha”

para protegerse

J1 podrá intuir lo que piensa J2 y

elegir “Arriba”…

pero, ¿Hay alguna posibilidad de

cuantificar las dudas de los jugadores?

(75)

Análisis asimétrico presc/desc

Izda. Dcha. Arriba 4,-100 10,6

Debajo 12,8 5,4

Consideremos el problema del jugador J2

desde el punto de vista del análisis de decisiones

Supongamos que J1 elige

“Arriba” con una probabilidad p, y “Debajo” con 1-p.

Entonces, la utilidad esperada del J2 es -100p + 8(1-p) = 8 – 108p para “Izda.” y 6p + 4(1-p) = 4 – 2p para “Dcha.”

Así que, la probabilidad de equilibrio se encuentra al resolver la ecuación

8 – 108p = 4 – 2p, o p = 0.036.

Así que J2 debe elegir “Dcha.” si el piensa que la probabilidad de que J1 elija “Arriba”

es más que 0.036

Un análisis similar se puede efectuar para J1

J1 debe elegir “Abajo” si el piensa que la probabilidad de que J2 elija “Dcha.” es más