• No se han encontrado resultados

MASTER EN INGENIERÍA DE LA DECISIÓN

N/A
N/A
Protected

Academic year: 2021

Share "MASTER EN INGENIERÍA DE LA DECISIÓN"

Copied!
77
0
0

Texto completo

(1)

MASTER EN INGENIERÍA DE LA

DECISIÓN

ANÁLISIS DE NEGOCIACIONES.

2 CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS (NO COOPERATIVOS)

EQUILIBRIOS DE NASH

(2)

Objetivo

En esta sesión introducimos los dos

conceptos básicos de la teoría de juegos no

cooperativos:

„

dominacia (tal vez iterada),

„

equilibrio de Nash

Tiempo esperado: 4 horas (incluida la

actividad).

(3)

Plan

El plan para esta sesión es el siguiente

„

Descripción básica de juegos

„

Conceptos de dominancia

„

Concepto de equilibrio de Nash no cooperativo

„

Cálculo de equilibrios de Nash

(4)

Contexto básico

El tipo de problemas que consideramos tienen estos rasgos:

„

Hay varios decisores

„

El pago que recibe cada decisor depende no sólo de su decisión,

sino también de las de los demás

„

Puede tener lugar tanto en situación de conflicto como de

cooperación

„

Los participantes o decisores se denominan

jugadores

„

Los pagos a los jugadores en función de sus acciones se

denominan

las funciones de pagos

Un

juego

es un conjunto de reglas conocidas por los

jugadores que determinan qué

pueden hacer y las

consecuencias y los pagos asociados a sus decisiones

(5)

Posibilidades

Hay varios tipos de juegos en función de:

„

Número de jugadores: 2, 3, …, n,…

„

Número de estrategias disponibles: Finitas,

Infinitas

„

Función de pagos: Juegos de suma nula,

(Juegos bipersonales de suma nula), Juegos de

diferencia constante. Juegos de suma no nula

„

Situación previa al juego: Cooperativos, no

cooperativos

(6)

Ejemplos. Posibilidades.

„

El conocido juego Piedra-papel-tijera es un ejemplo de

„

Juego bipersonal

„

Juego de suma nula (si uno gana el otro pierde)

„

Finito (cada uno tiene 3 alternativas para elegir: piedra, papel,

o tijera)

(7)

Ejemplos. Posibilidades.

„

Partir una herencia de 500000 pesos en tres partes (x,

y, 500000-x-y) con x, y entre 0 y 500000, y x+y menor

que 500000

„

Es un juego tripersonal

„

Es un juego de suma constante

„

Con un número de estrategias infinito

„

Es un juego no cooperativo, si no se permite la comunicación.

(8)

Conceptos básicos de Teoría de Juegos

Vamos a introducir brevemente los

conceptos de la Teoría de Juegos. Para

ello:

„

Juntaos por parejas!!!!

„

Presentamos varias situaciones que nos

ayudarán a introducir algunos conceptos

básicos…

(9)

Conceptos básicos de Teoría de Juegos

Las reglas serán:

„

Tienes que actuar

„

Tus consecuencias dependen de lo que

hagas tú y los demás

„

No sabes lo que harán, pero sabes lo que

podrían hacer

(10)

Reglas básicas

Dos jugadores, dos alternativas

Estrategias fijas

Información perfecta

Selección simultánea, salvo que se indique lo contrario

(11)

Matriz del juego

Izda. Dcha. Arriba A,I A,D

Debajo D,I D,D

„ La forma normal de un juego es una matriz

que muestra

„ los jugadores, „ las estrategias,

„ y las recompensas (ver el ejemplo a la

derecha).

„ Hay dos jugadores:

„ uno elige la fila „ y otro la columna.

„ En el ejemplo, cada jugador tiene dos

estrategias:

„ las estrategias del jugador 1 (o sea, el jugador

de las filas) se denominan “Arriba” y “Debajo”,

„ las del jugador 2 (o sea, el jugador de las

(12)

Matriz del juego

Izda. Dcha.

Arriba 3,2 1,5

Debajo 4,7 3,1

„ Las recompensas se especifican en el interior:

„ el primer número es la recompensa recibida por

el jugador 1 (fila);

„ el segundo es la recompensa del jugador 2.

(columna)

„ Por ejemplo, si el jugador 1 elige “arriba” y el

jugador 2 elige “izda.” entonces sus recompensas son 3 y 2, respectivamente.

„ Cuando un juego se presenta en forma normal,

se presupone que todos los jugadores actúan simultáneamente, o sea, sin saber la elección que toma el otro.

(13)

Matriz del juego: suma nula

Izda. Dcha.

Arriba 3,-3 -2,2

Debajo -4,4 1,-1 „

En los juegos de

suma nula

el

beneficio total para todos los

jugadores del juego, en cada

combinación de estrategias,

siempre suma cero (en otras

palabras, un jugador se

beneficia solamente a expensas

del otro).

(14)

Matriz del juego: suma nula

Izda. Dcha.

Arriba 3 -2

Debajo -4 1

„

El juego del ejemplo anterior tiene

información redundante (siendo de

suma nula). Puede simplificarse y

transformarse en esta otra que

representa tan solo las ganancias

del jugador 1, teniendo en cuenta

que las ganancias del opositor son

cantidades opuestas.

(15)

Ejemplo. Juego suma nula.

Piedra

Papel

Tijera

Piedra

0

-1

1

Papel

1

0

-1

Tijera

-1

1

0

Tenéis aquí

representado el juego de

Piedra-papel-tijera en forma normal.

(

Lee el material adicional de la Wikipedia

)

(16)

Considera este juego…

Izda. Dcha. Arriba 4,5 10,-6

Debajo 12,7 5,9

„ Piensa que harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

„ ¿Y si fueras el jugador de columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

(17)

Indeterminación

Izda. Dcha. Arriba 4,5 10,-6

Debajo 12,7 5,9

„Denominemos

„ J1 al Jugador de las filas (J1) y „ J2 al Jugador de las columnas.

Podría ocurrir la siguiente situación…

„J1 ha elegido “Debajo”, porque ha pensado que

„ J2 elegirá “Izda.” para evitar la posibilidad de “ganar” -6.

„Supongamos que J2 ha elegido “Dcha.”, porque ha pensado que

„ J1 ha pensado que J2 elegiría “Izda.” y, por eso,

„ J1 elegirá “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2

será “Dcha”, pues gana 9.

„Pero podría ocurrir que J1 pensase que J2 elíjese “Dcha”, porque

„ J2 habría pensado que J1 habría pensado que „ J2 elegiría “Izda.” y, por eso,

„ J1 elegiría “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2 será

(18)

Indeterminación

„ El problema es que:

„ “Debajo” (para J1) es la mejor respuesta contra

“Izda” (de J2)

„ “Izda” es la mejor respuesta contra “Arriba” „ “Arriba” es la mejor respuesta contra “Dcha.” „ “Dcha.” es la mejor respuesta contra “Debajo”

Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…

Izda. Dcha. Arriba 4,5 10,-6

Debajo 12,7 5,9

Para algunos juegos no existen prescripciones simples...

Esto es, necesitamos suponer no sólo que los jugadores son racionales, sino también que todos los jugadores saben que todos los jugadores son racionales, y que todos los jugadores saben que todos los jugadores saben que todos los jugadores son

racionales, y así ad infinitum…

Este juego tal y como está formulado queda indeterminado… lo podremos resolver más adelante

(19)

Indeterminación

„ El problema es que:

„ “Debajo” (para J1) es la mejor respuesta contra

“Izda” (de J2)

„ “Izda” es la mejor respuesta contra “Arriba” „ “Arriba” es la mejor respuesta contra “Dcha.” „ “Dcha.” es la mejor respuesta contra “Debajo”

Conclusión: Ninguna estrategia simple y fija es mejor que otra… Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada…

Izda. Dcha. Arriba 4,5 10,-6

Debajo 12,7 5,9

¿por qué no simplemente suponer que todos los jugadores saben que todos los jugadores son racionales? Cuando un jugador conoce las reglas no emprende o

asume algunos comportamientos. Sin embargo, si ese mismo jugador no está seguro de que los demás jugadores saben que él conoce las reglas, no estará seguro de que los demás jugadores sepan que él no emprenderá ni asumirá dichas

comportamientos. Este tipo de incertidumbre genera dudas en la mente de los

jugadores y modifica dramáticamente lo que cada uno termina por hacer. De aquí la

importancia de suponer información de dominio público en todos los niveles (ad

(20)

Considera este juego…

„ Piensa que harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

„ ¿Y si fueras el jugador de columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

Izda. Dcha.

Arriba 4,3 3,0

(21)

Dominancia

Izda. Dcha.

Arriba 4,3 3,0

Debajo 12,8 5,4

„ Para el jugador 1 la estrategia “Debajo” domina

la “Arriba” (tachada) porque 12 > 4 y 5 > 3.

„Para el jugador 2 la “Izda.” domina “Dcha.”

(tachada) porque 3 > 0 y 8 > 4.

„La única celda no tachada es la que corresponde a

las estrategias “Debajo” y “Izda.” Entonces, las recompensas de los jugadores son 12 y 8

respectivamente.

„ Una estrategia domina estrictamente a otra cuando es mejor elección

independiente de la elección del otro jugador.

„ Un jugador siempre elige estrategia no dominada y tacha las

(22)

Considera este juego…

„ Piensa que harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

„ ¿Y si fueras el jugador de columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

(23)

Dominancia iterada

Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

„

Cada jugador predice que el otro seguirá

estrategias no dominadas

„ Es fácil comprobar que el jugador de las filas

no tiene estrategia no dominada

„ La estrategia dominante del jugador de las

(24)

Dominancia iterada

Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

„

Cada jugador predice que el otro seguirá

estrategias no dominadas

„ Es fácil comprobar que el jugador de las filas

no tiene estrategia no dominada

„ La estrategia dominante del jugador de las

columnas es “Dcha.”

„ Sin embargo, el jugador de las filas elegirá

“Arriba” ya que el sabe que “Dcha.” es la estrategia dominante del jugador de las columnas, y así maximizará su ganancia

(25)

Considera este juego…

„ Piensa qué harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

„ ¿Y si fueras el jugador de columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

Izda. Dcha.

Arriba 4,3 10,6

(26)

Equilibrio

Izda. Dcha.

Arriba 4,3 10,6

Debajo 12,8 5,4 „

En este ejemplo ninguno de los dos

jugadores tiene una estrategia dominante:

„ Si el jugador 1 uno elige “Arriba” es conveniente al 2 eligir “Dcha.” y viceversa: si el 2 elige “Dcha.” el 1 tiene que eligir “Arriba”.

„ Si el 1 elige “Debajo” el 2 tiene que eligir “Izda.” y viceversa.

„ Asimismo, “Debajo”- “Izda.” y “Arriba”-”Dcha.” son aquellas combinaciones de

estrategias en las cuales ningún jugador pueda mejorar cambiando de estrategia, supuesto que el otro jugador elija su estrategia.

„ Por tanto, es probable que elijan los jugadores las combinaciones de estrategias. „ Estas estrategias se llaman equilibrios (de Nash, no cooperativos).

(27)

Considera este juego…

„ Hasta ahora hemos analizado los juegos bajo la

condición de que ambos jugadores tomen sus decisiones simultáneamente.

„ Ahora supongamos que uno de los dos

elige primero.

„Piensa qué harías si fueras el jugador

de las filas. ¿Que estrategia elegirías?

„ ¿Y si fueras el jugador de columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

Izda. Dcha. Arriba 0,0 1,2

(28)

La ventaja de elegir primero

„

Hay dos equilibrios: {Arriba, Dcha.} y

{Debajo, Izda.}.

„

Cada jugador prefiere uno de estos

equilibrios:

„ El jugador de las filas prefiere “Debajo” y „ El jugador de las columnas – “Dcha.”

„

El jugador que elige el segundo no tiene

otra elección salvo acceder a la elección

del jugador que ha elegido el primero…

Izda. Dcha. Arriba 0,0 1,2

(29)

Considera este juego…

„ Piensa qué harías si fueras el jugador

por filas. ¿Qué estrategia elegirías?

„ ¿Y si fueras el jugador por columnas? „ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra interpretación…

Izda. Dcha.

Arriba 5,5 -5,10

(30)

Los peligros de la racionalidad

Izda. Dcha.

Arriba 5,5 -5,10

Debajo 10,-5 -2,-2

En este ejemplo,

„

1, como jugador racional, tachará la

estrategia “Arriba” como dominada

„

2 tachará como dominada la estrategia

“Izda.”

„

Los jugadores acabarán con una solución

ineficiente

, pues (5, 5) es mejor que (-2, -2)…

„

Es este un ejemplo del dilema del prisionero

(31)

El dilema del prisionero

„ Dos delincuentes son detenidos y

encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.

„ El alguacil sospecha que han participado en

el robo del banco, delito cuya pena es 10 años de cárcel, pero no tiene pruebas.

„ Sólo tiene pruebas y puede culparles de un

delito menor, tenencia ilícita de armas, cuyo castigo es de 2 años de cárcel.

„ Promete a cada uno de ellos que reducirá su

condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco... No Conf Conf No Conf 2,2 10,0 Conf 0,10 5,5

Mira a la derecha la tabla de decisión con el dilema que se le plantea a cada uno de los prisioneros que, ahora, quieren minimizar la

(32)

El dilema del prisionero

„

Como en el ejemplo

anterior el juego resulta en

una decisión

socialmente

ineficiente,

pues a los

delincuentes les conviene

confesar. Cada uno busca

su bien de forma egoísta,

lo que les lleva a una mala

decisión social. Caen en

una trampa (una trampa

social o dilema social)

No

Conf Conf

No

Conf 2,2 10,0

(33)

Dilemas sociales en contexto de riesgos

adversarios

B invierte en

seguridad IT B no invierte en seguridad Compañía A invierte en seguridad IT Ambos incurren en costes Bajo riesgo A incurre en costes Riesgo relativamente alto A no invierte en seguridad B incurre en costes Riesgo relativament e alto Equilibrio: A,B evitan costes Riesgo alto

„ Considerad un contexto en el que hay dos

compañías interconectadas que deben decidir si invierten o no en seguridad IT. La situación queda descrita

cualitativamente en la tabla adjunta. A escala global, las compañías prefieren no cooperar en las cuestiones de la

seguridad jugando sus estrategias

egoístas. Es otro ejemplo de dilema del prisionero.

(34)

La carrera de armamento (60-80)

Considerad la relación que se formó entre la ex-URSS y EE.UU. en los años 60:

„ Cada país puede optar por continuar

armándose o reducir su armamento

„ Ambos países se dan cuenta de que

las dificultades económicas

producidas por la carrera hacen más deseable el desarme conjunto a la carrera

„ Ambos países preferirían su

superioridad militar a su paridad militar… ordenando las cuatro

situaciones posibles (1 peor, 4 mejor)

URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar

2. Carrera (igualdad, con penurias) 3. Desarme mutuo

(35)

La carrera de armamento (60-80)

URSS Desarmar Armar EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar

2. Carrera (igualdad, con penurias) 3. Desarme mutuo

4. Superioridad militar

De nuevo, el comportamiento racional egoísta llevará a la decisión (armar, Armar) ie la carrera de armamento

(36)

Formalización de conceptos

Formalizamos ahora los conceptos anteriores suponiendo

que hay

n

jugadores en el juego:

„

Espacio de alternativas para cada jugador:

Si – el conjunto de estrategias con que cuenta el jugador i, donde i ∈{1,…, n} y n es el número de los jugadores „

Alternativas para cada jugador

Sea si ∈ Si una estrategia arbitraria del espacio de estrategias del jugador i

„

Evaluación para cada jugador

Sea (s1,…, si ,…, sn) una combinación de estrategias, y sea

ui la función de ganancias para el jugador i :

ui (s1,…, si ,…, sn) es la ganancia del jugador i si los jugadores eligen las alternativas (s1,…, si ,…, sn)

(37)

Formalización de conceptos

„

Juego en forma normal

: La representación en

forma normal de un juego con

n

jugadores especifica

los espacios de estrategias de los jugadores

S

1

, ... ,

S

n

y sus funciones de ganancias

u

1

, . . . ,

u

n

.

„

Denotamos este juego mediante

G

= {

S

1

, ... ,

S

n

;

u

1

,…

,

u

n

}.

(38)

Ejemplo de juego en forma normal

„

Consideremos el juego de la transparencia 12.

„

Hay 2 jugadores (F y C)

„

Los espacios de estrategias son

S

f

={A,D}, S

c

={I,D}

„

Las funciones de pago son

u

f

(A,I)=3, u

f

(A,D)=1,u

f

(D,I)=4, u

f

(D,D)=3

(39)

Ejemplo de juego en forma normal

„

Consideremos un juego en forma normal con tres

jugadores 1, 2, 3. Sus conjuntos estratégicos son

S

1

=S

2

=S

3

=[0, 1].

„

Sus funciones de pago son:

u

1

(x,y,z)=x+y-z, u

2

(x,y,z)=x-yz,

and

u

3

(x,y,z)=xy-z,

donde para simplificar

s

1

=

x

,

s

2

=

y

,

s

3

=

z.

„

Si los jugadores anuncian las estrategias

x

= ½,

y

(40)

Formalización. Estrategia no dominada

„

Solución no dominada:

En el juego en forma normal, sean

s

i

’ y

s

i

’’

posibles estrategias del jugador

i

. La estrategia

s

i

’ está

dominada

por la estrategia

s

i

’’

si para cada combinación

(

s

1

, ... ,

s

i -1

,

s

i +1

, ... ,

s

n

) que puede ser construida a partir de

los espacios de estrategias de los otros jugadores

S

1

, ... ,

S

i -1

,

S

i +1

, ... ,

S

n

,

la ganancia de

i

por utilizar

s

i

es estrictamente

menor que la ganancia de

i

por utilizar

s

i

’’

:

u

i

(

s

1

, ... ,

s

i -1

,

s

i

’,

s

i +1

, ... ,

s

n

) <

u

i

(

s

1

, ... ,

s

i -1

,

s

i

’’,

s

i +1

, ... ,

s

n

)

„

Los jugadores racionales no utilizan estrategias estrictamente

dominadas, debiendo centrarse en las estrategias no

dominadas.

(41)

Formalización. Equilibrio de Nash

„

Equilibrio de Nash:

En el juego en forma normal de

n

jugadores las estrategias

s

1*

, …,

s

n*

forman un equilibrio de Nash si, para cada jugador

i

,

s

i*

es la mejor

respuesta del jugador

i

(o al menos una de ellas) a las estrategias de los

otros

n

-

1 jugadores, (

s

1*

, ... ,

s

i*-1

,

s

i*+1

, ... ,

s

n*

):

u

i

(

s

1*

, ... ,

s

i*-1

,

s

i*

,

s

i*+1

, ... ,

s

n*

)

u

i

(

s

1*

, ... ,

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

para cada posible estrategia

s

i

S

i

; esto es, si es una solución de

max

u

i

(

s

1*

, ... ,

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

s.a.

s

i

S

i

(42)

Función de mejor respuesta

Un concepto clave aquí

es el de mejor respuesta: Supuesto que conozco

las decisiones tomadas por las otras partes, cuál es mi mejor alternativa,

mi mejor respuesta?

La correspondiente función se denomina función de respuesta

Un equilibrio de Nash se corresponde al cruce de funciones de respuesta:

Una estrategia es un equilibrio si para cada jugador, toda estrategia en el

soporte del equilibrio es una mejor respuesta a la estrategia

(43)

Función de mejor respuesta

„

Para buscar los equilibrios de Nash

en juegos de forma normal se usan

las funciones de mejores

respuestas, construidas para cada

jugador. Hazlo antes de pasar

C1 C2 C3

F1 1,4 2,2 2,3

F2 3,1 1,5 4,1

F3 2,0 3,4 1,2

„ Considerad el ejemplo adjunto

„ Observad que ninguna estrategia de

ninguno de los jugadores es dominada

„ Calculad las mejores respuestas del

jugador de filas y del jugador de

columnas, antes de pasar a la siguiente transparencia

(44)

Función de mejor respuesta

„

Para buscar los equilibrios de Nash

en juegos de forma normal se usan

las funciones de mejores

respuestas, construidas para cada

jugador.

„ Equilibrio de Nash. Otro

ejemplo

C1 C2 C3

F1 1,4 2,2 2,3

F2 3,1 1,5 4,1

F3 2,0 3,4 1,2

„ Observad que ninguna estrategia de

ninguno de los jugadores es dominada

„ Denotamos la función de mejor respuesta

del jugador 1 cuando el jugador 2 elige Ci como r1(Ci), de manera que

„ F2 = r 1(C1) „ F3 = r 1(C2) „ F2 = r 1(C3)

„ (las mejores respuestas del J1 marcamos

con ×)

×

×

(45)

Función de mejor respuesta

„ Equilibrio de Nash. Otro

ejemplo C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2 × × × ×

„ Análógamente, construimos la función de

mejor respuesta del jugador 2:

„ C1 = r 2(F1) „ C2 = r 2(F2) „ C2 = r 2(F3)

„ (las mejores respuestas del J2 marcamos

con ×)

„ Vemos que F3 = r 1(C2) y C2 = r 2(F3), es

decir (F3, C2) es el equilibrio de Nash. No hay otras celdas con dos cruces ⇒ no hay más equilibrios…

× ×

(46)

Función de mejor respuesta

„ Equilibrio de Nash

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

Considerad ahora este ejemplo. Calculad el equilibrio de Nash y las funciones de mejor respuesta

(47)

Función de mejor respuesta

„ Equilibrio de Nash

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

Consideramos otro ejemplo

„ Aquí, como en el ejemplo anterior las

mejores respuestas

„ del jugador “filas” marcamos con ×, „ y las del jugador “columnas” - con ×

„ No existe celda que contenga dos cruces,

así que no existe el equilibrio de Nash en

estrategias puras…

×

×

×

(48)

Estrategia pura, estrategia mixta

Hasta ahora nos hemos fijado sólo en estrategias puras: I, D, A, D,…. Pero es concebible (y en cierta forma necesario) considerar estrategias mixtas que son distribuciones de probabilidad sobre las estrategias puras. Por ejemplo, el jugador por filas podría considerar una estrategia mixta que fuese (2/3, 1/3) que se interpreta como: Juego A con probabilidad 2/3 y Juego D con probabilidad 1/3.

En particular la estrategia (1,0) del jugador por filas (Juego A con

probabilidad 1, Juego D con probabilidad 0) coincide con la estrategia A: Las estrategias puras son casos particulares de las estrategias mixtas

(49)

Estrategia pura, estrategia mixta

„

C1 C2

F1 -1,1 1,-1

F2 1,-1 -1,1

A partir de la matriz de pagos, construimos los pagos de las

estrategias mixtas, como ilustramos en el ejemplo último. Consideramos las estrategias mixtas (p,1-p) para el jugador por filas y (q,1-q) para el

jugador por columnas. ×

×

×

×

Lo ilustramos para el jugador por filas:

•Con probabilidad p juega F1 y espera ganar ( q * (-1))+((1-q) *1)

•Con probabilidad (1-p) juega F2 y espera ganar (q* 1)+ ((1-q) * (-1)) En total espera ganar p*(1-2q)+(1-p)*(2q-1)=2p+2q-4pq-1

(50)

Formalización de conceptos

„ Derivemos de forma más general la mejor respuesta del jugador i a la

estrategia mixta del jugador j.

„ Sea J el número de estrategias puras en S1 y K el número de estrategias puras

en S2

„ Escribimos S1= { s11, ... ,s1J} y S2 = { s21, ... ,s2K}, y utilizamos s1j y s2k para

denotar las estrategias puras s de S1 y S2 respectivamente.

„ Si el jugador 1 cree que el jugador 2 utilizará las estrategias (s21, ... ,s2K) con

probabilidades p2 = (p21, ... ,p2K), la ganancia esperada del jugador 1 por utilizar la estrategia mixta p1 = (p11, ... ,p1J) es

donde p1j p2k es la probabilidad de que 1 utilice s1j y 2 utilice s2k.

„ Para que la estrategia mixta (p11, ... ,p1J) sea mejor respuesta del jugador 1 a la

(51)

Formalización de conceptos

„

Hacemos el mismo análisis para el jugador 2, cuya ganancia

esperada por utilizar la estrategia

mixta (p21, ... ,p2K)

cuando el

cree que el jugador 1 utilizará la estratégia mixta

(p11, ... ,p1J), es

„

Para que el par de estrategias mixtas

(p

1*

,p

2*

)

forme un

equilibrio de Nash

,

p

1*

debe cumplir

para cada distribución de probabilidad

p

1

sobre

S

1

,

y

p

2

debe

cumplir

para cada distribución de probabilidad

p

2

sobre

S

2.

(1)

(52)

Formalización de conceptos. Resultados

„

En un juego en forma normal de con

n

jugadores

G ={

S

1

, ... ,

S

n

;

u

1

, ... ,

u

n

}, si

n

es un número finito y

S

i

es finito para cada

i

, existe al menos un equilibrio de

Nash, que posiblemente incluye estrategias mixtas.

(53)

Cálculo de equilibrio de Nash

„

Supongamos que jugador

1 cree que jugador 2

elegirá C1 con

probabilidad

q

y C2 con

probabilidad 1-

q.

„

y que jugador 2 cree que

jugador 1 elegirá F1 con

probabilidad

p

y F2 con

probabilidad 1-

p.

C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1 Ilustramos los cálculos

Con el siguiente ejemplo

(54)

Cálculo de equilibrio de Nash

„ Supongamos que jugador 1

cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.

„ y que jugador 2 cree que

jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1

„ La ganancia esperada del jugador 1 será:

„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

„ La ganancia esperada del jugador 1 será:

„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

(55)

Cálculo de equilibrio de Nash

„ Supongamos que jugador 1

cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.

„ y que jugador 2 cree que

jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1

„ La ganancia esperada del jugador 1 será:

„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

„ o sea, la ganancia u1(p,q) es creciente en p si q > 2/3 y decreciente si q <2/3. „ Así, la mejor respuesta del jugador 1 es F1 si q > 2/3 y F2 si q <2/3.

„ La ganancia esperada del jugador 1 será:

„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

„ o sea, la ganancia u2(p,q) es creciente en q si p < 1/2 y decreciente p > 1/2. „ Así, la mejor respuesta del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2.

(56)

Cálculo de equilibrio de Nash

„

Las mejores

respuestas se

puede representar

gráficamente.

C1 C2 F1 2,2 3,4 F2 1,3 5,1

„ La estrategia del jugador 1 es

„ F1 si q > 2/3 y „ F2 si q <2/3. „ F1 o F2 (cualquiera estrategia) si q =2/3 q 2/3 p 1

(57)

Cálculo de equilibrio de Nash

„

Las mejores

respuestas se

puede representar

gráficamente

C1 C2 F1 2,2 3,4 F2 1,3 5,1 q 1/2 p 1

„ La estrategia del jugador 2 es

„ C1 si p < 1/2 , „ C2 si p > 1/2 y „ C1 o C2 si p = 1/2.

(58)

Cálculo de equilibrio de Nash

„

Las mejores respuestas se

puede representar

gráficamente. En esta

representación a los

equilibrios de Nash les

corresponden las cruces de

las funciones de respuestas

C1 C2

F1 2,2 3,4

F2 1,3 5,1

„ La estrategia del jugador 1 es

„ F1 si q > 2/3 y „ F2 si q <2/3. „ F1 o F2 si q =2/3

„ La estrategia del jugador 2 es

„ C1 si p < 1/2 y „ C2 si p > 1/2. „ C1 o C2 si p = 1/2. q 2/3 1 q 1/2 p 1 „ El punto (q, p) = (2/3, 1/2) es el equilibrio de Nash en estrategias mixtas

(59)

Cálculo de equilibrio de Nash

„

El razonamiento se podría

generalizar a este caso.

C1 C2

F1 a1,b1 a2,b2

F2 a3,b3 a4,b4

„

Calculamos utilidades esperadas para cada agente

„

Calculamos mejores respuestas para cada agente

„

Buscamos cruces de las funciones de respuesta

„

Pero para matrices 3x3 se empieza a complicar…

(60)

Test Equilibrio de Nash (para el caso

continuo)

Y si aprovechamos las condiciones de optimalidad

(Recuerda la asignatura de Métodos de Optimización)?

Sea G un juego en forma estratégica cuyos conjuntos de estrategias son los intervalos abiertos con las funciones de pago dos veces

diferenciables.

Supongamos que el perfil estratégico (

s

1*

, …,

s

n*) satisface:

para cada jugador i, cada

s

1* es el único punto estacionario de la función

u

i

(

s

1*

, ... ,

s

i*-1

,

s

i

,

s

i*+1

, ... ,

s

n*

)

, si ∈Si . Si,

para cada i. Entonces (

s

1*

, …,

s

n*) es el equilibrio de Nash del juego G.

0

)

,...,

(

* * 1

=

i n i

s

s

s

u

0

)

,...,

(

2 * * 1 2

<

i n i

s

s

s

u

(61)

„

Consideremos un juego en forma estratégica con tres jugadores 1,

2, 3.

„

Los conjuntos estratégicos son

S

1

=S

2

=S

3

=[0, +

]

.

„

Sus funciones de pago son:

„

Para encontrar el equilibrio de Nash debemos resolver el sistema

de ecuaciones:

„

Al calcular las derivadas obtendremos:

(62)

„

De manera que tenemos que resolver el sistema de ecuaciones:

„

Resolviéndola, obtendremos

x

=

y

=

z

=1.

„

Al calcular las segundas derivadas obtendremos:

„

Para cualquiera elección

x

,

y

,

z

> 0.

„

Entonces, (1, 1, 1) es el equilibrio de Nash (único).

Ejemplo Test Equilibrio de Nash

Ejemplo Test Equilibrio de Nash

(63)

Ejemplo Test equilibrio de Nash

„ Supongamos que jugador 1

cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q.

„ y que jugador 2 cree que

jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 q C2 1-q F1 p 2,2 3,4 F2 1-p 1,3 5,1

„ La ganancia esperada del jugador 1 será:

„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),

„ La ganancia esperada del jugador 1 será:

„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

„ El punto estacionario de la derivada primera de u1 es 2/3 „ El punto estacionario de la derivada segunda de u2 es ½ „ Y comprobáis que es equilibrio de Nash

(64)

„

Aplicad el test introducido para calcular el

equilibrio de Nash en el ejemplo de la

transparencia 46. Podéis hacerlo por

parejas.

„

Envíanos la solución por email (puedes

hacerlo a mano y escanearlo) antes del

día 23 de Febrero a las 18.00 hora de

Madrid.

Ejemplo Test Equilibrio de Nash

Ejemplo Test Equilibrio de Nash

(65)

Aplicación Política

Puedes saltar esta sección, aunque es muy interesante. Ponemos uno de

los ejemplos de uso político del concepto de equilibrio de Nash: El

teorema del votante de la mediana. Viene a explicar por qué

el

centro político es tan codiciado en unas elecciones.

Para más información véase

(66)

Aplicación: Por qué

el centro político es

tan codiciado

„

Supongamos que

„ las preferencias de los votantes se distribuyen uniformemnte en una sola dimensión, a lo largo del espectro ideológico de izquierda (0) a derecha (1).

„ Hay dos candidatos

„ Cada votante vota al candidato que esté más cercano a su posición ideológica

„

Bajo estas condiciones, predeciremos la posición ideológica de los

candidatos…

„

Podemos ver la situación como un juego estratégico entre dos

jugadores – los candidatos

„ El conjunto de las estrategias de cada jugador es [0, 1]

„ Las función de pago para cada jugador es la parte del electorado que le vota.

(67)

Aplicación: Por qué

el centro político es

tan codiciado

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + = < + − = . si 2 si 5 . 0 si 2 1 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 2 a a a a a a a a a a a a u

„ Las funciones de pago de los jugadores son las siguientes:

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ > + − = < + = . si 2 1 si 5 . 0 si 2 ) , ( 2 1 2 1 2 1 2 1 2 1 2 1 1 a a a a a a a a a a a a u „ En efecto,

„ Consideremos el perfil estratégico (a1, a2), con a1 < a2

„ Las ideologías más cercanas a a1 que a2 se representan con el

intervalo [0, (a1+a2)/2]. Eso quiere decir que (a1+a2)/2 -ecima parte del electorado votará por el candidato 1.

„ Análogamente, [ (a1+a2)/2, 1] representa las ideologías más cercanos

al a2 que al a1. Asimismo, 1 - (a1+a2)/2 -ecima parte votará por el candidato 2.

(68)

Aplicación: Por qué

el centro político es

tan codiciado

El teorema del votante de la mediana dice:

„ Se puede mostrar que el único equilibrio de Nash de este juego

es (1/2, 1/2).

„ De manera que, en las condiciones mencionadas, cada candidato

intenta atraer al votante que está en el centro de la distribución del espectro ideológico.

El resultado se debe a Anthony Downs

(69)

Aplicación: Duopolio de Cournot

Puedes saltar esta parte, aunque es interesante.

Explicamos una importante aplicación económica del

concepto de equilibrio de Nash

Cournot introdujo este ejemplo de mercado en 1838 y

descubrió

su equilibrio, muchos años antes que Nash

introdujese su concepto.

Es un modelo fundamentl

en teoría de la organización

industrial

Mira sobre el modelo del duopolio de Cournot en Wikipedia

(70)

Aplicación: Duopolio de Cournot

Dos empresas producen un mismo producto y compiten

por un mercado. Sean

„ q1 y q 2 las cantidades producidas,

„ P(Q) = a – Q es el precio del producto, donde Q = q1 +

q 2.

„ ciqi el coste de producción por la empresa i, suponemos que ci < a.

Las empresas eligen sus producciones de forma

simultánea.

Cuánto debe producir cada empresa para maximizar

beneficio

(71)

Aplicación: Duopolio de Cournot

„

Traducimos el problema a un juego en forma normal:

„ Dos jugadores – dos empresas

„ Espacio de estrategias: Si = [0,∞) (el producto es continuamente divisible)

„ Las ganancias de las empresas son:

ui(q i, q j ) = q i (P(q i + q j ) – ci)= q i (a - (q i + q j ) – ci)

„

El par de estrategias (

s

1

*,

s

2

*) forma un equilibrio de

Nash si,

„ para cada jugador

ui (si*, sj*) ≥ ui (si , sj*) para cada posible estrategia si de Si .

„ para cada jugador s*i es una solución del problema max ui (si, sj) (*) s.a. si ∈Si

(72)

Aplicación: Duopolio de Cournot

„

La condición de primer orden del problema (*) es

necesaria y suficiente ,con lo que se obtiene:

q

1

* = 1/2(a-

q

2

* -

c1

)

Y

q

2

* = 1/2(a-

q

1

* -

c2

)

de donde obtenemos:

q

1

* = (a+c2-2c1)/3

q

2

* = (a +c1-2c2)/3

(73)

Críticas

Indudablemente, el concepto de equilibrio de Nash es muy importante, ha

conllevado importantes aplicaciones políticas, económicas, biológicas,…. pero tiene sus críticas

„ Hipótesis de conocimiento común: „ la hemos formulado aquí. „ Equilibrios múltiples

„ A veces hay más de un equilibrio y puede ser difícil elegir entre ellos. „ Dilemas sociales

„ El dilema de prisionero tiene muchas “implicaciones prácticas” donde los

jugadores acaban con unas estrategias socialmente ineficientes.

„ No ‘sirven’ para dar consejo a una de las partes

„ En algunos juegos sería útil comunicarse antes de empezar el juego; en

otros no, para no estar amenazado; en algunos juegos mejor esperar al otro jugador para que sea el primero, en otros mejor dar el primer paso… En general, sirven más bien para hacer una predicción del juego,

(74)

Análisis asimétrico presc/desc

Izda. Dcha. Arriba 4,-100 10,6

Debajo 12,8 5,4

„ Este juego es “casi como” el juego de

la transparencia “Equilibrio”,

„ pero en este juego el jugador de las

columnas (J2) arriesga “ganar” -100.

„ Por eso, J2 podrá pensar elegir “Dcha”

para protegerse

„ J1 podrá intuir lo que piensa J2 y

elegir “Arriba”…

„ pero, ¿Hay alguna posibilidad de

cuantificar las dudas de los jugadores?

(75)

Análisis asimétrico presc/desc

Izda. Dcha. Arriba 4,-100 10,6

Debajo 12,8 5,4

„ Consideremos el problema del jugador J2

desde el punto de vista del análisis de decisiones

„ Supongamos que J1 elige

„ “Arriba” con una probabilidad p, y „ “Debajo” con 1-p.

„ Entonces, la utilidad esperada del J2 es „ -100p + 8(1-p) = 8 – 108p para “Izda.” y „ 6p + 4(1-p) = 4 – 2p para “Dcha.”

„ Así que, la probabilidad de equilibrio se encuentra al resolver la ecuación

8 – 108p = 4 – 2p, o p = 0.036.

„ Así que J2 debe elegir “Dcha.” si el piensa que la probabilidad de que J1 elija “Arriba”

es más que 0.036

„ Un análisis similar se puede efectuar para J1

„ J1 debe elegir “Abajo” si el piensa que la probabilidad de que J2 elija “Dcha.” es más

(76)

Actividad

„

Para el juego de piedra papel tijera en forma

normal

„

Calcula equilibrio de Nash.

„

Interpretar solución.

„

Podéis hacerlo por parejas.

„

Envíanos la solución por email (puedes hacerlo a

mano y escanearlo) antes del día 23 de Febrero

a las 18.00 hora de Madrid.

„

Pf haced un único envío con los dos ejercicios

(77)

Punto final

Alguna pregunta más?

Hacédnoslas mediante el correo electrónico interno del

Master.

Dos buenas fuentes para este capítulo son

Gibbons. Game

Theory

for

Applied

Economists

(hay

versión en Español)

Referencias

Documento similar

 Para recibir todos los números de referencia en un solo correo electrónico, es necesario que las solicitudes estén cumplimentadas y sean todos los datos válidos, incluido el

La determinación molecular es esencial para continuar optimizando el abordaje del cáncer de pulmón, por lo que es necesaria su inclusión en la cartera de servicios del Sistema

trañables para él: el campo, la vida del labriego, otra vez el tiempo, insinuando ahora una novedad: la distinción del tiempo pleno, el tiempo-vida, y el tiempo

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

En esta línea y en modelos macroeconómicos (modelos con racionamiento) algunos autores han analizado las propiedades dinámicas del equilibrio bajo determinadas

We have studied the relaxation process of the specific heat and the entropy for the three-dimensional Coulomb glass at very low temperatures and in thermal equilibrium9. The long

Necessary and su fficient conditions for their existence in an approximate dynamics of order k are obtained and we give explicit expressions of these equilibria, use- ful for the