• No se han encontrado resultados

Teoria de Juegos Juegos Dinamicos

N/A
N/A
Protected

Academic year: 2021

Share "Teoria de Juegos Juegos Dinamicos"

Copied!
15
0
0

Texto completo

(1)

JUEGOS DINAMICOS DE INFORMACIÓN COMPLETA Juego Dinámico

Un juego dinámico, es un juego secuencial (a diferencia de los juegos estáticos), donde los jugadores adquieren nueva información, respecto a lo realizado por los demás jugadores, mientras el juego se desarrolla. En los juegos dinámicos la estructura secuencial del juego tiene relevancia, es por ello que se recomienda utilizar la forma extensiva para poder analizar un juego dinámico.

Juego de información completa

Al igual que en los juegos estáticos de información completa, tanto la estructura del juego, la racionalidad de los jugadores y los futuros pagos, de acuerdo a las estrategias utilizadas, son de conocimiento común.

Un juego dinámico de información completa puede ser representado mediante la forma normal o estratégica, sin embargo al utilizar esta representación podemos encontrar los equilibrios de Nash, tal y como se ha estudiado en la parte de juegos estáticos de información completa. Sin embargo, en el caso de juegos dinámicos (como se dijo en la definición de juego dinámico) resulta más apropiado contar con una representación del juego que muestre la estructura secuencial del juego. La representación en su forma extensiva de un juego incorpora explícitamente la estructura secuencial. Utilizando esta representación de los juegos dinámicos podemos encontrar lo que se conoce como Equilibrio de Nash perfecto en subjuegos, el cual es el concepto de solución en juegos dinámicos (a diferencia de los Equilibrios de Nash en juegos estáticos) que será explicado más adelante.

Ejemplo 14 Dilema del Prisionero (diferencia entre juegos estáticos y dinámicos)

Recordemos el enunciado del dilema del prisionero, el cual se representa en su forma normal de la siguiente manera J2

NC

C

J1

NC

(

2,2)

(0,3)

C

(

3,0)

(1,1)

Para poder representarlo en su forma extensiva utilizaremos el diagrama de árbol. Para este caso como ya hemos entrado a la parte de juegos dinámicos haremos una distinción en la forma extensiva de representar un juego estático y dinámico, para ello representamos el dilema del prisionero en su forma extensiva donde:

 Panel A: Dilema del prisionero en juegos estáticos

 Panel B : Dilema del prisionero en juegos dinámicos. Para esta versión del dilema del prisionero, tenemos que el jugador 1 elige primero su acción, la cual es observada por el jugador 2 antes de que él deba elegir su acción. Es por ello que se les conoce como juegos secuenciales.

A continuación la forma extensiva del dilema del prisionero

Página 1 de 15

(2)

TEORIA DE JUEGOS

Las líneas punteadas del panel A que unen los nodos de decisión del jugador 2 nos hace referencia a que el juego es un juego estático, donde el plan de acción se toma al inicio del juego (por ambos jugadores) mientras que el juego representado en el panel B nos muestra la secuencialidad del juego, donde el jugador 2 decidirá qué estrategia usar dependiendo de la estrategia tomada por el jugador 1.

Diferencia entre acción y estrategia

En los juegos estáticos vistos anteriormente no existía diferencia entre acción y estrategia. La estrategia de un jugador consistía en la elección de una acción. Sin embargo, en los juegos dinámicos una estrategia es muy diferente a una acción. Los jugadores pueden ir tomando distintas acciones a lo largo del juego. La estrategia de un jugador es un plan contingente completo de acción.

Representación extensiva

La definición matemática de un juego en su forma extensiva consiste en la descripción de los elementos que lo componen:

1. Un conjunto finito de jugadores N .

Un conjunto finito de acciones

A=×

i∈ N

A

i .

Un conjunto finito de nodos

X

.

A continuación se utiliza el ejemplo anterior donde se representan los nodos los cuales están encerrados con un círculo rojo

J

2

J

2

J

1

J

1

J

2

C

NC

NC C NC C

(

2

2

)

(

0

3

)

(

3

0

)

(

1

1

)

(

1

1

)

(

3

0

)

(

0

3

)

(

2

2

)

C NC C NC

NC

C

J

2

(3)

2. Una función p: X que especifica en único inmediato predecesor de cada nodo. Hay dos tipos de nodos:

Nodos terminales

T =

{

x

∈ X

}

que no pertenecen a ningún jugador, sino que representan los resultados del juego y a los que se asocian los pagos correspondientes de cada jugador.

 Los demás nodos X∖T son los nodos de decisión, donde algún jugador es requerido a tomar una acción. Dentro de ellos está el nodo inicial

x

0 donde el

juego empieza.

3. Una función γ : X∖

{

x0

}

→ A que asigna la acción que lleva hacia cada nodo (no

inicial) x desde su inmediato predecesor.

4. Una colección de conjuntos de información

H

y una función

H : X ∖T → H

que a cada nodo de decisión

x

le asigna un conjunto de información

h=H ( x )

∈ H

. 5. Una función

I : H → N

que a cada conjunto de información le asigna un jugador. El

conjunto de información de

i

se denota

H

i

=

{

h

∈ H :i=I (h)

}

.

La interpretación de un conjunto de información es que un jugador no puede distinguir en qué nodo está entre los nodos que pertenecen a un mismo conjunto de información cuando elige una acción cualesquiera de ellos. Por lo tanto, se requiere que todos los nodos de decisión asignados a un mismo conjunto de información tengan las mismas acciones disponibles.

Página 3 de 15

Panel A: Juego estático Panel B: Juego dinámico

J

2

J

2

J

1

J

1

J

2

C

NC

NC C NC C

(

2

2

)

(

0

3

)

(

3

0

)

(

1

1

)

(

1

1

)

(

3

0

)

(

0

3

)

(

2

2

)

C NC C NC

NC

C

J

2

(4)

TEORIA DE JUEGOS

Así, podemos definir el conjunto de acciones disponibles en cada conjunto de información

h : A (h)=

{

a

∈ A :a ∈ A ( x ) para x ∈h

}

A continuación se utiliza el ejemplo anterior donde se señalan los conjuntos de información del jugador 1 y 2

6. Una colección de pagos

v =

{

v

1

(

∙) ,… , v

n

(

∙)

}

que a cada jugador le asigna un pago en

cada nodo terminal:

v

i

:T → R .

Por lo tanto, podemos definir un juego dinámico en su forma extensiva por la colección de todos sus elementos: ΓE=

X , A , N , p

(

)

, γ

(

)

, H , H

(

)

, I

(

)

, v

.

Se han asumido N y A finitos (y por lo tanto X finito), pero la definición se puede extender directamente al caso más general. Un juego dinámico se dice finito si X es finito (que implica N y A finitos)

Información perfecta e imperfecta

Un juego extensivo es de información perfecta si cada conjunto de información contiene un único nodo. De lo contrario, es un juego de información imperfecta. Así, el juego del dilema del

Panel A: Juego estático Panel B: Juego dinámico

J

2

J

2

J

1

J

1

J

2 C NC

NC

C

NC

C

(

2

2

)

(

0

3

)

(

3

0

)

(

1

1

)

(

1

1

)

(

3

0

)

(

0

3

)

(

2

2

)

C

NC

C

NC

NC C

J

2

(5)

prisionero que vimos anteriormente (Panel A) es un juego de información imperfecta, mientras que la versión del juego en su forma dinámica (Panel B) es un juego de información perfecta.

Estrategia Pura Definición

Una estrategia pura para el jugador

i

es una función

s

i

: H

i

→ A

tal que

s

i

(

h)∈ A (h) , ∀ h ∈ H

i . Al conjunto de estrategias puras de

i

lo denotamos por

S

i .

Es importante enfatizar que una estrategia especifica una acción para todos y cada uno de los conjuntos de información del jugador. Ello incluso si de acuerdo a la estrategia algún conjunto de información no va a ser alcanzado en el juego.

En concreto, sean h y h ' dos conjuntos de información que pertenecen al jugador i donde h ' se encuentra en una etapa posterior en el juego que h . Una estrategia del jugador i debe asignar una acción a h ' aun cuando la acción especificada en h impida que se llegue a h ' durante el juego. La idea detrás de una estrategia en un juego dinámico es que debe especificar qué haría el jugador en cada nodo de decisión del juego. Es por ello que una estrategia en un juego dinámico es un plan contingente y completo de acción. Dos planes contingentes completos de acción que se diferencian sólo en una acción constituyen dos estrategias diferentes. Por lo tanto, es común que los jugadores tengan muchas posibles estrategias en juegos dinámicos. Específicamente, si

|

A (h)

|

es el número de acciones disponibles del jugador

i

en el conjunto de información

h

, entonces el número de estrategias puras de dicho jugador es

|

S

i

|

=

h∈Hi

|

A (h)

|

Ejemplo 15 Dilema del Prisionero (estrategias en juegos en su forma extensiva) Recordemos el enunciado del dilema del prisionero

Página 5 de 15

Panel A: Juego estático Panel B: Juego dinámico

J

2

J

2

J

1

J

1

J

2

C

NC

NC

C

NC

C

(

2

2

)

(

0

3

)

(

3

0

)

(

1

1

)

(

1

1

)

(

3

0

)

(

0

3

)

(

2

2

)

C

NC

C

NC

NC

C

J

2

(6)

TEORIA DE JUEGOS

En el juego del dilema del prisionero (Panel A), cada jugador tiene sólo un conjunto de información (aunque el jugador 1 tiene un único nodo de decisión en el suyo y el jugador 2 tiene dos nodos de decisión), en el cual dos acciones están disponibles: NC y C . Sus estrategias deben especificar qué acción tomar en dicho conjunto de información. El conjunto de todas las estrategias puras posibles de cada jugador son entonces:

S

1

=

{

NC , C

}

y

S

2

=

{

NC , C

}

. Vemos que estos son iguales a los conjuntos de acciones de los jugadores:

A

1

=

{

NC , C

}

y

A

2

=

{

NC , C

}

.

Es en este sentido que mencionamos anteriormente que

no hay diferencia práctica entre acción y estrategia en los juegos estáticos.

En cambio, el juego del dilema del prisionero presentado en el Panel B es un juego dinámico. En este caso el jugador 1 sigue teniendo un único conjunto de información y su conjunto de estrategias puras sigue siendo

S

1

=

{

NC , C

}

.

Sin embargo, el jugador dos tiene dos

conjuntos de información: aquél al que se llega luego de que el jugador 1 juegue NC y aquél al que se llega luego de que el jugador 1 juegue C . Una estrategia pura del jugador 2 debe especificar qué acción va a tomar en cada uno de sus conjuntos de información. Definimos una estrategia pura del jugador 2 como un vector

(

X , Y )

, donde X indica la acción a tomar si el jugador 1 juega

NC

e

Y

indica la acción a tomar si el jugador 1 juega

C

. El conjunto de estrategias puras del jugador 2 será entonces:

S

1

=

{

(

NC , NC) , (NC , C ), (C , NC) , (C , C)

}

.

El número de estrategias puras del jugador 2

es 4, que es lo que se obtiene al calcular

|

S2

|

=

h∈ H2

|

A

(

h

)

|

=2 ×2=4

Estrategia Mixta Definición

(7)

Una estrategia mixta

σ

i para el jugador

i

es (al igual que para juegos estáticos) una

distribución de probabilidad sobre su conjunto de estrategias puras

S

i .

Representación Normal de Juegos Extensivos

Siempre es posible reducir un juego en su forma extensiva a un juego en su forma normal o estratégica, donde los pagos están asociados a perfiles de estrategias en lugar de a nodos terminales. Un perfil de estrategias puras lleva a un único nodo terminal. Sea

t

s

∈ T

el único

nodo terminal asociado con el perfil de estrategias puras

s

. Entonces

u

i

(

s)=v

i

(

t

s

)

,

∀ i ∈ N

. Asimismo, el pago esperado asociado al perfil de estrategias mixtas

σ

es:

U

i

(

σ )=

s∈ S

(

j∈N

σ

j

(

s

j

)

)

v

i

t

s

En la práctica, veremos que para juegos dinámicos es muchas veces más conveniente considerar las estrategias de comportamiento de los jugadores en lugar de sus estrategias mixtas.

Estrategia de Comportamiento Definición

Una estrategia de comportamiento

σ

i

(

A (h)

)

para el jugador

i

es una distribución de

probabilidad sobre sus acciones disponibles en cada uno de sus conjuntos de información

h

∈ H

i . En otras palabras, asumimos que un jugador asigna probabilidades a sus decisiones

en cada uno de sus conjuntos de información, en lugar de asignar probabilidades a sus estrategias puras. Ambas definiciones son equivalentes bajo el supuesto, que vamos a mantener, que los jugadores tienen “memoria perfecta”: un jugador no puede olvidar lo que hizo en una etapa anterior del juego (este resultado es conocido como el teorema de Kuhn).

CONCEPTOS DE SOLUCIÓN EQUILIBRIO DE NASH

Recordemos la definición de equilibrio de Nash dada anteriormente: un equilibrio de Nash es un perfil de estrategias

σ

¿ tal que para cada jugador

i

:

U

i

(

σ

i¿

, σ

¿i

)

≥ U

i

(

σ

i

, σ

¿i

)

,

∀ σ

i

∈ Σ

i

.

Sendero de Equilibrio Página 7 de 15

(8)

TEORIA DE JUEGOS

En un juego dinámico decimos que, dado un EN

σ

¿ , un conjunto de información h está en el sendero de equilibrio si y sólo si se alcanza con probabilidad positiva al jugar

σ

¿

.

Ejemplo 16 Juego del Ultimátum

Dos personas utilizan el siguiente procedimiento para asignar dos objetos indivisibles. J2 propone una asignación y el J1 puede aceptar la propuesta o rechazarla. Si J1 rechaza la propuesta, ningún jugador recibe el objeto, si la acepta, la asignación propuesta se lleva a cabo. El pago de cada jugador es el número de objetos que recibe.

La representación de este juego en su forma extensiva es la siguiente:

J

2

Como podemos observar, en este juego el jugador 2 tiene un solo conjunto de información, mientras que el jugador 1 tiene 3 conjuntos de información, por lo tanto el conjunto de estrategias puras del J2, quien tiene un único conjunto de información, es:

S

2

=

{

(2−0) , (1−1) ,(0−2)

}

El J1 como se dijo tiene tres conjuntos de información. Por lo tanto definimos una estrategia pura del J1 como XYZ , donde X indica la acción a tomar si J2 juega

(

0−2)

. El conjunto de estrategias puras de J1 es:

S

1

=

{

AAA , AAR , ARA , ARR , RAA , RAR, RRA , RRR

}

La representación normal del juego será:

J

2

(2−0 )

(1−1)

(0−2)

(1−1)

(

0−2)

(2−0 )

J

1

J

1

J

1 R A R A R A

(

0

0

)

(

1

1

)

(

2

0

)

(

0

0

)

(

0

2

)

(

0

0

)

(9)

J

1 AAA 2,0 1,1 0,2

AAR

2,0

1,1

0,0

ARA 2,0 0,0 0,2

ARR

2,0

0,0

0,0

RAA 0,0 1,1 0,2

RAR

0,0

1,1

0,0

RRA 0,0 0,0 0,2

RRR

0,0

0,0

0,0

Tenemos nueve equilibrios de Nash en estrategias puras:

EN=

(

ARR ,(2−0)

)

,

(

AAR , (1−1)

)

,

(

RAR , (1−1)

)

,

(

AAA , (0−2)

)

,

(

ARA , (0−2 )

)

,

(

ARR , (0−2)

)

,

(

RAA , (0−2)

)

,

(

RRA , (0−2)

)

,

(

RRR , (0−2)

)

Analicemos uno de estos EN, por ejemplo

(

ARR , (0−2)

)

:

J

2

Para este caso, la línea continua de color rojo representa un sendero de equilibrio, las líneas discontinuas representan las otras acciones que conforman la estrategia del J1.

Un problema del concepto de equilibrio de Nash en juegos dinámicos es que pueden no ser secuencialmente racionales. El principio de racionalidad secuencial establece que la estrategia de cada jugador debe especificar acciones óptimas en todos sus nodos de decisión, incluso en aquellos que se encuentran fuera del sendero de equilibrio. En el ejemplo previo, el equilibrio de Nash

(

ARR , (0−2)

)

no es secuencialmente racional. De acuerdo a este equilibrio, aunque

Página 9 de 15

(1−1)

(

0−2)

(2−0 )

J

1

J

1

J

1

R

A

R

A

R

A

(

0

0

)

(

1

1

)

(

2

0

)

(

0

0

)

(

0

2

)

(

0

0

)

(10)

TEORIA DE JUEGOS

no sea óptimo para J1, J1 jugaría rechazar si J2 juega

(

1−1)

. Este nodo no está en el sendero de equilibrio por lo que sólo constituye una “amenaza” de J1. Sin embargo, es una amenaza no creíble porque, de darse el caso, J1 actuaría de manera óptima aceptando la propuesta

(

1−1)

de J2. Así J2 preferiría jugar

(1−1)

y obtener 1 en lugar de jugar

(

0−2)

y obtener

0

. Por su puesto, J2 puede realizar esta misma deducción y por lo tanto, no esperaríamos que el equilibrio de Nash

(

ARR , (0−2)

)

se dé en realidad.

Analicemos otro de estos EN, por ejemplo

(

ARA ,(0−2)

)

:

J

2

¿Es este equilibrio secuencialmente racional?

Para encontrar los equilibrios de Nash que son secuencialmente racionales podemos aplicar el procedimiento conocido como inducción hacia atrás. Posteriormente vamos a explicar detalladamente este procedimiento. Por ahora, sólo lo ilustramos aplicándolo al ejemplo anterior. Empezamos determinando las acciones óptimas de J1 en los últimos nodos de decisión: A luego de

(

2−0 )

, A luego de

(1−1)

y tanto A como R luego de

(0−2)

. En seguida vamos hacia atrás y determinamos qué es lo óptimo para J2 en el primer nodo de decisión dado que anticipa correctamente lo que óptimamente va a hacer J1 en cada uno de los nodos finales de decisión. Como luego de

(

0−2)

tanto A como R son óptimos para J1, debemos tratar cada uno de estos casos por separado. En caso de que J1 juegue

A

luego de

(

0−2)

, lo óptimo para J2 es jugar

(0−2)

. En caso de que J1 juegue R luego de

(

0−2)

, lo óptimo para J2 es jugar

(

1−1)

. Así, vemos que en el ejemplo previo sólo hay dos EN secuencialmente racionales:

(1−1)

(

0−2)

(2−0 )

J

1

J

1

J

1 R A R A R A

(

0

0

)

(

1

1

)

(

2

0

)

(

0

0

)

(

0

2

)

(

0

0

)

(11)

EN=

{

(

AAA ,

(

0−2

)

)

,

(

AAR ,

(

1−1

)

)

}

En base a estos resultados podemos identificar tres posibles casos de acuerdo a las acciones óptimas para el jugador 1:

1. Siempre: Acciones de color celeste

2. Caso 1: Acción de color verde (En caso de que J1 juegue

A

luego de

(0−2)

, lo óptimo para J2 es jugar

(0−2)

)

3. Caso 2: Acción de color naranja (En caso de que J1 juegue

R

luego de

(

0−2)

, lo óptimo para J2 es jugar

(1−1)

)

De igual manera podemos identificar los casos para el jugador 2 de acuerdo a sus acciones óptimas:

1. Caso 1: Acción de color verde (En caso de que J1 juegue A luego de

(0−2)

, lo óptimo para J2 es jugar

(0−2)

)

2. Caso 2: Acción de color naranja (En caso de que J1 juegue R luego de

(

0−2)

, lo óptimo para J2 es jugar

(1−1)

)

El juego en su forma extensiva quedaría de la forma

J

2

Por lo tanto los equilibrios de Nash secuencialmente racionales son los ya hallados.

Hemos visto cómo se puede aplicar el principio de racionalidad secuencial en un ejemplo de un juego finito de información perfecta. El concepto de solución que incorpora este principio de

Página 11 de 15

(1−1)

(

0−2)

(2−0 )

J

1

J

1

J

1 R A R A R A

(

0

0

)

(

1

1

)

(

2

0

)

(

0

0

)

(

0

2

)

(

1

1

)

(12)

TEORIA DE JUEGOS

manera más general es conocido como equilibrio de Nash perfecto en Subjuegos. Antes de presentar este concepto, necesitamos primero definir qué es un subjuego.

Subjuego

Dado un juego en forma extendida, un subjuego es cualquier subconjunto de nodos que constituye un juego por derecho propio. Ello significa que debe satisfacer dos condiciones:

1. Comienza con un conjunto de información que contiene un único nodo y contiene todos los sucesores (inmediatos y subsiguientes) de este nodo. El subjuego no contiene otros nodos además de éstos.

2. Si el subjuego contiene el nodo

x

, entonces contiene todos los nodos que están en el mismo conjunto de información que

x

. (Es decir, no hay conjuntos de información “rotos”)

Tenga en cuenta que el juego original también es un subjuego. Ejemplo 17 Subjuegos

En la figura debajo se muestran dos juegos presentados en los apartados anteriores. El juego del Dilema del prisionero en su forma estática y dinámica.

Recordemos el enunciado del dilema del prisionero

En base a la definición de subjuego ¿Cuántos subjuegos tiene el Panel A y cuantos subjuegos tiene el Panel B?

Panel A: Juego estático Panel B: Juego dinámico

J

2

J

2

J

1

J

1

J

2 C NC

NC

C

NC

C

(

2

2

)

(

0

3

)

(

3

0

)

(

1

1

)

(

1

1

)

(

3

0

)

(

0

3

)

(

2

2

)

C

NC

C

NC

NC C

J

2

(13)

Podemos identificar que el Panel A (juego estático) cuenta con un único subjuego que es el juego mismo. El panel B (juego dinámico) cuenta con tres subjuegos: el juego mismo y cada subjuego que comienza en un nodo de decisión del jugador 2.

Puesto que un subjuego es un juego en sí mismo podemos aplicarle los conceptos de solución usuales. Precisamente eso es lo que hace el equilibrio de Nash Perfecto en Subjuegos.

Equilibrio de Nash Perfecto en Subjuegos

Dado un juego en su forma extensiva, un perfil de estrategias

σ

¿ es un equilibrio de Nash Perfecto en Subjuegos (ENPS) si induce un equilibrio de Nash (EN) en todos los subjuegos del juego (incluyendo el juego original).

Notese que si

σ

¿ es un ENPS, entonces también es un EN (dado que el juego original también es un subjuego). Pero no todo EN es un ENPS. Por lo tanto, el conjunto de los ENPS es un subconjunto del conjunto de los EN:

{

ENPS

}

{

EN

}

.

Así, el ENPS nos brinda una predicción más precisa sobre los resultados que caben esperar en un juego dinámico.

El procedimiento de inducción hacia atrás que ilustramos previamente es clave porque brinda un método para encontrar los ENPS. Dado que en cada subjuego los jugadores eligen sus acciones óptimas anticipando correctamente las acciones óptimas de los demás, a ningún jugador le conviene desviarse de su estrategia y, por lo tanto, estamos encontrando un EN en cada subjuego.

Detallamos los pasos del método de inducción hacia atrás para juegos finitos de información perfecta:

1. Encontrar las acciones óptimas en los últimos nodos de decisión.

2. Encontrar las acciones óptimas en los penúltimos nodos de decisión dado que los jugadores anticipan correctamente las acciones óptimas que van a ser tomadas en los últimos nodos de decisión.

3. Así sucesivamente hasta llegar al nodo inicial.

Si nunca se encuentra más de una acción óptima en cada nodo, entonces el procedimiento brinda un único ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada acción óptima identificada.

Para esta categoría de juegos, contamos con el siguiente teorema: Teorema de Zermelo

Todo juego finito de información perfecta tiene un ENPS en estrategias puras que puede obtenerse por inducción hacia atrás. Además, si ningún jugador tiene los mismos pagos en cualquiera de los nodos terminales, entonces hay un único ENPS que puede ser derivado de esta manera.

Nótese que este teorema sólo se aplica a los juegos de información perfecta.

El procedimiento de inducción hacia atrás se puede generalizar para obtener los ENPS en todo juego dinámico finito: no sólo en aquellos con información perfecta, sino también en aquellos

(14)

TEORIA DE JUEGOS

con información imperfecta. Los pasos del método generalizado de inducción hacia atrás son los siguientes:

1. Encontrar el EN en cada uno de los subjuegos finales.

2. Encontrar el EN en el penúltimo subjuego dado que los jugadores anticipan correctamente los EN que van a darse en los subjuegos finales.

3. Así sucesivamente hasta llegar al nodo inicial.

Si nunca se encuentra más de una acción óptima o EN, entonces el procedimiento brinda un único ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada caso identificado.

Equilibrio de Nash Perfecto en Subjuegos (Definición alternativa - Emilio Cerdá)

Definición extraida del libro “Teoria de Juegos” - Emilio Cerdá:

La estructura temporal de un juego dinámico con información completa obliga a cada jugador a tener en cuenta que sus decisiones en cada momento influyen en las posibilidades y pagos posteriores para él y para los demás, y que al mismo tiempo las decisiones futuras previsibles suyas y de los demás condicionan sus decisiones presentes. Aparece así un elemente de vital importancia, la credibilidad que se puede dar a las decisiones futuras a la hora de determinar las decisiones presentes, es decir, la credibilidad de las posibles amenazas o promesas que se pueden plantear sobre el comportamiento futuro para condicionar el comportamiento presente de los jugadores.

… vamos a plantear un concepto de equilibrio llamado equilibrio de Nash perfecto en subjuegos. Este concepto representa, para el caso de los juegos dinámicos con información completa, una adecuación y una mejora con respecto al equilibrio de Nash, precisamente porque tiene en cuenta ese elemento de credibilidad antes mencionado.

Ejemplo 18 Elección del nicho de mercado

La empresa E está considerando entrar a un mercado que en ese momento sólo tiene una empresa incumbente (empresa I). En la primera etapa, la empresa E puede decidir entrar o quedarse fuera del mercado. Si E elige quedarse fuera el juego termina y los pagos son 0 para la empresa E y 2 para la empresa I. Si E elige entrar al juego va a una segunda etapa. En la segunda etapa ambas empresas eligen simultáneamente su nicho de mercado (grande o pequeño). Si ambas eligen el mismo nicho de mercado, ambas empresas incurren en pérdidas (

−3 si nicho grande, −6 si nicho pequeño). Si eligen nichos diferentes, la empresa en el

nicho grande gana 1 , mientras que la empresa en el nicho pequeño pierde −1 . La representación extensiva de este juego es el siguiente (donde NP es nicho pequeño y NG es nicho grande):

E

Página 14 de 15 E

Entrar No entrar

(15)

Encontrar los ENPS.

Inducción hacia atrás generalizada: Juegos dinámicos con información completa pero imperfecta

El algoritmo de inducción hacia atrás se aplica para juegos de información perfecta, pero podemos generalizar este método para juegos de información imperfecta.

Para juegos finitos, la inducción hacia atrás generalizada se realiza de la siguiente forma: 1. Encontrar el EN en los últimos subjuegos.

2. Encontrar el EN en los penúltimos subjuegos dado que los jugadores anticipan correctamente los EN que van a darse en los últimos nodos de decisión.

3. Así sucesivamente hasta llegar al nodo inicial.

Si en cada nodo hay solo una acción óptima o EN entonces este será el único ENPS.

En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada caso. Para el ejemplo 18 (Elección del nicho de mercado) Una estrategia de la empresa I es simplemente la acción que elige luego de que la empresa E entra en el mercado. Definimos una estrategia de la empresa E como (X,Y), donde X indica si E entra o no al mercado en la primera etapa e Y indica qué juega en la segunda etapa si entra. Los ENPS son

(

(

E , NG) , NP

)

,

(

(

F , NP) , NG

)

Referencias

Documento similar

Las fuentes históricas proporcionan la ambientación necesaria para muchos juegos de rol, contribuyen a la elaboración de la acción o eventos que van a

La Teoría de Juegos estudia problemas de conflicto (juegos no cooperativos) y de cooperación (juegos cooperativos) entre dos o más agentes (jugadores) y de qué

Solo más tarde el baloncesto figura en los Juegos Olímpicos.. El primer juego de baloncesto olímpico tuvo lugar en los Juegos Olímpicos de verano de 1936

Trastorno por juegos digitales, videojuegos o juegos por internet, (Gaming disorder )que pueden realizarse tanto de modo presencial como online, de forma individual o

Y la tercera rastrea si en la caja donde se encuentra la posición marcada por la fila y columna recibidas como segundo y tercer parámetro ( short f, short c ) hay una única

Práctica final para la Asignatura “Fundamentos de Informática” 6 de 11 Un programa del juego del ratón y los cuatro gatos puede tener tantas implementaciones

Ahora que sabéis la importancia del peso, debéis intentar equilibrar las siguientes figuras, repartiendo adecuadamente el peso, para mantener el equilibrio

representar las diferentes dimensiones que puede tener un tablero, el turno del jugador al que le toca mover ficha en juegos de mes sencillos, una lista de condiciones que determinan