• No se han encontrado resultados

Introducción a Juegos de Campo Medio

N/A
N/A
Protected

Academic year: 2022

Share "Introducción a Juegos de Campo Medio"

Copied!
67
0
0

Texto completo

(1)

Introducci´ on a Juegos de Campo Medio

Joherigu

Seminario de Finanzas

Noviembre 2020

(2)

Introducci´on

¿Juegos grandes?

La teor´ıa de Juegos de Campo Medio (Mean-Field Games, MFGs) estudia el equilibrio de juegos grandes (con un gran n´umero N de participantes), analizando su comportamiento en el l´ımite.

Particularmente, se enfoca en juegos grandes con “jugadores peque˜nos”, donde la influencia individual de cada jugador disminuye conforme N → ∞.

(3)

Introducci´on Riesgo sist´emico

Modelo de Riesgo sist´ emico

El modelo consta de lo siguiente:

Una red de N bancos (agentes) que interact´uan entre s´ı mediante el pr´estamo y cobro de sus reservas de efectivo.

Para cada 1≤ i ≤ N, Xti representa la log-reserva de efectivo del i -´esimo banco al tiempo t∈ [0, T ].

Todos los agentes est´an interesados en conocer la posible ocurrencia de impago para una gran cantidad de bancos de manera simult´anea (riesgo sist´emico).

(4)

Introducci´on Riesgo sist´emico

La din´amica de las log-reservas est´a dada por

dXti =⎡⎢

⎢⎢⎢⎣

1 N

N

j=1

aij(Xtj− Xti) + αit

⎤⎥⎥⎥

⎥⎦dt+ σdWti

= [a (Xt− Xti) + αit] dt + σdWti,

donde aij es la cantidad de reservas que intercambia i con j , y (αit) es la cantidad que el i -´esimo agente intercambia fuera del sistema.

(5)

Introducci´on Riesgo sist´emico

El costo que el agente i est´a interesado en minimizar es Ji(α) = E [∫0T(1

2∣αit2− qαit(Xt− Xti) +

2(Xt− Xti)2) dt +c

2(XT− XTi )2] ,

donde c, > 0 balancean las interacciones con el resto del sistema, y q > 0 pondera las contribuciones de los tama˜nos relativos de los componentes (prerrogativas del regulador). En lo que resta, se considera q2≤  para garantizar convexidad.

(6)

Recordatorio de Juegos

Recordatorio de Juegos

(7)

Recordatorio de Juegos Definiciones

Definiciones

Un Juego es un modelo de agentes (jugadores) que interact´uan entre s´ı y que toman decisiones.

P el conjunto de jugadores, con #P = N.

Ai es el conjunto de acciones (admisibles) del i -´esimo jugador, de donde se define el conjunto de acciones admisibles A:

A= A1× ⋯ × AN.

(8)

Recordatorio de Juegos Definiciones

Se dice que a= (a1, . . . , aN) ∈ A es un perfil de acciones. Se denota por a−i como el perfil de acciones que excluye al jugador i :

a−i= (a1, . . . , ai−1, ai+1, . . . , aN) . Ai denota el conjunto de estrategias del i -´esimo jugador:

Ai ∶= {α ∶ [0, T ] → Ai} .

Para cada 1≤ i ≤ N, se tiene Ji ,N ∶ A → R, tambi´en llamada Funci´on de costo del jugador i .

(9)

Recordatorio de Juegos Equilibrio de Nash

Equilibrio de Nash

Se dice que un perfil de acciones ˆa∈ A es un Equilibrio de Nash si, y s´olo si, para todo jugador i = 1, . . . , N se cumple que

Ji(ˆa) ≤ Ji(ai, ˆa−i) , ∀ai ∈ Ai.

(10)

Recordatorio de Juegos Equilibrio de Nash

Equivalentemente, definiendo la llamada Funci´on De Mejor Respuesta (BRF, Best Response Function) Bi ∶ A → A como

Bi(a) ∶= {b ∈ A ∶ bi = arg min

α∈Ai

Ji(α, a−i)} ,

se dice que un perfil de acciones ˆa∈ A es un Equilibrio de Nash si, y s´olo si, ˆa es un punto fijo de la BRF B:

B(ˆa) = ˆa.

(11)

Recordatorio de Juegos Juegos sim´etricos

Juegos sim´ etricos

Se dice que un juego es sim´etrico si:

1 Todos los jugadores tienen el mismo conjunto de acciones admisibles:

A1= . . . = AN. Es decir, A= AN

2 Las funciones de costo son sim´etricas:

Ji(a1, . . . , aN) = Jσ(i)(aσ(1), . . . , aσ(N)) , para cualquier permutaci´on σ en{1, . . . , N}.

(12)

Recordatorio de Juegos Estrategia mixta

Estrategia mixta

Una estrategia mixta para el i -´esimo agente de un juego es una

distribuci´on de probabilidad µi ∈ P (Ai) dadas las acciones del resto de los jugadores, donde P (Ai) denota el conjunto de medidas de probabilidad (Borel) sobre el conjunto admisible Ai.

Es decir, α∈ A ahora son aleatorias con ley µ.

(13)

Recordatorio de Juegos Equilibrio de Nash (cont.)

Equilibrio de Nash (cont.)

Una estrategia perfil ˆα∼ ˆµ ∈ P (A) es llamada Equilibrio de Nash en estrategias mixtas si, y s´olo si, para cada jugador 1≤ i ≤ N se cumple que

JNi ( ˆα) ≤ JNi (α) , ∀α ∈ A, donde JNi (α) est´a dado por

JNi (α) ∶= ∫ANJi(a1, . . . , aN)dµ1(a1) × ⋯ × µN(aN) = ∫ANJi(a)dµ(a), α∼ µ ∈ P(A).

(14)

Juegos estoc´asticos finitos

Juegos estoc´ asticos finitos

(15)

Juegos estoc´asticos finitos Espacio de referencia

Espacio de referencia

Sea (Ω, F, P) un espacio de probabilidad, y sea W = (Wt, 0≤ t ≤ T ) un proceso de Wiener M-dimensional en dicho espacio.

Se denota por F = (Ft, 0≤ t ≤ T ) a la filtraci´on (completada por conjuntos de medida nula) generada por el proceso W .

(16)

Juegos estoc´asticos finitos Espacio de referencia

Con la misma notaci´on que antes, se supone que para todo i , Ai es un espacio m´etrico compacto, y que el conjunto de estrategias admisibles A = A1× ⋯ × AN est´a dado por elementos de la forma

A ∋ α = (α1, . . . , αN) ,

donde αi = (αit, 0≤ t ≤ T ) es un proceso B ([0, T ]) ⊗ F/B (Ai) -progresivamente medible para todo 1≤ i ≤ N.

(17)

Juegos estoc´asticos finitos Sistema controlado

Sistema Controlado

Para cada α∈ A, se define el estado del sistema controlado como el proceso RD-valuado X = Xα que evoluciona seg´un la din´amica

dXt= B (t, Xt, αt) dt + Σ (t, Xt, αt) dWt, 0≤ t ≤ T , (1) X0= x ∈ RD,

para (B, Σ) ∶ [0, T ] × Ω × RD× A → RD× RD×M, con D= d1+ ⋯ + dN.

Es decir, Xt= (Xt1, . . . , XtN), donde Xti ∈ Rdi es el estado individual del jugador i .

(18)

Juegos estoc´asticos finitos Funci´on de costo

Funci´ on de costo

Para cada jugador 1≤ i ≤ N, la funci´on de costo de la estrategia α est´a dado por

Ji(α; 0, x) = E [∫0Tfi(t, Xt, αt) dt + gi(XT)∣X0= x] , donde fi ∶ [0, T ] × Ω × RD× A → R y gi ∶ Ω × RD → R representan los costos corrientes y terminales, respectivamente.

(19)

Juegos estoc´asticos finitos Problema de control ´optimo

Problema de control ´ optimo

Para cada 1≤ i ≤ N, se busca hallar un proceso Ai-valuado ˆαi,

progresivamente medible, tal que el valor de la funci´on de la respectiva funci´on de costo se minimize:

ˆ

αi ∈ arg min

αi∈Ai

Jii, ˆα−i) ,

donde ˆα= (ˆα1, . . . , ˆαN).

¡Misma noci´on de optimalidad que un equilibrio de Nash!

(20)

Juegos estoc´asticos finitos Tipos de estrategias

Tipos de estrategias

La existencia y unicidad de un equilibrio depende de la de la estructura de informaci´on disponible y el tipo de acciones que permite el modelo de juego.

Open loop:

αit = φi(t, X0, W[0,t]) , Closed loop:

αit= φi(t, X[0,t]) , Markovian:

αit= φ (t, Xt) ,

donde φi, 1≤ i ≤ N, son funciones deterministas medibles.

(21)

Juegos estoc´asticos finitos Funci´on de Valor

Funci´ on de Valor

Se define la funci´on de valor para el jugador i como vi(t, x) ∶ = inf

αi∈Ai

E [∫tTfi(s, Xs, αis, ˆα−is ) + gi(XT)∣Xt= x] , (2) donde X = Xαi, ˆα−i es soluci´on (fuerte) del sistema controlado (1).

(22)

Juegos estoc´asticos finitos etodos de soluci´on

M´ etodos de soluci´ on

¿C´omo encontrar el control ´optimo ˆα, as´ı como el valor del costo m´ınimo v(t, x) para el juego de N jugadores?

La v´ıa anal´ıtica: Ecuaciones de Hamilton-Jacobi-Bellman y soluciones de viscosidad.

La v´ıa probabilista: El principio del m´aximo estoc´astico

(23)

V´ıa anal´ıtica

V´ıa de soluci´ on anal´ıtica

(24)

V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs

Hamiltoniano y Condici´ on de Isaacs

Se define el Hamiltoniano del i -´esimo jugador como la funci´on Hi ∶ [0, T ] × RD× RD× RD×M× A → R dada por

Hi(t, x, y, z, α) = B(t, x, α)Ty+1

2Tr((ΣΣT) (t, x, α)z) + fi(t, x, α).

(25)

V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs

Se dir´a que la condici´on de Isaacs se cumple si existe una funci´on (t, x, y, z) ↦ ˆα(t, x, y, z) ∈ A

tal que para cada 1≤ i ≤ N y para todo t ∈ [0, T ], x ∈ RD,

y = (y1, . . . , yN) ∈ (RD)N, z= (z1, . . . , zN) ∈ (RD×M)N, se cumple que Hi(t, x, yi, zi,̂α(t, x, y, z)) ≤ Hi(t, x, yi, zi,(αi,α̂−i(t, x, y, z))) (3) para todo αi ∈ Ai.

(26)

V´ıa anal´ıtica Ecuaci´on HJB

Ecuaci´ on HJB

Suponiendo que la funci´on de valor vi, definida en (2), es suficientemente suave, entonces vi es una soluci´on (viscosa) del problema de Cauchy

− ∂tvi(t, x) − inf

αi∈Ai

Hi(t, x, ∂xvi(t, x), ∂2xxvi(t, x), αi) = 0, (4) para todo (t, x) ∈ [0, T ) × RD, con condici´on terminal

vi(T , x) = gi(x). (5)

A (4)-(5) se le conoce com´unmente como Ecuaci´on de Hamilton-Jacobi-Bellman.

(27)

V´ıa anal´ıtica Ecuaci´on HJB

Rec´ıprocamente, si Vi es una soluci´on de (4)-(5), entonces Vi es la funci´on de valor del problema de control (1)-(2).

M´as a´un, el control ´optimo se obtiene de la minimizaci´on del Hamiltoniano; es decir, de la condici´on de Isaacs (3).

(28)

V´ıa probabilista

V´ıa de soluci´ on probabilista

(29)

V´ıa probabilista Proceso adjunto

El proceso adjunto (Open loop)

Para una estrategia admisible α∈ A y el correspondiente proceso de estados X = Xα, se dice que los N pares de procesos((Yi ,α, Zi ,α))1≤i≤N son los procesos adjuntos asociados al juego si para cada i se satisface la Ecuaci´on Diferencial Estoc´astica hacia atr´as

dYti ,α= −∂xHi(t, Xt, Yti ,α, Zti ,α, αt) dt+ Zti ,αdWt, t∈ [0, T ],

YTi ,α= ∂xgi(XT) . (6)

(30)

V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin

Principio del M´ aximo (Estoc´ astico) de Pontryagin

Sea ˆα un Equilibrio de Nash (open loop), ̂X el respectivo proceso controlado y ( ˆY , ˆZ) el proceso adjunto asociado (6). Si el mapeo α↦ Hi(t, ˆXt, ˆYti, ˆZti, α, ˆα−it ) es convexo Leb1⊗ P-ctp, entonces la condici´on de Isaacs se sataisface trayectorialmente:

Hi(t, ˆXt, ˆYti, ˆZti, ˆαt) = inf

ai∈Ai

Hi(t, ˆXt, ˆYti, ˆZti, α, ˆα−it ) , Leb1⊗ P − ctp.

(7)

(31)

V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin

Rec´ıprocamente, para α, Xα y(Yα, Zα) control, sistema y proceso adjunto admisibles, respectivamente; si el mapeo

(x, α) ↦ Hi(t, x, ˆYti, ˆZti, α, ˆα−it ) es convexo Leb1⊗ P-ctp, si (7) se verifica con α, y si adem´as las gi son convexas, entonces α es un equilibrio de Nash.

(32)

Juegos de Campo Medio

Juegos de Campo Medio

(33)

Juegos de Campo Medio

Se introducen algunos conceptos que se usar´an m´as adelante

Sea Q un espacio m´etrico compacto y den´otese porP(Q) el conjunto de medidas de Probabilidad (Borel).

Se dota aP(Q) con la topolog´ıa de convergencia d´ebil*, W. Luego, (P(Q), W) es compacto; adem´as, puede ser metrizado por la distancia Kantorovich-Rubinstein d1:

d1(µ, ν) ∶ = sup {∫Qf d(µ − ν) ∶ f 1-Lipschitz continua } , para todo µ, ν∈ P (Q).

Para x= (x1, . . . , xN) ∈ RN, se denota por µNx a la distribuci´on emp´ırica de x :

µNx = 1 N

N

1

δxi.

(34)

Juegos de Campo Medio L´ımite de funciones sim´etricas

L´ımite de funciones sim´ etricas

Para cada N ≥ 1, sea uN∶ QN → R una funci´on sim´etrica en sus entradas.

Sup´ongase que (uN) cumple lo siguiente:

(Cota unif.) supN≥1supx∈QN∣uN(x)∣ < ∞.

(Cont. unif.) Existe un m´odulo de continuidad ω, indep. de N, tal que

∣uN(x) − uN(y)∣ ≤ ω (d1Nx, µNy)) , ∀x, y ∈ QN,∀N ≥ 1.

Entonces, existe una subsucesi´on (uNk)k≥1 y un mapa Lipschitz continuo U ∶ P(Q) → R que cumple

klim→∞ sup

x∈QNk ∣uNk(x) − U (µNxk)∣ = 0.

(35)

Juegos de Campo Medio Formulaci´on del Problema

Formulaci´ on del Problema

El enfoque de Campo Medio toma en cuenta que:

La interacci´on entre los jugadores es (fuertemente) sim´etrica.

Dicha interacci´on se da a trav´es de la distribuci´on emp´ırica de los estados del sistema.

(36)

Juegos de Campo Medio Formulaci´on del Problema

Formalmente:

Se asumen las hip´otesis de un juego sim´etrico (mismo espacio de controles para todos los jugadores, funci´on de costo sim´etrica en sus entradas).

M´as a´un, la din´amica de los estados individuales es la misma para todos los jugadores.

La funci´on de costo tambi´en verifica las condiciones de (Cota uniforme)y(Continuidad uniforme)

(37)

Juegos de Campo Medio Formulaci´on del Problema

Interacciones en juego finito:

dXti = Bi(t, Xti,Xt−i, αit−it ) dt + Σi(t, Xti,Xt−i, αit−it ) dWti, 0≤ t ≤ T , X0i = x ∈ Rdi

Interacciones tipo Mean Field:

dXti = b (t, Xti, αitNX−1−i

t ) dt + σ (t, Xti, αitNX−1−i

t ) dWti, 0≤ t ≤ T , (8) X0i = x ∈ Rd.

(38)

Juegos de Campo Medio Formulaci´on del Problema

Similarmente, para la funci´on de costo:

Ji(α) = E [∫0Tf (t, Xti, αitNX−1−i

t ) dt + g (XTNX−1−i T )] .

(39)

Juegos de Campo Medio Comportamiento asint´otico

Comportamiento asint´ otico

De los resultados de Propagaci´on de Caos [15], se tiene que para Xi = Xi ,N soluci´on de (8),

Xi ,N→ Xi d´ebilmente cuando N→ ∞.

(40)

Juegos de Campo Medio Comportamiento asint´otico

M´as a´un, (Xi)

i≥1 son copias independientes del proceso dX1t = ∫ b (t,Xt1, α1t, y) mt(dy)dt

+ ∫ σ (t,Xt1, α1t, y) mt(dy)dW1t, 0≤ t ≤ T , X10= x ∈ Rd,

donde W es un MB d -dimensional, y m∶ [0, T ] → P (A1) denota la ley del proceso X1:

mt= L (X1t) .

(41)

Juegos de Campo Medio Comportamiento asint´otico

Es decir, la din´amica de los estados individuales con interacci´on de Campo Medio converge a un proceso de McKean-Vlasov :

dXt= b (t, Xt, αt,L (Xt)) dt + σ (t, Xt, αt,L (Xt)) dWt, 0≤ t ≤ T , X0= ξ ∼ L (X0) .

(42)

Juegos de Campo Medio El Problema MFG

El Problema MFG

Sean

(Ω, F, F, P) un espacio de probabilidad filtrado y completo, con W un F-MB d-dimensional;

A (conjunto de acciones admisibles) un espacio m´etrico compacto;

A (conjunto de estrategias admisibles) el espacio de procesos A-valuados, F-progresivamente medibles α (cuadrado integrables);

ξ∈ L2(Ω, F0, P, Rd) una condici´on inicial.

Entonces, el problema de Juego de Campo Medio consiste en obtener la funci´on de (Mejor respuesta)del jugador representante, y posteriormente resolver el problema de (Punto fijo).

(43)

Juegos de Campo Medio El Problema MFG

(Mejor respuesta) Para µ∶ [0, T ] → P(A) dado (fijo), resolver el problema de Control Estoc´astico

αinf∈AJµ(α) con Jµ(α) = E [∫0Tf (t, Xtα, αt, µt) dt + g (XT, µT)] , sujeto a

dXtα= b (t, Xtα, αt, µt) dt + σ (t, Xtα, αt, µt) dWt, 0≤ t ≤ T , X0α= ξ ∼ µ0,

donde los coeficientes son tales que la EDE tiene una soluci´on fuerte y el funcional de costo es fuertemente sim´etrico.

(44)

Juegos de Campo Medio El Problema MFG

(Punto fijo) Encontrar un flujo µ tal que µt = L ( ˆXt) para toda t ∈ [0, T ], donde ˆX = Xαˆ es soluci´on del problema de(Mejor respuesta).

(45)

Juegos de Campo Medio Equilibrios de Nash en el l´ımite

Equilibrios de Nash en el l´ımite

Theorem ([4])

Para todo N, sea JN la funci´on de costo de un Juego sim´etrico con N participantes. Si ˆαN ∼ mN es un equilibrio de Nash (en estrategias mixtas), entonces existe m∈ P(A) tal que (mN) converge a m en la topolog´ıa de convergencia d´ebil*, y cumple con la llamada Ecuaci´on de campo medio:

Jm(α) = inf

m∈P(A)Jm(α), α∼ m.

(46)

Juegos de Campo Medio Equilibrios de Nash en el l´ımite

Theorem ([5][16])

Suponiendo que existe una soluci´on al problema de MFG (coeficientes Lipschitz, acotados y suficientemente suaves, convexidad del espacio y del Hamiltoniano, entre otros), entonces existe (N)N≥1, N→ 0, tal que la estrategia perfil ( ˆα, . . . , ˆα) para el N-juego, con ˆα soluci´on del MFG, es un N-equilibrio de Nash:

Ji ,N( ˆα, . . . , ˆα) ≤ Ji ,N( ˆα, . . . , αi, . . . , ˆα) + N, ∀αi ∈ A, ∀i.

(47)

Soluci´on de MFGs

Soluci´ on de MFGs

(48)

Soluci´on de MFGs Hamiltoniano

Hamiltoniano

Se define el Hamiltoniano como la funci´on

H∶ [0, T ] × Rd× P(A) × Rd× Rd×d× A → R dada por H(t, x, µ, y, z, α) = b(t, x, µ, α)Ty+1

2Tr((σσT) (t, x, µ, α)z) + f (t, x, µ, α).

(49)

Soluci´on de MFGs V´ıa anal´ıtica

Bosquejo del m´ etodo anal´ıtico

Para abordar el problema de (Mejor respuesta):

1 Se define una funci´on de valor para el problema de control:

v(t, x; µ) ∶ = inf

α∈AE [∫tTf (s, Xs, αs, µs) ds + g (XT, µT)∣Xt= x] .

2 Se prueba un principio de Programaci´on din´amica para el semi-grupo correspondiente.

3 Se deduce la ecuaci´on HJB en t´erminos de la medida µ y se prueba que la funci´on de valor v es soluci´on viscosa de ´esta.

4 Finalmente, se obtienen los lemas de verificaci´on.

(50)

Soluci´on de MFGs V´ıa anal´ıtica

Para abordar el problema de (Punto fijo):

1 Se obtiene el generador de la difusi´on.

2 Se acopla la din´amica de la distribuci´on del proceso a la HJB; i.e., ecuaci´on FP (Kolmogorov hacia adelante) con la condici´on inicial µ0= L(ξ).

(51)

Soluci´on de MFGs V´ıa anal´ıtica

Formulaci´ on anal´ıtica del MFG

Solucionar el sistema acoplado de ecuaciones diferenciales:

tv+ H (t, x, µt, ∂xv , ∂xx2 v , ˆα) = 0, v(T , x) = g(x, µT),

tµt−1

2Tr(∂xx2 ((σσT) (t, x, µ, ˆα)µt)) (9) + divx(b(t, x, µ, ˆα)µt) = 0, µ0 = L(ξ),

con ˆα= ˆα (t, x, µt, ∂xv , ∂xx2 v) determinista tal que H(t, x, µt, y , z, ˆα(t, x, µt, y , z)) = inf

α∈AH(t, x, µt, y , z, α) (10)

(52)

Soluci´on de MFGs V´ıa anal´ıtica

Entonces, lasoluci´on al Juego de Campo Medioest´a dada por el par(v, µ) que resuelve (9), y el control ´optimo ˆα por la condici´on de Isaacs (10).

(53)

Soluci´on de MFGs Via probabilista

Bosquejo del m´ etodo probabilista

Para abordar el problema de (Mejor respuesta):

Theorem (Principio del m´aximo para MFGs)

Sea µ∶ [0, T ] → P2(A) medible y acotada. Bajo condiciones de suavidad y continuidad sobre los coeficientes b, σ, f , g , el sistema (adjunto) de

FBSDEs

dXt= b (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dt X0 = ξ, + σ (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dWt,

dYt= −∂xH(t, Xt, µt, Yt, Zt, ˆα(t, Xt, µt, Yt, Zt)) dt YT = ∂xg(XT, µT) ,

+ ZtdWt, (11)

donde ˆα viene de (10), tiene una (´unica) soluci´on(X , Y , Z).

(54)

Soluci´on de MFGs Via probabilista

Theorem (Principio del m´aximo para MFGs, cont.)

Adem´as, el control ˆα= (ˆα (t, Xt, µt, Yt, Zt))t∈[0,T ] cumple que Jµ( ˆα) + E [∫0T∣αt− ˆαt2dt] ≤ Jµ(α) , ∀α ∈ A.

(55)

Soluci´on de MFGs Via probabilista

Para abordar el problema de (Punto fijo):

Se retoma el comportamiento asint´otico de las interacciones de Campo Medio (propagaci´on de caos) para obtener µ tal que

P ○ ( ˆXt)−1= µt.

Se acopla dicha ley al sistema adjunto (11) del principio del m´aximo.

(56)

Soluci´on de MFGs Via probabilista

Formulaci´ on probabilista del MFG

Resolver el sistema de ecuaciones estoc´asticas McKean-Vlasov d ˆXt= b (t, ˆXt,L ( ˆXt) , ˆα (t, ˆXt,L ( ˆXt) , ˆYt, ˆZt)) dt

+ σ (t, ˆXt,L ( ˆXt) , ˆα (t, ˆXt,L ( ˆXt) , ˆYt, ˆZt)) dWt, d ˆYt= −∂xH(t, Xt,L ( ˆXt) , ˆYt, ˆZt, ˆα(t, Xt,L ( ˆXt) , ˆYt, ˆZt)) dt

+ ˆZtdWt, (12)

con condiciones inicial y terminal ˆX0= ξ y ˆYT = ∂xg( ˆXT,L (XT)), respectivamente, y ˆα(t, x, µt, y , z) como en (10).

(57)

Soluci´on de MFGs Via probabilista

Entonces, la soluci´on al Juego de Campo Medioest´a dada por el proceso ( ˆX , ˆY , ˆZ) que resuelve (12).

(58)

Aplicaci´on

Aplicaci´ on: Ejemplo inicial

(59)

Aplicaci´on Riesgo Sist´emico

Riesgo Sist´ emico (cont.)

Modelando el problema como un MFG:

1 Para t ↦ mt (determinista), resolver el problema de control

αinf∈AE [∫0T(1

2∣αt2− qαt(mt− Xt) + 

2(mt− Xt)2) dt +c

2(mT− XT)2] , sujeto a

dXt= [a (mt− Xt) + αt] dt + σdWt, X0= ξ.

2 Hallar ˆm∶ [0, T ] → R tal que ˆmt= E [ ˆXt] para toda 0 ≤ t ≤ T .

(60)

Aplicaci´on Riesgo Sist´emico

El Hamiltoniano del problema es H(t, x, y, α) = [a(mt− x) + α] y +1

2− qα(mt− x) + 

2(mt− x)2, que es convexo en (x, α) bajo la hip´otesis de q2≤ , y alcanza su m´ınimo en

α(t, x, mˆ t, y) = q(mt− x) − y.

(61)

Aplicaci´on Riesgo Sist´emico

El correspondiente sistema adjunto de FBSDEs es

dXt= [(a + q) (mt− Xt) − Yt] dt + σdWt, m0= E [ξ] ,

dYt= [(a + q)Yt+ ( − q2) (mt− Xt)] dt + ZtdWt, YT = c(XT− mT).

Procediendo de manera an´aloga a un problema de control lineal-cuadr´atico, la soluci´on al sistema anterior est´a dada por

t= −ηt(mt− Xt), Zˆt = σηt, donde ηt es soluci´on de la ecuaci´on de Riccati

tηt = 2(a + q)ηt+ ηt2− (e − q2), ηT = c.

(62)

Conclusiones

Conclusiones

Un Juego de Campo Medio es un problema de Control.

Los equilibrios en el problema MFG aproximan a los equilibrios en un juego finito.

Resolver el problema implica resolver sistemas acoplados de ecuaciones diferenciales que van hacia adelante y hacia atr´as en el tiempo.

La v´ıa anal´ıtica resuelve un sistema en un espacio de dimensi´on infinita (espacio de medidas de probabilidad). La v´ıa probabilista, un sistema de ecuaciones estoc´asticas McKean-Vlasov (dependientes de la ley del proceso).

(63)

Conclusiones

Extensiones

Juegos con ruido com´un. [5]

Juegos en grafos. [11]

Problemas de paro ´optimo. [14, 3]

Procesos con saltos. [1]

Otras formulaciones y aplicaciones. [9, 12]

Otros m´etodos de soluci´on (Martingalas controladas). [10]

Otras nociones de optimalidad (Mean Field Control Problems). [2, 6]

(64)

Referencias

Referencias I

[1] Chiara Benazzoli, Luciano Campi, and Luca Di Persio.“Mean field games with controlled jump–diffusion dynamics: Existence results and an illiquid interbank market model”.In: Stochastic Processes and their Applications 130.11 (2020), pp. 6927–6964.

[2] Alain Bensoussan, Jens Frehse, Phillip Yam, et al.Mean field games and mean field type control theory.Vol. 101. Springer, 2013.

[3] Charles Bertucci.“Optimal stopping in mean field games, an

obstacle problem approach”.In: Journal de Math´ematiques Pures et Appliqu´ees 120 (2018), pp. 165–194.

[4] Pierre Cardaliaguet.Notes on mean field games. Tech. rep.

Technical report, 2010.

[5] Ren´e Carmona, Fran¸cois Delarue, et al. Probabilistic Theory of Mean Field Games with Applications I-II.Springer, 2018.

(65)

Referencias

Referencias II

[6] Ren´e Carmona, Fran¸cois Delarue, and Aim´e Lachapelle.“Control of McKean–Vlasov dynamics versus mean field games”.In:

Mathematics and Financial Economics 7.2 (2013), pp. 131–166.

[7] Wendell H Fleming and Raymond W Rishel.Deterministic and stochastic optimal control.Vol. 1. Springer Science & Business Media, 2012.

[8] Diogo A Gomes et al.“Mean field games models—a brief survey”.

In: Dynamic Games and Applications 4.2 (2014), pp. 110–154.

[9] Olivier Gu´eant, Jean-Michel Lasry, and Pierre-Louis Lions.“Mean field games and applications”.In: Paris-Princeton lectures on mathematical finance 2010. Springer, 2011, pp. 205–266.

(66)

Referencias

Referencias III

[10] Daniel Lacker.“Mean field games via controlled martingale problems: existence of Markovian equilibria”.In: Stochastic Processes and their Applications 125.7 (2015), pp. 2856–2894.

[11] Daniel Lacker and Agathe Soret.“A case study on stochastic games on large graphs in mean field and sparse regimes”.In: arXiv preprint arXiv:2005.14102 (2020).

[12] Laetitia Laguzet and Gabriel Turinici.“Individual vaccination as Nash equilibrium in a SIR model with application to the 2009–2010 influenza A (H1N1) epidemic in France”.In: Bulletin of

Mathematical Biology 77.10 (2015), pp. 1955–1984.

[13] Makiko Nisio.“Stochastic control theory”. In: ISI Lecture Notes 9 (1981).

(67)

Referencias

Referencias IV

[14] Marcel Nutz.“A mean field game of optimal stopping”.In: SIAM Journal on Control and Optimization 56.2 (2018), pp. 1206–1221.

[15] Alain-Sol Sznitman.“Topics in propagation of chaos”. In: Ecole d’´et´e de probabilit´es de Saint-Flour XIX—1989. Springer, 1991, pp. 165–251.

[16] Athanasios Vasiliadis.“An Introduction to Mean Field Games using probabilistic methods”.In: arXiv preprint arXiv:1907.01411 (2019).

Referencias

Documento similar

Petición de decisión prejudicial — Cour constitutionnelle (Bélgica) — Validez del artículo 5, apartado 2, de la Directiva 2004/113/CE del Consejo, de 13 de diciembre de 2004, por

Las fuentes históricas proporcionan la ambientación necesaria para muchos juegos de rol, contribuyen a la elaboración de la acción o eventos que van a

La Teoría de Juegos estudia problemas de conflicto (juegos no cooperativos) y de cooperación (juegos cooperativos) entre dos o más agentes (jugadores) y de qué

El contar con el financiamiento institucional a través de las cátedras ha significado para los grupos de profesores, el poder centrarse en estudios sobre áreas de interés

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

We have created this abstract to give non-members access to the country and city rankings — by number of meetings in 2014 and by estimated total number of participants in 2014 —

ti ra cada jugador una bola de hierro o acero (10) y comi enza a jugar el que más se aprox ime a la figura para lo cual se pasa el otro lado de la raya tirando su bola de metal