Introducci´ on a Juegos de Campo Medio
Joherigu
Seminario de Finanzas
Noviembre 2020
Introducci´on
¿Juegos grandes?
La teor´ıa de Juegos de Campo Medio (Mean-Field Games, MFGs) estudia el equilibrio de juegos grandes (con un gran n´umero N de participantes), analizando su comportamiento en el l´ımite.
Particularmente, se enfoca en juegos grandes con “jugadores peque˜nos”, donde la influencia individual de cada jugador disminuye conforme N → ∞.
Introducci´on Riesgo sist´emico
Modelo de Riesgo sist´ emico
El modelo consta de lo siguiente:
Una red de N bancos (agentes) que interact´uan entre s´ı mediante el pr´estamo y cobro de sus reservas de efectivo.
Para cada 1≤ i ≤ N, Xti representa la log-reserva de efectivo del i -´esimo banco al tiempo t∈ [0, T ].
Todos los agentes est´an interesados en conocer la posible ocurrencia de impago para una gran cantidad de bancos de manera simult´anea (riesgo sist´emico).
Introducci´on Riesgo sist´emico
La din´amica de las log-reservas est´a dada por
dXti =⎡⎢
⎢⎢⎢⎣
1 N
N
∑
j=1
aij(Xtj− Xti) + αit
⎤⎥⎥⎥
⎥⎦dt+ σdWti
= [a (Xt− Xti) + αit] dt + σdWti,
donde aij es la cantidad de reservas que intercambia i con j , y (αit) es la cantidad que el i -´esimo agente intercambia fuera del sistema.
Introducci´on Riesgo sist´emico
El costo que el agente i est´a interesado en minimizar es Ji(α) = E [∫0T(1
2∣αit∣2− qαit(Xt− Xti) +
2(Xt− Xti)2) dt +c
2(XT− XTi )2] ,
donde c, > 0 balancean las interacciones con el resto del sistema, y q > 0 pondera las contribuciones de los tama˜nos relativos de los componentes (prerrogativas del regulador). En lo que resta, se considera q2≤ para garantizar convexidad.
Recordatorio de Juegos
Recordatorio de Juegos
Recordatorio de Juegos Definiciones
Definiciones
Un Juego es un modelo de agentes (jugadores) que interact´uan entre s´ı y que toman decisiones.
P el conjunto de jugadores, con #P = N.
Ai es el conjunto de acciones (admisibles) del i -´esimo jugador, de donde se define el conjunto de acciones admisibles A:
A= A1× ⋯ × AN.
Recordatorio de Juegos Definiciones
Se dice que a= (a1, . . . , aN) ∈ A es un perfil de acciones. Se denota por a−i como el perfil de acciones que excluye al jugador i :
a−i= (a1, . . . , ai−1, ai+1, . . . , aN) . Ai denota el conjunto de estrategias del i -´esimo jugador:
Ai ∶= {α ∶ [0, T ] → Ai} .
Para cada 1≤ i ≤ N, se tiene Ji ,N ∶ A → R, tambi´en llamada Funci´on de costo del jugador i .
Recordatorio de Juegos Equilibrio de Nash
Equilibrio de Nash
Se dice que un perfil de acciones ˆa∈ A es un Equilibrio de Nash si, y s´olo si, para todo jugador i = 1, . . . , N se cumple que
Ji(ˆa) ≤ Ji(ai, ˆa−i) , ∀ai ∈ Ai.
Recordatorio de Juegos Equilibrio de Nash
Equivalentemente, definiendo la llamada Funci´on De Mejor Respuesta (BRF, Best Response Function) Bi ∶ A → A como
Bi(a) ∶= {b ∈ A ∶ bi = arg min
α∈Ai
Ji(α, a−i)} ,
se dice que un perfil de acciones ˆa∈ A es un Equilibrio de Nash si, y s´olo si, ˆa es un punto fijo de la BRF B:
B(ˆa) = ˆa.
Recordatorio de Juegos Juegos sim´etricos
Juegos sim´ etricos
Se dice que un juego es sim´etrico si:
1 Todos los jugadores tienen el mismo conjunto de acciones admisibles:
A1= . . . = AN. Es decir, A= AN
2 Las funciones de costo son sim´etricas:
Ji(a1, . . . , aN) = Jσ(i)(aσ(1), . . . , aσ(N)) , para cualquier permutaci´on σ en{1, . . . , N}.
Recordatorio de Juegos Estrategia mixta
Estrategia mixta
Una estrategia mixta para el i -´esimo agente de un juego es una
distribuci´on de probabilidad µi ∈ P (Ai) dadas las acciones del resto de los jugadores, donde P (Ai) denota el conjunto de medidas de probabilidad (Borel) sobre el conjunto admisible Ai.
Es decir, α∈ A ahora son aleatorias con ley µ.
Recordatorio de Juegos Equilibrio de Nash (cont.)
Equilibrio de Nash (cont.)
Una estrategia perfil ˆα∼ ˆµ ∈ P (A) es llamada Equilibrio de Nash en estrategias mixtas si, y s´olo si, para cada jugador 1≤ i ≤ N se cumple que
JNi ( ˆα) ≤ JNi (α) , ∀α ∈ A, donde JNi (α) est´a dado por
JNi (α) ∶= ∫ANJi(a1, . . . , aN)dµ1(a1) × ⋯ × µN(aN) = ∫ANJi(a)dµ(a), α∼ µ ∈ P(A).
Juegos estoc´asticos finitos
Juegos estoc´ asticos finitos
Juegos estoc´asticos finitos Espacio de referencia
Espacio de referencia
Sea (Ω, F, P) un espacio de probabilidad, y sea W = (Wt, 0≤ t ≤ T ) un proceso de Wiener M-dimensional en dicho espacio.
Se denota por F = (Ft, 0≤ t ≤ T ) a la filtraci´on (completada por conjuntos de medida nula) generada por el proceso W .
Juegos estoc´asticos finitos Espacio de referencia
Con la misma notaci´on que antes, se supone que para todo i , Ai es un espacio m´etrico compacto, y que el conjunto de estrategias admisibles A = A1× ⋯ × AN est´a dado por elementos de la forma
A ∋ α = (α1, . . . , αN) ,
donde αi = (αit, 0≤ t ≤ T ) es un proceso B ([0, T ]) ⊗ F/B (Ai) -progresivamente medible para todo 1≤ i ≤ N.
Juegos estoc´asticos finitos Sistema controlado
Sistema Controlado
Para cada α∈ A, se define el estado del sistema controlado como el proceso RD-valuado X = Xα que evoluciona seg´un la din´amica
dXt= B (t, Xt, αt) dt + Σ (t, Xt, αt) dWt, 0≤ t ≤ T , (1) X0= x ∈ RD,
para (B, Σ) ∶ [0, T ] × Ω × RD× A → RD× RD×M, con D= d1+ ⋯ + dN.
Es decir, Xt= (Xt1, . . . , XtN), donde Xti ∈ Rdi es el estado individual del jugador i .
Juegos estoc´asticos finitos Funci´on de costo
Funci´ on de costo
Para cada jugador 1≤ i ≤ N, la funci´on de costo de la estrategia α est´a dado por
Ji(α; 0, x) = E [∫0Tfi(t, Xt, αt) dt + gi(XT)∣X0= x] , donde fi ∶ [0, T ] × Ω × RD× A → R y gi ∶ Ω × RD → R representan los costos corrientes y terminales, respectivamente.
Juegos estoc´asticos finitos Problema de control ´optimo
Problema de control ´ optimo
Para cada 1≤ i ≤ N, se busca hallar un proceso Ai-valuado ˆαi,
progresivamente medible, tal que el valor de la funci´on de la respectiva funci´on de costo se minimize:
ˆ
αi ∈ arg min
αi∈Ai
Ji(αi, ˆα−i) ,
donde ˆα= (ˆα1, . . . , ˆαN).
¡Misma noci´on de optimalidad que un equilibrio de Nash!
Juegos estoc´asticos finitos Tipos de estrategias
Tipos de estrategias
La existencia y unicidad de un equilibrio depende de la de la estructura de informaci´on disponible y el tipo de acciones que permite el modelo de juego.
Open loop:
αit = φi(t, X0, W[0,t]) , Closed loop:
αit= φi(t, X[0,t]) , Markovian:
αit= φ (t, Xt) ,
donde φi, 1≤ i ≤ N, son funciones deterministas medibles.
Juegos estoc´asticos finitos Funci´on de Valor
Funci´ on de Valor
Se define la funci´on de valor para el jugador i como vi(t, x) ∶ = inf
αi∈Ai
E [∫tTfi(s, Xs, αis, ˆα−is ) + gi(XT)∣Xt= x] , (2) donde X = Xαi, ˆα−i es soluci´on (fuerte) del sistema controlado (1).
Juegos estoc´asticos finitos M´etodos de soluci´on
M´ etodos de soluci´ on
¿C´omo encontrar el control ´optimo ˆα, as´ı como el valor del costo m´ınimo v(t, x) para el juego de N jugadores?
La v´ıa anal´ıtica: Ecuaciones de Hamilton-Jacobi-Bellman y soluciones de viscosidad.
La v´ıa probabilista: El principio del m´aximo estoc´astico
V´ıa anal´ıtica
V´ıa de soluci´ on anal´ıtica
V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs
Hamiltoniano y Condici´ on de Isaacs
Se define el Hamiltoniano del i -´esimo jugador como la funci´on Hi ∶ [0, T ] × RD× RD× RD×M× A → R dada por
Hi(t, x, y, z, α) = B(t, x, α)Ty+1
2Tr((ΣΣT) (t, x, α)z) + fi(t, x, α).
V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs
Se dir´a que la condici´on de Isaacs se cumple si existe una funci´on (t, x, y, z) ↦ ˆα(t, x, y, z) ∈ A
tal que para cada 1≤ i ≤ N y para todo t ∈ [0, T ], x ∈ RD,
y = (y1, . . . , yN) ∈ (RD)N, z= (z1, . . . , zN) ∈ (RD×M)N, se cumple que Hi(t, x, yi, zi,̂α(t, x, y, z)) ≤ Hi(t, x, yi, zi,(αi,α̂−i(t, x, y, z))) (3) para todo αi ∈ Ai.
V´ıa anal´ıtica Ecuaci´on HJB
Ecuaci´ on HJB
Suponiendo que la funci´on de valor vi, definida en (2), es suficientemente suave, entonces vi es una soluci´on (viscosa) del problema de Cauchy
− ∂tvi(t, x) − inf
αi∈Ai
Hi(t, x, ∂xvi(t, x), ∂2xxvi(t, x), αi) = 0, (4) para todo (t, x) ∈ [0, T ) × RD, con condici´on terminal
vi(T , x) = gi(x). (5)
A (4)-(5) se le conoce com´unmente como Ecuaci´on de Hamilton-Jacobi-Bellman.
V´ıa anal´ıtica Ecuaci´on HJB
Rec´ıprocamente, si Vi es una soluci´on de (4)-(5), entonces Vi es la funci´on de valor del problema de control (1)-(2).
M´as a´un, el control ´optimo se obtiene de la minimizaci´on del Hamiltoniano; es decir, de la condici´on de Isaacs (3).
V´ıa probabilista
V´ıa de soluci´ on probabilista
V´ıa probabilista Proceso adjunto
El proceso adjunto (Open loop)
Para una estrategia admisible α∈ A y el correspondiente proceso de estados X = Xα, se dice que los N pares de procesos((Yi ,α, Zi ,α))1≤i≤N son los procesos adjuntos asociados al juego si para cada i se satisface la Ecuaci´on Diferencial Estoc´astica hacia atr´as
dYti ,α= −∂xHi(t, Xt, Yti ,α, Zti ,α, αt) dt+ Zti ,αdWt, t∈ [0, T ],
YTi ,α= ∂xgi(XT) . (6)
V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin
Principio del M´ aximo (Estoc´ astico) de Pontryagin
Sea ˆα un Equilibrio de Nash (open loop), ̂X el respectivo proceso controlado y ( ˆY , ˆZ) el proceso adjunto asociado (6). Si el mapeo α↦ Hi(t, ˆXt, ˆYti, ˆZti, α, ˆα−it ) es convexo Leb1⊗ P-ctp, entonces la condici´on de Isaacs se sataisface trayectorialmente:
Hi(t, ˆXt, ˆYti, ˆZti, ˆαt) = inf
ai∈Ai
Hi(t, ˆXt, ˆYti, ˆZti, α, ˆα−it ) , Leb1⊗ P − ctp.
(7)
V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin
Rec´ıprocamente, para α, Xα y(Yα, Zα) control, sistema y proceso adjunto admisibles, respectivamente; si el mapeo
(x, α) ↦ Hi(t, x, ˆYti, ˆZti, α, ˆα−it ) es convexo Leb1⊗ P-ctp, si (7) se verifica con α, y si adem´as las gi son convexas, entonces α es un equilibrio de Nash.
Juegos de Campo Medio
Juegos de Campo Medio
Juegos de Campo Medio
Se introducen algunos conceptos que se usar´an m´as adelante
Sea Q un espacio m´etrico compacto y den´otese porP(Q) el conjunto de medidas de Probabilidad (Borel).
Se dota aP(Q) con la topolog´ıa de convergencia d´ebil*, W∗. Luego, (P(Q), W∗) es compacto; adem´as, puede ser metrizado por la distancia Kantorovich-Rubinstein d1:
d1(µ, ν) ∶ = sup {∫Qf d(µ − ν) ∶ f 1-Lipschitz continua } , para todo µ, ν∈ P (Q).
Para x= (x1, . . . , xN) ∈ RN, se denota por µNx a la distribuci´on emp´ırica de x :
µNx = 1 N
N
∑
1
δxi.
Juegos de Campo Medio L´ımite de funciones sim´etricas
L´ımite de funciones sim´ etricas
Para cada N ≥ 1, sea uN∶ QN → R una funci´on sim´etrica en sus entradas.
Sup´ongase que (uN) cumple lo siguiente:
(Cota unif.) supN≥1supx∈QN∣uN(x)∣ < ∞.
(Cont. unif.) Existe un m´odulo de continuidad ω, indep. de N, tal que
∣uN(x) − uN(y)∣ ≤ ω (d1(µNx, µNy)) , ∀x, y ∈ QN,∀N ≥ 1.
Entonces, existe una subsucesi´on (uNk)k≥1 y un mapa Lipschitz continuo U ∶ P(Q) → R que cumple
klim→∞ sup
x∈QNk ∣uNk(x) − U (µNxk)∣ = 0.
Juegos de Campo Medio Formulaci´on del Problema
Formulaci´ on del Problema
El enfoque de Campo Medio toma en cuenta que:
La interacci´on entre los jugadores es (fuertemente) sim´etrica.
Dicha interacci´on se da a trav´es de la distribuci´on emp´ırica de los estados del sistema.
Juegos de Campo Medio Formulaci´on del Problema
Formalmente:
Se asumen las hip´otesis de un juego sim´etrico (mismo espacio de controles para todos los jugadores, funci´on de costo sim´etrica en sus entradas).
M´as a´un, la din´amica de los estados individuales es la misma para todos los jugadores.
La funci´on de costo tambi´en verifica las condiciones de (Cota uniforme)y(Continuidad uniforme)
Juegos de Campo Medio Formulaci´on del Problema
Interacciones en juego finito:
dXti = Bi(t, Xti,Xt−i, αit,α−it ) dt + Σi(t, Xti,Xt−i, αit,α−it ) dWti, 0≤ t ≤ T , X0i = x ∈ Rdi
Interacciones tipo Mean Field:
dXti = b (t, Xti, αit,µNX−1−i
t ) dt + σ (t, Xti, αit,µNX−1−i
t ) dWti, 0≤ t ≤ T , (8) X0i = x ∈ Rd.
Juegos de Campo Medio Formulaci´on del Problema
Similarmente, para la funci´on de costo:
Ji(α) = E [∫0Tf (t, Xti, αit,µNX−1−i
t ) dt + g (XT,µNX−1−i T )] .
Juegos de Campo Medio Comportamiento asint´otico
Comportamiento asint´ otico
De los resultados de Propagaci´on de Caos [15], se tiene que para Xi = Xi ,N soluci´on de (8),
Xi ,N→ Xi d´ebilmente cuando N→ ∞.
Juegos de Campo Medio Comportamiento asint´otico
M´as a´un, (Xi)
i≥1 son copias independientes del proceso dX1t = ∫ b (t,Xt1, α1t, y) mt(dy)dt
+ ∫ σ (t,Xt1, α1t, y) mt(dy)dW1t, 0≤ t ≤ T , X10= x ∈ Rd,
donde W es un MB d -dimensional, y m∶ [0, T ] → P (A1) denota la ley del proceso X1:
mt= L (X1t) .
Juegos de Campo Medio Comportamiento asint´otico
Es decir, la din´amica de los estados individuales con interacci´on de Campo Medio converge a un proceso de McKean-Vlasov :
dXt= b (t, Xt, αt,L (Xt)) dt + σ (t, Xt, αt,L (Xt)) dWt, 0≤ t ≤ T , X0= ξ ∼ L (X0) .
Juegos de Campo Medio El Problema MFG
El Problema MFG
Sean
(Ω, F, F, P) un espacio de probabilidad filtrado y completo, con W un F-MB d-dimensional;
A (conjunto de acciones admisibles) un espacio m´etrico compacto;
A (conjunto de estrategias admisibles) el espacio de procesos A-valuados, F-progresivamente medibles α (cuadrado integrables);
ξ∈ L2(Ω, F0, P, Rd) una condici´on inicial.
Entonces, el problema de Juego de Campo Medio consiste en obtener la funci´on de (Mejor respuesta)del jugador representante, y posteriormente resolver el problema de (Punto fijo).
Juegos de Campo Medio El Problema MFG
(Mejor respuesta) Para µ∶ [0, T ] → P(A) dado (fijo), resolver el problema de Control Estoc´astico
αinf∈AJµ(α) con Jµ(α) = E [∫0Tf (t, Xtα, αt, µt) dt + g (XT, µT)] , sujeto a
dXtα= b (t, Xtα, αt, µt) dt + σ (t, Xtα, αt, µt) dWt, 0≤ t ≤ T , X0α= ξ ∼ µ0,
donde los coeficientes son tales que la EDE tiene una soluci´on fuerte y el funcional de costo es fuertemente sim´etrico.
Juegos de Campo Medio El Problema MFG
(Punto fijo) Encontrar un flujo µ tal que µt = L ( ˆXt) para toda t ∈ [0, T ], donde ˆX = Xαˆ es soluci´on del problema de(Mejor respuesta).
Juegos de Campo Medio Equilibrios de Nash en el l´ımite
Equilibrios de Nash en el l´ımite
Theorem ([4])
Para todo N, sea JN la funci´on de costo de un Juego sim´etrico con N participantes. Si ˆαN ∼ mN es un equilibrio de Nash (en estrategias mixtas), entonces existe m∈ P(A) tal que (mN) converge a m en la topolog´ıa de convergencia d´ebil*, y cumple con la llamada Ecuaci´on de campo medio:
Jm(α) = inf
m∈P(A)Jm(α), α∼ m.
Juegos de Campo Medio Equilibrios de Nash en el l´ımite
Theorem ([5][16])
Suponiendo que existe una soluci´on al problema de MFG (coeficientes Lipschitz, acotados y suficientemente suaves, convexidad del espacio y del Hamiltoniano, entre otros), entonces existe (N)N≥1, N→ 0, tal que la estrategia perfil ( ˆα, . . . , ˆα) para el N-juego, con ˆα soluci´on del MFG, es un N-equilibrio de Nash:
Ji ,N( ˆα, . . . , ˆα) ≤ Ji ,N( ˆα, . . . , αi, . . . , ˆα) + N, ∀αi ∈ A, ∀i.
Soluci´on de MFGs
Soluci´ on de MFGs
Soluci´on de MFGs Hamiltoniano
Hamiltoniano
Se define el Hamiltoniano como la funci´on
H∶ [0, T ] × Rd× P(A) × Rd× Rd×d× A → R dada por H(t, x, µ, y, z, α) = b(t, x, µ, α)Ty+1
2Tr((σσT) (t, x, µ, α)z) + f (t, x, µ, α).
Soluci´on de MFGs V´ıa anal´ıtica
Bosquejo del m´ etodo anal´ıtico
Para abordar el problema de (Mejor respuesta):
1 Se define una funci´on de valor para el problema de control:
v(t, x; µ) ∶ = inf
α∈AE [∫tTf (s, Xs, αs, µs) ds + g (XT, µT)∣Xt= x] .
2 Se prueba un principio de Programaci´on din´amica para el semi-grupo correspondiente.
3 Se deduce la ecuaci´on HJB en t´erminos de la medida µ y se prueba que la funci´on de valor v es soluci´on viscosa de ´esta.
4 Finalmente, se obtienen los lemas de verificaci´on.
Soluci´on de MFGs V´ıa anal´ıtica
Para abordar el problema de (Punto fijo):
1 Se obtiene el generador de la difusi´on.
2 Se acopla la din´amica de la distribuci´on del proceso a la HJB; i.e., ecuaci´on FP (Kolmogorov hacia adelante) con la condici´on inicial µ0= L(ξ).
Soluci´on de MFGs V´ıa anal´ıtica
Formulaci´ on anal´ıtica del MFG
Solucionar el sistema acoplado de ecuaciones diferenciales:
∂tv+ H (t, x, µt, ∂xv , ∂xx2 v , ˆα) = 0, v(T , x) = g(x, µT),
∂tµt−1
2Tr(∂xx2 ((σσT) (t, x, µ, ˆα)µt)) (9) + divx(b(t, x, µ, ˆα)µt) = 0, µ0 = L(ξ),
con ˆα= ˆα (t, x, µt, ∂xv , ∂xx2 v) determinista tal que H(t, x, µt, y , z, ˆα(t, x, µt, y , z)) = inf
α∈AH(t, x, µt, y , z, α) (10)
Soluci´on de MFGs V´ıa anal´ıtica
Entonces, lasoluci´on al Juego de Campo Medioest´a dada por el par(v, µ) que resuelve (9), y el control ´optimo ˆα por la condici´on de Isaacs (10).
Soluci´on de MFGs Via probabilista
Bosquejo del m´ etodo probabilista
Para abordar el problema de (Mejor respuesta):
Theorem (Principio del m´aximo para MFGs)
Sea µ∶ [0, T ] → P2(A) medible y acotada. Bajo condiciones de suavidad y continuidad sobre los coeficientes b, σ, f , g , el sistema (adjunto) de
FBSDEs
dXt= b (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dt X0 = ξ, + σ (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dWt,
dYt= −∂xH(t, Xt, µt, Yt, Zt, ˆα(t, Xt, µt, Yt, Zt)) dt YT = ∂xg(XT, µT) ,
+ ZtdWt, (11)
donde ˆα viene de (10), tiene una (´unica) soluci´on(X , Y , Z).
Soluci´on de MFGs Via probabilista
Theorem (Principio del m´aximo para MFGs, cont.)
Adem´as, el control ˆα= (ˆα (t, Xt, µt, Yt, Zt))t∈[0,T ] cumple que Jµ( ˆα) + E [∫0T∣αt− ˆαt∣2dt] ≤ Jµ(α) , ∀α ∈ A.
Soluci´on de MFGs Via probabilista
Para abordar el problema de (Punto fijo):
Se retoma el comportamiento asint´otico de las interacciones de Campo Medio (propagaci´on de caos) para obtener µ tal que
P ○ ( ˆXt)−1= µt.
Se acopla dicha ley al sistema adjunto (11) del principio del m´aximo.
Soluci´on de MFGs Via probabilista
Formulaci´ on probabilista del MFG
Resolver el sistema de ecuaciones estoc´asticas McKean-Vlasov d ˆXt= b (t, ˆXt,L ( ˆXt) , ˆα (t, ˆXt,L ( ˆXt) , ˆYt, ˆZt)) dt
+ σ (t, ˆXt,L ( ˆXt) , ˆα (t, ˆXt,L ( ˆXt) , ˆYt, ˆZt)) dWt, d ˆYt= −∂xH(t, Xt,L ( ˆXt) , ˆYt, ˆZt, ˆα(t, Xt,L ( ˆXt) , ˆYt, ˆZt)) dt
+ ˆZtdWt, (12)
con condiciones inicial y terminal ˆX0= ξ y ˆYT = ∂xg( ˆXT,L (XT)), respectivamente, y ˆα(t, x, µt, y , z) como en (10).
Soluci´on de MFGs Via probabilista
Entonces, la soluci´on al Juego de Campo Medioest´a dada por el proceso ( ˆX , ˆY , ˆZ) que resuelve (12).
Aplicaci´on
Aplicaci´ on: Ejemplo inicial
Aplicaci´on Riesgo Sist´emico
Riesgo Sist´ emico (cont.)
Modelando el problema como un MFG:
1 Para t ↦ mt (determinista), resolver el problema de control
αinf∈AE [∫0T(1
2∣αt∣2− qαt(mt− Xt) +
2(mt− Xt)2) dt +c
2(mT− XT)2] , sujeto a
dXt= [a (mt− Xt) + αt] dt + σdWt, X0= ξ.
2 Hallar ˆm∶ [0, T ] → R tal que ˆmt= E [ ˆXt] para toda 0 ≤ t ≤ T .
Aplicaci´on Riesgo Sist´emico
El Hamiltoniano del problema es H(t, x, y, α) = [a(mt− x) + α] y +1
2α2− qα(mt− x) +
2(mt− x)2, que es convexo en (x, α) bajo la hip´otesis de q2≤ , y alcanza su m´ınimo en
α(t, x, mˆ t, y) = q(mt− x) − y.
Aplicaci´on Riesgo Sist´emico
El correspondiente sistema adjunto de FBSDEs es
dXt= [(a + q) (mt− Xt) − Yt] dt + σdWt, m0= E [ξ] ,
dYt= [(a + q)Yt+ ( − q2) (mt− Xt)] dt + ZtdWt, YT = c(XT− mT).
Procediendo de manera an´aloga a un problema de control lineal-cuadr´atico, la soluci´on al sistema anterior est´a dada por
Yˆt= −ηt(mt− Xt), Zˆt = σηt, donde ηt es soluci´on de la ecuaci´on de Riccati
∂tηt = 2(a + q)ηt+ ηt2− (e − q2), ηT = c.
Conclusiones
Conclusiones
Un Juego de Campo Medio es un problema de Control.
Los equilibrios en el problema MFG aproximan a los equilibrios en un juego finito.
Resolver el problema implica resolver sistemas acoplados de ecuaciones diferenciales que van hacia adelante y hacia atr´as en el tiempo.
La v´ıa anal´ıtica resuelve un sistema en un espacio de dimensi´on infinita (espacio de medidas de probabilidad). La v´ıa probabilista, un sistema de ecuaciones estoc´asticas McKean-Vlasov (dependientes de la ley del proceso).
Conclusiones
Extensiones
Juegos con ruido com´un. [5]
Juegos en grafos. [11]
Problemas de paro ´optimo. [14, 3]
Procesos con saltos. [1]
Otras formulaciones y aplicaciones. [9, 12]
Otros m´etodos de soluci´on (Martingalas controladas). [10]
Otras nociones de optimalidad (Mean Field Control Problems). [2, 6]
Referencias
Referencias I
[1] Chiara Benazzoli, Luciano Campi, and Luca Di Persio.“Mean field games with controlled jump–diffusion dynamics: Existence results and an illiquid interbank market model”.In: Stochastic Processes and their Applications 130.11 (2020), pp. 6927–6964.
[2] Alain Bensoussan, Jens Frehse, Phillip Yam, et al.Mean field games and mean field type control theory.Vol. 101. Springer, 2013.
[3] Charles Bertucci.“Optimal stopping in mean field games, an
obstacle problem approach”.In: Journal de Math´ematiques Pures et Appliqu´ees 120 (2018), pp. 165–194.
[4] Pierre Cardaliaguet.Notes on mean field games. Tech. rep.
Technical report, 2010.
[5] Ren´e Carmona, Fran¸cois Delarue, et al. Probabilistic Theory of Mean Field Games with Applications I-II.Springer, 2018.
Referencias
Referencias II
[6] Ren´e Carmona, Fran¸cois Delarue, and Aim´e Lachapelle.“Control of McKean–Vlasov dynamics versus mean field games”.In:
Mathematics and Financial Economics 7.2 (2013), pp. 131–166.
[7] Wendell H Fleming and Raymond W Rishel.Deterministic and stochastic optimal control.Vol. 1. Springer Science & Business Media, 2012.
[8] Diogo A Gomes et al.“Mean field games models—a brief survey”.
In: Dynamic Games and Applications 4.2 (2014), pp. 110–154.
[9] Olivier Gu´eant, Jean-Michel Lasry, and Pierre-Louis Lions.“Mean field games and applications”.In: Paris-Princeton lectures on mathematical finance 2010. Springer, 2011, pp. 205–266.
Referencias
Referencias III
[10] Daniel Lacker.“Mean field games via controlled martingale problems: existence of Markovian equilibria”.In: Stochastic Processes and their Applications 125.7 (2015), pp. 2856–2894.
[11] Daniel Lacker and Agathe Soret.“A case study on stochastic games on large graphs in mean field and sparse regimes”.In: arXiv preprint arXiv:2005.14102 (2020).
[12] Laetitia Laguzet and Gabriel Turinici.“Individual vaccination as Nash equilibrium in a SIR model with application to the 2009–2010 influenza A (H1N1) epidemic in France”.In: Bulletin of
Mathematical Biology 77.10 (2015), pp. 1955–1984.
[13] Makiko Nisio.“Stochastic control theory”. In: ISI Lecture Notes 9 (1981).
Referencias
Referencias IV
[14] Marcel Nutz.“A mean field game of optimal stopping”.In: SIAM Journal on Control and Optimization 56.2 (2018), pp. 1206–1221.
[15] Alain-Sol Sznitman.“Topics in propagation of chaos”. In: Ecole d’´et´e de probabilit´es de Saint-Flour XIX—1989. Springer, 1991, pp. 165–251.
[16] Athanasios Vasiliadis.“An Introduction to Mean Field Games using probabilistic methods”.In: arXiv preprint arXiv:1907.01411 (2019).