Introducción a Juegos de Campo Medio

(1)

Introducci´ on a Juegos de Campo Medio

Joherigu

Seminario de Finanzas

Noviembre 2020

(2)

Introducci´on

¿Juegos grandes?

La teor´ıa de Juegos de Campo Medio (Mean-Field Games, MFGs) estudia el equilibrio de juegos grandes (con un gran n´umero N de participantes), analizando su comportamiento en el l´ımite.

Particularmente, se enfoca en juegos grandes con “jugadores peque˜nos”, donde la influencia individual de cada jugador disminuye conforme N → ∞.

(3)

Introducci´on Riesgo sist´emico

Modelo de Riesgo sist´ emico

El modelo consta de lo siguiente:

Una red de N bancos (agentes) que interact´uan entre s´ı mediante el pr´estamo y cobro de sus reservas de efectivo.

Para cada 1≤ i ≤ N, Xtⁱ representa la log-reserva de efectivo del i -´esimo banco al tiempo t∈ [0, T ].

Todos los agentes están interesados en conocer la posible ocurrencia de impago para una gran cantidad de bancos de manera simultánea (riesgo sistémico).

(4)

La din´amica de las log-reservas est´a dada por

dX_tⁱ =⎡⎢

⎢⎢⎢⎣

1 N

N

∑

j=1

a^ij(Xt^j− Xtⁱ) + αⁱt

⎤⎥⎥⎥

⎥⎦dt+ σdWtⁱ

= [a (Xt− Xtⁱ) + αⁱ_t] dt + σdW_tⁱ,

donde a^ij es la cantidad de reservas que intercambia i con j , y (αⁱ_t) es la cantidad que el i -´esimo agente intercambia fuera del sistema.

(5)

El costo que el agente i est´a interesado en minimizar es Jⁱ(α) = E [∫₀^T(1

2∣αⁱt∣²− qαⁱt(Xt− Xtⁱ) +

2(Xt− Xtⁱ)²) dt +c

2(XT− X_Tⁱ )²] ,

donde c, > 0 balancean las interacciones con el resto del sistema, y q > 0 pondera las contribuciones de los tama˜nos relativos de los componentes (prerrogativas del regulador). En lo que resta, se considera q²≤ para garantizar convexidad.

(6)

Recordatorio de Juegos

(7)

Recordatorio de Juegos Definiciones

Definiciones

Un Juego es un modelo de agentes (jugadores) que interact´uan entre s´ı y que toman decisiones.

P el conjunto de jugadores, con #P = N.

Ai es el conjunto de acciones (admisibles) del i -´esimo jugador, de donde se define el conjunto de acciones admisibles A:

A= A1× ⋯ × AN.

(8)

Recordatorio de Juegos Definiciones

Se dice que a= (a¹, . . . , a^N) ∈ A es un perfil de acciones. Se denota por a⁻ⁱ como el perfil de acciones que excluye al jugador i :

a⁻ⁱ= (a¹, . . . , aⁱ⁻¹, aⁱ⁺¹, . . . , a^N) . Ai denota el conjunto de estrategias del i -´esimo jugador:

Ai ∶= {α ∶ [0, T ] → Ai} .

Para cada 1≤ i ≤ N, se tiene J^{i ,N} ∶ A → R, tambi´en llamada Funci´on de costo del jugador i .

(9)

Recordatorio de Juegos Equilibrio de Nash

Equilibrio de Nash

Se dice que un perfil de acciones ˆa∈ A es un Equilibrio de Nash si, y s´olo si, para todo jugador i = 1, . . . , N se cumple que

Jⁱ(ˆa) ≤ Jⁱ(aⁱ, ˆa⁻ⁱ) , ∀aⁱ ∈ Ai.

(10)

Recordatorio de Juegos Equilibrio de Nash

Equivalentemente, definiendo la llamada Funci´on De Mejor Respuesta (BRF, Best Response Function) Bⁱ ∶ A → A como

Bⁱ(a) ∶= {b ∈ A ∶ bⁱ = arg min

α∈Ai

Jⁱ(α, a⁻ⁱ)} ,

se dice que un perfil de acciones â∈ A es un Equilibrio de Nash si, y sólo si, â es un punto fijo de la BRF B:

B(ˆa) = ˆa.

(11)

Recordatorio de Juegos Juegos sim´etricos

Juegos sim´ etricos

Se dice que un juego es sim´etrico si:

1 Todos los jugadores tienen el mismo conjunto de acciones admisibles:

A1= . . . = AN. Es decir, A= A^N

2 Las funciones de costo son sim´etricas:

Jⁱ(a¹, . . . , a^N) = J^σ⁽ⁱ⁾(a^σ⁽¹⁾, . . . , a^σ^(N)) , para cualquier permutaci´on σ en{1, . . . , N}.

(12)

Recordatorio de Juegos Estrategia mixta

Estrategia mixta

Una estrategia mixta para el i -´esimo agente de un juego es una

distribuci´on de probabilidad µi ∈ P (Ai) dadas las acciones del resto de los jugadores, donde P (Ai) denota el conjunto de medidas de probabilidad (Borel) sobre el conjunto admisible A_i.

Es decir, α∈ A ahora son aleatorias con ley µ.

(13)

Recordatorio de Juegos Equilibrio de Nash (cont.)

Equilibrio de Nash (cont.)

Una estrategia perfil ˆα∼ ˆµ ∈ P (A) es llamada Equilibrio de Nash en estrategias mixtas si, y s´olo si, para cada jugador 1≤ i ≤ N se cumple que

J_Nⁱ ( ˆα) ≤ JNⁱ (α) , ∀α ∈ A, donde J_Nⁱ (α) est´a dado por

J_Nⁱ (α) ∶= ∫_ANJⁱ(a¹, . . . , a^N)dµ1(a¹) × ⋯ × µN(a^N) = ∫_ANJⁱ(a)dµ(a), α∼ µ ∈ P(A).

(14)

Juegos estoc´asticos finitos

Juegos estoc´ asticos finitos

(15)

Juegos estoc´asticos finitos Espacio de referencia

Espacio de referencia

Sea (Ω, F, P) un espacio de probabilidad, y sea W = (Wt, 0≤ t ≤ T ) un proceso de Wiener M-dimensional en dicho espacio.

Se denota por F = (Ft, 0≤ t ≤ T ) a la filtraci´on (completada por conjuntos de medida nula) generada por el proceso W .

(16)

Juegos estoc´asticos finitos Espacio de referencia

Con la misma notación que antes, se supone que para todo i , Ai es un espacio métrico compacto, y que el conjunto de estrategias admisibles A = A1× ⋯ × AN está dado por elementos de la forma

A ∋ α = (α¹, . . . , α^N) ,

donde αⁱ = (αⁱt, 0≤ t ≤ T ) es un proceso B ([0, T ]) ⊗ F/B (Ai) -progresivamente medible para todo 1≤ i ≤ N.

(17)

Juegos estoc´asticos finitos Sistema controlado

Sistema Controlado

Para cada α∈ A, se define el estado del sistema controlado como el proceso R^D-valuado X = X^α que evoluciona seg´un la din´amica

dX_t= B (t, Xt, α_t) dt + Σ (t, Xt, α_t) dWt, 0≤ t ≤ T , (1) X0= x ∈ R^D,

para (B, Σ) ∶ [0, T ] × Ω × R^D× A → R^D× R^D^×M, con D= d1+ ⋯ + dN.

Es decir, Xt= (Xt¹, . . . , X_t^N), donde X_tⁱ ∈ R^dⁱ es el estado individual del jugador i .

(18)

Juegos estoc´asticos finitos Funci´on de costo

Funci´ on de costo

Para cada jugador 1≤ i ≤ N, la funci´on de costo de la estrategia α est´a dado por

Jⁱ(α; 0, x) = E [∫₀^Tfⁱ(t, Xt, αt) dt + gⁱ(XT)∣X0= x] , donde fⁱ ∶ [0, T ] × Ω × R^D× A → R y gⁱ ∶ Ω × R^D → R representan los costos corrientes y terminales, respectivamente.

(19)

Juegos estoc´asticos finitos Problema de control ´optimo

Problema de control ´ optimo

Para cada 1≤ i ≤ N, se busca hallar un proceso Ai-valuado ˆαⁱ,

progresivamente medible, tal que el valor de la funci´on de la respectiva funci´on de costo se minimize:

ˆ

αⁱ ∈ arg min

αⁱ∈Ai

Jⁱ(αⁱ, ˆα⁻ⁱ) ,

donde ˆα= (ˆα¹, . . . , ˆα^N).

¡Misma noci´on de optimalidad que un equilibrio de Nash!

(20)

Juegos estoc´asticos finitos Tipos de estrategias

Tipos de estrategias

La existencia y unicidad de un equilibrio depende de la de la estructura de informaci´on disponible y el tipo de acciones que permite el modelo de juego.

Open loop:

αⁱ_t = φⁱ(t, X0, W_[0,t]) , Closed loop:

αⁱ_t= φⁱ(t, X_[0,t]) , Markovian:

αⁱ_t= φ (t, Xt) ,

donde φⁱ, 1≤ i ≤ N, son funciones deterministas medibles.

(21)

Juegos estoc´asticos finitos Funci´on de Valor

Funci´ on de Valor

Se define la funci´on de valor para el jugador i como vⁱ(t, x) ∶ = inf

αⁱ∈Ai

E [∫_t^Tfⁱ(s, Xs, αⁱ_s, ˆα⁻ⁱ_s ) + gⁱ(XT)∣Xt= x] , (2) donde X = X^αⁱ^{, ˆ}^α⁻ⁱ es soluci´on (fuerte) del sistema controlado (1).

(22)

Juegos estocásticos finitos Métodos de solución

M´ etodos de soluci´ on

¿C´omo encontrar el control ´optimo ˆα, as´ı como el valor del costo m´ınimo v(t, x) para el juego de N jugadores?

La v´ıa anal´ıtica: Ecuaciones de Hamilton-Jacobi-Bellman y soluciones de viscosidad.

La v´ıa probabilista: El principio del m´aximo estoc´astico

(23)

V´ıa anal´ıtica

V´ıa de soluci´ on anal´ıtica

(24)

V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs

Hamiltoniano y Condici´ on de Isaacs

Se define el Hamiltoniano del i -´esimo jugador como la funci´on Hⁱ ∶ [0, T ] × R^D× R^D× R^D^×M× A → R dada por

Hⁱ(t, x, y, z, α) = B(t, x, α)^Ty+1

2Tr((ΣΣ^T) (t, x, α)z) + fⁱ(t, x, α).

(25)

V´ıa anal´ıtica Hamiltoniano y Condici´on de Isaacs

Se dirá que la condición de Isaacs se cumple si existe una función (t, x, y, z) ↦ ˆα(t, x, y, z) ∈ A

tal que para cada 1≤ i ≤ N y para todo t ∈ [0, T ], x ∈ R^D,

y = (y¹, . . . , y^N) ∈ (R^D)^N, z= (z¹, . . . , z^N) ∈ (R^D^×M)^N, se cumple que Hⁱ(t, x, yⁱ, zⁱ,̂α(t, x, y, z)) ≤ Hⁱ(t, x, yⁱ, zⁱ,(αⁱ,α̂⁻ⁱ(t, x, y, z))) (3) para todo αⁱ ∈ Ai.

(26)

V´ıa anal´ıtica Ecuaci´on HJB

Ecuaci´ on HJB

Suponiendo que la funci´on de valor vⁱ, definida en (2), es suficientemente suave, entonces vⁱ es una soluci´on (viscosa) del problema de Cauchy

− ∂tvⁱ(t, x) − inf

αⁱ∈Ai

Hⁱ(t, x, ∂xvⁱ(t, x), ∂²xxvⁱ(t, x), αⁱ) = 0, (4) para todo (t, x) ∈ [0, T ) × R^D, con condici´on terminal

vⁱ(T , x) = gⁱ(x). (5)

A (4)-(5) se le conoce com´unmente como Ecuaci´on de Hamilton-Jacobi-Bellman.

(27)

V´ıa anal´ıtica Ecuaci´on HJB

Rec´ıprocamente, si Vⁱ es una soluci´on de (4)-(5), entonces Vⁱ es la funci´on de valor del problema de control (1)-(2).

Más aún, el control óptimo se obtiene de la minimización del Hamiltoniano; es decir, de la condición de Isaacs (3).

(28)

V´ıa probabilista

V´ıa de soluci´ on probabilista

(29)

V´ıa probabilista Proceso adjunto

El proceso adjunto (Open loop)

Para una estrategia admisible α∈ A y el correspondiente proceso de estados X = X^α, se dice que los N pares de procesos((Y^{i ,α}, Z^{i ,α}))₁_≤i≤N son los procesos adjuntos asociados al juego si para cada i se satisface la Ecuación Diferencial Estocástica hacia atrás

dY_t^{i ,α}= −∂xHⁱ(t, Xt, Y_t^{i ,α}, Z_t^{i ,α}, αt) dt+ Zt^{i ,α}dWt, t∈ [0, T ],

Y_T^{i ,α}= ∂xgⁱ(XT) . (6)

(30)

V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin

Principio del M´ aximo (Estoc´ astico) de Pontryagin

Sea ˆα un Equilibrio de Nash (open loop), ̂X el respectivo proceso controlado y ( ˆY , ˆZ) el proceso adjunto asociado (6). Si el mapeo α↦ Hⁱ(t, ˆX_t, ˆY_tⁱ, ˆZ_tⁱ, α, ˆα⁻ⁱ_t ) es convexo Leb1⊗ P-ctp, entonces la condici´on de Isaacs se sataisface trayectorialmente:

Hⁱ(t, ˆX_t, ˆY_tⁱ, ˆZ_tⁱ, ˆα_t) = inf

aⁱ∈Ai

Hⁱ(t, ˆX_t, ˆY_tⁱ, ˆZ_tⁱ, α, ˆα⁻ⁱ_t ) , Leb1⊗ P − ctp.

(7)

(31)

V´ıa probabilista Principio del M´aximo (Estoc´astico) de Pontryagin

Rec´ıprocamente, para α, X^α y(Y^α, Z^α) control, sistema y proceso adjunto admisibles, respectivamente; si el mapeo

(x, α) ↦ Hⁱ(t, x, ˆY_tⁱ, ˆZ_tⁱ, α, ˆα⁻ⁱ_t ) es convexo Leb1⊗ P-ctp, si (7) se verifica con α, y si adem´as las gⁱ son convexas, entonces α es un equilibrio de Nash.

(32)

Juegos de Campo Medio

(33)

Juegos de Campo Medio

Se introducen algunos conceptos que se usar´an m´as adelante

Sea Q un espacio m´etrico compacto y den´otese porP(Q) el conjunto de medidas de Probabilidad (Borel).

Se dota aP(Q) con la topolog´ıa de convergencia d´ebil*, W^∗. Luego, (P(Q), W^∗) es compacto; adem´as, puede ser metrizado por la distancia Kantorovich-Rubinstein d1:

d1(µ, ν) ∶ = sup {∫_Qf d(µ − ν) ∶ f 1-Lipschitz continua } , para todo µ, ν∈ P (Q).

Para x= (x1, . . . , x_N) ∈ R^N, se denota por µ^N_x a la distribuci´on emp´ırica de x :

µ^N_x = 1 N

N

∑

1

δ_x_i.

(34)

Juegos de Campo Medio L´ımite de funciones sim´etricas

L´ımite de funciones sim´ etricas

Para cada N ≥ 1, sea u^N∶ Q^N → R una funci´on sim´etrica en sus entradas.

Sup´ongase que (u^N) cumple lo siguiente:

(Cota unif.) sup_N≥1sup_x_∈Q^N∣u^N(x)∣ < ∞.

(Cont. unif.) Existe un m´odulo de continuidad ω, indep. de N, tal que

∣u^N(x) − u^N(y)∣ ≤ ω (d1(µ^Nx, µ^N_y)) , ∀x, y ∈ Q^N,∀N ≥ 1.

Entonces, existe una subsucesi´on (u^N^k)_k_≥1 y un mapa Lipschitz continuo U ∶ P(Q) → R que cumple

klim→∞ sup

x∈Q^Nk ∣u^N^k(x) − U (µ^Nx^k)∣ = 0.

(35)

Juegos de Campo Medio Formulaci´on del Problema

Formulaci´ on del Problema

El enfoque de Campo Medio toma en cuenta que:

La interacci´on entre los jugadores es (fuertemente) sim´etrica.

Dicha interacción se da a través de la distribución emp´ırica de los estados del sistema.

(36)

Formalmente:

Se asumen las hipótesis de un juego simétrico (mismo espacio de controles para todos los jugadores, función de costo simétrica en sus entradas).

Más aún, la dinámica de los estados individuales es la misma para todos los jugadores.

La funci´on de costo tambi´en verifica las condiciones de (Cota uniforme)y(Continuidad uniforme)

(37)

Interacciones en juego finito:

dX_tⁱ = Bⁱ(t, Xtⁱ,X_t⁻ⁱ, αⁱ_t,α⁻ⁱ_t ) dt + Σⁱ(t, Xtⁱ,X_t⁻ⁱ, αⁱ_t,α⁻ⁱ_t ) dWtⁱ, 0≤ t ≤ T , X₀ⁱ = x ∈ R^dⁱ

Interacciones tipo Mean Field:

dX_tⁱ = b (t, Xtⁱ, αⁱ_t,µ^N_X⁻¹−i

t ) dt + σ (t, Xtⁱ, αⁱ_t,µ^N_X⁻¹−i

t ) dWtⁱ, 0≤ t ≤ T , (8) X₀ⁱ = x ∈ R^d.

(38)

Similarmente, para la funci´on de costo:

Jⁱ(α) = E [∫₀^Tf (t, Xtⁱ, αⁱ_t,µ^N_X⁻¹−i

t ) dt + g (XT,µ^N_X⁻¹−i T )] .

(39)

Juegos de Campo Medio Comportamiento asint´otico

Comportamiento asint´ otico

De los resultados de Propagaci´on de Caos [15], se tiene que para Xⁱ = X^{i ,N} soluci´on de (8),

X^{i ,N}→ Xⁱ d´ebilmente cuando N→ ∞.

(40)

M´as a´un, (Xⁱ)

i≥1 son copias independientes del proceso dX¹_t = ∫ b (t,X^t¹, α¹_t, y) mt(dy)dt

+ ∫ σ (t,X^t¹, α¹_t, y) mt(dy)dW¹_t, 0≤ t ≤ T , X¹₀= x ∈ R^d,

donde W es un MB d -dimensional, y m∶ [0, T ] → P (A1) denota la ley del proceso X¹:

m_t= L (X¹t) .

(41)

Es decir, la din´amica de los estados individuales con interacci´on de Campo Medio converge a un proceso de McKean-Vlasov :

dXt= b (t, Xt, αt,L (Xt)) dt + σ (t, Xt, αt,L (Xt)) dWt, 0≤ t ≤ T , X0= ξ ∼ L (X0) .

(42)

Juegos de Campo Medio El Problema MFG

El Problema MFG

Sean

(Ω, F, F, P) un espacio de probabilidad filtrado y completo, con W un F-MB d-dimensional;

A (conjunto de acciones admisibles) un espacio m´etrico compacto;

A (conjunto de estrategias admisibles) el espacio de procesos A-valuados, F-progresivamente medibles α (cuadrado integrables);

ξ∈ L²(Ω, F0, P, R^d) una condici´on inicial.

Entonces, el problema de Juego de Campo Medio consiste en obtener la funci´on de (Mejor respuesta)del jugador representante, y posteriormente resolver el problema de (Punto fijo).

(43)

(Mejor respuesta) Para µ∶ [0, T ] → P(A) dado (fijo), resolver el problema de Control Estoc´astico

αinf∈AJ^µ(α) con J^µ(α) = E [∫₀^Tf (t, Xt^α, α_t, µ_t) dt + g (XT, µ_T)] , sujeto a

dX_t^α= b (t, Xt^α, αt, µt) dt + σ (t, Xt^α, αt, µt) dWt, 0≤ t ≤ T , X₀^α= ξ ∼ µ0,

donde los coeficientes son tales que la EDE tiene una soluci´on fuerte y el funcional de costo es fuertemente sim´etrico.

(44)

(Punto fijo) Encontrar un flujo µ tal que µt = L ( ˆXt) para toda t ∈ [0, T ], donde ˆX = X^α^ˆ es soluci´on del problema de(Mejor respuesta).

(45)

Juegos de Campo Medio Equilibrios de Nash en el l´ımite

Equilibrios de Nash en el l´ımite

Theorem ([4])

Para todo N, sea J^N la función de costo de un Juego simétrico con N participantes. Si ˆα^N ∼ mN es un equilibrio de Nash (en estrategias mixtas), entonces existe m∈ P(A) tal que (mN) converge a m en la topolog´ıa de convergencia débil*, y cumple con la llamada Ecuación de campo medio:

J^m(α) = inf

m∈P(A)J^m(α), α∼ m.

(46)

Juegos de Campo Medio Equilibrios de Nash en el l´ımite

Theorem ([5][16])

Suponiendo que existe una soluci´on al problema de MFG (coeficientes Lipschitz, acotados y suficientemente suaves, convexidad del espacio y del Hamiltoniano, entre otros), entonces existe (N)N≥1, N→ 0, tal que la estrategia perfil ( ˆα, . . . , ˆα) para el N-juego, con ˆα soluci´on del MFG, es un _N-equilibrio de Nash:

J^{i ,N}( ˆα, . . . , ˆα) ≤ J^{i ,N}( ˆα, . . . , αⁱ, . . . , ˆα) + N, ∀αⁱ ∈ A, ∀i.

(47)

Soluci´on de MFGs

Soluci´ on de MFGs

(48)

Soluci´on de MFGs Hamiltoniano

Hamiltoniano

Se define el Hamiltoniano como la funci´on

H∶ [0, T ] × R^d× P(A) × R^d× R^d×d× A → R dada por H(t, x, µ, y, z, α) = b(t, x, µ, α)^Ty+1

2Tr((σσ^T) (t, x, µ, α)z) + f (t, x, µ, α).

(49)

Soluci´on de MFGs V´ıa anal´ıtica

Bosquejo del m´ etodo anal´ıtico

Para abordar el problema de (Mejor respuesta):

1 Se define una funci´on de valor para el problema de control:

v(t, x; µ) ∶ = inf

α∈AE [∫_t^Tf (s, Xs, α_s, µ_s) ds + g (XT, µ_T)∣Xt= x] .

2 Se prueba un principio de Programaci´on din´amica para el semi-grupo correspondiente.

3 Se deduce la ecuación HJB en términos de la medida µ y se prueba que la función de valor v es solución viscosa de ésta.

4 Finalmente, se obtienen los lemas de verificaci´on.

(50)

Para abordar el problema de (Punto fijo):

1 Se obtiene el generador de la difusi´on.

2 Se acopla la dinámica de la distribución del proceso a la HJB; i.e., ecuación FP (Kolmogorov hacia adelante) con la condición inicial µ₀= L(ξ).

(51)

Formulaci´ on anal´ıtica del MFG

Solucionar el sistema acoplado de ecuaciones diferenciales:

∂_tv+ H (t, x, µt, ∂_xv , ∂_xx² v , ˆα) = 0, v(T , x) = g(x, µT),

∂tµt−1

2Tr(∂xx² ((σσ^T) (t, x, µ, ˆα)µt)) (9) + divx(b(t, x, µ, ˆα)µt) = 0, µ0 = L(ξ),

con ˆα= ˆα (t, x, µt, ∂_xv , ∂_xx² v) determinista tal que H(t, x, µt, y , z, ˆα(t, x, µt, y , z)) = inf

α∈AH(t, x, µt, y , z, α) (10)

(52)

Entonces, lasolución al Juego de Campo Medioestá dada por el par(v, µ) que resuelve (9), y el control óptimo ˆα por la condición de Isaacs (10).

(53)

Soluci´on de MFGs Via probabilista

Bosquejo del m´ etodo probabilista

Para abordar el problema de (Mejor respuesta):

Theorem (Principio del m´aximo para MFGs)

Sea µ∶ [0, T ] → P2(A) medible y acotada. Bajo condiciones de suavidad y continuidad sobre los coeficientes b, σ, f , g , el sistema (adjunto) de

FBSDEs

dXt= b (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dt X0 = ξ, + σ (t, Xt, µt, ˆα(t, Xt, µt, Yt, Zt)) dWt,

dYt= −∂xH(t, Xt, µt, Yt, Zt, ˆα(t, Xt, µt, Yt, Zt)) dt YT = ∂xg(XT, µT) ,

+ ZtdW_t, (11)

donde ˆα viene de (10), tiene una (´unica) soluci´on(X , Y , Z).

(54)

Theorem (Principio del m´aximo para MFGs, cont.)

Adem´as, el control ˆα= (ˆα (t, Xt, µ_t, Y_t, Z_t))_t_{∈[0,T ]} cumple que J^µ( ˆα) + E [∫₀^T∣αt− ˆαt∣²dt] ≤ J^µ(α) , ∀α ∈ A.

(55)

Para abordar el problema de (Punto fijo):

Se retoma el comportamiento asint´otico de las interacciones de Campo Medio (propagaci´on de caos) para obtener µ tal que

P ○ ( ˆXt)⁻¹= µt.

Se acopla dicha ley al sistema adjunto (11) del principio del m´aximo.

(56)

Formulaci´ on probabilista del MFG

Resolver el sistema de ecuaciones estoc´asticas McKean-Vlasov d ˆX_t= b (t, ˆX_t,L ( ˆX_t) , ˆα (t, ˆX_t,L ( ˆX_t) , ˆY_t, ˆZ_t)) dt

+ σ (t, ˆXt,L ( ˆXt) , ˆα (t, ˆXt,L ( ˆXt) , ˆYt, ˆZt)) dWt, d ˆY_t= −∂xH(t, Xt,L ( ˆX_t) , ˆY_t, ˆZ_t, ˆα(t, Xt,L ( ˆX_t) , ˆY_t, ˆZ_t)) dt

+ ˆZ_tdW_t, (12)

con condiciones inicial y terminal ˆX0= ξ y ˆYT = ∂xg( ˆXT,L (XT)), respectivamente, y ˆα(t, x, µt, y , z) como en (10).

(57)

Entonces, la soluci´on al Juego de Campo Medioest´a dada por el proceso ( ˆX , ˆY , ˆZ) que resuelve (12).

(58)

Aplicaci´on

Aplicaci´ on: Ejemplo inicial

(59)

Aplicaci´on Riesgo Sist´emico

Riesgo Sist´ emico (cont.)

Modelando el problema como un MFG:

1 Para t ↦ mt (determinista), resolver el problema de control

αinf∈AE [∫₀^T(1

2∣αt∣²− qαt(mt− Xt) +

2(mt− Xt)²) dt +c

2(mT− XT)²] , sujeto a

dX_t= [a (mt− Xt) + αt] dt + σdWt, X₀= ξ.

2 Hallar ˆm∶ [0, T ] → R tal que ˆmt= E [ ˆXt] para toda 0 ≤ t ≤ T .

(60)

El Hamiltoniano del problema es H(t, x, y, α) = [a(mt− x) + α] y +1

2α²− qα(mt− x) +

2(mt− x)², que es convexo en (x, α) bajo la hip´otesis de q²≤ , y alcanza su m´ınimo en

α(t, x, mˆ t, y) = q(mt− x) − y.

(61)

El correspondiente sistema adjunto de FBSDEs es

dX_t= [(a + q) (mt− Xt) − Yt] dt + σdWt, m₀= E [ξ] ,

dY_t= [(a + q)Yt+ ( − q²) (mt− Xt)] dt + ZtdW_t, Y_T = c(XT− mT).

Procediendo de manera análoga a un problema de control lineal-cuadrático, la solución al sistema anterior está dada por

Yˆt= −ηt(mt− Xt), Zˆt = σηt, donde ηt es soluci´on de la ecuaci´on de Riccati

∂_tη_t = 2(a + q)ηt+ η_t²− (e − q²), η_T = c.

(62)

Conclusiones

Un Juego de Campo Medio es un problema de Control.

Los equilibrios en el problema MFG aproximan a los equilibrios en un juego finito.

Resolver el problema implica resolver sistemas acoplados de ecuaciones diferenciales que van hacia adelante y hacia atr´as en el tiempo.

La v´ıa anal´ıtica resuelve un sistema en un espacio de dimensi´on infinita (espacio de medidas de probabilidad). La v´ıa probabilista, un sistema de ecuaciones estoc´asticas McKean-Vlasov (dependientes de la ley del proceso).

(63)

Conclusiones

Extensiones

Juegos con ruido com´un. [5]

Juegos en grafos. [11]

Problemas de paro ´optimo. [14, 3]

Procesos con saltos. [1]

Otras formulaciones y aplicaciones. [9, 12]

Otros m´etodos de soluci´on (Martingalas controladas). [10]

Otras nociones de optimalidad (Mean Field Control Problems). [2, 6]

(64)

Referencias

Referencias I

[1] Chiara Benazzoli, Luciano Campi, and Luca Di Persio.“Mean field games with controlled jump–diffusion dynamics: Existence results and an illiquid interbank market model”.In: Stochastic Processes and their Applications 130.11 (2020), pp. 6927–6964.

[2] Alain Bensoussan, Jens Frehse, Phillip Yam, et al.Mean field games and mean field type control theory.Vol. 101. Springer, 2013.

[3] Charles Bertucci.“Optimal stopping in mean field games, an

obstacle problem approach”.In: Journal de Math´ematiques Pures et Appliqu´ees 120 (2018), pp. 165–194.

[4] Pierre Cardaliaguet.Notes on mean field games. Tech. rep.

Technical report, 2010.

[5] Ren´e Carmona, Fran¸cois Delarue, et al. Probabilistic Theory of Mean Field Games with Applications I-II.Springer, 2018.

(65)

Referencias

Referencias II

[6] Ren´e Carmona, Fran¸cois Delarue, and Aim´e Lachapelle.“Control of McKean–Vlasov dynamics versus mean field games”.In:

Mathematics and Financial Economics 7.2 (2013), pp. 131–166.

[7] Wendell H Fleming and Raymond W Rishel.Deterministic and stochastic optimal control.Vol. 1. Springer Science & Business Media, 2012.

[8] Diogo A Gomes et al.“Mean field games models—a brief survey”.

In: Dynamic Games and Applications 4.2 (2014), pp. 110–154.

[9] Olivier Gu´eant, Jean-Michel Lasry, and Pierre-Louis Lions.“Mean field games and applications”.In: Paris-Princeton lectures on mathematical finance 2010. Springer, 2011, pp. 205–266.

(66)

Referencias

Referencias III

[10] Daniel Lacker.“Mean field games via controlled martingale problems: existence of Markovian equilibria”.In: Stochastic Processes and their Applications 125.7 (2015), pp. 2856–2894.

[11] Daniel Lacker and Agathe Soret.“A case study on stochastic games on large graphs in mean field and sparse regimes”.In: arXiv preprint arXiv:2005.14102 (2020).

[12] Laetitia Laguzet and Gabriel Turinici.“Individual vaccination as Nash equilibrium in a SIR model with application to the 2009–2010 influenza A (H1N1) epidemic in France”.In: Bulletin of

Mathematical Biology 77.10 (2015), pp. 1955–1984.

[13] Makiko Nisio.“Stochastic control theory”. In: ISI Lecture Notes 9 (1981).

(67)

Referencias

Referencias IV

[14] Marcel Nutz.“A mean field game of optimal stopping”.In: SIAM Journal on Control and Optimization 56.2 (2018), pp. 1206–1221.

[15] Alain-Sol Sznitman.“Topics in propagation of chaos”. In: Ecole d’été de probabilités de Saint-Flour XIX—1989. Springer, 1991, pp. 165–251.

[16] Athanasios Vasiliadis.“An Introduction to Mean Field Games using probabilistic methods”.In: arXiv preprint arXiv:1907.01411 (2019).