Clase 2: Programaci´
on din´
amica
Matem´atica avanzada para macroeconom´ıa
Hamilton Galindo
Junio - Agosto 2015
Contenido
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama Funci´on valor
Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles Principio de optimalidad M´etodo para solucionar el PF
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
¿Qu´e tipo de problema queremos resolver? I
Queremos resolver un problema de “optimizaci´on din´amica”, al cual lla-maremosProblema Secuencial (PS):
Problema secuencial (PS) sup {ut} ∞ X t=0 βtr (xt, ut) (1) s.a : xt+1 = g (xt, ut) ut ∈ Γ(xt), t = 0, 1, 2, ... x0 ∈ X dado Donde:
1 r(xt, ut) : funci´on de retorno (instant´aneo) r (xt, ut) : Xx Rm→ R
¿Qu´e tipo de problema queremos resolver? II
2 β :factor de descuento, β ∈ [0, ∞) 3 xt:vector de variables de estado (xt∈ Rn) 4 ut:vector de variables de control (ut∈ Rm)
5 g(xt, ut) :funci´on que describe la evoluci´on de la variables de estado (funci´on de transici´on o ley de movimiento):
g (xt, ut) : Xx Rm→ X
6 Γ(xt) :es una correspondencia que describe las posibilidades de la variable de control cuando la econom´ıa se encuentra en el estado “xt”.
Γ : X ⇒ Rm
7 X :es el espacio de los valores que puede tomar la variable de estado (X ⊂ Rn)
Ejemplo: crecimiento ´optimo (Brock y Mirman, 1972) I
El modelo b´asico de crecimiento est´a descrito por el siguiente problema (en t´erminos generales):
Max {ct,kt+1}∞t=0 ∞ X t=0 βtlnct s.a: kt+1= (1 − δ)kt+ it ct+ it = f (kt) ct, kt ≥ 0∀t
A este problema lo llamamosproblema secuencial(PS). Considerando las siguientes forma funcionales u(ct)lnct, f (kt) = ktα , y supuestos α ∈ (0, 1), δ = 1 y k0dado se tiene:
Ejemplo: crecimiento ´optimo (Brock y Mirman, 1972) II
Problema secuencial: Brock y Mirman (1972)
Max {ct,kt+1}∞t=0 ∞ X t=0 βtlnct s.a: kt+1= ktα− ct ct, kt≥ 0
Formas de resolver un problema de optimizaci´on din´amica
Tres formas de resolver este tipo de problemas: 1 M´etodo de apr´oximaciones sucesivas 2 Programaci´on din´amica
Es el estudio de problemas de optimizaci´on din´amica a trav´es del an´alisis de ecuaciones funcionales.
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
Funci´on valor
Funci´on valor
Bellman (1974) indica que el PS tiene una propiedad recursiva. Esto per-mite transformar el PS en unProblema Funcional (PF).
Funci´on valor
1 Se define una “funci´on valor V (x0)” que indica el valor m´aximo de la funci´on objetivo para cada x0> 0.
V (x0) = max {ut} ∞ X t=0 βtr (xt, ut) (2)
2 Por ejemplo: en t = 1 se tiene x1 V (x1) = max {ut} ∞ X t=1 βt−1r (xt, ut) (3)
Ecuaci´on de Bellman
Ecuaci´on de Bellman I
Ecuaci´on de Bellman
Bellman (1974) transform´o la funci´on objetivo del PS en una ecuaci´on funcional: V (x0) = max {ut} ∞ X t=0 βtr (xt, ut) = max {ut} r (x0, u0) + βr (x1, u1) + β2r (x2, u2)... = max {ut} r (x0, u0) + βr (x1, u1) + β2r (x2, u2)... | {z } V (x1) V (x0) = max {ut} r (x0, u0) + βV (x1)
Ecuaci´on de Bellman
Ecuaci´on de Bellman II
A esta ´ultima ecuaci´on se le conoce como ecuaci´on de Bellman. Es-ta ecuaci´on es una ecuaci´on funcional; es decir, es una ecuaci´on cuya soluci´on es una funci´on (funci´on valor).
Problema funcional
Problema funcional I
Al reemplazar la ecuaci´on de Bellman en el PS se obtiene el PF (para t): Problema funcional V (xt) = max {ut} r (x0, u0) + βV (g (xt, ut)) (4) s.a : ut ∈ Γ(xt), t = 0, 1, 2, ... x0 ∈ X dado
1 El problema de infinitos periodos (PS) se ha convertido en un proble-ma de dos periodos.
2 Se est´a utilizando (explotando) la recursividad del PS.
3 Ahora el problema consiste en encontrar la funci´on que resuelve el PF; es decir, la funci´on valor.
Del PS al PF
Proceso de transformaci´on del PS al PF
Problema Secuencial (PS)
Problema
Funcional (PF) Problema punto fijo
Solución Solución PF Solución PS (valor supremo) Teorema de Equivalencia Se transforma Se transforma 2 1 3 4 5 6
Por el teorema del punto fijo para
contracciones
Encontrar el punto fijo del operador T en Ca(X):
T[V](x) = V(x) Se encuentra la función valor (V) Se encuentra la función de política: h(x) Se encuentra el plan óptimo: {(xt, ut)}
Resolviendo paso a paso el problema de maximización del PF Es…
Del PS al PF
Principales hip´otesis, proposiciones y teoremas
T3 (teorema de diferenciabilidad de la función valor) Teorema de Benveniste-Scheinkman Teoremas Proposiciones Hipótesis P1: ῦ resuelve el PF P2: ῦ resuelve el PS P3: din. fac. en el PF P4: din. fac. en el PS T1 (teorema de equivalencia) Principio de optimalidad H1 al H3
T2 (punto fijo para contracciones) H4 y H5
H4 al H7 P5: estrictamente función valor monótona H4, H5 y H7 al H10 P6: estrictamente función valor
cóncava H4, H5 y H7 al H12 Función objetivo Supremo Monotonicidad Concavidad Diferenciabilidad 3 propiedades de la función valor PS PF
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
Principio de optimalidad
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
Principio de optimalidad
Principio de optimalidad I
Bellman (1974) propuso un principio el cual permit´ıa encontrar una relaci´on entre la soluci´on del PS y el PF. A este principio se le conoce como el “Principio de optimalidad”.
Teorema 1 (Principio de optimalidad)
La soluci´on V del PF, evaluado en x0, brinda el valor del supremo en el PS cuando el estado inicial es x0. Adem´as, una secuencia {ut}∞t=0 alcanza el supremo si y solo si esta secuencia satisface [5]:
V (xt) = r (xt, ut) + βV (xt+1) (5) La pregunta que surge es:¿Bajo qu´e condiciones el principio de optimalidad se mantiene?
Principio de optimalidad
¿Bajo qu´e condiciones el principio de optimalidad se mantiene? I
Cuatro proposiciones juntas establecen condiciones bajo las cuales la so-luci´on del PS y del PF coinciden exactamente, y que la pol´ıticas ´optimas son aquellas que satifacen [5]:
1 Proposici´on 1: establece que la funci´on del supremo eV para el PS satisface el PF (del PS al PF). No obstante, la ecuaci´on funcional (adem´as de eV ) puede tener otras soluciones.
2 Proposici´on 2:establece lo inverso de manera parcial (del PF al PS). Es parcial porque se impone una condici´on de acotamiento. Esta pro-posici´on impide que la ecuaci´on funcional tenga otras soluciones por-que no cumplen la condici´on de transversalidad fuerte. La ´unica solu-ci´on que cumple dicha condici´on es eV .
3 Proposici´on 3:Muestra que si {ut}∞
t=0 es una secuencia que alcanza el supremo en el PS, entonces este satisface [5] para:
V |{z} sol. del PF = Ve |{z} sol. del PS
Principio de optimalidad
¿Bajo qu´e condiciones el principio de optimalidad se mantiene? II
4 Proposici´on 4:Establece que cualquier secuencia {ut}∞
t=0que satisface [5] para V = eV y que tambi´en satisface una condici´on de acotamiento, entonces tambi´en alcanza el supremo en el PS.
Principio de optimalidad Definiciones
Antes de ver las hip´otesis que sustentan las cuatro proposiciones es impor-tante mencionar algunas definiciones:
1 Din´amica factible desde x0: es una sucesi´on de estados y controles {(xt, ut)}∞t=0 en Xx Rm para el PS si: ut ∈ Γ(xt) y xt+1 = g (xt, ut) para todo t = 0, 1, 2...
2 Π(x0):conjunto de todas las din´amicas factibles desde x0. Π(x0) :
{(xt, ut)}∞t=0 tal que ut ∈ Γ(xt), ∀t = 0, 1, 2...
3 Plan factible desde x0:es una sucesi´on de controles {(ut)}∞ t=0 4 Plan ´optimo desde x0: es un plan factible {(u∗
t)}∞t=0 que permite al-canzar el supremo del PS.
5 Cabe mencionar que un plan factible determina un´ıvocamente una din´amica factible. Por tanto, un plan ´optimo {(ut)}∞t=0 determina una din´amica ´optima {(xt∗, ut∗)}∞t=0.
Principio de optimalidad
Hip´otesis que sustentan las proposiciones I
Las cuatro proposiciones anteriores est´an basadas en tres hip´otesis: Hip´otesis 1: Γ(x )
Γ(x ) 6= φ para todo x ∈ X .
La hip´otesis 1 asegura que Π(x0) (conjunto de din´amicas factibles desde x0) no sea vac´ıo ∀x0 ∈ X . Esto indica que todos los planes factibles pueden ser evaluados usando r (x , u) y β.
En el PS,P∞ t=0β
tr (x
t, ut)podr´ıa tomar tres valores: un n´umero finito, +∞ o −∞. Deseamos que esta funci´on objetivo est´e acotada: es decir que la sumatoria infinita tenga un valor finito.
La hip´otesis 2 elimina la posibilidad que P∞ t=0β
tr (x
t, ut) sea +∞. Para ello se restringe el conjunto de din´amicas factibles de tal forma que dicha sumatoria est´e acotada (superiormente).
Principio de optimalidad
Hip´otesis que sustentan las proposiciones II
Hip´otesis 2: funci´on objetivo Para todo x0∈ X , ∃Mx0 ∈ R, tal que
P∞ t=0β
tr (x
t, ut) ≤ Mx0 para toda
din´amica factible {(xt, ut)}t=0,1,2... desde x0.
No obstante, la funci´on objetivo (suma infinita) a´un puede tomar, para ciertas din´amicas factibles, el valor de −∞. Lahip´otesis 3busca acotar dicha din´amicas.
Hip´otesis 3: funci´on objetivo
Para todo x0∈ X , ∃ una din´amica factible {(xt, ut)}t=0,1,2... desde x0y un mx0 ∈ R, tal que la sucesi´on de sumas parciales {Sn}t=0,1,2...Sn=
Pn t=0β
tr (x
Principio de optimalidad
Hip´otesis que sustentan las proposiciones III
Por tanto, las hip´otesis 2 y 3 tienen como ´unico fin garantizar la existencia de un valor finito para el supremo del PS; es decir, que la funci´on objetivo est´e bien definida para cada din´amica factible {(xt, ut)} ∈ Γ(x0).
Seg´un las condiciones anteriores podemos definir la “funci´on supremo” e
V : X → R que sea el valor supremo del PS:
e V (x0) = sup {(xt,ut)}∈Π(x0) ∞ X t=0 βtr (xt, ut) (6)
Donde eV (x0) es el valor supremo del PS. A esta funci´on eV se le llama “funci´on valor”.
Principio de optimalidad Funci´on supremo
Nota: Por definici´on, la funci´on supremo eV : X → R es ´unica y satisface tres condiciones (condiderando una funci´on objetivo gen´erica µ(x )): e V (x0) = sup x ∈Π(x0) µ(x ) 1 Si | eV (x0)| < ∞, entonces: e V (x0) ≥ µ(x ), ∀(para todo) x ∈ Π(x0)
Para cualquier > 0: eV (x0) ≤ µ(x ) + , para alg´un x ∈ Π(x0)
2 Si | eV (x0)| = +∞, entonces existe una secuencia {xk} en Π(x0) tal
que:
Lim
k→∞µ(x
k
) = +∞
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´on 1 (del PS al PF)
Bajo las hip´otesis 1, 2 y 3, eV resuelve el PF.
Demostraci´on (proposici´on 1):
La estrategia de demostraci´on tiene dos pasos: el primero es encontrar la relaci´on entre la funci´on supremo eV y la ecuaci´on funcional para dos valores iniciales distintos x1y x0. El segundo consiste en unir el resultado del paso 1 para x1y x0.
1 Evaluando en x1:Sea > 0, u0∈ Γ(x0) y x1= g (x0, u0)
Como eV (x1) es el valor supremo del PS con valor inicial x1(t = 1),
entonces ∃ una din´amica factible desde x1, {(x1, u1), (x2, u2), ...} tal
que (por la propiedad del supremo):
∞
X
t=1
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
Se sabe que {(x0, u0), (x1, u1), ...} ∈ Π(x0) y que por la propiedad del
supremo: e V (x0) ≥ ∞ X t=0 βtr (xt, ut) ≥ r (x0, u0) + β ∞ X t=1 βt−1r (xt, ut) ≥ r (x0, u0) + β eV (x1) − β e V (x0) ≥ r (x0, u0) + β eV (g (x0, u0)) − β
Para pasar de la segunda a la tercera l´ınea se utiliza laecuaci´on [7]. Como la´ultima ecuaci´ones verdad para todo > 0 y u0es cualquier
elemento de Γ(x0), entonces tenemos que:
e
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
Como la ecuaci´on anterior se cumple para todo u0, entonces:
e V (x0) ≥ sup u0∈Γ(x0) r (x0, u0) + β eV (g (x0, u0))
Generalizando para todo “t”:
e V (x ) ≥ sup u∈Γ(x ) r (x , u) + β eV (g (x , u)) (8)
2 Evaluando en x0:Sea > 0, entonces por definici´on del supremo, ∃ una din´amica factible desde x0{(x0, u0), (x1, u1), ...} tal que:
e V (x0) ≤ ∞ X t=0 βtr (xt, ut) + e V (x0) ≤ r (x0, u0) + β eV (x1) +
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
Como es arbitrario, entonces:
e V (x0) ≤ r (x0, u0) + β eV (g (x0, u0)) e V (x0) ≤ sup u0∈Γ(x0) r (x0, u0) + β eV (g (x0, u0))
Generalizando para todo “t”:
e V (x ) ≤ sup u∈Γ(x ) r (x , u) + β eV (g (x , u)) (9)
3 Uniendo resultados:uniendo las dos ecuaciones [8] y [9] se tiene:
sup u∈Γ(x ) r (x , u)+β eV (g (x , u)) ≤ eV (x ) ≤ sup u∈Γ(x ) r (x , u)+β eV (g (x , u))
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
4 Por tanto: e V (x ) = sup u∈Γ(x ) r (x , u) + β eV (g (x , u)) (10)
Lo cual indica que la funci´on supremo (o funci´on valor) es una soluci´on de la ecuaci´on funcional (PF).
5 La proposici´on 1 indica que eV es una soluci´on del PF, pero no in-dica que sea la ´unica. Con el fin de asegurar que esta sea la ´unica soluci´on del PF se impone una restricci´on adicional: “condici´on de transversalidad fuerte”. La proposici´on 2asegura lo anterior.
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´on 2 (del PF al PS)
Seg´un las hip´otesis 1, 2 y 3, V resuelve el PF, y si adem´as se cumple la condici´on de transversalidad fuerte:
Lim
t→∞β
t
V (xt) = 0
para todo x0∈ X y din´amica factible {(xt, ut)} desde x0, entonces e
V = V (es decir, V resuelve el PS).
Demostraci´on (proposici´on 2):
En este caso hay que demostrar que V es la funci´on supremo eV . La estrategia de demostraci´on tiene dos pasos: el primero es demostrar que para toda din´amica factible desde x0se cumple que V (x0) ≥
P∞
t=0βtr (xt, ut). El segundo es demostrar
que para todo > 0, ∃ una din´amica factible {(xt, ut)} desde x0 de modo que:
V (x0) ≤P∞t=0βtr (xt, ut) + . Ambos pasos aseguran que V es la funci´on supremo
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
1 Paso 1a: Como V es soluci´on del PF, entonces ∀ din´amica factible {(xt, ut)} ∈ Π(x0) tenemos:
V (x0) ≥ r (x0, u0) + βV (x1)(por propiedad del supremo)
V (x1) ≥ r (x1, u1) + βV (x2)(para x1)
r (x0, u0)+βV (x1) ≥ r (x0, u0)+βr (x1, u1) +ββV (x2)
por transitividad en la 1era inecuaci´on:
V (x0) ≥ r (x0, u0) + βr (x1, u1) + β2V (x2) V (x0) ≥
1 X t=0
βtr (xt, ut) + β2V (x2)(en forma compacta) Por inducci´on (k pasos):
V (x0) ≥ k X t=0
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
2 Paso 1b: Haciendo k → ∞ y usando la condici´on de transversalidad fuerte: V (x0) ≥ Lim k→∞ k X t=0 βtr (xt, ut) + βk+1V (xk+1) V (x0) ≥ Lim k→∞ k X t=0 βtr (xt, ut) + Lim k→∞ βk+1V (xk+1)
por condici´on de transversalidad fuerte:
V (x0) ≥ ∞ X t=0 βtr (xt, ut) +0 V (x0) ≥ ∞ X t=0 βtr (xt, ut) (12)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
3 Paso 2a: Sea > 0 y {δt}t=0,1,2... una sucesi´on de n´umeros reales positivos, tal que:
∞ X t=0
δtβt ≤ (13)
4 Paso 2b:Como V resuelve el PF, entonces ∃u0∈ Γ(x0) de modo que:
(por propiedad del supremo)
V (x0) ≤ r (x0, u0) + βV (x1) + δ0 tambi´en existe u1 ∈ Γ(x1) tal que:
V (x1) ≤ r (x1, u1) + βV (x2) + δ1
r (x0, u0)+βV (x1) ≤ r (x0, u0)+βr (x1, u1) +ββV (x2) +βδ1 por transitividad en la 1era inecuaci´on:
V (x0) ≤ r (x0, u0) + βr (x1, u1) + β2V (x2) + βδ1 (en forma compacta)
V (x0) ≤ 1 X t=0 βtr (xt, ut) + β2V (x2) + 1 X t=1 βtδt
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
5 Paso 2c:Por inducci´on (k pasos):
V (x0) ≤ k X t=0 βtr (xt, ut) + βk+1V (xk+1) + k X t=1 βtδt
6 Paso 2d:Haciendo k → ∞ y usando la expresi´on [13]:
V (x0) ≤ Lim k→∞ k X t=0 βtr (xt, ut) + βk+1V (xk+1) + k X t=1 βtδt V (x0) ≤ Lim k→∞ k X t=0 βtr (x t, ut) + Lim k→∞ βk+1V (x k+1) + Lim k→∞ k X t=1 βtδ t
por condici´on de transversalidad fuerte y [13]:
V (x0) ≤ ∞ X t=0 βtr (xt, ut) +0+ V (x0) ≤ ∞ X t=0 βtr (xt, ut) + (14)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad VI
7 De las inecuaciones [12] y [14] se concluye que V es la funci´on supremo (funci´on valor).
8 El PF puede tener muchas soluciones, pero la proposici´on 2muestra que dichas soluciones (excepto eV ) violan la condici´on de transversa-lidad fuerte y la ´unica que satisface dicha condici´on es eV . Por tanto V = eV
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´on 3 (din´amica factible del PS al PF)
Bajo las hip´otesis 1,2 y 3: sea {(xt∗, ut∗)} una din´amica factible
desde x0∗ que permite alcanzar el supremo del PS, entonces dicha
din´amica factible cumple con [5]:
e V (xt∗) = r (x ∗ t, u ∗ t) + β eV (x ∗ t+1) (15)
Es decir, permite alcanzar el supremo en el PF.
Demostraci´on (proposici´on 3):La estrategia de demostraci´on tiene dos pasos: primero demostramos que la ecuaci´on [15] se cumple para t = 0. El segundo es extender este resultado para todo t = 1, 2, 3 (por inducci´on).
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II 1 Paso 1a: debido a que {(x∗
t, u∗t)} es una din´amica factible desde x0∗ que permite alcanzar el supremo del PS, entonces se cumple:
e V (x0∗) = ∞ X t=0 βtr (xt∗, ut∗) ∞ X t=0 βtr (xt∗, u∗t) = r (x0∗, u0∗) + β ∞ X t=0 βtr (xt+1∗ , ut+1∗ ) (16)
2 Paso 1b:para toda din´amica factible {(x∗
1, u1), (x2, u2), (x3, u3), ...} ∈ Π(x1∗), por la definici´on del supremo se cumple:
∞ X t=0 βtr (xt∗, u∗t) ≥ r (x0∗, u∗0) + β ∞ X t=0 βtr (xt+1, ut+1) (17)
Por tanto, de la expresi´on [16] y [17] se tiene que: ∞ X t=0 βtr (xt+1∗ , u∗t+1) ≥ ∞ X t=0 βtr (xt+1, ut+1) (18)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
3 Paso 1c:adem´as, como la din´amica factible {(x∗
1, u∗1), (x2∗, u2∗), (x3∗, u3∗), ...} ∈ Π(x1∗), entonces se cumple queP∞
t=0β tr (x∗
t+1, ut+1∗ ) tiene que ser el valor supremo con valor inicial en x1∗:
e V (x1∗) = ∞ X t=0 βtr (xt+1∗ , ut+1∗ ) (19)
4 Paso 1d:reemplazando la expresi´on [19] en [16] se tiene: e
V (x0∗) = r (x0∗, u∗0) + β eV (x1∗) (20) 5 Paso 2a: se prob´o que:
e V (x0∗) = r (x0∗, u0∗) + β eV (x1∗) e V (x1∗) = ∞ X t=0 βtr (xt+1∗ , u∗t+1)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
6 Paso 2b:se propone una hip´otesis inductiva: e
V (xk∗) = r (xk∗, uk∗) + β eV (xk+1∗ ) (21) Donde eV (xk∗)∀k ∈ N se define como:
e V (xk∗) = ∞ X t=0 βtr (xt+k∗ , ut+k∗ ) (22)
Si la hip´otesis (ecuaci´on [21]) se cumple para “k + 1”, entonces la hipotesis es verdadera.
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
7 Paso 2c:verificando para “k + 1”:
de [21] y de [22] r (xk∗, uk∗) + β eV (xk+1∗ ) = V (xe k∗) = ∞ X t=0 βtr (xt+k∗ , u∗t+k) r (xk∗, uk∗) + β eV (xk+1∗ ) = r (xk∗, u∗k) + β ∞ X t=0 βtr (xt+(k+1)∗ , u∗t+(k+1)) e V (xk+1∗ ) = ∞ X t=0 βtr (xt+(k+1)∗ , ut+(k+1)∗ ) e V (xk+1∗ ) = r (x ∗ k+1, u ∗ k+1) + β ∞ X t=0 βtr (xt+(k+2)∗ , u∗t+(k+2)) e V (xk+1∗ ) = r (x ∗ k+1, u ∗ k+1) + βV (xe k+2∗ ) (23)
Por tanto la hip´otesis inductiva es verdadera y generalizable para todo “t=0, 1, 2, ...”
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad I
Proposici´on 4 (din´amica factible del PF al PS) Bajo las hip´otesis 1,2 y 3: si {(xt∗, u
∗
t)} una din´amica factible desde
x0∗ que satisface [15] y se cumple la condici´on de transversalidad
d´ebil: Lim t→∞β t V (xt) ≤ 0, entonces {(xt∗, ut∗)} resuelve el PS. Demostraci´on (proposici´on 4):
La estrategia es la siguiente: que {(x∗
t, u∗t)} resuelve el PS significa que permite
al-canzar el supremo: eV (x0) = sup {ut}
P∞
t=0βtr (xt, ut) . Es decir,V (xe 0∗) = P∞
t=0βtr (xt∗, u∗t).
Esto ´ultimo es lo que tenemos que demostrar.
1 Paso 1:Como {(x∗
t, ut∗)} es una din´amica factible desde x0, entonces:
e V (x0∗) ≥ ∞ X t=0 βtr (xt∗, ut∗) (24)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad II
2 Paso 2: Adem´as, {(x∗
t, ut∗)} satisface [15]; es decir, permite alcanzar el supremo en el PF: e V (xt∗) = r (xt∗, ut∗) + β eV (xt+1∗ ) ∀t = 0, 1, 2, ... : e V (x0∗) = r (x0∗, u0∗) + β eV (x1∗) e V (x1∗) = r (x1∗, u1∗) + β eV (x2∗) e V (x2∗) = r (x2∗, u2∗) + β eV (x3∗) ... e V (xk∗) = r (xk∗, uk∗) + β eV (xk+1∗ )
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad III
3 Paso 3: reemplazando eV (x∗ 2) en eV (x1∗): e V (x2∗) = r (x2∗, u∗2) + β eV (x3∗) e V (x1∗) = r (x1∗, u∗1) + β r (x2∗, u2∗) + β eV (x3∗) reemplazando eV (x1 ) en∗ V (xe ∗ 0 ): e V (x0∗) = r (x0∗, u∗0) + β r (x1∗, u1∗) + βr (x2∗, u2∗) + β2V (xe 3∗) de forma compacta: e V (x0∗) = 2 X t=0 βtr (xt∗, ut∗) + β3V (xe 3∗)
por inducci´on (k pasos):
e V (x0∗) = k X t=0 βtr (xt∗, ut∗) + βk+1V (xe k+1∗ ) (25)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad IV
4 Paso 4: tomando k → ∞ en la ecuci´on [25]:
e V (x0∗) = Lim k→∞ k X t=0 βtr (xt∗, ut∗) + β k+1 e V (xk+1∗ ) e V (x0∗) = ∞ X t=0 βtr (xt∗, u∗t) + Lim k→∞ βk+1V (xe k+1∗ )
por condici´on de transversalidad d´ebil: Lim
t→∞β t V (xt ) ≤ 0 e V (x0∗) ≤ ∞ X t=0 βtr (xt∗, u∗t) (26)
Principio de optimalidad
Las 4 proposiciones que sutentan el principio de optimalidad V
5 Paso 5: de la inecuaci´on [24] y [26] se tiene: ∞ X t=0 βtr (xt∗, u∗t) ≤ eV (x0∗) ≤ ∞ X t=0 βtr (xt∗, u∗t) (27) Por tanto: e V (x0∗) = ∞ X t=0 βtr (xt∗, ut∗) (28)
Lo cual indica que la din´amica factible {(xt∗, u∗t)} resuelve el PS. Conclusi´on
Las proposiciones 1 al 4 implican que (bajo las hip´otesis 1, 2 y 3) la soluci´on a la ecuaci´on [5]: V (xt) = r (xt, ut) + βV (xt+1) (PF) coincide exactamente (en t´erminos de valores y planes ´optimos) con la soluci´on del PS. Es decir, el principio de optimalidad se mantiene.
M´etodo para solucionar el PF
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
M´etodo para solucionar el PF
M´etodo para solucionar el PF I
1 Hasta aqu´ı se ha estudiado la relaci´on entre el PS y el PF, pero no se ha dado ning´un m´etodo para solucionar el PF.
2 Lo interesante de la programaci´on din´amica es que ofrece varios m´ eto-dos de soluci´on del PF: m´etodos te´oricos y num´ericos.
3 El principal m´etodo es considerar al PF como unproblema de punto fijo (PptoFijo). Para ello necesitamos dos hip´otesis adicionales: sobre la correspondencia Γ(x ) y la funci´on de retorno r (x , u).
M´etodo para solucionar el PF
Hip´otesis que permiten considerar el PF como un PptoFijo I
Hip´otesis 4: Γ(x )
Γ : X ⇒ X es una correspondencia de valores compactos (i.e. Γ(x) es compacto para todo x), continua y Γ(x ) 6= φ para todo x.
Hip´otesis 5: β y r (x , u)
β ∈ (0, 1) y r (xt, ut) es acotada y continua sobre el grafo de Γ. Donde:
Grafo de Γ :(x, u) ∈ XxRm tal que u ∈ Γ(x )
Laship´otesis 4 y 5implican laship´otesis 1, 2 y 3. Por tanto, las pro-posiciones 1 al 4 se mantienen, y por ende el principio de optimalidad. Por la hip´otesis 5, eV (y por lo tanto “V” por el principio de optima-lidad) que es una funci´on real, tambi´en es a acotada y continua.
M´etodo para solucionar el PF
Hip´otesis que permiten considerar el PF como un PptoFijo II Definamos Ca(X ) :Espacio de las funciones reales, continuas y aco-tadas. Entonces: eV = V ∈ Ca(X ).
Definimos un operadorT: Ca(X ) → Ca(X )del PF:
T [V ](x ) = sup {u}∈Γ(x) r (x , u) + βV (g (x , u)) (29) Del PF sabemos: V (x ) = sup {u}∈Γ(x) r (x , u) + βV (g (x , u)) (30)
De [29] y [30], el PF se convierte en un “Problema de punto fijo (PptoFijo)”:
T [V ](x ) = V (x ) (31)
Donde la funci´on V es el punto fijo. Si encontramos la funci´on V que resuelve [31] (PptoFijo), entonces tendremos la soluci´on del PF y por el principio de optimalidad tendremos la soluci´on del PS.
M´etodo para solucionar el PF
Hip´otesis que permiten considerar el PF como un PptoFijo III
Debido a que se tiene la funci´on valor, se puede encontrar el plan ´
optimo:
Forma 1:resolviendo paso a paso el problema del m´aximo que aparece en el PF (i.e. encontrar la funci´on de pol´ıtica). Forma 2:resolviendo el sistema de ecuaciones:
V (xt∗) = r (x ∗ t, u ∗ t) + βV (x ∗ t+1), t = 0, 1, 2, 3...
Necesitamos un teorema que asegure que el operador “T : Ca(X ) → Ca(X )” tiene un ´unico punto fijoy por tanto una soluci´on alPptoFijo. El teorema del punto fijo para contracciones asegura lo anterior.
M´etodo para solucionar el PF
Teorema del punto fijo
Teorema 2 (Punto fijo para contracciones)
Bajo las hip´otesis 4 y 5: sea Ca(X ) (espacio de las funciones reales,
continuas y acotadas sobre X) con la norma del supremo k · k,
entonces el operador “T” definido en Ca(X ) es una aplicaci´on de este espacio en s´ı mismo, T: Ca(X ) → Ca(X ) , definido como:
T [V ](x ) = sup r (xt, ut) + βV (g (xt, ut)) (32) sujeto a: ut ∈ Γ(xt), Satisface: 1 T [V ] ∈ Ca(X )
2 “T” tiene un ´unico punto fijo “V”: T [V ] = V 3 Para cualquier V0∈ Ca(X ) se tiene:
kTn (V0) − V k ≤ βnkV0− V k En particular: Lim n→∞T n (V0) = V
M´etodo para solucionar el PF
Teorema del punto fijo
Nota:la norma del supremo k · k est´a definido como:
kf k = sup{|f (x)|} (33)
El teorema del punto fijo ofrece un m´etodo de soluci´on del PF: “la convergencia de iteraciones sucesivas de una funci´on contractiva al punto fijo”, la cual consiste en: la sucesi´on de funciones {Vn}∞n=0 definida como:
Vn= T [Vn−1], n ≥ 1 (34)
converge al punto fijo (V) de la contracci´on T; es decir: Lim
M´etodo para solucionar el PF
Teorema del punto fijo: demostraci´on I
Demostraci´on (teorema 2):
1 Paso 1:bajo las hip´otesis 4, 5 y 8 se tiene que para cada f ∈ Ca(X ) ∧ x ∈ X el problema del punto de fijo:
T [f ](x ) = max ut∈Γ(X )
r (xt, ut) + βf (ut)
(36)
se reduce a maximizar la funci´on continua: r (xt, ·) + βf (·)
(37) sobre el conjunto compacto Γ(X ). Esto permite alcanzar el m´aximo. Una pregunta que tenemos que responder es: ¿T [f ] es acotada y continua? se sabe que su dominio lo es.
2 Paso 2a: debido a que r (xt, ut) y f (ut) son acotadas, entonces: T [f ], tambi´en es acotada.
M´etodo para solucionar el PF
Teorema del punto fijo: demostraci´on II
3 Paso 2b: debido a que r (xt, ut) y f (ut) son continuas, y Γ(X ) es compacto, entonces: por el teorema del m´aximo se tiene que T [f ] es continua.
Por tanto, del paso 2ay 2b se tiene que: T [f ] es continua y acotada, y dado que T fue definido (dominio) en Ca(X ), entonces se obtiene que el operador T [f ] es:
T [f ] : Ca(X ) → Ca(X ) 4 Paso 4: ¿T es una contracci´on?
S´ı. Esto se debe a que el operador T cumple con las condiciones de Blackwell.
5 Paso 5: ¿T tiene un ´unico punto fijo?
S´ı. Debido a que Ca(X ) es un espacio de Banach, entonces por el teorema de la “aplicaci´on contractiva”, T tiene un ´unico punto fijo V ∈ Ca(X ) y se cumple que:
kTn(V
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) I
El modelo b´asico de crecimiento est´a descrito por el siguiente problema (en t´erminos generales):
Max {ct,kt+1}∞t=0 ∞ X t=0 βtlnct s.a: kt+1= (1 − δ)kt+ it ct+ it = f (kt) ct, kt ≥ 0∀t
A este problema lo llamamosproblema secuencial(PS). Considerando las siguientes forma funcionales u(ct)lnct, f (kt) = ktα , y supuestos α ∈ (0, 1), δ = 1 y k0dado se tiene:
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) II
Problema secuencial: Brock y Mirman (1972)
Max {ct,kt+1}∞t=0 ∞ X t=0 βtlnct s.a: kt+1= ktα− ct ct, kt≥ 0 La ecuaci´on funcional (o de Bellman) es:
V (kt) = Max {ct,kt+1}∞t=0
lnct+ βV (kt+1)
Al reemplazar la restricci´on en la ecuaci´on de Bellman kt+1 = ktα− ct, el problema funcional asociado queda descrito de la siguiente manera:
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) III
Problema funcional: Brock y Mirman (1972) V (kt) = Max
{ct}∞t=0
lnct+ βV (ktα− ct)
0 ≤ ct ≤ ktα
Encontrando la funci´on valor
1 Para resolver el PF utilizaremos el m´etodo de iteraci´on de la funci´on valor (propuesto por el teorema del punto fijo para contracciones), la expresi´on [34]:
Vn= T [Vn−1], n ≥ 1 (38)
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) IV
2 EncontrandoV1 V1 = T [V0] ↓ = Max {ct}∞t=0 lnct+ β V0(ktα− ct) | {z } =0 = Max {ct}∞t=0 lnct (39)
(a) En esta etapa se aplica la condici´on de primer orden:
∂ funci´on objetivo ∂ct
= 0
No obstante, en este caso, por ser “ln” mon´otona entonces el valor m´aximo se alcanza cuando ct = ktα (ver la restricci´on del PF).
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) V
(b) Reemplazando ct que maximiza la funci´on objetivo en [39] se obtiene
T [V0] y por ende V1: V1 = T [V0] = lnktα V1 = αlnkt (40) 3 EncontrandoV2 V2 = T [V1] ↓ = Max {ct}∞t=0 lnct+ β V1(ktα− ct) | {z } =αln(kα t−ct) = Max {ct}∞t=0 lnct+ βαln(ktα− ct) (41)
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VI
(a) En esta etapa se aplica la condici´on de primer orden:
∂ funci´on objetivo ∂ct = 0 ct = ktα 1 + βα (42)
(b) Reemplazando ct que maximiza la funci´on objetivo en [41] se obtiene
T [V1] y por ende V2: V2 = T [V1] = α(1 + βα)lnkt+ βαln βα 1 + βα − ln(1 + βα) V2 = α(1 + βα)lnkt+ βαln βα 1 + βα − ln(1 + βα) (43)
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VII
4 De igual forma podemos hacer paraV3y luego en forma general vemos que: Vn(kt) = An+ α n−1 X i =0 (βα)ilnkt (44)
Donde hacemos que n → ∞ por la propiedad [35]: Lim n→∞Vn= V Lim n→∞Vn(kt) = n→∞LimAn+ Limn→∞ α n−1 X i =0 (βα)ilnkt V = A + α ∞ X i =0 (βα)ilnkt V = A + α 1 − βαlnkt (45)
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) VIII
La constante “A” la podemos encontrar reemplazando “V” y la din´amica ´
optima en la ecuaci´on de Bellman. Encontrando la funci´on de pol´ıtica
Dado que ya conocemos la funci´on valor (V ), la cual reemplazamos en la ecuaci´on de Bellman del PF.
1 Reemplezando la funci´on valor en el PF: V (kt) = Max
{ct}∞t=0
lnct+ βln(ktα− ct)
0 ≤ ct≤ ktα
El problema funcional se convierte en un problema de optimizaci´on est´andar (en “t”), a la cual se puede aplicar las condiciones de primer orden.
Aplicando CPO:
∂ funci´on objetivo ∂ct
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) IX
Encontramos lafunci´on de pol´ıtica: ct = h(kt)
ct = (1 − αβ)ktα (46)
2 Encontrando la constante “A”: reemplazando la funci´on valor y la funci´on de pol´ıtica en la ecuaci´on de Bellman (el max desaparece porque la funci´on de pol´ıtica permite alcanzar dicho m´aximo):
A + α
1 − βαlnkt= ln(h(kt)) + βln(k α
t − h(kt)) Resolviendo e igualando los coeficientes de los t´erminos similares:
A = 1 1 − β (ln(1 − αβ) + αβ 1 − αβlnαβ)
M´etodo para solucionar el PF
Ejemplo 1: modelo de Brock y Mirman (1972) X
1 La din´amica ´optima:es la sucesi´on {ct, kt}∞
t=0 descrita por este sistema de ecuaciones (con k0dado):
Ec. de evoluci´on de la variable de estado
kt+1 = ktα− (1 − αβ)k α t = αβk α t (47) Funci´on de pol´ıtica ct = (1 − αβ)ktα (48)
M´etodo para solucionar el PF
Ejemplo 2: modelo con h´abitos de consumo
Max {ct,kt+1}∞t=0 ∞ X t=0 βt(lnct+ γlnct−1) sujeto a: ct+ kt+1≤ Aktα Donde: β ∈ (0, 1), γ < 0, A > 0 y α ∈ (0, 1). k0y c−1 dado.
1 Escribir la ecuaci´on de Bellman.
2 Demuestre que la soluci´on de dicha ecuaci´on tiene la forma: v (kt, ct−1) = E + Flnkt+ Glnct−1
3 Demostrar que la din´amica ´optima del capital tiene la forma: lnkt+1= I + Hlnkt
Donde E,F,G,H,I son constantes. D´e f´ormulas expl´ıcitas para estas constantes en t´erminos de los par´ametros del problema.
M´etodo de c´alculo diferencial para solucionar el PF
1 Problema de optimizaci´on din´amica
2 Programaci´on din´amica: panorama
Funci´on valor Ecuaci´on de Bellman Problema funcional Del PS al PF
3 Programaci´on din´amica: detalles
Principio de optimalidad M´etodo para solucionar el PF
M´etodo de c´alculo diferencial para solucionar el PF
M´etodo de c´alculo diferencial para solucionar el PF
Para aplicar los m´etodos de c´alculo diferencial en la soluci´on de proble-mas de optimizaci´on din´amica se requiere que la funci´on valor tenga tres propiedades importante:
1 Monotonicidad: 2 Concavidad: 3 Diferenciabilidad:
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt)
Hip´otesis 6: r (x , u) y g (x , u) Para cada u ∈ Rm, las funciones:
r (xt, u) : X → R es estrictamente creciente g (xt, u) : X → X es creciente
Hip´otesis 7: Γ(x )
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt) I
Proposici´on 5 (monotonicidad de V (x ))
Bajo las hip´otesis 4 al 7, entonces la funci´on valor es estrictamente creciente.
Demostraci´on (proposici´on 5):
La estrategia tiene dos pasos: el primero es demostrar que “T[f]” es una funci´on estrictamente creciente; el segundo paso es considerar el “PptoFijo” y de all´ı derivar que “V” es tambi´en estrictamente creciente.
1 Sabemos:
Ca(X )es el espacio de las funciones reales, continuas y acotadas con la norma del supremo.
Cc(X ) ⊂ Ca(X )es el espacio de las funciones reales, continuas, aco-tadas ycrecientes.
Se observa que Cc(X ) es un subespacio cerrado en Ca(X ), y por tanto
es un espacio completo en la norma del supremo.
2 Paso 1: vamos a probar que “si f ∈ Ca(X ) es creciente, entonces T [f ] es una funci´on estrictamente creciente”
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt) II
3 Paso 1a:por lahip´otesis 6: si x0 ≥ x entonces g (x0, u) ≥ g (x , u) ∀u.
dado que f es creciente:
f (g (x0, u)) ≥ f (g (x , u))
r (x0, u)+βf (g (x0, u)) ≥ r (x0, u)+βf (g (x , u))
por la hip´otesis 6 r (x , u) es creciente:
r (x0, u) ≥ r (x , u), entonces:
r (x0, u)+βf (g (x0, u)) > r (x , u)+βf (g (x , u)) (49) 4 Paso 1b:Aplicando “max” en la relaci´on [49]:
max u∈Γ(x ) r (x0, u) + βf (g (x0, u)) > max u∈Γ(x ) r (x , u) + βf (g (x , u)) (50) 5 Paso 1c:por lahip´otesis 7se tiene que: “si x0≥ x ⇒ Γ(x0) ⊇ Γ(x )”
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt) III
Γ(X’)
Γ(X)
u
Donde u ∈ Γ(x ), entonces u ∈ Γ(x0). Reemplazando este resultado en [50] se tiene: max u∈Γ(x0) r (x0, u) + βf (g (x0, u)) > max u∈Γ(x ) r (x , u) + βf (g (x , u)) (51)
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt) IV
6 Paso 1d: por la definici´on del operador “T” para una funci´on “f” cualquiera: T [f ](x ) = sup {u}∈Γ(x) r (x , u) + βf (g (x , u))
La expresi´on [51] se convierte en:
T [f ](x0) > T [f ](x ) (52) Es decir T [f ] es estrictamente creciente.
Conclusi´on 1
Por tanto se cumple lo que queriamos probar en elpaso 1:
“si f ∈ Ca(X ) es creciente, entonces T [f ] es una funci´on estrictamente creciente”
7 Paso 2: como Cc(X ) es un subespacio cerrado de Ca(X ), entonces la funci´on valor “V” est´a en Cc(X ):
M´etodo de c´alculo diferencial para solucionar el PF Monotonicidad de V (xt) V
Ca(X) Cc(X) V
Adem´as, como T [V ] = V , y T es estrictamente creciente entonces “V” tambi´en es estrictamente creciente.
Conclusi´on 2
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) I
Hip´otesis 8: X
X es un subconjunto convexo de Rn.
Definici´on conjunto convexo:el conjunto “X ” es convexo si para dos elementos de dicho conjunto x e y , la combinaci´on lineal (con t ∈ [0, 1]) tambi´en se encuentra dentro de dicho conjunto. Es decir: ∀x ∧ y ∈ X y ∀t ∈ [0, 1] se cumple que [(1 − t)x + ty ] ∈ X
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) II
Hip´otesis 9: r (x , u) y g (x , u)
r (xt, ut) es estrictamente c´oncava y g (xt, ut) es c´oncava.
Definici´on funci´on c´oncava:una funci´on real definida en un conjunto convexo (dominio) es c´oncava, si para dos puntos x e y cualesquiera definidas en su dominio, y para cualquier t ∈ [0, 1] se cumple: f (tx + (1 − t)y ) ≥ tf (x ) + (1 − t)f (y )
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) III
Hip´otesis 10: Γ(x ) Γ(xt) es convexa; es decir:
1 Γ(x ) es un conjunto convexo para todo x ∈ X .
2 Dado λ ∈ [0, 1], x , x0∈ X y x 6= x0, entonces si u ∈ Γ(x ) y u0∈ Γ(x0) implica que:
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) I
Proposici´on 6 (concavidad de V (x ))
Seg´un las hip´otesis 4,5,8,9 y 10, la funci´on valor es estrictamente c´oncava y la correspondencia de pol´ıtica es una funci´on
continua.
Demostraci´on (proposici´on 6):
La estrategia tiene dos pasos: el primero es demostrar que “T[f]” es una funci´on creciente y estrictamente c´oncava; el segundo paso es considerar el “PptoFijo” y de all´ı derivar que “V” tambi´en es creciente y estrictamente c´oncava.
1 Paso 1: vamos a probar que “si f ∈ Ca(X ) es creciente y c´oncava, entonces T [f ] es una funci´on creciente y estrictamente c´oncava”. (que sea creciente lo sabemos de la proposici´on 5).
2 Paso 1a: dado λ ∈ [0, 1], x , x0 ∈ X y x 6= x0, y sea u, u0 tales que resuelven el problema del m´aximo definido por: T [f ](x ) y T [f ](x0) respectivamente.
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) II
3 Paso 1b:adem´as, por la hip´otesis 10 se tiene que: λu + (1 − λ)u0∈ Γ(λx + (1 − λ)x0) entonces, tenemos que (por la definici´on del supremo):
T [f ](x ) ≥ r (e ex ,u) + βf (g (e ex ,u))e (53) Donde: e x = λx + (1 − λ)x0 e u = u + (1 − λ)u0
4 Paso 1c:pero r (·, ·) es estrictamente c´oncava (hip´otesis 9), entonces para r (x ,e u) que es igual a r (λx + (1 − λ)xe 0, u + (1 − λ)u0) se tiene que:
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) III
5 Paso 1d:adem´as, dado que g (·, ·) es c´oncava (hip´otesis 9), entonces se tiene que:
g (x ,e u) ≥ λg (x , u) + (1 − λ)g (xe 0, u0) (55) y dado que f es creciente, entonces aplicando “f” a la ecuaci´on an-terior (ecu.55):
f (g (ex ,u)) ≥ f (λg (x , u) + (1 − λ)g (xe 0, u0)) (56) y como f es c´oncava:
f (λg (x , u) + (1 − λ)g (x0, u0)) ≥ λf (g (x , u)) + (1 − λ)f (g (x0, u0)) (57)
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) IV
6 Paso 1e: introduciendo la expresi´on [54] y [57] (multiplicada por β) en la expresi´on inicial [53] se tiene:
T [f ](x )e ≥ r (x ,eu) + βf (g (e ex ,u))e > λr (x , u) + (1 − λ)r (x0, u0) + β[λf (g (x , u)) + (1 − λ)f (g (x0, u0))] > λr (x, u) + λβf (g (x, u)) + (1 − λ)r (x0, u0) + (1 − λ)βf (g (x0, u0)) > λ r (x, u) + βf (g (x, u)) | {z } T [f ](x ) + (1 − λ) r (x0 , u0) + βf (g (x0, u0)) | {z } T [f ](x0) T [f ](x )e > λT [f ](x ) + (1 − λ)T [f ](x 0 ) Conclusi´on 1
Por tanto se cumple lo que queriamos probar en elpaso 1:
“si f ∈ Ca(X ) es creciente y c´oncava, entonces T [f ] es una funci´on creciente y estrictamente c´oncava”
M´etodo de c´alculo diferencial para solucionar el PF Concavidad de V (xt) V
7 Paso 2:como Cc(X ) (acotado para las funciones estrictamente c´ onca-va) es un subespacio cerrado de Ca(X ), entonces la funci´on valor “V” est´a en Cc(X ) (acotado para las funciones estrictamente c´oncava):
Ca(X) Cc(X)
V
Estrictamente Cóncava
Adem´as, como T [V ] = V , y T es estrictamente c´oncava entonces “V” tambi´en es estrictamente c´oncava.
Conclusi´on 2
M´etodo de c´alculo diferencial para solucionar el PF Diferenciabilidad de V (xt) I
Hip´otesis 11: r (x , u) y g (x , u)
r (xt, ut) y g (xt, ut) son continuamente diferenciables en el interior del grafo de Γ(xt).
Hip´otesis 12: diferenciabilidad
Sea (x∗, u∗) en el interior del grafo de Γ, tal que ∃ una funci´on diferenciable “τ ” definida en una vecindad abierta V de x∗ tal que:
τ : V → U
M´etodo de c´alculo diferencial para solucionar el PF Diferenciabilidad de V (xt) II
Teorema 3 (Diferenciabilidad de la funci´on valor (Benveniste-Scheinkman 1))
Bajo las hip´otesis 4, 5, 8, 9, 10, 11 y 12; si x0∈ Int(X ) y h(x0) ∈ Int(Γ(x0)),
en-tonces la funci´on valor escontinuamente diferenciableen x0y su derivada est´a dada por:
∂V (x0) ∂x0 =∂r (x0, h(x0)) ∂x0 + β∂V (g (x0, h(x0))) ∂x0 (58) Esto es generalizado para todo t.
1 Este teorema es un paso previo para demostrar elteorema del envol-vente.
2 Requiere que en la ecuaci´on de Bellman se introduzca la funci´on de pol´ıtica h(x ) (adem´as de la ecuaci´on de movimiento de la variable de estado g (x , h(x ))).
M´etodo de c´alculo diferencial para solucionar el PF Diferenciabilidad de V (xt) III
3 Las hip´otesis descritas aseguran que la funci´on valor sea dos veces diferenciable (Stokey y Lucas, 1989. pag 84), la cual asegura que la funci´on de pol´ıtica h(x ) sea diferenciable. Esta propiedad es recogida en el teorema de BS (1 y 2).
Teorema 4 (Teorema de la envolvente (Benveniste-Scheinkman 2))
Bajo las hip´otesis 4, 5, 8, 9, 10, 11 y 12; si x0∈ Int(X ) y h(x0) ∈ Int(Γ(x0)), y
cumpiendose el teorema BS 1, entonces para x , u se cumple: ∂V (x0)
∂x0
=∂r (x0, u0) ∂u0
(59) Esto es generalizado para todo t.
1 Este teorema asegura una relaci´on entre la funci´on de valor y la funci´on de utilidad.
M´etodo de c´alculo diferencial para solucionar el PF
Pasos para utilizar el m´etodo de BS
1 En la ecuaci´on de Bellman aplicar las CPO. Es decir, derivar el lado derecho de dicha ecuaci´on con respecto a la variable de control. 2 Aplicar el teorema del envolvente. Recordar que el teorema de la
di-ferenciabilidad es solo para demostrar el teorema del envolvente. Nota:
Este m´etodo (teorema de BS) brinda explicitamente las CPO sin necesidad de conocer la funci´on valor; no obstante, no brinda la soluci´on al problema; es decir, no especifica lafunci´on de pol´ıtica.
M´etodo de c´alculo diferencial para solucionar el PF
Ejemplo: aplicaci´on del teorema de la envolvente I
Un ejemplo t´ıpico del consumidor:
Problema de optimizaci´on de un consumidor
Max {ct,wt+1}∞t=0 ∞ X t=0 βtu(ct) sujeto a: wt+1= (1 + r )(wt+ ct)
Donde: β ∈ (0, 1), wt es la riqueza del individuo y w0dado. Soluci´on: Ecuaci´on de Bellman V (wt) = Max {ct}∞t=0 u(ct) + βV (wt+1)
M´etodo de c´alculo diferencial para solucionar el PF
Ejemplo: aplicaci´on del teorema de la envolvente II
V (wt) = Max {ct}∞t=0 u(ct) + βV ((1 + r )(wt+ ct)) (60)
Condiciones de primer orden
Derivamos el lado derecho de la ecuaci´on de Bellman con respecto a la variable de control ct: ∂u(ct) ∂ct + β∂V (wt+1) ∂wt+1 [(1 + r )(wt+ ct)] ∂ct = 0 ∂u(ct) ∂ct + β∂V (wt+1) ∂wt+1 (−1)(1 + r ) = 0 ∂u(ct) ∂ct = β(1 + r )∂V (wt+1) ∂wt+1 (61)
M´etodo de c´alculo diferencial para solucionar el PF
Ejemplo: aplicaci´on del teorema de la envolvente III
Teorema de la envolvente El teorema del envolvente indica:
∂V (wt) ∂wt
= ∂u(ct) ∂ct
(62) Un periodo hacia adelante:
∂V (wt+1) ∂wt+1
= ∂u(ct+1) ∂ct+1
(63)
Encontrando la ecuaci´on de Euler
Introduciendo la ecuaci´on [63] (teorema de la envolvente) en la ecuaci´on [64] (CPO), se tiene la ecuaci´on de Euler:
∂u(ct) ∂ct
= β(1 + r )∂V (wt+1) ∂wt+1
M´etodo de c´alculo diferencial para solucionar el PF
Ejemplo: aplicaci´on del teorema de la envolvente IV
∂u(ct) ∂ct
= β(1 + r )∂u(ct+1) ∂ct+1