MacroEconometría Avanzada
Series de Tiempo Univariantes: Modelos ARMA
Procesos autorregresivos
El aspecto de la distribución conjunta de un proceso estocástico que ha atraído mas interés es la esperanza condicional dado el pasado
E(yt jzt 1)
donde
zt 1 =fyt 1,yt 2,yt 3, ...g
Procesos autorregresivos
Una justi…cación es porque la media condicional de yt dado todo el
pasado zt 1 es el mejor predictor deyt dado zt 1
(mejor en sentido de minimizar el valor esperado del cuadrado del error de predicción)
o sea si consideras cualquier predictor
b
yt =g(zt 1)
resulta que la g óptima es E(yt jzt 1)
E(yt jzt 1) =arg min
Procesos autorregresivos
La motivación anterior es en términos de predicción
Procesos autorregresivos:AR(p)
Un modelo autorregresivo de ordenp establece que
E(yt jzt 1) =E(yt jyt 1,yt 2, ...,yt p)
es decir sólo los últimos p rezagos son relevantes para especi…car la esperanza condicional
Es más general que un proceso Markoviano de ordenp que establece
algo similar para la distribución condicional:
f(yt jzt 1) =f(yt jyt 1,yt 2, ...,yt p)
Un modelo autorregresivo lineal de orden p establece que
E(yt j zt 1) =E(yt jyt 1,yt 2, ...,yt p)
= w+φ1yt 1+φ2yt 2+...+φpyt p
MDS
Def: MDS(secuencia diferencia de martingala):
Una secuencia et se dice que es MDS si veri…ca que
E(et jzt 1) =0
es decir no se puede predecir aunque conozcas todo el pasado
entonces podemos escribir el modelo autorregresivo así
MDS
MDS es el supuesto que en series de tiempo remplaza al supuesto de que
E(ε/X) =0
en el modelo de regresión
MDS
MDS aparece de forma natural en modelos económicos en los que los agentes optimizan su comportamiento
Por ejemplo, los modelos de valoración de activos suelen implicar que los rendimientos …nancieros son una constante mas un proceso MDS Otro ejemplo, versiones del modelo de ciclo vital, implican que la tasa de crecimiento del consumo es una constante mas un proceso MDS (Hall, 1978)
La ecuación básica del modelo de consumption-asset pricing
β0E "
Ct+1
Ct
α0
Rt+1 jzt 1
MDS
Nota que MDS implica RB (suponiendo que la varianza sea …nita) MDS se corresponde con la idea de independencia en media
RB se corresponde con la idea de ausencia de correlación
ver Goldberger, capítulo 6
MDS
Nota que siet es MDS esto implica que
cov(et,g(zt 1)) =0
prueba: aplica LEI
cov(et,g(zt 1)) =E(etg(zt 1))
=EE(etg(zt 1)jzt 1) =E(g(zt 1)E(et jzt 1)) =0
Modelos ARMA
un P.E. yt sigue un modelo ARMA(p,q) si
yt = w+φ1yt 1+φ2yt 2+...+φpyt p+et+
+θ1et 1+θ2et 2+...+θqet q
donde (w,φ1, ...,φp, θ1, ...θq)son constantes
y, o bienet RB(0,σ2)-más
general-o bienet MDS - un poco más
restrictivo-Modelos ARMA. Interpretación AR(1)
Interpretación Piensa en el AR(1)
yt =w+φ1yt 1+et
¿qué representaw +φ1yt 1?
si asumes queet RB(0,σ2)entonces w+φ1yt 1 representa el mejor
predictor lineal deyt dado yt 1
si asumes queet MDS entonces w+φ1yt 1 representa la esperanza
condicional de yt dadozt 1
Recuerda que si quieres interpretar fácil y correctamente tienes que
asumir queet MDS y en este caso
Modelos ARMA. Interpretación AR(1)
Interpretación
asumiendo
et MDS con D(0,σ2)
entonces si
yt =w+φ1yt 1+et
yt jzt 1 D(w+φ1yt 1,σ2) yt hereda la distribución de et
Teorema de Descomposición de Wold
Def: Un proceso es regularsi no se puede predecir perfectamente su
futuro usando su información pasada,
un proceso essingular cuando sí se puede
o sea si llamasbxt,bzt a estos predictores, tienes que
E(bzt zt)2 = 0,
Teorema de Descomposición de Wold
Cualquier proceso estocástico (P.E.) estacionario débilmente yt se
puede escribir como
yt =xt+zt
en donde xt es un P.E. estacionario regular, y dondezt es un P.E.
estacionario singular.
y además el componente regular se puede escribir como un MA(∞)
xt = ∞
∑
j=0
ajet j
dondeet es ruido blanco (RB) y
∞
∑
j=0
Teorema de Descomposición de Wold
El Teorema de descomposición de Wold se ha usado para tratar de justi…car el uso generalizado de modelos ARMA para series de tiempo estacionarias.
Sin embargo, en el fondo el teorema no es muy informativo en el
sentido de que et es ruido blanco (RB), no MDS.
Teorema de Descomposición de Wold
Además:
* Hay procesos estacionarios de fuerte dependencia, que sí son
MA(∞),pero no pueden aproximarse por modelos ARMA
(la razón es que en estos modelos con fuerte dependencia, las γu se
van hacia cero de forma muy lenta, hiperbólica, mientras que en los
ARMA las γu se van hacia cero de forma muy rápida, exponencial,
como luego comentaremos)
*En modelos no lineales, ej ARCH, que luego veremos, aj =0 para
j 1.O sea el P.E. es RB. La dependencia no aparece re‡ejada en
Estacionariedad de modelos ARMA
Considera un P.E. yt que sigue un modelo ARMA(p,q)
yt = w +φ1yt 1+φ2yt 2+...+φpyt p+
+et +θ1et 1+θ2et 2+...+θqet q
donde (w,φ1, ...,φp, θ1, ...θq)son constantes y et RB(0,σ2)
la pregunta es ¿qué condiciones tienen que cumplir las constantes
Estacionariedad de modelos ARMA
Lo primero a notar es quew, θ1, ...θq no juegan ningún papel a la
hora de ver si la varianza deyt es …nita
w es un intercepto que afecta al nivel de yt pero no a su varianza
θ1, ...θq son los coe…cientes de la parteMA(q)y, comoq es …nito,
tampoco juegan ningún papel a la hora de ver si la varianza deyt es
…nita
Estacionariedad de modelos ARMA
Piensa en un AR(1)
yt =φyt 1+et
conet RB(0,σ2)
Es una ecuación en diferencias estocástica de orden 1 Una solución es
yt = ∞
∑
k=0
φket k
Verifícalo remplazado esta solución en la ecuación inicial
Estacionariedad de modelos ARMA
Seguimos con el AR(1)
yt =φyt 1+et
que podemos escribir usando el operadorL
(1 φL)yt =et
y ahora considera (1 φL)que es un polinomio en Lde orden 1,
su raíz se obtiene igualando a cero y despejando
(1 φL) =0
L = 1 φ
entonces la condición de estacionariedadjφj<1 también puede
expresarse como que la raíz del polinomio (1 φL) es mayor que 1
Estacionariedad de modelos ARMA
Ahora considera un AR(p)
yt =φ1yt 1+φ2yt 2+...+φpyt p+et
que podemos escribir
(1 φ1L φ2L2 ... φpLp)yt =et
o sea
φ(L)yt =et
en donde
φ(L) = (1 φ1L φ2L2 ... φpLp)
se le llama el polinomio autorregresivo deyt
Estacionariedad de modelos ARMA
de la misma forma que la condición de estacionariedad de un AR(1)
era que la raíz del polinomioφ(L) fuera mayor que 1 (en valor
absoluto)
la condición de estacionariedad de un AR(p) es que lasp raíces del
polinomioφ(L) sean mayores que 1 (en valor absoluto)
si tienes raíces complejas tienes que exigir que el módulo sea mayor que uno
Esto se suele expresar diciendo que "Un modelo ARMA es estacionario si todas las raíces del polinomio autorregresivo están fuera del círculo unitario"
Estacionariedad de modelos ARMA
La condición de que todas las raíces del polinomio autorregresivo estén fuera del círculo unitario se corresponde con restricciones en los
φ0s
por ejemplo para el ARMA(2,q) estas condiciones son:
φ2+φ1 < 1
Momentos de un AR(1)
Ahora vamos a calcular la media, varianza y autocovarianzas de un AR(1) estacionario
yt =w+φ1yt 1+et (1)
llamaµa la media, entonces tomando esperanzas en la ecuación
anterior nos queda
µ=w+φ1µ
por tanto
µ= w
1 φ1
tomando varianzas en la ecuación (1) nos queda
γ0 =φ21γ0+σ2
usando que E(yt 1et) =0,por tanto
γ0 = σ
2
FACV y FAC
Def. a la colección de γs se le llama la función de autocovarianzas
(FACV)
y a la colección de ρs se le llama lafunción de autocorrelación
Momentos de un AR(1)
¿Cuál es la FAC de un AR(1)?
De la ecuación (1) podemos calcular γ1
γ1 =cov(yt,yt 1) =cov(w+φ1yt 1+et,yt 1) =φ1γ0
y sucesivamente
γ2 =cov(yt,yt 2) =cov(w +φ1yt 1+et,yt 2) =φ1γ1 =φ21γ0
y, en general,
ρk =φk1
la FAC decae exponencialmente
FAC de un AR(2)
yt =w +φ1yt 1+φ2yt 2+et
usando que para s 1
cov(yt s,et) =0
entonces
γs =cov(yt,yt s) =cov(w+φ1yt 1+φ2yt 2+et,yt s)
γs =φ1γs 1+φ2γs 2
FAC de un AR(p)
Para un AR(p) es lo mismo:
la FAC sigue la misma ecuación en diferencias de orden p que sigue el proceso
sea
yt =φ1yt 1+φ2yt 2+...+φpyt p+et
entonces
Momentos de un ARMA(p,q)
¿Cómo es la FAC de un ARMA(p,q)? Piensa en el ARMA(1,1)
yt =w+φ1yt 1+et +θet 1
dondeet RB(0,σ2)
γ1=cov(yt,yt 1) =cov(w+φ1yt 1+et +θet 1,yt 1)
=φ1γ0+θcov(et 1,yt 1)
por estacionariedad
FAC de un ARMA(1,1)
yt =w+φ1yt 1+et +θet 1
tomando varianzas en ambos lados
γ0 =φ21γ0+σ2+θ2σ2+2θφ1σ 2
por tanto
γ0 = σ
2(1+
θ2+2θφ1)
1 φ21
por tanto
γ1 =φ1γ0+θσ2 =σ2(1+θφ1)(φ1+θ)
1 φ21
por tanto
ρ1= (1+θφ1)(φ1+θ)
FAC de un ARMA(1,1)
yt =w+φ1yt 1+et +θet 1
γ2 =cov(yt,yt 2) =cov(w+φ1yt 1+et+θet 1,yt 2) =φ1γ1
y, en general, para s 2
γs =φ1γs 1
por tanto,.
FAC de un ARMA(p,q)
Para un ARMA(p,q) es lo mismo:
la parteMA(q)"contamina" (afecta) las primeras q
autocorrelaciones,
pero eventualmente la FAC de unaARMA(p,q)se comporta como la
Estimación de modelos ARMA
Los parámetros θ1, ...θq correspondientes a la parte MA son mas
complicados de estimar, se puede asumir una distribución sobre et y
usar estimadores máximo verosímiles
Aquí nos centramos en la estimación de un AR(p)
yt =w+φ1yt 1+φ2yt 2+...+φpyt p+et
donde asumimos queyt es EEyE con varianza …nita yet es MDS con
Estimación de modelos AR
de…ne los vectores
xt = (1 yt 1 yt 2 yt p)0
β= (w φ1 φ2 φp)0
entonces podemos escribir el modelo como
yt =xt0β+et
el estimador MCO se puede escribir como
b β= 1
n
n
∑
t=1
xtxt0
! 1
1
n
n
∑
t=1
xtyt
!
Estimación de modelos AR
Ahora de…ne el proceso
ut =xtet
nota que ut es un vector de dimensión (p+1)-igual quext
ademásut es MDS
E(ut jzt 1) =E(xtet jzt 1) =xtE(et jzt 1) =0
Ademásut es EEyE y por tanto
1
n
n
Estimación de modelos AR
De igual forma, xt es EEyE, y por tanto, xtxt0 también es EEyE, o sea
1
n
n
∑
t=1
xtxt0 !p E(xtxt0)
llama
Q =E(xtxt0)
por tanto, usando Slutsky,
b
β= β+ 1 n
n
∑
t=1
xtxt0
! 1
1
n
n
∑
t=1
ut
!
!p β+Q 10=β
Estimación de modelos AR
Para derivar su distribución límite nos hace falta el siguiente Teorema Central del Límite para MDS
TCL para MDS:Si ut es un vector MDS que es EEyE y
E(utut0) =Ω<∞
entonces
1
p n
n
∑
t=1
ut !d N(0,Ω)
Estimación de modelos AR
Entonces la distribución límite del estimador MCO
b
β=β+ 1 n
n
∑
t=1
xtxt0
! 1
1
n
n
∑
t=1
ut
!
es muy fácil de derivar combinando
1
n
n
∑
t=1
xtxt0 !p Q
y 1 p n n
∑
t=1
ut !d N(0,Ω)
en donde
obtenemos
p
n(bβ β)!d N(0,Q 1ΩQ 1)
Predicción con modelos ARMA
Una de los usos mas importantes de estos modelos es para predecir
Hemos visto que el mejor predictor deyt dado el pasado zt 1 es la
esperanza condicional
E(yt jzt 1)
donde
zt 1 =fyt 1,yt 2,yt 3, ...g
Escribir el mejor predictor con un modelo ARMA es muy sencillo, usando que la esperanza condicional es un operador lineal
vamos a denotar el mejor predictor en el momento T deyT+s como
b
yT+sjT =E(yT+s jzT)
donde
zT =fyT,yT 1,yT 2, ...g
Predicción con modelos ARMA
entonces, ejemplo AR(1)
yt =φyt 1+et
yT+1 =φyT +eT+1
b
yT+1jT =φbyTjT +beT+1jT
nota que
b
yTjT =yT
Predicción con modelos ARMA
por tanto
b
yT+1jT =φyT
de igual forma
b
yT+2jT =φbyT+1jT +beT+2jT =φ2yT
y en general
b
yT+sjT = φsyT
nota que el proceso, la FAC y las predicciones obedecen la misma ecuación en diferencias de orden 1
Predicción con modelos ARMA
para un ARMA(p,q) es similar
yt = w +φ1yt 1+φ2yt 2+...+φpyt p+
+et +θ1et 1+θ2et 2+...+θqet q
yT+s = w+φ1yT+s 1+φ2yT+s 2+...+φpyT+s p+
Predicción con modelos ARMA
las observaciones pasadas se conocen
b
yT+sjT =yT+s sis 0
los errores pasados se conocen (o por lo menos se pueden estimar)
b
eT+sjT =eT+s sis 0
los errores futuros no se pueden predecir
b
eT+sjT =0 sis >0
y
b yT+sjT
Predicción con modelos ARMA
ej ARMA(2,2)
yt =w +φ1yt 1+φ2yt 2+et+θ1et 1+θ2et 2
yT+1 =w+φ1yT +φ2yT 1+eT+1+θ1eT +θ2eT 1
b
yT+1jT =w +φ1yT +φ2yT 1+θ1eT +θ2eT 1
Predicción con modelos ARMA
yT+3 =w+φ1yT+2+φ2yT+1+eT+3+θ1eT+2+θ2eT+1
b
yT+3jT =w+φ1byT+2jT +φ2byT+1jT
en general, para s 3
b
yT+sjT =w+φ1byT+s 1jT +φ2byT+s 2jT
nota que el proceso, la FAC y las predicciones obedecen la misma ecuación en diferencias de orden 2
No-Estacionariedad
Muchas series temporales económicas no son estacionarias
Puede haber varios motivos
-Tendencias, crecimiento, ej, PIB, precios, demanda de dinero
No-Estacionariedad: Estacionalidad
Cuidado: no confundas estacionariedad conestacionalidad
Estacionalidad es un caso de violación del supuesto de estacionariedad Hay varias formas de tratar series con estacionalidad
1 Incluir dummies para cada estación. Esto implica que la
estacionalidad tiene un efecto en la media constante en el tiempo
2 Usar datos desestacionalizados. Los datos desestacionalizados son
datos …ltrados, tipicamente promediando (y ponderando) los datos pasados y futuros. Nota que estos …ltros pueden alterar la FAC de la serie
3 Aplicar una diferencia estacional, o sea trabajar con los incrementos
estacionales
∆s =yt yt s
dondes =4 con datos trimestrales, y s =12 con datos anuales. El
No-Estacionariedad: Tendencias
Hay dos enfoques básicos para modelizar las series con tendencia
1 Trend Stationarity (TS): las series son estacionarias alrededor de una
tendencia determinística
2 Di¤erence Stationarity (DS): los incrementos de las series son
estacionarios, se conoce como tendencia estocástica
Trend Stationarity (TS)
Se supone que las series se comportan de acuerdo con el modelo
yt =µt +St
donde µt es un polinomio determinístico temporal,
µt =µ0+µ1t+µ2t2+...+µptp
y dondeSt es la parte estocástica que se supone sigue un modelo
Trend Stationarity (TS)
El caso mas habitual es suponer queµt es un polinomio lineal:
µt = µ0+µ1t
y suponer un modelo puramente autorregresivo
yt =µ0+µ1t+ρ1yt 1+ρ2yt 2+...+ρpyt p+et (2)
Estimamos por MCO los parámetros del modelo (2)
Estos estimadores son CAN
Di¤erence Stationarity (DS)
En este caso se supone que la parte autorregresiva tiene una raíz unitaria
o sea si
ρ(L)yt = µ+et
ρ(L) = 1 ρ1L ... ρpLp
yt tiene una raíz unitaria si
ρ(1) =0
o sea
ρ(1) =1 ρ1 ... ρp =0
Di¤erence Stationarity
Def: si yt tiene una raíz unitaria entonces escribimos
yt I(1)
y decimos que yt es integrado de orden 1, mientras que
∆yt I(0)
es estacionario (no hay que tomar ninguna diferencia para hacerlo estacionario)
Di¤erence Stationarity
El modelo
(1 ρ1L ... ρpLp)yt =µ+et
puede también escribirse de foma equivalente
∆yt =µ+α0yt 1+α1∆yt 1+...+αp 1∆yt (p 1)+et
(reparametrización de Dickey-Fuller), en donde
Di¤erence Stationarity
ej. el AR(2)
yt =µ+ρ1yt 1+ρ2yt 2+et
se puede escribir
∆yt =µ+α0yt 1+α1∆yt 1+et
en donde
ρ2 = α1
ρ1 = 1+α0+α1
Di¤erence Stationarity
Esta forma de escribir el modelo (reparametrización de Dickey-Fuller) es útil porque el parámetro α0 recoge toda la información sobre si hay
o no raíz unitaria
si α0 =0 entoncesρ(1) =0 y tienes una raíz unitaria
si α0 6=0 entoncesρ(1)6=0 y no tienes una raíz unitaria
Por tanto la hipótesis de raíz unitaria (no estacionariedad) puede escribirse como
H0 :α0 =0
mientras que la hipótesis de estacionariedad (ρ(1)<0)puede
escribirse como
Di¤erence Stationarity
Nota que bajo la hipótesis nula el modelo es
∆yt =µ+α1∆yt 1+...+αp 1∆yt (p 1)+et
∆yt sigue un AR(p)estacionario,
la forma natural de contrastar
H0 :α0 =0
es mediante el estadístico t asociado a α0 en el modelo estimado por
Di¤erence Stationarity
Como bajoH0,yt 1 I(1),la distribución límite de este estadísticot
no es laN(0,1)
de hecho tenemos los siguientes resultados
Teorema: Bajo la hipótesis nula
nbα0 !d (1 α1 ... αp 1)DFα
y
tα0 = b α0
s.e.(bα0) !d
DFt
Ambas distribuciones,DFα yDFt,son no-normales, tienen asimetría a
la izquierda y medias negativas
Di¤erence Stationarity
Nota que bα0 converge a 0 (su valor bajo la hipótesis nula) a una tasa
mas rápida que la habitual(pn), se habla desuperconsistencia
Nota que la hipótesis alternativa es de un lado, por tanto rechazas siempre que
tα0 <cv
dondecv es el valor crítico de la tabla de DFt
Di¤erence Stationarity
Hasta ahora hemos descrito el contraste de DF para el caso en que el modelo tiene un intercepto,
muchas veces también es de interés el caso en el que el modelo tiene una tendencia lineal, o sea el modelo es
∆yt = µ1+µ2t+α0yt 1+α1∆yt 1+...+αp 1∆yt (p 1)+et
en este caso el modelo bajo la hipótesis alternativa es el modelo TS típico
En este caso el modelo se sigue estimando por MCO y sigues calculando el el estadísticot asociado aα0
pero ahora la distribución asintótica bajo la hipótesis nula cambia También está tabulada
E-views contiene estos valores críticos y te reporta automáticamente
el p valor
Nota que Eviews también te reporta el caso de no intercepto, pero