Series de Tiempo Univariantes: Modelos ARMA

(1)

MacroEconometría Avanzada

(2)

Series de Tiempo Univariantes: Modelos ARMA

(3)

Procesos autorregresivos

El aspecto de la distribución conjunta de un proceso estocástico que ha atraído mas interés es la esperanza condicional dado el pasado

E(yt jzt 1)

donde

zt 1 =fyt 1,yt 2,yt 3, ...g

(4)

Procesos autorregresivos

Una justi…cación es porque la media condicional de yt dado todo el

pasado _zt 1 es el mejor predictor deyt dado zt 1

(mejor en sentido de minimizar el valor esperado del cuadrado del error de predicción)

o sea si consideras cualquier predictor

b

yt =g(zt 1)

resulta que la g óptima es E(yt jzt 1)

E(yt jzt 1) =arg min

(5)

Procesos autorregresivos

La motivación anterior es en términos de predicción

(6)

Procesos autorregresivos:AR(p)

Un modelo autorregresivo de ordenp establece que

E(yt jzt 1) =E(yt jyt 1,yt 2, ...,yt p)

es decir sólo los últimos p rezagos son relevantes para especi…car la esperanza condicional

Es más general que un proceso Markoviano de ordenp que establece

algo similar para la distribución condicional:

f(yt jzt 1) =f(yt jyt 1,yt 2, ...,yt p)

Un modelo autorregresivo lineal de orden p establece que

E(yt j zt 1) =E(yt jyt 1,yt 2, ...,yt p)

= w+φ₁yt 1+φ₂yt 2+...+φ_pyt p

(7)

MDS

Def: MDS(secuencia diferencia de martingala):

Una secuencia et se dice que es MDS si veri…ca que

E(et jzt 1) =0

es decir no se puede predecir aunque conozcas todo el pasado

entonces podemos escribir el modelo autorregresivo así

(8)

MDS

MDS es el supuesto que en series de tiempo remplaza al supuesto de que

E(ε/X) =0

en el modelo de regresión

(9)

MDS

MDS aparece de forma natural en modelos económicos en los que los agentes optimizan su comportamiento

Por ejemplo, los modelos de valoración de activos suelen implicar que los rendimientos …nancieros son una constante mas un proceso MDS Otro ejemplo, versiones del modelo de ciclo vital, implican que la tasa de crecimiento del consumo es una constante mas un proceso MDS (Hall, 1978)

La ecuación básica del modelo de consumption-asset pricing

β₀E "

Ct+1

Ct

α0

Rt+1 jzt 1

(10)

MDS

Nota que MDS implica RB (suponiendo que la varianza sea …nita) MDS se corresponde con la idea de independencia en media

RB se corresponde con la idea de ausencia de correlación

ver Goldberger, capítulo 6

(11)

MDS

Nota que siet es MDS esto implica que

cov(et,g(zt 1)) =0

prueba: aplica LEI

cov(et,g(zt 1)) =E(etg(zt 1))

=EE(etg(zt 1)jzt 1) =E(g(zt 1)E(et jzt 1)) =0

(12)

Modelos ARMA

un P.E. yt sigue un modelo ARMA(p,q) si

yt = w+φ₁yt 1+φ₂yt 2+...+φ_pyt p+et+

+θ1et 1+θ2et 2+...+θqet q

donde (w,φ₁, ...,φ_p, θ1, ...θq)son constantes

y, o bienet RB(0,σ2)-más

general-o bienet MDS - un poco más

(13)

restrictivo-Modelos ARMA. Interpretación AR(1)

Interpretación Piensa en el AR(1)

yt =w+φ₁yt 1+et

¿qué representaw +φ₁yt 1?

si asumes queet RB(0,σ2)entonces w+φ₁yt 1 representa el mejor

predictor lineal deyt dado yt 1

si asumes queet MDS entonces w+φ₁yt 1 representa la esperanza

condicional de yt dadozt 1

Recuerda que si quieres interpretar fácil y correctamente tienes que

asumir queet MDS y en este caso

(14)

Modelos ARMA. Interpretación AR(1)

Interpretación

asumiendo

et MDS con D(0,σ2)

entonces si

yt =w+φ₁yt 1+et

yt jzt 1 D(w+φ₁yt 1,σ2) yt hereda la distribución de et

(15)

Teorema de Descomposición de Wold

Def: Un proceso es regularsi no se puede predecir perfectamente su

futuro usando su información pasada,

un proceso essingular cuando sí se puede

o sea si llamas_bxt,bzt a estos predictores, tienes que

E(_bzt zt)2 = 0,

(16)

Teorema de Descomposición de Wold

Cualquier proceso estocástico (P.E.) estacionario débilmente yt se

puede escribir como

yt =xt+zt

en donde xt es un P.E. estacionario regular, y dondezt es un P.E.

estacionario singular.

y además el componente regular se puede escribir como un MA(∞)

xt = ∞

∑

j=0

ajet j

dondeet es ruido blanco (RB) y

∞

∑

j=0

(17)

Teorema de Descomposición de Wold

El Teorema de descomposición de Wold se ha usado para tratar de justi…car el uso generalizado de modelos ARMA para series de tiempo estacionarias.

Sin embargo, en el fondo el teorema no es muy informativo en el

sentido de que et es ruido blanco (RB), no MDS.

(18)

Teorema de Descomposición de Wold

Además:

* Hay procesos estacionarios de fuerte dependencia, que sí son

MA(∞),pero no pueden aproximarse por modelos ARMA

(la razón es que en estos modelos con fuerte dependencia, las γu se

van hacia cero de forma muy lenta, hiperbólica, mientras que en los

ARMA las γ_u se van hacia cero de forma muy rápida, exponencial,

como luego comentaremos)

*En modelos no lineales, ej ARCH, que luego veremos, aj =0 para

j 1.O sea el P.E. es RB. La dependencia no aparece re‡ejada en

(19)

Estacionariedad de modelos ARMA

Considera un P.E. yt que sigue un modelo ARMA(p,q)

yt = w +φ₁yt 1+φ₂yt 2+...+φ_pyt p+

+et +θ1et 1+θ2et 2+...+θqet q

donde (w,φ₁, ...,φ_p, θ1, ...θq)son constantes y et RB(0,σ2)

la pregunta es ¿qué condiciones tienen que cumplir las constantes

(20)

Estacionariedad de modelos ARMA

Lo primero a notar es quew, θ1, ...θq no juegan ningún papel a la

hora de ver si la varianza deyt es …nita

w es un intercepto que afecta al nivel de yt pero no a su varianza

θ1, ...θq son los coe…cientes de la parteMA(q)y, comoq es …nito,

tampoco juegan ningún papel a la hora de ver si la varianza deyt es

…nita

(21)

Estacionariedad de modelos ARMA

Piensa en un AR(1)

yt =φyt 1+et

conet RB(0,σ2)

Es una ecuación en diferencias estocástica de orden 1 Una solución es

yt = ∞

∑

k=0

φket k

Verifícalo remplazado esta solución en la ecuación inicial

(22)

Estacionariedad de modelos ARMA

Seguimos con el AR(1)

yt =φyt 1+et

que podemos escribir usando el operadorL

(1 φL)yt =et

y ahora considera (1 φL)que es un polinomio en Lde orden 1,

su raíz se obtiene igualando a cero y despejando

(1 φL) =0

L = 1 φ

entonces la condición de estacionariedad_jφj<1 también puede

expresarse como que la raíz del polinomio (1 φL) es mayor que 1

(23)

Estacionariedad de modelos ARMA

Ahora considera un AR(p)

yt =φ₁yt 1+φ₂yt 2+...+φ_pyt p+et

que podemos escribir

(1 φ₁L φ₂L2 ... φ_pLp)yt =et

o sea

φ(L)yt =et

en donde

φ(L) = (1 φ₁L φ₂L2 ... φ_pLp)

se le llama el polinomio autorregresivo deyt

(24)

Estacionariedad de modelos ARMA

de la misma forma que la condición de estacionariedad de un AR(1)

era que la raíz del polinomioφ(L) fuera mayor que 1 (en valor

absoluto)

la condición de estacionariedad de un AR(p) es que lasp raíces del

polinomioφ(L) sean mayores que 1 (en valor absoluto)

si tienes raíces complejas tienes que exigir que el módulo sea mayor que uno

Esto se suele expresar diciendo que "Un modelo ARMA es estacionario si todas las raíces del polinomio autorregresivo están fuera del círculo unitario"

(25)

Estacionariedad de modelos ARMA

La condición de que todas las raíces del polinomio autorregresivo estén fuera del círculo unitario se corresponde con restricciones en los

φ0s

por ejemplo para el ARMA(2,q) estas condiciones son:

φ₂+φ₁ < 1

(26)

Momentos de un AR(1)

Ahora vamos a calcular la media, varianza y autocovarianzas de un AR(1) estacionario

yt =w+φ₁yt 1+et (1)

llamaµa la media, entonces tomando esperanzas en la ecuación

anterior nos queda

µ=w+φ₁µ

por tanto

µ= w

1 φ₁

tomando varianzas en la ecuación (1) nos queda

γ₀ =φ2₁γ₀+σ2

usando que E(yt 1et) =0,por tanto

γ₀ = σ

2

(27)

FACV y FAC

Def. a la colección de γ_s se le llama la función de autocovarianzas

(FACV)

y a la colección de ρ_s se le llama lafunción de autocorrelación

(28)

Momentos de un AR(1)

¿Cuál es la FAC de un AR(1)?

De la ecuación (1) podemos calcular γ1

γ₁ =cov(yt,yt 1) =cov(w+φ₁yt 1+et,yt 1) =φ₁γ₀

y sucesivamente

γ2 =cov(yt,yt 2) =cov(w +φ₁yt 1+et,yt 2) =φ₁γ1 =φ21γ0

y, en general,

ρ_k =φk₁

la FAC decae exponencialmente

(29)

FAC de un AR(2)

yt =w +φ₁yt 1+φ₂yt 2+et

usando que para s 1

cov(yt s,et) =0

entonces

γ_s =cov(yt,yt s) =cov(w+φ₁yt 1+φ₂yt 2+et,yt s)

γs =φ1γs 1+φ2γs 2

(30)

FAC de un AR(p)

Para un AR(p) es lo mismo:

la FAC sigue la misma ecuación en diferencias de orden p que sigue el proceso

sea

yt =φ₁yt 1+φ₂yt 2+...+φ_pyt p+et

entonces

(31)

Momentos de un ARMA(p,q)

¿Cómo es la FAC de un ARMA(p,q)? Piensa en el ARMA(1,1)

yt =w+φ₁yt 1+et +θet 1

dondeet RB(0,σ2)

γ1=cov(yt,yt 1) =cov(w+φ₁yt 1+et +θet 1,yt 1)

=φ₁γ₀+θcov(et 1,yt 1)

por estacionariedad

(32)

FAC de un ARMA(1,1)

tomando varianzas en ambos lados

γ0 =φ21γ0+σ2+θ2σ2+2θφ1σ 2

por tanto

γ₀ = σ

2₍₁₊

θ2+2θφ₁)

1 φ2₁

por tanto

γ₁ =φ₁γ₀+θσ2 =σ2(1+θφ1)(φ1+θ)

1 φ2₁

por tanto

ρ₁= (1+θφ1)(φ1+θ)

(33)

FAC de un ARMA(1,1)

γ₂ =cov(yt,yt 2) =cov(w+φ₁yt 1+et+θet 1,yt 2) =φ₁γ₁

y, en general, para s 2

γs =φ1γs 1

por tanto,.

(34)

FAC de un ARMA(p,q)

Para un ARMA(p,q) es lo mismo:

la parteMA(q)"contamina" (afecta) las primeras q

autocorrelaciones,

pero eventualmente la FAC de unaARMA(p,q)se comporta como la

(35)

Estimación de modelos ARMA

Los parámetros θ1, ...θq correspondientes a la parte MA son mas

complicados de estimar, se puede asumir una distribución sobre et y

usar estimadores máximo verosímiles

Aquí nos centramos en la estimación de un AR(p)

yt =w+φ₁yt 1+φ₂yt 2+...+φ_pyt p+et

donde asumimos queyt es EEyE con varianza …nita yet es MDS con

(36)

Estimación de modelos AR

de…ne los vectores

xt = (1 yt 1 yt 2 yt p)0

β= (w φ₁ φ₂ φ_p)0

entonces podemos escribir el modelo como

yt =xt0β+et

el estimador MCO se puede escribir como

b β= 1

n

∑

t=1

xtxt0

! 1

1

n

∑

t=1

xtyt

!

(37)

Estimación de modelos AR

Ahora de…ne el proceso

ut =xtet

nota que ut es un vector de dimensión (p+1)-igual quext

ademásut es MDS

E(ut jzt 1) =E(xtet jzt 1) =xtE(et jzt 1) =0

Ademásut es EEyE y por tanto

1

n

(38)

Estimación de modelos AR

De igual forma, xt es EEyE, y por tanto, xtxt0 también es EEyE, o sea

1

n

∑

t=1

xtxt0 !p E(xtxt0)

llama

Q =E(xtxt0)

por tanto, usando Slutsky,

b

β= β+ 1 n

n

∑

t=1

xtxt0

! 1

1

n

∑

t=1

ut

!

!p β+Q 10=β

(39)

Estimación de modelos AR

Para derivar su distribución límite nos hace falta el siguiente Teorema Central del Límite para MDS

TCL para MDS:Si ut es un vector MDS que es EEyE y

E(utut0) =Ω<∞

entonces

1

p n

n

∑

t=1

ut !d N(0,Ω)

(40)

Estimación de modelos AR

Entonces la distribución límite del estimador MCO

b

β=β+ 1 n

n

∑

t=1

xtxt0

! 1

1

n

∑

t=1

ut

!

es muy fácil de derivar combinando

1

n

∑

t=1

xtxt0 !p Q

y 1 p n n

∑

t=1

ut !d N(0,Ω)

en donde

(41)

obtenemos

p

n(bβ β)!d N(0,Q 1ΩQ 1)

(42)

Predicción con modelos ARMA

Una de los usos mas importantes de estos modelos es para predecir

Hemos visto que el mejor predictor deyt dado el pasado zt 1 es la

esperanza condicional

E(yt jzt 1)

donde

zt 1 =fyt 1,yt 2,yt 3, ...g

Escribir el mejor predictor con un modelo ARMA es muy sencillo, usando que la esperanza condicional es un operador lineal

vamos a denotar el mejor predictor en el momento T deyT+s como

b

y_T₊_s_j_T =E(yT+s jzT)

donde

zT =fyT,yT 1,yT 2, ...g

(43)

Predicción con modelos ARMA

entonces, ejemplo AR(1)

yt =φyt 1+et

yT+1 =φyT +eT+1

b

y_T₊₁_j_T =φbyT_jT +beT+1_jT

nota que

b

y_T_j_T =yT

(44)

Predicción con modelos ARMA

por tanto

b

y_T₊₁_j_T =φyT

de igual forma

b

y_T₊₂_j_T =φbyT+1_jT +beT+2_jT =φ2yT

y en general

b

y_T₊_s_j_T = φsyT

nota que el proceso, la FAC y las predicciones obedecen la misma ecuación en diferencias de orden 1

(45)

Predicción con modelos ARMA

para un ARMA(p,q) es similar

yt = w +φ₁yt 1+φ₂yt 2+...+φ_pyt p+

+et +θ1et 1+θ2et 2+...+θqet q

yT+s = w+φ₁yT+s 1+φ₂yT+s 2+...+φ_pyT+s p+

(46)

Predicción con modelos ARMA

las observaciones pasadas se conocen

b

y_T₊_s_j_T =yT+s sis 0

los errores pasados se conocen (o por lo menos se pueden estimar)

b

e_T₊_s_j_T =eT+s sis 0

los errores futuros no se pueden predecir

b

e_T₊_s_j_T =0 sis >0

y

b y_T₊_s_j_T

(47)

Predicción con modelos ARMA

ej ARMA(2,2)

yt =w +φ₁yt 1+φ₂yt 2+et+θ1et 1+θ2et 2

yT+1 =w+φ₁yT +φ₂yT 1+eT+1+θ1eT +θ2eT 1

b

y_T₊₁_j_T =w +φ₁yT +φ₂yT 1+θ1eT +θ2eT 1

(48)

Predicción con modelos ARMA

yT+3 =w+φ₁yT+2+φ₂yT+1+eT+3+θ1eT+2+θ2eT+1

b

y_T₊₃_j_T =w+φ₁byT+2_jT +φ2byT+1_jT

en general, para s 3

b

y_T₊_s_j_T =w+φ₁byT+s 1_jT +φ2byT+s 2_jT

nota que el proceso, la FAC y las predicciones obedecen la misma ecuación en diferencias de orden 2

(49)

No-Estacionariedad

Muchas series temporales económicas no son estacionarias

Puede haber varios motivos

-Tendencias, crecimiento, ej, PIB, precios, demanda de dinero

(50)

No-Estacionariedad: Estacionalidad

Cuidado: no confundas estacionariedad conestacionalidad

Estacionalidad es un caso de violación del supuesto de estacionariedad Hay varias formas de tratar series con estacionalidad

1 _{Incluir dummies para cada estación. Esto implica que la}

estacionalidad tiene un efecto en la media constante en el tiempo

2 Usar datos desestacionalizados. Los datos desestacionalizados son

datos …ltrados, tipicamente promediando (y ponderando) los datos pasados y futuros. Nota que estos …ltros pueden alterar la FAC de la serie

3 Aplicar una diferencia estacional, o sea trabajar con los incrementos

estacionales

∆s =yt yt s

dondes =4 con datos trimestrales, y s =12 con datos anuales. El

(51)

No-Estacionariedad: Tendencias

Hay dos enfoques básicos para modelizar las series con tendencia

1 _{Trend Stationarity (TS): las series son estacionarias alrededor de una}

tendencia determinística

2 Di¤erence Stationarity (DS): los incrementos de las series son

estacionarios, se conoce como tendencia estocástica

(52)

Trend Stationarity (TS)

Se supone que las series se comportan de acuerdo con el modelo

yt =µ_t +St

donde µ_t es un polinomio determinístico temporal,

µ_t =µ₀+µ₁t+µ₂t2+...+µ_ptp

y dondeSt es la parte estocástica que se supone sigue un modelo

(53)

Trend Stationarity (TS)

El caso mas habitual es suponer queµ_t es un polinomio lineal:

µ_t = µ₀+µ₁t

y suponer un modelo puramente autorregresivo

yt =µ₀+µ₁t+ρ₁yt 1+ρ₂yt 2+...+ρ_pyt p+et (2)

Estimamos por MCO los parámetros del modelo (2)

Estos estimadores son CAN

(54)

Di¤erence Stationarity (DS)

En este caso se supone que la parte autorregresiva tiene una raíz unitaria

o sea si

ρ(L)yt = µ+et

ρ(L) = 1 ρ₁L ... ρ_pLp

yt tiene una raíz unitaria si

ρ(1) =0

o sea

ρ(1) =1 ρ₁ ... ρ_p =0

(55)

Di¤erence Stationarity

Def: si yt tiene una raíz unitaria entonces escribimos

yt I(1)

y decimos que yt es integrado de orden 1, mientras que

∆yt I(0)

es estacionario (no hay que tomar ninguna diferencia para hacerlo estacionario)

(56)

Di¤erence Stationarity

El modelo

(1 ρ₁L ... ρ_pLp)yt =µ+et

puede también escribirse de foma equivalente

∆yt =µ+α0yt 1+α1∆yt 1+...+αp 1∆yt (p 1)+et

(reparametrización de Dickey-Fuller), en donde

(57)

Di¤erence Stationarity

ej. el AR(2)

yt =µ+ρ₁yt 1+ρ₂yt 2+et

se puede escribir

∆yt =µ+α0yt 1+α1∆yt 1+et

en donde

ρ₂ = α1

ρ₁ = 1+α0+α1

(58)

Di¤erence Stationarity

Esta forma de escribir el modelo (reparametrización de Dickey-Fuller) es útil porque el parámetro α0 recoge toda la información sobre si hay

o no raíz unitaria

si α0 =0 entoncesρ(1) =0 y tienes una raíz unitaria

si α0 6=0 entoncesρ(1)6=0 y no tienes una raíz unitaria

Por tanto la hipótesis de raíz unitaria (no estacionariedad) puede escribirse como

H0 :α0 =0

mientras que la hipótesis de estacionariedad (ρ(1)<0)puede

escribirse como

(59)

Di¤erence Stationarity

Nota que bajo la hipótesis nula el modelo es

∆yt =µ+α1∆yt 1+...+αp 1∆yt (p 1)+et

∆yt sigue un AR(p)estacionario,

la forma natural de contrastar

H0 :α0 =0

es mediante el estadístico t asociado a α0 en el modelo estimado por

(60)

Di¤erence Stationarity

Como bajoH0,yt 1 I(1),la distribución límite de este estadísticot

no es laN(0,1)

de hecho tenemos los siguientes resultados

Teorema: Bajo la hipótesis nula

n_bα0 !d (1 α1 ... αp 1)DFα

y

tα0 = b α0

s.e.(bα0) !d

DFt

Ambas distribuciones,DFα yDFt,son no-normales, tienen asimetría a

la izquierda y medias negativas

(61)

Di¤erence Stationarity

Nota que bα0 converge a 0 (su valor bajo la hipótesis nula) a una tasa

mas rápida que la habitual(pn), se habla desuperconsistencia

Nota que la hipótesis alternativa es de un lado, por tanto rechazas siempre que

t_α₀ <cv

dondecv es el valor crítico de la tabla de DFt

(62)

Di¤erence Stationarity

Hasta ahora hemos descrito el contraste de DF para el caso en que el modelo tiene un intercepto,

muchas veces también es de interés el caso en el que el modelo tiene una tendencia lineal, o sea el modelo es

∆yt = µ₁+µ₂t+α0yt 1+α1∆yt 1+...+αp 1∆yt (p 1)+et

en este caso el modelo bajo la hipótesis alternativa es el modelo TS típico

En este caso el modelo se sigue estimando por MCO y sigues calculando el el estadísticot asociado aα0

pero ahora la distribución asintótica bajo la hipótesis nula cambia También está tabulada

E-views contiene estos valores críticos y te reporta automáticamente

el p valor

Nota que Eviews también te reporta el caso de no intercepto, pero