Vectores Autorregresivos (VAR)

(1)

Econometria de Series Temporales

Vectores Autorregresivos (VAR)

Walter Sosa Escudero

(2)

Procesos estocasticos multivariados

Y

t

= [

Y

1t

; Y

2t

;

¢ ¢ ¢

; Y

N t

]

0

;

t

= 1

;

2 ; : : : ; T

Estamos interesados en el comportamiento temporal de

N

variables simultaneamente.

²

E

(

Y

t

) =

¹

(vector de esperanzas)

²

E

(

Y

t

¡

¹

)(

Y

t_¡¿

¡

¹

)

0

= ¡(

¿

)

(matriz de autocovarianzas)

El elemento i; j es: °_i;j = E(Y_it _¡ ¹_it)(Y_j;t_¡_¿ _¡¹_j;t_¡_¿)

Los elementos de la diagonal son las autocovarianzas y los de fuera de la diagonal las autocovarianzas cruzadas.

(3)

Y

t es estacionario si:

1.

_E

₍

_Y

_t

_{) =}

_{¹ <}

₁

.

2.

E

(

Y

t

¡

¹

)(

Y

t_¡¿

¡

¹

)

0

= ¡(

¿

)

<

1 ;

¿

= 0

;

1 ;

2 ; : : :

Estacionariedad de

_Y

_t implica estacionariedad de

Y

it

; i

= 1

; : : : ; N

. El converso NO es cierto (porque?)

(4)

Ruido Blanco Multivariado

"

t es

N

£

1

. Es RBM si: 1.

E

(

"

t

) = 0

2.

E

(

"

_t

"

0_s

) =

8 <

:

−

N_£N si

t

=

s

0

si

t

₆

=

s

Cuidado: los elementos de

"

t pueden estar correlacionados

(5)

Vectores Autorregresivos (VAR)

VAR(1) con media cero

Y

t

= ©

Y

t_¡1

+

"

t

;

"

t

»

RBM

Y

_t es

N

_£

1

,

©

es

N

_£

N

. Ejemplo:

Xt = Á11Xt_¡1 +Á12Zt_¡1 +"1t

Zt = Á12Xt_¡1 +Á12Zt_¡1 +"2t

Relacion entre el presente de una variable y el pasado de todas las variables del sistema.

(6)

Motivacion historica y metodologica del uso de VAR's

²

Motivacion: Sims (1980).

(7)

Algunos resultados utiles de algebra

² Si A es cuadrada y diagonal con elemento carateristico a_ii, AK es una matriz diagonal con elemento i; i igual a aK_ii.

² Am_£m. Cualquier escalar ¸ que satisfaga Ax = ¸x para un vector

m _£1; x ₆= 0 es un autovalor de A. x es un autovector de A

correspondiente al autovalor ¸.

² Si ¸ es un autovalor de A, entonces _jA_¡ ¸I_j = 0.

² La ecuacion caracteristica _jA _¡¸I_j = 0 es una ecuacion de grado

m. Entonces, Amm tiene m autovalores.

² Am_£m con autovalores ¸1; ¸2; : : : ; ¸m, entonces:

(a) tr(A) =

P

m_i=1 ¸i

(b) _jA_j =

Q

m

(8)

² Si Am_£m tiene m autovalores diferentes, entonces los autovectores

asociados son todos linealmente independientes.

² Si Am_£m tiene m autovalores diferentes y ¤ ´ diag(¸1; : : : ; ¸m) y

X _´ (x1; x2;¢ ¢ ¢; xm), entonces:

A = X¤X¡1

² Bajo las condiciones del resultado anterior:

AK = AA_{¢ ¢ ¢}A = (X¤X¡1)(X¤X¡1)_{¢ ¢ ¢}(X¤KX¡1) = X¤KX¡1

(9)

Estacionariedad de VAR(1)

Recordar caso AR(1): Yt = ÁYt_¡1 + "t. Estacionario si jÁj < 1.

Reemplazando recursivamente en VAR(1):

Y

_t

=

k

_X

_¡1 j=0

©

j

"

_t_¡_j

+ ©

k

Y

_t_¡_k

En forma similar a AR(1) requeriremos que

©

k

_!

0

, o, equivalentemente,

j

©

_j

<

1

.

De acuerdo al resultado anterior

© =

X

¤

X

¡1 en donde

X

es la matriz de autovectores y

_¤

la matriz diagonal con los

autovalores

¸

₁

; : : : ; ¸

_N. Entonces,

©

k

=

X

¤

k

X

¡1

(10)

Resumiendo:

Y

_t

= ©

Y

_t_¡₁

+

"

_t es estacionario si y solo si todos los autovalores de

©

son <1 en valor absoluto, o, equivalentemente, si todas las raices de la ecuacion

caracteristica

j

©

_¡

¸I

N

j

son menores a uno en valor absoluto.

Si VAR(1) es estacionario:

Y

t

=

1

X

j=0

©

j

"

t_¡j

(11)

VAR(p)

Y

t

= ©

1

Y

t_¡1

+ ©

2

Y

t_¡2

+

¢ ¢ ¢

+ ©

p

Y

t_¡p

+

"

t

;

"

t

»

RBM

Estacionariedad de VAR(p): todas las raices de

j

¸

p

I

_¡

¸

p¡1

©

1

¡ ¢ ¢ ¢ ¡

©

p

j

= 0

son mayores que uno en valor absoluto. Si VAR(p) es

(12)

Estimacion de VAR Consideremos VAR(1):

X

_t

=

Á

₁₁

X

_t_¡₁

+

Á

₁₂

Z

_t_¡₁

+

"

_1t

Z

t

=

Á

12

X

t_¡1

+

Á

12

Z

t_¡1

+

"

2t

²

Notar que los supuestos de Gauss-Markov se veri¯can ecuacion por ecuacion. MCO es insesgado, consistente y e¯ciente, ecuacion por ecuacion.

²

MCO ecuacion-por-ecuacion es tambien e¯ciente en terminos del sistema. Idea: es un caso particular de SUR con las mismas variables explicativas en cada ecuacion: MCG coincide con MCO. Explica gran parte de la

(13)

Interpretacion de VAR

²

No es una forma estructural. Los coe¯cientes no tienen una interpretacion clara ya que solo se busca una

representacion de los datos.

²

En la practica es comun basar la interpretacion en tests agregados y ejercicios de simulacion.

²

Simulacion: a) Funciones impulso-respuesta, b) Descomposicion de la varianza.

²

Tests: a) Relevancia de variables, b) Signi¯catividad de rezagos, c) Relaciones entre ecuaciones, d) Causalidad de Granger.

(14)

Funciones impulso-respuesta

Investigar que sucede con el sistema VAR ante variaciones exogenas.

Consideremos la representacion VMA(

1

) de VAR(p):

Y

t

=

1

X

s=0

ª

s

"

t_¡s

;

ª

0

=

I

m

; "

t

»

RBM

@Y

t

@"

t_¡j

=

@Y

t+s

@"

t

= ª

s

ª

ij

(

s

) :

Efecto sobre

Y

i;t+s de cambiar

"

jt en una unidad.

ª

_ij

(

s

)

=

p

V

(

"

_jt

)

: Efecto sobre

Y

_i;t+s de cambiar

"

_jt en un desvio estandar: Funcion de impulso-respuesta simple.

(15)

Ejemplo: VAR(1) con

_N

_{= 2}

, hay 4 funciones de impulso respuesta simple.

Problema:

"

it no son independientes.

N

= 2

V

(

"

t

) =

−

=

2

4 ¾

11

¾

12

¾

21

¾

22

3

5

(16)

Mas resultados de algebra

1. Si − es simetrica y positiva de¯nida, existe H no singular, tal que − = HH0. H es una `raiz cuadrada' de −. H no es unica.

2. Si "t es un vector aleatorio con E("t) = 0 y V ("t) = E("t"0_t) = −,

existe H tal que "t = Hvt, en donde vt es un vector aleatorio con

E(vt) = 0 y V (vt) = I.

vt son las innovaciones ortogonales de "t. La idea es:

vt ¡! Hvt ¡! "t ¡! Yt

Entonces, lo que realmente nos interesa es @Yt+s=@vt.

² Problema: H no es unica. Si − es simetrica y positiva de¯nida, existe una unica matrix P no-singular y triangular inferior tal que P P0 = −. P

(17)

La idea, entonces, es utilizar:

"

_t

=

P v

_t. Reemplazando:

Y

_t

=

1

X

i=1

ª

_s

P v

_t_¡_s

=

1

X

i=1

©

_s

v

_t_¡_s

;

©

_´

ª

_s

P

@Y

t

@v

t_¡s

=

@Y

t+s

@v

t

= ©

_s

Elemento caracteristico:

Á

(s)_ij

=

cambio en

Y

_i;t+s resultante de cambios en

v

j;t en una unidad.

¨

§

¥

¦

Á

(s)_ij

=

funcion de impulso-respuesta con respecto a las innovaciones ortogonales.

Notar que como V (vj;t = 1) tambien mide el efecto de cambios en 1

(18)

Cuestion importante: el uso de

_P

(la descomposicion de Choleski) implica cierta arbitrariedad.

Ejemplo: N = 2

Ã

"1t "2t

!

=

Ã

P11 0 P21 P22

! Ã

v1t v2t

!

"1t depende solo de v1t "2t depende de v1t y v2t

La dependencia entre "1t y "2t es generada por esta estructura recursiva.

Que implicaciones tiene, por ejemplo, si Y1 es la tasa de crecimiento de

la cantidad nominal de dinero y Y2 es la tasa de in°acion?

Entonces, el orden de las variables en la matriz de Choleski es muy importante.

(19)

Notar que si

−

=

2

4 ¾

11

0

0 ¾

22

3

5 =

₎

P

=

2

4 p

_¾

11

0

0 p

¾

22

3

5 ²

Si

−

es diagonal el orden de la descomposicion de Choleski no importa.

²

Trivialmente, las innovaciones originales son tambien las innovaciones ortogonales.

²

En la practica, entonces, es importante evaluar empiricamente la diagonalidad de

−

.

(20)

Seguimos con el algebra...

²

Si

−

es simetrica y pd, existe una unica matriz

H

triangular inferior con 1's en la diagonal principal, y una

unica matriz diagonal

D

con todos sus elementos positivos, tal que

−

=

HDH

0.

²

Si

"

t es un vector aleatorio con

E

(

"

t

) = 0

y

V

(

"

t

) =

−

,

entonces

"

t puede escribirse com

"

t

=

Hu

t, con

E

(

u

t

) = 0

y

V

(

u

t

) =

D

, en donde

H

y

D

satisfacen

−

=

HDH

0.

Notar que

V

(

u

jt

) =

d

j, el

j

¡

esimo elemento de la diagonal

principal de

D

. La idea, en este caso, es permitir que cada una de las innovaciones ortogonales tenga su propia

(21)

Disgresion notacional

X

=

2

4 A

1

B

1

A

2

B

2

3

5 _´

h

_A

_B

i

Chequear que:

XX

0

=

2

4 A

1

A

₂

3

5 h

_A

₁

_A

₂

i

+

2

4 B

1

B

₂

3

5 h

_B

₁

_B

₂

i

En general, si

x

i es la

i

-esima columna de

X

,

XX

0

=

P

x

i

x

0_i.

Es facil veri¯car que si

D

es diagonal con elemento caracteristico

d

i,

XDX

0

=

P

d

i

x

i

x

0_i

(22)

Descomposicion de la varianza

²

Supongamos un VAR con

N

variables. Cuanto de la variabilidad total de una variable es atribuible a

movimientos en cada una de las otras variables?

²

R

2 en el modelo lineal: proporcion de la varianza de

Y

que es explicada por movimientos en

X

. La idea es proporcionar una idea similar para descomponer la

variabilidad total de una variable del VAR en terminos de las variabilidades exogenas de cada una de las

(23)

Partimos de la representacion MA(

1

) de VAR:

Y

t

=

1

X

s=0

ª

s

"

t_¡s

;

ª

0

=

I

m

; "

t

»

RBM

que implica que:

V

(

Y

_t

)

=

1

X

s=0

ª

_s

−

ª

0_s

=

1

X

s=0

ª

_s

HDH

0

ª

0_s

=

1

X

s=0

ª

s

(

_N

X

i=1

d

i

h

i

h

0_i

)

ª

0_s

=

N

X

i=1

d

i

(

₁

X

s=0

ª

s

h

i

h

0_i

ª

0_s

)

(24)

V

(

Y

t

)

=

N

X

i=1

V

(

u

i

)

(

₁

X

s=0

ª

s

h

i

h

0_i

ª

0_s

)

=

N

X

i=1

V

(

u

i

)

B

(i)

En particular, la j-esima varianza:

V

(

Y

tj

) =

N

X

i=1

V

(

u

i

)

B

_jj(i)

1 =

N

X

i=1

V

(

u

i

)

B

(i) jj

V

(

Y

tj

)

=

N

X

i=1

z

ji

z

_ji

=

proporcion de la varianza de la

j

_¡

esima variable que es explicada por el componente exogeno de cada una de las

i

= 1

;

2 ; : : : ; N

variables del sistema.

(25)

En la practica: no podemos computar

1

rezagos!

Partimos de la representacion

V M A

(

₁

)

de VAR en

t

+ 1

:

Y

_t+1

=

"

_t+1

+ ª

₁

"

_t

+ ª

₂

"

_t_¡₁

+

_{¢ ¢ ¢}

La prediccion de

_Y

_t+1 con la informacion disponible en

_t

es la esperanza de

_Y

_t+1 condicional en toda la informacion disponible en

t

:

E

t

(

Y

t+1

) = ª

1

"

t

+ ª

2

"

t_¡1

+

¢ ¢ ¢

El error de pronostico de predecir

Y

t+1 en

t

sera:

(26)

Analogamente, el error de pronostico de predecir

Y

t+s en

t

sera:

e

t+2

´

Y

t+s

¡

E

t

(

Y

t+s

) =

"

t+s

+ª

1

"

t+s_¡1

+ª

2

"

t+s_¡2

+

¢ ¢ ¢

+ª

s_¡1

"

t+1

El valor esperado de

_e

_t+s es cero y su varianza es:

V

(

e

t+s

) =

−

+ ª

0₁

−

ª

1

+ ª

0₂

−

ª

2

+

¢ ¢ ¢

+ ª

0_s_¡₁

−

ª

s_¡1

²

Da una idea de la magnitud del error de prediccion (es el error cuadratico medio ya que la esperanza es cero!).

²

Notar que cuando

s

_{! 1}

,

V

(

e

t+s

)

!

V

(

Y

t

)

.

¨

§

¥

¦

(27)

Tests de hipotesis basicas en VAR

Supongamos que nos interesa evaluar si cierta restriccion sobre los parametros del VAR es correcta,

H

0

:

h

(

µ

) = 0

versus

h

(

µ

) = 0

en donde

µ

son todos los parametros del VAR y

h

es cualquier funcion continua.

Si

"

t

»

RBN

(0

;

−

)

(

T

¡

c

)

³

ln

j

−

^

r

j ¡

ln

j

−

^

u

j

´

»

Â

2

(

m

)

asintoticamente bajo

H

0, en donde

−

^

r y

−

u son las matrices

de varianzas estimadas bajo el modelo restringido y sin

restringir, respectivamente,

_m

es el numero de restricciones,

c

es el numero de parametros estimados en cada ecuacion en el modelo sin restringir, y

T

es el numero de

(28)

Ejemplos

1. Relevancia de rezagos: Ejemplo, si en con series trimestrales los rezagos del 9 al 12 son relevantes. Modelo sin restringir: incluye los 12 rezagos, sin restringir: solo los primeros 8.

2. Relevancia de variables: todos los rezagos de una variable son irrelevantes en todas las ecuaciones.

(29)

Causalidad de Granger

Consideremos la primera ecuacion de la representacion VAR(p) para

x

_t y

y

_t:

x

t

=

c

+

p

X

i=1

®

i

x

t_¡i

+

p

X

i=1

¯

i

y

t_¡i

y

_t no causa a

x

_t en el sentido de Granger si

¯

1

=

¯

2

=

¢ ¢ ¢

=

¯

p

= 0

La hipotesis puede ser facilmente evaluada con un test

F

de signi¯catividad conjunta (existen varias alternativas). En

forma similar se puede de¯nir ausencia de causalidad de Granger de

x

t.

(30)

²

Es uno de los resultados mas abusados en econometria.

²

En realidad evalua si el pasado de

y

_t contribuye a predecir

x

_t. Es mas un test que tiene que ver con precedencia temporal y no con causalidad.

Ejemplo 1: Forward-looking behavior y precios de acciones.

Ejemplo 2: Shocks en los precios de petroleo y recesiones.

Ejemplo 3: Efectos reales del dinero (Stock y Watson (1989), Christiano y Ljungqvist (1988)).