• No se han encontrado resultados

Análisis de series temporales y. Modelos autoregresivos. Series temporales.

N/A
N/A
Protected

Academic year: 2022

Share "Análisis de series temporales y. Modelos autoregresivos. Series temporales."

Copied!
23
0
0

Texto completo

(1)

Modelos autoregresivos.

Contenidos 1. Series temporales.

– Valores esperados.

– Procesos estacionarios.

– Ecuaciones de diferencias.

– Predicci´on.

2. Modelos de series temporales

– Medias m´oviles: Modelos MA(q).

– Procesos autorregresivos: AR(p).

– Series no estacionarias.

– Heterocedasticidad

∗ Modelo ARCH(q)

∗ Modelo GARCH(p,q).

Series temporales.

Una serie temporal es una secuencia ordenada de valores, correspondientes a la magnitud de una variable en un determinado instante en el tiempo

{Xτ}τ =1 ≡ X1, X2, . . . , Xt, . . .

• Ejemplo:

– Ruido blanco gaussiano: Secuencia de variables aleatorias con una distribuci´on normal N (0, σ)

1, 2, . . . t, . . .

– Caminante Browniano: Secuencia de variables aleatorias

0, 1,

2

τ =1

τ,

3

τ =1

τ, . . .

t

τ =1

τ, . . .

en la cual{τ}τ =1 es ruido blanco gaussiano.

La hip´otesis que realizamos es que la serie temporal de longitud T est´a generada mediante la extracci´on de muestras de una distribuci´on de densidad de probabilidad

P

{Xτ}Tτ =1

Análisis de series temporales y

(2)

• Ejemplo: En una secuencia determinista, en la cual la trayectoria es

´

unica, la distribuci´on es un producto de distribuciones delta

P {Xτ}Tτ =1



=

T



τ =1

δ (Xτ − G(Xτ −1, τ ))

• Ejemplo: Para ruido blanco gaussiano la distribuci´on de densidad de probabilidad es factorizable

P {τ}Tτ =1



=

T



τ =1

 1

exp



1 22τ



La distribuci´on marginal de la variable Xt se obtiene mediante integraci´on de la distribuci´on completa respecto al resto de las variables

P (Xt) =



dX1



dX2. . .



dXt−1



dXt+1. . . . . .



dXT P {Xτ}Tτ =1



.

Valores esperados.

El valor esperado de una determinada funci´on de los valores de una serie temporal F ({Xτ}Tτ =1) es

E F



{Xτ}Tτ =1



=



dX1



dX2. . .



dXT F ({Xτ}Tτ =1)P



{Xτ}Tτ =1



En la pr´actica los valores esperados se obtienen mediante un promedio sobre realizaciones de la serie temporal



Xτ(i)

T

τ =1 ≡ X1(i), X2(i), . . . , XT(i), i = 1, 2, . . . I

La estimaci´on emp´ırica mediante el promedio sobre I realizaciones es

F  = 1 I

I



i=1

F





Xτ(i)

T τ =1

,

Esta estimaci´on converge al valor exacto en el l´ımite de un n´umero infinito de realizaciones:

F  → E [F ] , cuando I → ∞.

(3)

• Media:

E [Xt] = µt.

• Varianza: Definiendo

Xˆt = Xt− µt, la varianza es

E ˆXt2



= σt2.

• Autocovarianza:

E ˆXt+τXˆt



= γ(t; τ).

• Autocorrelaci´on:

ρ(t; τ ) = γ(t; τ ) σt2 .

• Ejemplo: Ruido blanco gaussiano.

E [t] = 0

E [t+τt] = σ2δτ,0 – t ≈ N (0, σ)

Procesos estacionarios.

• Un proceso X0, X1, . . . , Xt, . . . es estacionario en sentido estricto si se cumple

P (Xt1, Xt2, . . . , Xtr) = P (Xt1, Xt2, . . . , Xtr).

• Un proceso es d´ebilmente estacionario, o estacionario con respecto a la covarianza si cumple las condiciones

E [Xt] = µ E

t+τt

 = γτ

La condici´on de estacionaridad estricta implica la d´ebil si existen los dos primeros momentos de la distribuci´on.

– Un proceso estacionario es erg´odico respecto a la media si

X = 1 T

T

τ =1

Xτ → µ, T → ∞

– Un proceso estacionario es erg´odico respecto a la varianza si 1

T − τ

T −τ

t=1

Xˆt+τXˆt → γτ, T → ∞

(4)

Funci´ on de autocovarianza/autocorrelaci´ on.

Para un proceso estacionario (a partir de este momento, se utilizar´a la condici´on d´ebil), se define la funci´on de covarianza como

γτ = E [Xt+τXt] . El coeficiente de correlaci´on es

ρτ = γτ γ0.

El valor de este coeficiente est´a acotado

−1 ≤ ρτ ≤ 1.

Se define el operador de retrasos LXt = Xt−1; con las propiedades

L0Xt = Xt; L−1Xt = Xt+1;

LτXt = Xt−τ;

Ecuaciones de diferencias de primer orden.

Consideremos la ecuaci´on de diferencias de primer orden Xt = φXt−1+ t.

La ecuaci´on se resuelve mediante un m´etodo recursivo

Xt = φtX0+t−1

τ =0

φτt−τ

Los comportamientos posibles de la soluci´on son

• Con el valor φ > 1 la soluci´on es explosiva.

• Con el valor φ < −1 la soluci´on es explosiva y presenta oscilaciones.

• Con el valor 0 ≤ φ < 1 la soluci´on decae exponencialmente.

• Con el valor −1 < φ ≤ 0 la soluci´on decae exponencialmente con oscilaciones.

(5)

0 10 20 30 40 50 60 70 80 90 100

−2

−1 0 1

x 1017

Xt

φ = −1.50

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt

φ = −1.00

0 10 20 30 40 50 60 70 80 90 100

−2

−1 0 1 2

Xt

φ = −0.50

Tiempo

Figure 1: Simulaciones (σ = 1).

0 10 20 30 40 50 60 70 80 90 100

−2

−1 0 1 2 Xt

φ = 0.50

0 10 20 30 40 50 60 70 80 90 100

−6

−4

−2 0 2

Xt

φ = 1.00

0 10 20 30 40 50 60 70 80 90 100

−5

−4

−3

−2

−1 0x 1017

Xt

φ = 1.50

Tiempo

Figure 2: Simulaciones (σ = 1).

Ecuaciones de diferencias de orden p.

Consideremos la ecuaci´on de diferencias de primer orden

Xt =

p i=1

φi Xt−i+ t.

Definiendo un vector de estado

ξt = (Xt Xt−1 . . . Xt−p+1) , la ecuaci´on se puede reescribir como

ξt = F · ξt−1 + t, con las definiciones

t = (t 0 0 . . . 0 0)

F =













φ1 φ2 φ3 . . . φp−1 φp

1 0 0 . . . 0 0

1 0 0 . . . 0 0

. . .

0 0 0 . . . 1 0















.

El caracter explosivo de la evoluci´on depende de los autovalores de F.

(6)

Ejemplo:

Consideremos la ecuaci´on de diferencias de orden 2 Xt = φ1Xt−1 + φ2Xt−2+ t.

La ecuaci´on se puede escribir de manera equivalente como

 Xt Xt−1



=

 φ1 φ2

1 0



·

 Xt−1 Xt−2

 +

 t 0

 . El comportamiento de las soluciones depende de los autovalores de de F

λ1 = 1 2



φ1+

φ21 + 4φ2

 , λ2 = 1

2



φ1−

φ21 + 4φ2

 .

−3 −2 −1 0 1 2 3

−2

−1.5

−1

−0.5 0 0.5 1 1.5

φ1 φ2

(0,1)

(−2,−1) (2,−1)

Complex; | λj | > 1 Complex; | λj | < 1 Real; | λj | < 1

Real;λ2 < −1 Real;λ1 > 1

φ12 + 4 φ2 = 0

φ2 = 1 + φ1 φ2 = 1− φ1

Figure 3: Diagrama de valores.

0 20 40 60 80 100

−4

−2 0 2 4 6 8

x 108

Tiempo Xt

λ1 = 1.22 λ2 = −1.22

0 20 40 60 80 100

−2

−1 0 1 2 3

Tiempo Xt

λ1 = 0.71 λ2 = −0.71

0 20 40 60 80 100

−2

−1 0 1 2

Tiempo Xt

λ1 = 0.71 i λ2 = −0.71 i

0 20 40 60 80 100

−2 0 2 4

x 108

Tiempo Xt

λ1 = 1.22 i λ2 = −1.22 i

Figure 4: Simulaciones (σ = 1).

(7)

Predicci´ on en series econ´ omicas.

Las series econ´omicas presentan una serie de caracter´ısticas comunes

• Generalmente las series temporales disponibles son cortas (excepto las series de “alta frecuencia”).

• Los valores de la serie temporal son generalmente dif´ıciles de medir con precisi´on (definiciones imprecisas: inflacci´on, desempleo, PNB, etc).

• No son estacionarias (tendencias a largo plazo, tendencias estacionales en la media y en la varianza, cambios en el paradigma econ´omico, memoria a largo plazo, etc.)

• Series no-lineales con componentes estoc´asticos.

En el problema de predicci´on hay diversos elementos que entran en juego:

• Conjunto de datos de partida.

– Determinar variables relevantes al problema.

– Determinar ventana de tiempo ´optima.

– Determinar frecuencia ´optima de los datos.

– Obtener los datos.

Esta elecci´on est´a condicionada a si el horizonte de predicci´on es a largo / corto plazo.

• Elecci´on del modelo a utilizar.

– Modelos param´etricos

∗ Lineales.

∗ No lineales (ej. modelos con cambio de r´egimen).

– Modelos no param´etricos

∗ Redes neuronales.

∗ Mezclas jer´arquicas de expertos.

∗ ´Arboles de regresi´on.

• Estimaci´on y evaluaci´on del modelo seleccionado

El conjunto de datos se divide en un conjunto de entrenamiento que sirve para estimar los par´ametros del modelo propuesto, y en un conjunto de prueba que se utiliza para evaluar la capacidad de predicci´on (generalizaci´on) del modelo. Generalmente se utiliza el Error cuadr´atico medio como criterio par la evaluaci´on de la predicci´on, aunque puede haber casos en los que ´esta no sea una medida razonable.

En general se observa con este procedimiento que los modelos lineales simples son m´as robustos en sus predicciones que los no lineales. Esta fen´omeno puede ser debida a varias causas

– Los modelos no lineales “memorizan” la serie temporal (sobreajuste).

– La serie datos de prueba suelen ser m´as corta que la serie de entrenamiento, y los efectos de la no-linealidad pueden ser peque˜nos.

– El criterio de error elegido puede conducir a conclusiones err´oneas sobre la calidad de la predicci´on.

(8)

Medias m´ oviles: MA(q)

El proceso de medias m´oviles de orden q es generado mediante la ecuaci´on de diferencias

Xt = t + ˜θ· ˜(q)t ,

donde t es ruido blanco gaussiano con desviaci´on est´andar σ, el vector de retrasos de este ruido blanco es

˜(q)t 

=

 1 

(q)t 

con la definici´on

˜(q)t 

= (t−1 t−2. . . t−q) .

El vector de par´ametros es θ˜ = 

θ0 θ , con

θ = (θ1 θ2. . . θq) .

• La media del proceso es

µ = θ0

• La funci´on autocovarianza del proceso es

γτ = 

θτ +q−τ

j=1θjθτ +j



σ2 τ ≤ q 0 τ > q

• Ejemplo: MA(1)

Xt = µ + t + θt−1

– Varianza:

E Xˆt2



= (1 + θ22. – Autocovarianza:

γ1 = θσ2

γ2 = γ3 = . . . = 0 – Autocorrelaci´on :

ρ1 = θ

1 + θ2,

ρ2 = ρ3 = . . . = 0

(9)

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt = εt + 0.59 εt−1

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 5: Simulaci´on MA(1) ; σ = 1 .

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt = εt − 0.88 εt−1 + 0.21 εt−2

0 2 4 6 8 10 12 14 16 18 20

−0.5 0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 6: Simulaci´on MA(2) ; σ = 1 .

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt = εt

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 7: Simulaci´on MA(0) ; σ = 1 .

0 10 20 30 40 50 60 70 80 90 100

−5 0 5 10

Xt = εt + 0.75 εt−1 − 0.97 εt−2 + 0.54 εt−3 + 0.94 εt−4

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 8: Simulaci´on MA(4) ; σ = 1 .

(10)

Proceso al l´ımite MA( ∞)

Consideremos el modelo de medias m´oviles Xt = µ +

τ =0

ψτt−τ,

donde t es ruido blanco gaussiano con desviaci´on est´andar σ.

La condici´on suficiente para que el proceso sea estacionario es

τ =0

ψτ2 < ∞.

Normalmente, se requiere una condici´on m´as estricta que implica la anterior

τ =0

τ| < ∞.

En el caso de que el proceso sea estacionario,

• La media del proceso es

E[Xt] = µ

• La varianza es

γ0 =

τ =0

ψ2τ

• La funci´on de autocovarianza es

γτ =

τ =0

ψτψτ +j.

Procesos autorregresivos: AR(p)

El proceso autorregresivo de orden p es generado mediante la ecuaci´on de diferencias

Xt = ˜φ· ˜X(p)t + t,

donde t es ruido blanco gaussiano con desviaci´on est´andar σ, el vector de retrasos de X es

(p)t 

=

 1 

X(p)t  ,

X(p)t 

= (Xt−1 Xt−2. . . Xt−p) , y el vector de par´ametros es

φ˜ = 

φ0 φ ,

φ = (φ1 φ2. . . φp) .

• El proceso es estacionario si las ra´ıces de la ecuaci´on

p i=1

φizi = 1

(11)

se encuentran fuera del c´ırculo unidad en el plano complejo.

• La media incondicional del proceso es E [Xt] = φ0

1 −p

i=1φi

• La media condicional del proceso es

E [Xt | Xt−1Xt−2. . . Xt−p] = φ0+

p i=1

φiXt−i

• Ecuaciones de Yule-Walker: Las funciones de autocorrelaci´on satisfacen la misma ecuaci´on que el proceso autorregresivo

γτ =

p

i=1

φiγτ −i+ σ2δτ,0

ρτ =

p

i=1

φiρτ −i

• Ejemplo: AR(1)

Xt = φ0+ φ1Xt−1+ t, φ1 < 1 – Media:

E [Xt] = φ0 1 − φ1. – Varianza:

E Xˆt2



= σ2 1 − φ21

– Autocovarianza y autocorrelaci´on:

γj = φj1

1 − φ21σ2 ρj = φj1

0 10 20 30 40 50 60 70 80 90 100

−5 0 5

Xt = −0.90 Xt−1 + epsilont

0 2 4 6 8 10 12 14 16 18 20

−0.5 0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 9: Simulaciones AR(1) (φ = −0.9; σ = 1).

(12)

0 10 20 30 40 50 60 70 80 90 100

−2 0 2 4

Xt = −0.45 Xt−1 + epsilont

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 10: Simulaciones AR(1) (φ = −0.45; σ = 1).

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt = 0.00 Xt−1 + epsilont

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 11: Simulaciones AR(1) (φ = 0; σ = 1).

0 10 20 30 40 50 60 70 80 90 100

−4

−2 0 2 4

Xt = 0.45 Xt−1 + epsilont

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 12: Simulaciones AR(1) (φ = 0.45; σ = 1).

0 10 20 30 40 50 60 70 80 90 100

−5 0 5 10

Xt = 0.90 Xt−1 + epsilont

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

Magnitud

Autocorrelaciones

0 2 4 6 8 10 12 14 16 18 20

0 0.5 1

τ

Magnitud

Autocorrelaciones de los valores absolutos

Figure 13: Simulaciones AR(1) (φ = 0.9; σ = 1).

(13)

El proceso AR(p) como un proceso MA( ∞)

En t´erminos del operador de retardo LXt = LXt−1, el proceso AR(p) se puede escribir como

Xt = φ0 +

p τ =1

φτLτXt + t

o, de manera equivalente (1 −

p τ =1

φτLτ)Xt = φ0 + t

Suponiendo que el inverso existe (lo cual est´a garantizado si el proceso es estacionario respecto a la covarianza)

Xt = µ + ψ(L)t, que corresponde a un proceso MA(∞) con

µ = φ0

1 −p

τ =1φτ ψ(L) = 1 1 −p

τ =1φτLτ.

Ejemplo: AR(1)

El proceso AR(1) con |φ1| < 1

Xt = φ0 + φ1Xt−1 + t

es equivalente a un proceso MA(∞) Xt = (1 − φ1L)−10 + t] =

φ0

1 − φ1 + 1

1 − φ1L t = φ0

1 − φ1 +

 τ =0

φτ1 Lτ t = φ0

1 − φ1 +

 τ =0

φτ1 t−τ.

(14)

Procesos ARMA(p,q)

Se puede construir un modelo que incluya simult´aneamente t´erminos de medias m´oviles y autorregresivos

Xt = c + φ· X(p)t + θ· (q)t + t.

El proceso es estacionario respecto a la varianza si las ra´ıces de

1 −

p i=1

φizi = 0

se encuentran fuera del c´ırculo unidad. Esta condici´on es independiente de los valores de los coeficientes del t´ermino correspondiente a medias m´oviles.

El proceso tambi´en se puede expresar como un modelo MA(∞)

Xt = µ + ψ(L)t, con las definiciones

µ = c

1 −p

i=1φi; ψ(L) =

q

i=1θiLi 1 −p

i=1φiLi.

De esta forma se puede tambi´en poner de manifiesto posibles problemas de modelos degenerados: Modelos con factores comunes en el denominador y numerador de ψ(L) generan series temporales que son indistinguibles.

Predicci´ on

La predicci´on del valor de Xt+h basado en un conjunto de variables explicativas It ≡ {Yt − τ; τ ≥ 0} equivale a hacer una estimaci´on de la distribuci´on condicional

P (Xt+h|It).

Normalmente las estimaciones se restringen a los dos primeros momentos:

• La media condicional

t+h|t = E [Xt+h|It] =

• La varianza condicional E 

Xt+h− ˆXt+h|t

2

|It

La media condicional es el estimador para Xt+h que minimiza el error cuadr´atico medio (varianza) de la estimaci´on.

(15)

Predicci´ on en procesos ARMA(p,q)

Consideremos un proceso ARMA(p,q) invertible

⎝1 −p

j=1

φjLj

⎠ (Xt− µ) =

⎝1 +q

j=1

θjLj

⎠ t

Este proceso se puede reescribir como

Xt − µ =

p j=1

φjLj(Xt − µ) +

⎝1 +q

j=1

θjLj

⎠ t.

La predicci´on con un horizonte s = 1 es Xˆt|t−1− µ =

p j=1

φjLj(Xt − µ) +

q j=1

θjLjt,

de donde se deduce

t = Xt− ˆXt|t−1 La predicci´on con un horizonte s es

t+s|t − µ =

p j=1

φj( ˆXt+s−j|t − µ) +

q j=s

θjt+s−j.

Predicci´ on con un n´ umero finito de observaciones

Las f´ormulas de predicci´on del apartado anterior asumen que disponemos de un n´umero infinito de observaciones hacia el pasado. En caso de que el n´umero de observaciones sea finito {Xt−m+1, Xt−m+2, . . . , Xt}, podemos suponer que las innovaciones son nulas para los tiempos anteriores al inicial

ττ <= t − m.

Este procedimiento es razonable siempre que la memoria de la serie temporal sea a corto plazo y que t 0.

Esiste una predicci´on m´as precisa, basada en encontrar la proyecci´on exacta de (Xt+1 − µ) en los m valores m´as recientes

Xt = (Xt − µ, Xt−1 − µ, . . . , Xt−m+1 − µ) . La predicci´on con un horizonte s = 1 es

t+1|t− µ =

m i=1

αi(Xt−i+1 − µ)

(16)

tiene como soluci´on

⎜⎜

γ0 γ1 . . . γm−1 γ1 γ0 . . . γm−2

... ... . . . ...

γm−1 γm−2 . . . γ0

⎟⎟

⎠ ·

⎜⎜

⎝ α1

α2 ...

αm

⎟⎟

⎠ =

⎜⎜

⎝ γ1

γ2 ...

γm

⎟⎟

⎠ .

Num´ericamente el sistema se puede resolver mediante una descomposici´on de Cholesky.

La predicci´on con un horizonte s es Xˆt+1|t− µ =

m i=1

α(s)i (Xt−i+1 − µ)

tiene como soluci´on

⎜⎜

γ0 γ1 . . . γm−1 γ1 γ0 . . . γm−2

... ... . . . ...

γm−1 γm−2 . . . γ0

⎟⎟

⎠·

⎜⎜

⎜⎝ α1(s)

α2(s)

...

αm(s)

⎟⎟

⎟⎠=

⎜⎜

γs γs+1

...

γs+m−1

⎟⎟

Descomposici´ on de Wold (Wold, 1938).

Un proceso cualquiera {Xt}t=−∞, estacionario respecto a la covarianza y de media cero, puede ser representado mediante el proceso

Xt =

 j=0

ψjt−j+ κt

con ψ0 = 1 y

j=0j|2 < ∞. La componente t es ruido blanco y representa el error de predicci´on para Xt de la predicci´on lineal ´optima a partir de toda la serie de valores anteriores de la variable

t = Xt − ˆE [Xt|Xt−1, Xt−2, . . .]

La componente linealmente determinista κt no est´a correlacionada con t−j para ning´un valor de j y puede ser predicha linealmente a partir de la secuencia de valores anteriores de Xt

κt = ˆE [κt|Xt−1, Xt−2, . . .]

La componente

j=0ψjt−j es una componente linealmente no-determinista.

(17)

La descomposici´on de Wold no puede utilizarse directamente para proponer un modelo para la serie temporal, ya que contiene un n´umero infinito de par´ametros. Con la hip´otesis adicional de que la funci´on ψ(L) puede ser aproximada con cierta precisi´on por un aproximante de Pad´e

ψL

 j=0

ψjLj ≈ θ(L) φ(L) =

q

i=0θqLq p

j=0φjLp, con θ0 = φ0 = 1.

Metodolog´ıa Box-Jenkins.

La observaci´on de que modelos con un n´umero excesivo de par´ametros conduce a modelos que generalizan de manera deficiente, nos lleva a preferir modelos con el n´umero m´as peque˜no de par´ametros.

Box y Jenkins proponen una metodologia para modelaci´on de series temporales

1. Realizar las transformaciones necesarias sobre los datos de forma que la serie transformada sea estacionaria.

• Transformaci´on logar´ıtmica

Yt = log Xt

Xt−1



• Transformaci´on a rendimientos

rt = log St

St−1



St − St−1

St−1

• Substraer tendencias

Yt = Xt− (α + δt).

• Tomar diferencias

Yt = Xt − Xt−1

(18)

• Eliminar componentes estacionales

Yt = Xt− Xt−12

2. Elegir un modelo ARMA(p,q), con p y q peque˜nos.

3. Estimar los par´ametros del modelo.

4. Hacer tests de diagn´ostico para comprobar que el modelo es coherente con los datos de la serie temporal.

Modelo para una serie temporal no estacionaria.

Hasta este momento hemos descrito modelos de una variable para una serie temporal que pueden ser escritos como

Xt = µ +

 τ =0

ψτt−τ = µ + ψ(L)t

con la propiedad

 τ =0

τ| < ∞

y con las ra´ıces de ψ(z) fuera del c´ırculo de radio unidad en el plano complejo. Para este tipo de series se cumple

E [Xt] = µ Xˆt+s|t ≡ lim

s→∞E [Xt + s|Xt, Xt−1, Xt−1, . . .] = µ.

En el contexto de series econ´omicas o financieras esto no tiene por qu´e ser correcto.

(19)

Hay dos formas de describir tendencias en una serie temporal

• Procesos que tienen un comportamiento estacionario una vez que se substrae un t´ermino de tendencia.

Ejemplo: Modelo con tendencia lineal

Xt = α + δt + ψ(L)t

Las propiedades de este modelo son – Predicci´on

Xˆt+s|t = α + δ(t + s) +

τ =0

ψs+τt−τ

– Comportamiento en el l´ımite: Dado que limτ −>∞ψτ = 0, se cumple

s→∞lim E ˆXt+s|t− (α + δ(t + s))



= 0.

– Error de predicci´on:

Xt+s− ˆXt+s|t =

s−1



tau=0

ψτt+s−τ

El valor del error cuadr´atico medio es E





Xt+s− ˆXt+s|t

2

= σ2

s−1



tau=0

ψτ2

Converge a una constante cuando s → ∞.

• Modelos integrados o de ra´ız unidad: Un modelo integrado de orden d es tal que al ser diferenciado d veces da lugar a un proceso estacionario.

– Caminante aleatorio con deriva δ

Xt = Xt−1+ δ + t, ψ(1) = 0.

– Ejemplo: Proceso integrado de orden 1

(1 − L)Xt = δ + ψ(L)t, ψ(1) = 0 – Consideremos el proceso con una ra´ız unidad

Xt = α + δt + ut,

donde ut es un proceso ARMA(p,q). El proceso diferenciado es estacionario

(1 − L)Xt = δ + ψ(L)t, donde

ψ(L)t = (1 − L)ut. Las propiedades de este modelo son

∗ Predicci´on:

La relaci´on b´asica es la predicci´on de las primeras diferencias

E [Xt+s− Xt+s−1|Xt, Xt−1, . . .] = δ +

τ =0

ψs+τt−τ.

Con la observaci´on

Xt+s = (Xt+s − Xt+s−1)+(Xt+s− Xt+s−1)+. . . (Xt+s− X

(20)

se llega a la relaci´on

Xˆt+s|t = sδ + Xt+

τ =0 s

θ=1

ψθ+τt − τ

∗ Errores de predicci´on El error de predicci´on es

Xt+s− ˆXt+s|t =

s

τ =1 τ −1

θ=0

ψτt+s−τ.

El valor del error cuadr´atico medio es

E



Xt+s− ˆXt+s|t

2

= σ2

s



θ=1 τ −1



τ =0

ψτ2 Crece linealmente cuando s → ∞.

En res´umen, la mayor diferencia entre procesos no estacionarios de estos dos tipos es la persistencia del efecto de las innovaciones: En los procesos con tendencia la influencia de las innovaciones disminuye con el tiempo. Sin embargo, en los procesos con ra´ız unidad, el efecto de las innovaciones se acumula en el tiempo. A pesar de las diferencias cualitativa, determinar cu´al es el proceso subyacente a partir de una muestra finita puede ser problem´atico.

Procesos ARIMA(p,d,q)

Un caso especialde modelos integrados son los procesos ARIMA(p,d,q). La diferencia de orden d de un proceso ARIMA(p,d,q) da lugar a un proceso estacionario ARMA(p,q).

Consideremos el proceso ARIMA(0,1,1) Xt = Xt−1+ δ + t + θt−1

• Predicci´on

Xˆt+s|t = sδ + Xt + θt.

• Suponiendo δ = 0, s = 1

Xˆt+1|t = Xt + θt.

Utilizando

t = Xt − ˆXt|t−1. obtenemos

Xˆt+1|t = Xtθ(Xt− ˆXt|t−1).

Iterando esta relaci´on se obtiene la predicci´on correspondiente a un

“exponential smoothing”

Xˆt+1|t = (1 + θ)

τ =0

(−θ)τXt−τ.

(21)

heterocedasticidad: ARCH(q)

Este modelo intenta reflejar la estructura temporal de la volatilidad de una serie temporal, proponiendo un modelo autoregresivo para la serie temporal y otro distinto para las innovaciones

Xt = φ˜· ˜X(m)t + ut

ut =  ht t

ht = ˜α·

˜ u2t(q)

,

donde t es ruido blanco gaussiano con desviaci´on est´andar igual a 1. La condici´on de no negatividad

αi >= 0

implica que el proceso es estacionario respecto a la covarianza si

q i=1

αi < 1

El vector de retrasos para las innovaciones es

2t(q)

= 

1 u2t−1 u2t−2 . . . u2t−q

• Volatilidad incondicional σ2 = E

u2t

= α0

1 −q

i=1αi

• Volatilidad condicional E

u2t | ut−1ut−2. . . ut−q

= α·

u2t(q)

• Estimaci´on por m´axima verosimilitud Suponiendo que las innovaciones tienen una distribuci´on normal la probabilidad condicional es

p(Xt|X(max(q,m))t ) = 1

√2πht

exp

⎧⎨

⎩−(Xt − ˜φ· ˜X(m)t )2 2ht

⎫⎬

⎭, donde

ht = ˜α·

˜ u2t(q)

y

ut = Xt− ˜φ· ˜X(q)t .

La funci´on a optimizar, con las restricciones correspondientes es el logaritmo de la funci´on de verosimilitud

LL = T

t=r

log p(Xt|X(r)t ), r = max(q, m).

(22)

• Ejemplo: AR(1) / ARCH(1)

Xt = φ0+ φ1Xt−1+ ut

ut = ht t

ht = α0+ α1u2t−1 – Volatilidad incondicional:

E



u2t



= α0 1 − α1. – Volatilidad condicional:

E



u2t | ut−1



= α0 + α1u2t−1

heterocedasticidad: GARCH(p,q)

Este modelo intenta reflejar la estructura temporal de la volatilidad de una serie temporal, proponiendo un modelo autoregresivo para la serie temporal y otro distinto para las innovaciones

Xt = φ˜· ˜X(m)t + ut ut = 

ht t

ht = κ + β· [ht](p) + α·

u2t(q)

,

donde t es ruido blanco gaussiano con desviaci´on est´andar igual a 1. El vector de retrasos para las innovaciones es

u2t(q)

= 

u2t−1 u2t−2 . . . u2t−q . El vector de retrasos para ht

[ht](p)

= (ht−1 ht−2 . . . ht−p) . Las restricciones para los par´ametros son

• No-negatividad

κ > 0; αj ≥ 0; βj ≥ 0

(23)

• Proceso estacionario (respecto a la covarianza)

r i=1

i + βi) < 1; r = max{p, q}

• Volatilidad incondicional σ2 = E

u2t

= κ

1 −r

i=1i + αi)

• Ejemplo: AR(1) / GARCH(1,1)

Xt = φ0+ φ1Xt−1+ ut

ut = ht t

ht = κ + βht−1+ αu2t−1 – Volatilidad incondicional:

E



u2t



= κ

1 − β − α.

Referencias

Documento similar

La utilización de la teoría de grupos en relación con el retículo de las subextensiones de una cierta extensión de cuerpos dada, constituye el núcleo central de la metodología

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

El Teorema 1.4 de Gerschgorin puede ser aplicado a la matriz X −1 AX para cualquier matriz no singular X ∈ C n×n , para estimar el conjunto de autovalores de A y este corolario es

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

[r]

[r]

El segundo, com- puesto por los elementos de su diagonal principal (predicciones adapta- das un período en adelante respecto al origen de predicción Ti).. La valoración de