Una nueva prueba Portmanteau para modelos ARMA en series
de tiempo
A new Portmanteau test for ARMA models in time series
Rafael Eduardo D´ıaz Bonillaa
Autor
Hanwen Zhangb
Director
Resumen
Uno de los supuestos que se debe validar en todo modelamiento de series de tiempo es que los residuales sean aproximadamente incorrelacionados. Las pruebas existentes utilizan en su mayor´ıa las correlaciones muestrales, mientras que la prueba de Monti utiliza las correlaciones parciales. En este estudio se pro-pone una nueva prueba que utilice tanto las correlaciones muestrales como las correlaciones parciales, a partir de la familia de estad´ısticas para analizar la independencia entre los residuales descrita por Box y Jenkins en 1976. La estad´ıstica propuesta se comportan de manera asint´otica como una combinaci´on lineal de variables aleatorias chi-cuadrado y su distribuci´on asint´otica se puede aproximar mediante una distribuci´on gamma. Para mirar el ajuste emp´ırico de la distribuci´on y estudiar su potencia frente a otras pruebas de uso com´un, se realiz´o un ejercicio de simulaci´on con 15 modelos ARMA(2,2) con p,q62 es-tacionario e invertible para datos peque˜nos medianos y grandes, con longitud de la serie de 50, 200 y 500 respectivamente. La potencia se calcul´o para las cuatro pruebas con rezagos fijos deh= 5, 10, 15 y 20. Posteriormente se realizo un peque˜no ejercicio con los datos reales de la variaci´on del consumo personal en EE.UU, para los a˜nos 1970 a 2010. Como principal resultado se encontr´o que el m´etodo propuesto se comporta de mejor manera que las pruebas cl´asicas y muestra ser m´as potente que las pruebas de Box-Pierce, Ljung-Box y Monti.
Palabras clave:Pruebas Portmanteau, autocorrelaci´on muestral, autocorrelaci´on parcial, Potencia,
mo-delos ARIMA..
Abstract
One of the assumptions that must be validated in all time series modeling is that the residuals are approximately incorrect. Existing tests use mostly sample correlations, while Monti’s test uses partial correlations. In this study we propose a new test that uses both the sample correlations and the partial correlations, from the family of statistics to analyze the independence between the residuals described by Box and Jenkins in 1976. The proposed statistics behave asymptotically a linear combination of random chi-square variables and their asymptotic distribution can be approximated by a gamma distribution. To look at the empirical adjustment of the distribution and study its power against other commonly used tests, a simulation exercise was carried out with 15 models ARMA (2,2) with p,q 62 stationary and invertible for medium and large small data, with length of the series of 50, 200 and 500 respectively. Power was calculated for the four tests with fixed lags ofh = 5, 10, 15 and 20. Subsequently, a small exercise was performed with the real data of the variation of personal consumption in the US, for the 1970s. 2010. As a main result, it was found that the proposed method behaves in a better way than the classic tests and it shows to be more powerful than the Box-Pierce, Ljung-Box and Monti tests.
Keywords:Pruebas Portmanteau, autocorrelaci´on muestral, autocorrelaci´on parcial, Potencia, modelos
ARIMA..
1. Introducci´
on
En an´alisis de series temporales, la construcci´on de un modelo consta de tres etapas (identificaci´on, es-timaci´on y verificaci´on de supuestos) seg´un la metodolog´ıa desarrollada por Box & Jenkins (1976). La primera etapa, consiste en identificar y seleccionar el modelo adecuado, si es necesario realizar transfor-maciones para que la serie sea estacionaria e identificar el componente estacional si lo hay, para finalmente elegir el modelo ARIMA, que mejor se ajuste. En la segunda etapa se estiman los par´ametros del modelo ARIMA seleccionado, com´unmente se utilizan los m´etodos de m´axima verosimilitud y m´ınimos cuadra-dos, obteniendo los errores est´andar y los residuos del modelo. Finalmente sigue la ´ultima etapa y una de las m´as importantes consiste en verificar que el modelo seleccionado proporciona un ajuste adecuado y cumple los supuestos b´asicos. En particular el diagn´ostico del modelo es una de las etapas m´as importan-tes en la construcci´on de este. Para examinar el adecuado ajuste de un modelo estad´ıstico, a menudo se realiza un an´alisis de los residuales. En particular nos interesa encontrar que los residuos del modelo, son un ruido blanco es decir que son independientes y por lo tanto el proceso no presenta ninguna correlaci´on serial. Adem´as la media y la varianza deben ser constantes en el tiempo. En caso de no cumplirse los supuestos, se realizan las modificaciones necesarias y se repiten las etapas anteriores hasta obtener el mejor modelo.
El m´etodo usual consiste en gr´aficar las funciones de los ACF y PACF de los residuales, que permi-te mostrar que rezagos son significativos, y tambi´en si hay alguna estructura en general. Sin embargo estos gr´aficos presentan dos problemas, primero solo mostraran estructuras dependientes lineales, y es probable que en muchos casos las estructuras no sean lineales. El segundo problema es que en presencia de datos at´ıpicos (outliers), la funci´on de auto correlaci´on muestral (ACF) y la funci´on de auto correlaci´on parcial (PACF), no son robustas, por lo que la estructura de correlaci´on es seriamente perturbada (Chan & Wei, 1992; Bonifazi & M´endez, 2014; Duerre et al, 2014; Bonifazi, 2015). Por esta raz´on la segunda op-ci´on, es construir una estad´ıstica de prueba para probar la hip´otesis nula, de que los residuales del modelo son independientes hasta un rezagoh. Con el fin de encontrar estructuras lineales y no lineales, en media y varianza. Estas estad´ısticas conocidas como portmanteau iniciaron con el trabajo de Box y Pierce, en la d´ecada de los 70. Si se ha elegido el modelo apropiado, habr´a una autocorrelaci´on de cero. En esta ´ultima etapa de verificaci´on de los supuestos, la metodolog´ıa propuesta por Box y Jenkins, parte de la idea de que todo modelo es err´oneo, debido a que el modelo desea representar un fen´omeno real, de la manera m´as simple. Evidentemente, si se debe seleccionar un modelo, este debe ser aquel que viole menos supuestos, o los menos importantes; es por esto que se eval´uan a todos los modelos para encontrar sus posibles fallas. Entonces las pruebas portmanteau se utilizan para probar la bondad de ajuste de modelos ARMA en series de tiempo. Las estad´ısticas iniciales de las pruebas portmanteau demostraron ser muy ineficientes para detectar desviaciones de los supuestos, pero ha aumentado el inter´es en el campo y ha aparecido recientemente una nueva variedad de estad´ısticas (ver Li y McLeod 1983, McLeod 1994, Monti 1994, Hong 1996, Pe˜na y Rodr´ıguez 2002 entre otras). Hay muchos art´ıculos que analizan el comportamiento de las pruebas, ver por ejemplo (Safi & Al-Reqep 2014), sin embargo no parece haber un consenso claro de cu´al es la mejor prueba, es por esta raz´on que es pertinente proponer un nuevo m´etodo m´as eficiente en t´erminos de potencia que las pruebas cl´asicas.
2. Objetivos
2.1. General
Proponer una nueva prueba para el an´alisis de la dependencia de los residuales en modelos ARMA, m´as potente que las pruebas de Ljung-Box y Monti.
2.2. Espec´ıficos
Determinar cual de las pruebas portmanteau, m´as populares que se usan en la actualidad es la de mayor potencia en diferentes escenarios.
Analizar el efecto de los rezagosh, en la potencia de las pruebas utilizadas en este estudio. Encontrar la distribuci´on te´orica y mostrar el ajuste emp´ırico de la estad´ıstica propuesta a esa distribuci´on.
3. Marco T´
eorico
3.1. Series Temporales
Por serie de tiempo nos referimos a datos estad´ısticos o secuencia de datos que se recopilan, observan o registran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros) y ordenados cronol´ogicamente. Los datos pueden estar espaciados a intervalos iguales o desiguales. Las series de tiempo son extremadamente comunes. En los negocios, observamos tasas de inter´es semanales, precios de cierre diarios, ´ındices de precios mensuales, cifras de ventas anuales, etc. En meteorolog´ıa, observamos temperaturas altas y bajas diarias, ´ındices anuales de precipitaci´on y sequ´ıa y velocidades de viento por hora. En agricultura, registramos cifras anuales de producci´on agr´ıcola y ganadera, erosi´on del suelo y ventas de exportaci´on. En las ciencias biol´ogicas, observamos la actividad el´ectrica del coraz´on a intervalos de milisegundos. En ecolog´ıa, registramos la abundancia de una especie animal. La lista de ´areas en las que se estudian las series temporales es pr´acticamente infinita. El prop´osito del an´alisis de series de tiempo es generalmente doble: entender o modelar el mecanismo estoc´astico que da lugar a una serie observada y predecir los valores futuros de una serie basada en la historia de esa serie.
Año
Precipitación
1880
1900
1920
1940
1960
1980
10
20
30
40
Año
Precipitación
1880
1900
1920
1940
1960
1980
10
20
30
40
En la figura 1, se observa un ejemplo de serie temporal de la precipitaci´on de la lluvia anual para la ciudad de Los ´Angeles, durante el per´ıodo 1878-1992 tomado del paquete TSA de R. En el gr´afico, se pueden observar a˜nos extremadamente h´umedos como 1883, y otros extremadamente secos 1983, el objetivo ser´ıa modelar est´a serie, con el fin de pronosticar la precipitaci´on en a˜nos pr´oximos. Para modelar estas series Box & Jenkins propusieron una metodolog´ıa que se muestra a continuaci´on.
3.2. Metodolog´ıa Box
&
Jenkins
En el an´alisis de series de tiempo, la metodolog´ıa de Box-Jenkins, nombrada as´ı en honor a los estad´ısticos George E. P. Box y Gwilym Jenkins, se aplica a los modelos autorregresivos de media m´ovil ARMA o a los modelos autorregresivos integrados de media m´ovil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pron´osticos sean m´as acertados.
El m´etodo original utiliza un enfoque de modelado iterativo en tres etapas, usando datos de un horno de gas. Estos datos son conocidos como datos de Box-Jenkins del horno de gas para la evaluaci´on comparativa de modelos de predicci´on.
Las tres etapas del modelado iterativo son las siguientes:
1. Identificaci´on y selecci´on del modelo: asegurarse de que las variables son estacionarias, la identifi-caci´on de la estacionalidad de la serie dependiente (diferenciaci´on estacional, para cierto per´ıodo, si es necesario), y el uso de los gr´aficos de las funciones de autocorrelaci´on y de autocorrelaci´on parcial de la serie de tiempo se utilizan para decidir cu´al componente (si es el caso) se debe utilizar en el modelo, el promedio autorregresivo (AR) o un promedio m´ovil (MA).
2. Estimaci´on de par´ametros usando algoritmos de c´alculo para tener coeficientes que mejor ajusten el modelo ARIMA seleccionado. Los m´etodos m´as comunes usan estimaci´on de m´axima verosimilitud o m´ınimos cuadrados no lineales.
3. Comprobar el modelo mediante el ensayo, si el modelo estimado se ajusta a las especificaciones de un proceso univariado estacionario. En particular, los residuos deben ser independientes el uno del otro, adem´as, la media y la varianza deben ser constantes en el tiempo. (Para identificar los errores de especificaci´on son ´utiles la graficaci´on de la media y la varianza de los residuos a trav´es del tiempo y la realizaci´on de una prueba de Ljung-Box o bien por medio del trazado de autocorrelaci´on y autocorrelaci´on parcial de los residuos.) Si la estimaci´on es inadecuada, tenemos que volver al paso uno e intentar buscar un modelo mejor.
4. Modelos para series estacionarias
En esta secci´on se discute los conceptos b´asicos de una clase amplia de modelos de series de tiempo param´etricos de los modelos autorregresivos de medias m´oviles (ARMA). Estos modelos han asumido gran importancia en el modelado de procesos del mundo real.
4.1. Proceso de Medias M´
oviles
Un modelos de medias m´oviles de orden(q), denotado como MA(q) describe una serie temporal estacio-naria, los primeros en considerarlo fue Slutzky (1937) y Wold (1938), puede ser escrito como sigue.
Xt=µ+t+θ1t−1+· · ·+θqq−1 (1)
En la pr´actica, la informaci´on disponible para poder estimar los modelos y luego predecir con ellos son las propias observaciones de la serie. Por ello, vamos a exigir que los modelos MA sean invertibles. La propiedad de invertibilidad establece que el valor presente de ytpueda expresarse como una combinaci´on lineal convergente de observaciones pasadas.
En general, en un modelo MA(q), la condici´on de invertibilidad viene dada porque las soluciones de la siguiente ecuaci´on:
1+θ1x+· · ·+θqxq=0 (2)
Proceso de medias m´oviles de primer orden:
Consideramos el caso m´as simple del proceso de medias m´oviles, el MA(1) es decir orden 1 ya que tiene un solo param´etroθsiµ=0 se define a continuaci´on.
Xt=µ+t+θt−1
dondeµes la media de la serie,θes el par´ametro del modelo yt,t−1 son los t´erminos de error (ruido blanco). El valor esperadoE(Yt) =0 y su varianza Var(Yt) =σ2e(1+θ2), con Cov(Yt,Yt−1) = −θσ2e y
Cov(Yt,Yt−1) =0. Ya que no hay e0scon ´ındice com´un entre Yt yYt−2. An´alogamente se obtiene que
Cov(Yt,Yt−k = 0)siempre que k2, es decir, el proceso no tiene una correlaci´on m´as all´a del rezago 1. Este hecho ser´a importante en el momento que tengamos que elegir modelos adecuados para datos reales. En el caso concreto de la propiedad de invertibilidad para el modelo MA(1) significa que |θ1| < 1, es decir 1+θ1x=, entonces la soluci´on esx= −1/θ1.
4.2. Procesos Autorregresivos
Los procesos autorregresivos propuestos por Yule (1926) son como su nombre sugiere: son regresiones sobre s´ı mismos. Espec´ıficamente, un proceso autorregresivoXtde ordenpsatisface la siguiente ecuaci´on:
Xt=c+φ1Xt−1+· · ·+φpXt−p+t (3)
En un modelo AR(p) en valor en el momentot de la serie se expresa como una combinaci´on lineal de las p observaciones anteriores de la serie m´as el termino de innovaci´on t, el cual se asume que son independientes deYt−1,Yt−2,Yt−3, ..., y que incorpora todo lo nuevo de la serie en el momentotque no se explica por los valores pasados. Sea el polinomio caracter´ıstico del modelo AR(p).
φ(x) =1−φ1x−φ2x2−· · ·−φpxp (4)
y correspondiente ecuaci´on caracter´ıstica del AR
1−φ1x−φ2x2−· · ·−φpxp=0 (5)
Como se se˜nal´o anteriormente, suponiendo que t es independiente de Yt−1,Yt−2,Yt−3, ... existe una soluci´on estacionaria a la ecuaci´on 6 si y solo si laspra´ıces de la ecuaci´on caracter´ıstica AR exceden cada una 1 en valor absoluto (m´odulo). Se pueden usar otras relaciones entre ra´ıces y coeficientes polin´omicos para mostrar que las siguientes dos desigualdades son necesarias para la estacionariedad. Es decir, para que las ra´ıces sean mayores que 1 en m´odulo, son necesarias ambas, pero no suficiente
φ1+φ2+· · ·+φp<1
y |φp|<1
(6)
Proceso Autorregresivo de primer orden:
Xt=c+φXt−1+t
donde t es un proceso de ruido blanco con media cero y varianza σ2. El proceso es de covarianza es estacionario si y solo si |φ|< 1. Si φ =1, entonces Xt tiene una ra´ız unitaria. El requisito de |φ| <1 generalmente se denomina condici´on de estacionariedad para el proceso AR(1)ver Box & Jenkins (1976).
En este caso la media marginal va estar dad por E(Xt) = c+φE(Xt−1) ⇒ µ = 1−cφ, en particular si
c=0, la media es 0, y con varianzaVar(Xt) =γ0= σ
2
e
1−φ2, dondeσe es la desviaci´on est´andar det.
4.3. Modelo autorregresivo de medias m´
oviles ARMA(p,q)
La notaci´on ARMA(p, q) se refiere al modelo con p t´erminos autorregresivos y q t´erminos de media m´ovil. Este modelo contiene los modelos AR(p) y MA(q).
Xt=c+ p X
i=1
φiXt−i+t+ q X
i=1
θit−i (7)
El modelo ARMA general fue descrito en la tesis de 1951 de Whitle, pero fueron popularizados en 1971 por George E. P. Box y Jenkins, quienes expusieron en su libro un m´etodo iterativo (Box-Jenkins) para elegir el n´umero de par´ametros y estimarlos. El modelo ARMA permite recoger efectos m´as duraderos de las innovaciones con menos restricciones, que el AR(p) y permite conservar sus efectos a diferencia delMA(q), en el cual las innovaciones dejan de tener efectos despu´es deqperiodos.
Proceso Autorregresivo de de medias m´oviles de orden (1,1)
El caso m´as simple de estos modelos mixtos es el ARMA(1,1), definiendo la ecuaci´on puede ser escrito:
Xt=c+φXt−1+t+t−1 (8) La condici´on de estacionariedad indica que la parte autorregresiva es estacionaria, esto es si|φ|<1, y la condici´on de invertibilidad se cumple si su componente de medias m´oviles es invertible, es decir |θ|<1. En este caso la media de E(Xt)esµ= 1−cφ y la funci´on de autocorrelaci´on.
ρ(h) =
(1+φθ)(φ+θ)
1+θ2+2φθ ,h=1
φρ(h−1) ,h>1 (9)
5. Pruebas de Bondad de Ajuste
En esta secci´on se consideran siguientes pruebas de bondad de ajuste para el an´alisis de la independencia de los residuales en modelos de series de tiempo, Box-Pierce, Ljung-Box y Monti. Estas tambi´en son llamadas pruebas portmanteau, y asumimos bajo la hip´otesis nula que el modelo ajustado es el correcto, y los residuales se comportan como un proceso ruido blanco.
Sea{Xt}un proceso generado por un modelo ARMA(p,q) estacionario e invertible, de la formaφ(B)Xt=
θ(B)εt dondeε∼N(0,σ2ε), conφ(B)yθ(B)son polinomios de ordenpyq respectivamente, dados por
φ = 1−φ1B−· · ·−φpBp y θ = 1−θ1B−· · ·−θqBq donde B es el operador de rezago definido
comoBkX
ˆrk= T X
t=k+1 ˆ εtˆεt−k
.XT
t=1 ˆ
ε2t parak=1, 2, ...,h6T−1 (10)
Si los ´ordenes p y q est´an adecuadamente identificados, cada rk ≈ 0 para k = 1, ...,h donde h se elige lo suficientemente grande como para detectar una correlaci´on significativa en los datos. Basados en estos coeficientes estimados, Box y Jenkins propusieron una familia de estad´ısticas para analizar la independencia entre los residuales en el a˜no 1976,tomado de (Zhang 2015) como sigue:
Q=T
δ
h X
k=1
wkg(ˆr2k) + (1−δ) h X
k=1
ωkg(πˆ2k)
(11)
Donde los ˆπk son los coeficientes de autocorrelaci´on parcial estimados de los residuales, 06δ61,h <
T,wk>0,ωk>0, y ges una funci´on de suavizamiento no decreciente con g(0) =0. Algunos miembros conocidos de esta familia cuandog(x) =xson:
Box & Pierce (1970), cuando δ=1 ywk=1
Ljung & Box (1978), cuando δ=1 ywk= (T +2)/(T−k) Monti (1994), cuandoδ=0 yωk= (T+2)/(T−k)
Estos estad´ısticos pueden ser resumidos como:
QBP=T h X
k=1
ˆr2k QLB=T h X
k=1
(T+2) (T −k)ˆr
2
k QM=T
h X
k=1
(T+2) (T −k)πˆ
2
k (12)
DondeQBP es la estad´ıstica de Box & Pierce (1970),QLB la estad´ıstica de Ljung & Box (1978), y QM es la estad´ıstica de Monti (1994).
5.1. Prueba de Box y Pierce
La propuesta cl´asica de las pruebas portmanteau es una de las dadas por Box-Pierce.
QBP =T h X
k=1 ˆ
r2k (13)
Entonces QBP es la estad´ıstica de prueba, donde ˆrk es la autocorrelaci´on muestral de orden k del residual,hes el n´umero de rezagos que se est´an probando yT es el tama˜no de la muestra.
Esta estad´ıstica se utiliza para probar la correlaci´on significativa hasta el un rezagoh. Sabemos que para datos independientes e id´enticamente distribuidos, cuando T →∞, las autocorrelaciones se comportan como variables aleatorias independientes con distribuci´on normal, y por lo tanto bajo la hip´otesis nula (modelo correctamente ajustado) se muestra queQBP es una variable aleatoria asimt´oticamente distri-buida de Chi-cuadrado con h−p−q grados de libertad, donde p y q son el orden de los t´erminos autorregresivos y de media m´ovil estimados en el modelo ajustado, respectivamente.
5.1.1. Distribuci´on Asint´otica de QBP
Sea {Xt} un proceso ARMA(p,q) donde los t´erminos de error {ε} son ruido blanco. Ahora bien, si el orden del modelo (p,q) fuera correctamente identificado y ajustado, y los ε0s para la muestra de la serie se calcularan utilizando los valores de par´ametros verdaderos, entonces estosε0sser´ıan desviaciones aleatorias no correlacionadas, y sus primerashautocorrelaciones muestralesr= (r1,r2, ...,rh)0, dondeh es peque˜no en relaci´on a T y
rk= T X
t=k+1
εtεt−k
.XT
t=1
ε2 (14)
paraTsuficientemente granderse acerca a una distribuci´on normal (Box & Pierce 1970) como si el modelo fuera de orden(p+q, 0). Tambi´en se puede demostrar f´acilmente que los{rk}no est´an correlacionados con varianza
Var(rk) =
T −k
T(T +2) ≈1/T (15)
Es decir que el vector de autocorrelaci´on de los residuales es aproximadamente una transformaci´on lineal de una variable normalr∼N(0,(1/T)I). Por lo cual se desprende en particular que la estad´ısticaT(T + 2)Phk=1(T−k)−1r2
k, para unT grande se distribuyeχ2conhgrados de libertad; como una aproximaci´on adicional de TPhk=1r2
k∼χ2h. Box y Pierce hicieron una representaci´on deˆr como transformaci´on lineal der, conˆr= (I−V)r, dondeV=X(X0X)−1X0 es una matriz de dimensi´onh− (p+q), yXes una matriz
h×p+qcuyo(i,j)-´esimo elemento es cero sii < jyψjsii>j, con coeficientesψ(B) = [φ(B)θ(B)]−1. Por lo tantoˆr∼N(0,(1/T)[I−V], y la estad´ısticaQBP=T
Ph k=1ˆr
2 k∼χ
2 h−p−q.
5.2. Prueba de Ljung-Box
Despu´es de algunas discusiones sobre la distribuci´on para la muestra finita de la estad´ıstica de prueba propuesta por Box y Pierce y su rendimiento conservador.
Ljung y Box (1978) propusieron una versi´on modificada de esa prueba, mejorando esta aproximaci´on sustituyendo los coeficientes de autocorrelaci´on ˆrk en (13) por sus valores estandarizados
˜r2k= (T+2) (T −k)ˆr
2
k (16)
Obteniendo la estad´ıstica
QLB=T h X
k=1
(T+2) (T−k)ˆr
2
k (17)
La estad´ıstica QLB tiene una distribuci´on para una muestra finita que est´a mucho m´as cerca de la de la distribuci´onχ2 con h−p−q grados de libertad, que la estad´ısticaQBP. La intuici´on indica que se est´a ajustando cada ˆrk en la estad´ıstica QBP por su varianza asint´otica. Sin embargo, esta modifica-ci´on no carece de cr´ıtica, ya que se ha demostrado, seg´un (Arranz 2005), que su varianza podr´ıa ser sustancialmente mayor que la de su distribuci´on asint´otica.
5.2.1. Distribuci´on Asint´otica de QLB
de que la varianza de losrk esT−1y es una aproximaci´on de la cantidadVar(rk) = (T−k)/(T(T+2)). Esta aproximaci´on de la varianza fue utilizada por la dificultad de derivar la distribuci´on nula deQBP. Sin embargo el resultado de Box & Pierce provee una buena aproximaci´on para un T relativamente grande con respecto ah, generalmente tomando a hcomo 15 o 20, pero este requerimiento dif´ıcilmente se mantiene en la practica, esta observaci´on fue notada por (Prothero & Wallis, 1976, citado por Davies, 1977 p. 518) qui´en propone usar la estad´ıstica QLBcomo alternativa aQBP. Ljung & Box demostraron queQLB, se distribuye aproximadamenteχ2conh−p−qgrados de libertad conE(QLB)'h−p−qy
V(QLB) =2h 1+ h−T10
y aunque la varianza deQLBexcede a 2h los estudios de simulaci´on de Ljung & Box (1978) indican que para prop´ositos pr´acticos la aproximaci´on es adecuada.
5.3. Prueba de Monti
Las estad´ısticas dadas en (13) y (17), est´an basadas sobre los coeficientes de autocorrelaci´on muestral. Monti (1994) propuso un estad´ıstico alternativo utilizando los coeficientes de autocorrelaci´on parcial, ˆπk,
k=1, 2, ...,h. El estad´ıstico propuesto es
QM=T h X
k=1
(T +2) (T−k)πˆ
2
k (18)
dondeT es la longitud de la serie.
En 1994 Monti demostr´o que si el modelo ARMA ajustado es el adecuado, entoncesQM se distribuye asint´oticamente como una variable aleatoria χ2h−p−q. Adem´as Monti (1994) demostro bajo simulaci´on que el rendimiento deQMes comparable al deQLBy mejor si el orden del promedio m´ovil es subestimado. Por otro lado,QLBfunciona mejor si el orden de la parte autorregresiva es el subestimado.
5.4. Propiedades Asint´
oticas de
Q
MSea rk el k-´esimo coeficiente de autocorrelaci´on muestral de los errores y πk el k-´esimo coeficiente de correlaci´on parcial de ˆt. Sea r = (r1,r2, ...,rh)0 y π = (π1,π2, ...,πh)0. Por el algoritmo de Durbin-Levinson, el vector πse puede obtener como una funci´on der,π=ψ(r), con el k-´esimo elemento dado por
πk=ψk(r) =
rk−r(0k−1)R−(k1−1)r∗(k−1) 1−r(0k−1)Rh−(k1−1)r(k−1)
(19)
Donde Rk is la matriz Toeplitz k×k, tal que Rk = (r|i−j|)i,j=1,2,...,k, con r∗k = (rk,rk−1, ...,r1)0. Sea ˆ
π= (πˆ1, ˆπ2, ..., ˆπh)0, el vector de los primerosh autocorrelaciones parciales de los residuales. Entonces ˆ
πk puede ser obtenido, an´alogamente aπk, reemplazando las autocorrelaciones del error por las autoco-rrelaciones del residual en la ecuaci´on (17). Monti afirma quesi el modelo es correctamente identificado, QM se distribuye asint´oticamente como una variable aleatoriaχ2h−p−q.La demostraci´on es como sigue: Si las autocorrelaciones del error son cero, rk = Op(T−
1
2)(k = 1, 2, ...). Adem´as Rk = Ik+Op(T−12) por (12).
π=r+Op(T−1) (20)
La expansi´on de Taylor deψ(ˆr)alrededor der
ˆ
π=ˆr+ ∂π
∂r(ˆr−r) +Op(T
−1) (21)
Ya que∂π/∂r=I+Op(T−
1
ˆ
π=ˆr+Op(T−1) (22)
Ahoraˆrpuede ser aproximado por una transformaci´on lineal singular der,ˆr= (Ih−V)r+Op(T−1), donde
Ves una matriz idempotente con rangosp+q(Box & Pierce 1970), yT12rest´a distribuida asint´oticamente como una variable normal multivariada con vector de medias cero y matriz de covarianzas diagonal Σh con
Var(T12rk) = T−k
T+2 (23)
Consecuentemente,T12Σ− 1
2πˆ es asint´oticamente normal multivariada con vector de medias cero y matriz de covarianzas(Ih−V) yQM es asint´oticamente unaχ2h−p−q. Bajo la hip´otesis nula, QLB y QM son asint´oticamentes equivalentes, pero obviamente, algunas diferencias pueden esperarse en sus comporta-mientos en muestras peque˜nas. En particular, sus resultados bajo la hip´otesis alternativa pueden ser sustancialmente diferentes, como se muestra en (Monti 1994).
6. Estad´ıstica Propuesta
Sea{Xt}un proceso de media cero generado por un modelo ARMA(p,q), es decirφ(B)Xt=θ(B)εt, donde
Bes el operador de rezago,φ(B)es un polinomio de ordenp, yθ(B)es un polinomio de ordenq, yεtes ruido blanco. Donde ˆε1, ˆε2, ..., ˆεT son los residuales obtenidos despu´es de estimar el modelo ARMA(p,q) en una muestra de tama˜noT, y sea ˆrk los coeficientes de autocorrelaci´on estimada de los residuales como en (10). La estad´ıstica propuesta parte de asignar un valor aδ y awk,ωk en la estad´ıstica Q, dada en (11) diferente a los usualmente utilizados en las estad´ısticas cl´asicas. Se tomo el valor de 0.5 para δ y pesos,
wk=ωk=
(T+2) (T −k)
(h−k+1)
h (24)
Los pesos (T +2)/(T −k)son tomados como enQLB y QM, para la parte restante(h−k+1)/hson derivados al usar t´ecnicas de an´alisis multivariado sobre la matriz de autocorrelaci´on (similar a Pe˜na & Rodr´ıguez (2002)). Observe que la autocorrelaci´on al rezago 1, ˆr1, est´a dada por el peso h/h = 1. La autocorrelaci´on muestral aal rezago 2, ˆr2est´a dada por el peso(h−1)/h <1. Se puede interpretar que los pesos hacen m´as ´enfasis sobre la primera autocorrelaci´on, y menor ´enfasis sobre la autocorrelaci´on al rezagohque corresponde a 1/h. Esto coincide con la intuici´on sobre las estimaciones pues la primera autocorrelaci´onr1se calcula usando informaci´on de todas lasnobservaciones. La segunda autocorrelaci´o se basa enn−1 observaciones, y lah-´esima autocorrelaci´on se basa enn−hobservaciones. Intuitivamente, tiene sentido poner m´as ´enfasis en la primera autocorrelaci´on, ya que deber´ıa ser la m´as precisa. Esta idea tambi´en es v´alida para las autocorrelaciones parciales. La estad´ıstica se puede resumir como sigue:
Qm0.5 =T (T+2)
2h
h X
k=1
(h−k+1) (T−k) (ˆr
2 k+πˆ
2
k) (25)
Alternativamente a las pruebas de Ljung-Box y Monti, las cuales utilizan los coeficientes de correlaci´on muestral y parcial, respectivamente. Esta mixtura pretender combinar coeficientes de correlaci´on muestral y parcial, asignandoles la misma ponderaci´o a trav´es deδ. En la siguiente secci´on, se muestra cual es la distribuci´on asint´otica deQmδ.
6.1. Distribuci´
on Asint´
oticas de
Q
mδSeaˆr= (ˆr1, ..., ˆrh)0y ˆπ= (πˆ1, ..., ˆπh)0 y usando los resultados de Ljung y Box (1978) y Monti (1994) que √
dondeV=XΨ−1X0, es la matriz de informaci´on para los par´ametrosφyθ, yXes una matrizh×(p+q)
con los elementosφyθdefinidos por φ1(B =PφiBi y θB1 = P
θiBi.
Teorema 1. Bajo la hip´otesis nula de un modelo adecuadamente ajustado, las estad´ısticas ˜QLB y ˜QMse distribuyen asint´otica mente comoPhk=1λkχ2kdonde
χ2k son variables aleatorias chi-cuadrado indepen-dientes con un grado de libertad yλk= (k=1, ...,h)son los valores propios de(I−V)W, dondeWes una matriz diagonal con elementoswii= (k−i+1)/h(i=1, ...,h). Defiendo a ˜QLB= T(Th+2)
Ph k=1
(h−k+1) T−k ˆr
2 k
y ˜QM= T(T+ 2) h
Ph k=1
(h−k+1) T−k πˆ
2 k.
Demostraci´on teorema 1. Tanto ˜QLBcomo ˜QMpueden ser expresado como formas cuadr´atica. Definiendo aW como una matriz diagonal de pesos.
W =
1 0 · · · 0
0 hh−1 · · · 0
..
. · · · . .. ...
0 · · · 0 h1
Entonces ˜QLB y ˜QM son asint´otica mente expresados como formas cuadr´aticas ˜QLB'Tˆr0Wˆry ˜QM'
Tˆr0Wˆr cuandoT →∞. DondeA0 denota la operaci´on transpuesta de un vector o matrizAyˆr, ˆπes un vector h×1 de la (autocorrelaci´on parcial) desde un rezago 1 hasta h. De el resultado en Box(1954), ambas formas cuadraticas se distribuyen una combinaci´on lineal de variables aleatoria chi cuadrados independientes por su respectivo valor propio como se muestra a continuaci´on
h X
k=1
λkχ2k (26)
Losλkson loshvalores propios de la matriz(I−V)Wdonde(I−V)es la matriz de covarianza de ambos √
Tˆr y √Tπˆ. Box Pierce(1970) y McLeod(1978) aproximaron la matriz V con la matriz de proyecci´on X(X0X)−1X0 cuandoh es suficientemente grande.
Observamos que las estad´ısticas ˜QLBy ˜QM siguen la misma distribuci´on nula asint´otica que la de Pe˜na y Rodr´ıguez(2002, 2006) y esta distribuci´on es similar a la de Mahdi y McLeod (2012). La densidad es dif´ıcil de escribir en forma expl´ıcita, pero la aproximaci´on de la distribuci´on ha sido discutida por muchos autores. Imhof (1961) hab´ıa demostrado que las probabilidades se pueden encontrar a trav´es de la integraci´on num´erica. Pe˜na y Rodr´ıguez(2006) sugirieron una aproximaci´on normal usando una generalizaci´on de la transformaci´on de ra´ız c´ubica Wilson-Hilferty de una variable aleatoria chi-cuadrado. Lin y McLeod (2006) y Mahdi y McLeod (2012) sugirieron un m´etodo de Monte Carlo para determinar los puntos cr´ıticos y los valores p. Para facilidad computacional, como la de Pe˜na y Rodr´ıguez (2002), recomendamos una aproximaci´on usando una distribuci´on gamma descrita en Satterthwaite (1941,1946) y Box (1954) con par´ametros de forma y escala
α= 3h(h+1) 2
4(2h2+3h+1−6h(p+q)), (27)
β= 2(2h
2+3h+1−6h(p+q)
h(h+1) (28)
McLeod (2012), pero en la pr´actica si h es grande en relaci´on con T, sus estad´ısticas pueden volverse num´ericamente inestables.
Teorema 2. Sea {Yt} un proceso ARMA(p,q) con secuencia de errores {t}. Si h = O(Tδ) para alg´un 0< δ <1 talqueh/T →0 yE[8]<∞, entonces bajo la hip´otesis nula cuandoT →∞,(Q˜LB−k1)/
√ K2 converge a variable normal est´andar, dondeK1 yK2 son dados por (29) y (30) respectivamente.
Aproximaci´on gamma. Box(1954) y Satterthwaite(1941,1946) demostraron que la distribuci´on de esta forma cuadr´atica en general puede ser aproximado porcχ2k, o por la distribuci´on gama. Los par´ametros son escogidos tal que la distribuci´on tiene los mismos dos primeros cumulan tes que la forma cuadr´atica. En particular, considere los par´ametros de forma y escala para la distribuci´on gama:
α= K 2 1
K2
y
β= K2 K1
dondeKies el i-´esimo cumulante de la distribuci´on. Box (1954) proporciono una formula para los cumu-lantes y por simple manipulaci´on algebraica de el resultado en Pe˜na y Rodr´ıguez provee:
K1= h X
i=1
=tr((I−V)W) = h−1
2 − (p+q) + 1 h
h X
i=2
(i−1)vii
y
K2=2 h X
i=1
λ2i =2tr((I−V)W(I−V)W)
= 1
3h(h+1)(2h+1) −2(p+q) + 4 h
h X
i=2
(i−1)vii− 4 h2
h X
i=2
(i−1)2vii+ 2 h2
h X
i=2 h X
j=2
(i−1)(j−1)v2ij
donde vij es el elemento en la fila i, columna j de la matriz V. Pe˜na y Rodr´ıguez (2002) demostraron que cuando hes moderadamente grande los t´erminosO(h−1)yO(h−2)tienden a cero. Recomendamos
usar un l´ımite superior en K1 ya que mejora la aproximaci´on bajo la distribuci´on nula y el argumento limitante paraK2de Pe˜na y Rodr´ıguez
K1=
h+1
2 − (p+q) (29)
K2=
(h+1)(2h+1)
3h −2(p+q) (30)
Aplicando los teoremas de aproximaci´on gamma descrito por Box(1954) y Satterthwaite(1941,1946), esto sugiere que la distribuci´on bajo la hip´otesis nula para la estad´ısticaQmδ es gamma con par´ametrosα,β
dados por:
α= 3(h
2+h−2(h−1)(p+q))2
4(2h3+3h2+h−6(h2−2h−1)(p+q)) , β=
7. Metodolog´ıa
Se simularon quince modelos ARMA(p,q) para el valor deδ=0.5 yh=20 con longitud de la serie 300 con diferentes valores deφyθestacionarios e invertibles. Posteriormente se ajusta el modelo con el orden correcto, y se calcula el valor deQmδ, graficando los valores de la estad´ıstica en un histograma con ajuste
de la densidad para una distribuci´on gama 1 con par´ametrosαy βcomo en (31). Se utilizo la prueba de bondad de ajuste de Kolmogorov-Smirnov para verificar queQmδ se distribuye gama. Se compararon
las pruebas Box-Pierce, Ljung-Box y Monti con la la propuesta con el fin de encontrar el m´etodo m´as potente en diferentes escenarios. Se utilizaron tres tama˜nos de muestra para la longitud de la serie T, para datos peque˜nosT = 50, para datos medianos T = 200 y para datos grandes T = 500 con rezagos h =5, 10, 15, 20. Los modelos ARMA(p,q) simulados con par´ametrosφ yθ, estacionarios e invertibles conpyq62, donde ARMA(1,0) es ajustado en todos los casos. Por lo que el n´umero total de escenarios evaluados fue de 180. Para el calculo del error de tipo I, se tomaron 6 de los modelos (1, 4, 6, 8, 13 y 14) propuestos. con longitud de la serie 50, 125, 200, 275, 350, 425 y 500. Finalmente se gr´aficaron para ver el comportamiento de cada una de las pruebas Portmanteu. El n´umero de simulaciones montecarlo (Nsim)fue de 10.000, utilizando el software estad´ısticoR versi´on 3.4.2, para la potencia de las pruebas se utilizo un valorα=0.05.
8. Resultados
Esta secci´on se divide en tres partes. La primera parte muestra el ajuste emp´ırico de la estad´ısticaQmδ
a la curva de densidad de la distribuci´on te´oricaΓ(α,β), adem´as se eval´ua la bondad de ajuste con la ayuda de la prueba no param´etrica de Kolmogorov - Smirnov. En la segunda parte se eval´ua el error de tipo I para las pruebas Portmanteau en 6 escenarios. Finalmente se calcula la potencia de las pruebas Portmanteau, bajo diferentes escenarios para datos peque˜nos, medianos y grandes.
8.1. Ajuste emp´ırico a la distribuci´
on gama
A continuaci´on se muestran los resultados obtenidos por simulaci´on montecarlo verificando emp´ıricamente que la distribuci´on Γ(α,β) se ajusta adecuadamente a la distribuci´on nula de Qmδ. En la figura 2 se
gr´afica ron 15 histogramas que corresponden al valor de la estad´ıstica Qmδ de los modelos ARMA(p,q)
propuestos en este este estudio. La aproximaci´on a la distribuci´on gamma parece la adecuada. Tabla 1: Pruebas de ajuste Kolmogorov-Smirnov a la estad´ısticaQmδ.
Modelo M´etodo α β δ φ1 φ2 θ1 θ2 D Valor p Alternativa
1 K-S 11.032 1.317 0.5 - - 0.7 - 0.010 0.258 Dos Colas
2 K-S 11.032 1.317 0.5 - - 0.4 - 0.008 0.591 Dos Colas
3 K-S 11.032 1.317 0.5 - - -0.5 - 0.010 0.247 Dos Colas
4 K-S 10.650 1.274 0.5 0.5 0.3 - - 0.013 0.055 Dos Colas
5 K-S 10.650 1.274 0.5 1.2 -0.73 - - 0.009 0.447 Dos Colas
6 K-S 10.650 1.274 0.5 - - 1 -0.6 0.010 0.240 Dos Colas
7 K-S 10.650 1.274 0.5 - - 0.24 0.1 0.010 0.253 Dos Colas
8 K-S 10.650 1.274 0.5 0.6 - 0.4 - 0.012 0.132 Dos Colas
9 K-S 10.650 1.274 0.5 0.5 - -0.7 - 0.008 0.558 Dos Colas
10 K-S 10.650 1.274 0.5 -0.2 - -0.6 - 0.012 0.128 Dos Colas
11 K-S 10.297 1.224 0.5 0.7 0.2 -0.5 - 0.026 0.051 Dos Colas
12 K-S 10.297 1.224 0.5 1 -0.35 0.1 - 0.012 0.111 Dos Colas
13 K-S 10.297 1.224 0.5 0.4 - -0.6 0.3 0.012 0.096 Dos Colas
14 K-S 9.9850 1.070 0.5 0.9 -0.3 1.3 -0.5 0.105 0.000 Dos Colas
15 K-S 9.9850 1.070 0.5 0.4 -0.3 -0.3 1.1 0.174 0.000 Dos Colas
Figura 2: Histograma de la estad´ısticaQmδ, ajuste dist.Γ(α,β)
.
Los resultados de la figura reffig1, muestran el correcto ajuste de la estad´ıstica a la distribuci´onΓ(α,β). Aunque en algunos casos el ajuste no fue tan bueno, por ejemplo para el modelo 15, en general la aproximaci´on a la distribuci´on gama parece adecuado. En la tabla 1., se observan los resultados obtenidos de la aplicaci´on de la prueba de bondad de ajuste Kolmogorov - Smirnov a la distribuci´on gama. En la mayor´ıa de casos el p valor fue mayor al nivel de significaci´on, para unα=0.05, contrastando la hip´otesis nulaF(x) =F(y)vsF(x)6=F(y), por lo que no hay suficiente evidencia estad´ıstica para rechazarH0 y se concluye que la estad´ıstica de prueba propuestaQmδ sigue en general una distribuci´onΓ(α,β).
9. Tama˜
no de la Prueba
En esta secci´on se calcula el error tipo I, definido como laPr(Rechazar H0|H0 es verdadaera) o falso positivo, es el error que se comete cuando el investigador rechaza la hip´otesis nulaH0siendo esta verdadera en la poblaci´on. Se eligieron como casos particulares el modelo 1 un MA(1) con θ = 0.7, el modelo 4 un AR(2) φ1 = 0.5,φ2 = 0.3, modelo 6 un MA(2) con θ1 = 1,θ2 = −0.6, modelo 8 un ARMA(1,1)
φ00.6,θ=0.4, modelo 13 un ARMA(1,2) conφ=0.4,θ1= −0.6,θ2=0.3 y modelo 14 un ARMA(2,2) conφ1=0.9,φ2= −0.3,θ1=1.3,θ= −0.5. Los resultados obtenidos se muestran en la figura 3. El valor de αutilizado fue al 0.05. Como vemos las pruebas en general se comportan bastante bien movi´endose alrededor del 5 %, por lo que no hay inflaci´on del error de tipo I.
9.1. Estudio de Simulaci´
on para Datos Peque˜
nos
Generamos datos para un tama˜no de muestra peque˜no (T = 50) mediante el software estad´ıstico R y la potencia de las pruebas se calcula para los rezagos h= 5, 10, 15 y 20. Los resultados se presentan en la Tabla 2 para h = 5 y 20. Para los otros rezagos la Tabla 8 se encuentra en el ap´endice.
Figura 3: Resultados del Error de tipo I cometido con los modelos ARMA ajustados.
rezagos h y alcanzan su m´axima potencia cuando este esh = 5. Por ejemplo, en el modelo 1 MA(1), hay deficiencias de la potencia de la prueba para el caso QBP del rezago 5 al rezago 10, es igual a (0.3376−0.2112)/0.3376×100 % = 37.4 % y c´alculos similares son utilizados para los otros modelos. Entonces, los promedios de la disminuci´on de la potencia con respecto a h del rezago 5 al 10 es un 19.3 %, 12.3 %, 20.1 %, 0.4 % paraQBP,QLB,QM,Qm0.5 respectivamente, con excepci´on del modelo 7 en el cual la potencia no disminuyo sino aumento, paraQLB,QM,Qm0.5 yQm0−75.
Para losAR(p)yMA(q), los resultados muestran queQMes mejor queQLBsi el orden del componente del promedio m´ovil es subestimado (ver los modelos 1,2,3,6, y 7 para todos los rezagos seleccionados). Por otro ladoQLBtiene mejor rendimiento queQMsi el orden del componente autorregresivo es subestimado (ver modelos 4 y 5 para todos los rezagos.)
En la Tabla 2 se observa que la estad´ıstica propuestaQmδ, fue la m´as potente en los modelos 1, 3, 4, 8,
10, 12 y 14 para el rezago h = 5. Mientras que para el rezago h = 20, fue la prueba m´as potente excepto en el modelo 2 y 7. En la general los resultados muestran que a medida que aumenta los rezagos h, el resultado de la estad´ıstica propuesta es m´as potente que las dem´as. Para tener una visi´on general de los resultados calculamos el promedio de la potencia para cada prueba Portmanteau teniendo en cuenta los 15 modelos propuestos en los cuatro rezagos seleccionados h=5,10,15 y 20 los resultados fueron los siguiente. ParaQBPfue de 21.92 %, paraQLBfue de 32.76 %, paraQMfue de 34.92 % y para 41.94 %, lo que muestra una mejora considerable con respecto a las pruebas cl´asicas, si comparamos con Box-Pierce la mejora fue de un 47.7 % y se la comparamos con la prueba de Monti la mejora fue de un 16.7 %.
9.2. Estudio de Simulaci´
on para Datos Medianos
Se generaron datos con tama˜no de muestra mediano (T = 200) por medio del software estad´ıstico R y la potencia de las pruebas se calculo parah=5, 10,15 y 20. Los resultados son presentados en la Tabla 3, para los rezagosh=5 y 15, los otros rezagos se encuentran disponibles en el ap´endice en la Tabla 9. El estudio de simulaci´on muestra que la potencia de las pruebas Portmanteu aumenta cuando T=200, en comparaci´on con T=50. La potencia de las pruebas decrece con respecto al rezago h 5 a 10 en 11.7 %, 9.4 %, 9.2 %, 0.7 % para QBP,QLB,QM y Qmδ respectivamente, con excepci´on de los modelos
5,14 y 15 pues todas tienen la misma potencia aproximadamente 100 %.
Tabla 2: Potencia de las pruebas Portmanteau con T = 50, h=5 y 20,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 5 h = 20
1 - - 0.7 - 0.3376 0.3984 0.5700 0.5794 0.1228 0.2832 0.2554 0.4232
2 - - 0.4 - 0.0812 0.1212 0.1330 0.1286 0.0312 0.1182 0.0662 0.1206 3 - - -0.5 - 0.1392 0.1944 0.2388 0.2456 0.0538 0.1670 0.1136 0.1902
4 0.5 0.3 - - 0.1992 0.2434 0.2436 0.3110 0.0716 0.1824 0.0978 0.2104
5 1.2 -0.73 - - 0.9910 0.9960 0.9932 0.9960 0.9254 0.9676 0.9410 0.9894
6 - - 1 -0.6 0.3304 0.3762 0.4984 0.4854 0.1142 0.2820 0.2298 0.3870
7 - - 0.24 0.1 0.0310 0.0440 0.0586 0.0350 0.0122 0.0728 0.0458 0.0552 8 0.6 - 0.4 - 0.2650 0.3140 0.3836 0.4524 0.1084 0.2540 0.1744 0.3244
9 0.5 - -0.7 - 0.0642 0.0906 0.1362 0.1082 0.0284 0.1136 0.0748 0.1166
10 -0.2 - -0.6 - 0.3288 0.3974 0.5526 0.5776 0.1232 0.2838 0.2584 0.4336
11 0.7 0.2 -0.5 - 0.2778 0.3576 0.3750 0.3734 0.0878 0.2384 0.1690 0.3046
12 1 -0.35 0.1 - 0.6084 0.6586 0.6700 0.7646 0.3050 0.5070 0.3798 0.6306
13 0.4 - -0.6 0.3 0.0756 0.1062 0.1270 0.1062 0.0260 0.1148 0.0714 0.1140 14 0.9 -0.3 1.3 -0.5 0.7868 0.8392 0.9376 0.9566 0.3862 0.6196 0.6612 0.8566
15 0.4 -0.3 -0.3 1.1 0.4336 0.5404 0.7580 0.6168 0.1322 0.3554 0.5252 0.6218
modelos 1, 2, 3, 6 y 7 para todos los rezagos seleccionados en las Tablas 3 y 9). En cuanto a los resultados de la estad´ıstica propuesta Qmδ para el rezago h = 5, fue la m´as potente para los modelos 1, 3, 4, 8,
10, 12 y 14. Sin embargo si el n´umero de rezagos aumenta hasta h = 20, fue igual o m´as potente que las pruebas cl´asicas en todos los modelos, (ver Tabla 9 con h=20). Como resultado global para todos los rezagos comparamos el promedio de la potencia obtenida por cada prueba, fueron los siguientes 71.06 %, 72.91 %, 74.81 %, 79.71 %, para QBP, QLB, QM y Qmδ respectivamente. se aprecia que el incremento
en la potencia varia desde 6.1 % hasta 10.8 % si lo comparamos con las pruebas cl´asicas de Monti o Box-Pierce.
Tabla 3: Potencia de las pruebas Portmanteau con T = 200, h=5 y 15,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 5 h = 15
1 - - 0.7 - 0.9952 0.9964 0.9990 0.9992 0.8908 0.9028 0.9852 0.9992
2 - - 0.4 - 0.3252 0.3466 0.3746 0.4174 0.1768 0.2204 0.2102 0.3450
3 - - -0.5 - 0.6662 0.6968 0.7488 0.7836 0.3840 0.4466 0.4972 0.6968
4 0.5 0.3 - - 0.9104 0.9152 0.9216 0.9544 0.7412 0.7546 0.7438 0.9026
5 1.2 -0.73 - - 1 1 1 1 1 1 1 1
6 - - 1 -0.6 0.9868 0.9852 0.9936 0.9938 0.8424 0.8806 0.9468 0.9896
7 - - 0.24 0.1 0.0592 0.0738 0.0740 0.0540 0.0514 0.0738 0.0634 0.0614 8 0.6 - 0.4 - 0.9370 0.9372 0.9648 0.9784 0.7366 0.7752 0.8272 0.9462
9 0.5 - -0.7 - 0.3126 0.3310 0.4084 0.3770 0.1648 0.1940 0.2506 0.3374
10 -0.2 - -0.6 - 0.9928 0.9932 0.9972 0.9992 0.8856 0.8998 0.9680 0.9930
11 0.7 0.2 -0.5 - 0.9968 0.9972 0.9978 0.9974 0.9810 0.9862 0.9818 0.9954
12 1 -0.35 0.1 - 0.9990 0.9992 0.9994 0.9994 0.9888 0.9898 0.9934 0.9992
13 0.4 - -0.6 0.3 0.6312 0.6546 0.6410 0.6692 0.4038 0.4508 0.4368 0.6062
14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1
15 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9960 0.9982 1 1
9.3. Estudio de Simulaci´
on para Datos Grandes
Se generaron datos de tama˜no de muestra grandes con (T = 500) por medio del software estad´ıstico R y la potencia de las pruebas se calcula para h=5, 10, 15 y 20. Los resultados se presentan en la Tabla 4 para h= 5 y 15, para los rezagos 10 y 20 los resultados se encuentran en la Tabla 10 que esta en el ap´endice. Todas las pruebas presentan sensibilidad al valor del rezago escogidoh.
En promedio la potencia de las pruebas decrece en cuando se pasa del rezago h = 5 a h = 10, en
mejores resultados que las pruebas cl´asicas para los rezagos h = 10, 15 y 20. En general el promedio de la potencia obtenido por las pruebas Portmanteau fue de 87.11 %, 87.44 %, 88.32 %, 90.76 % para las estad´ısticasQBP,QLB,QMyQm0.5 respectivamente, por lo tanto la mejora en potencia que ofreceQmδ
es entre 2.7 % a 4 % con respecto a las pruebas cl´asicas.
Tabla 4: Potencia de las pruebas Portmanteau con T = 500, h=5 y 10,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 5 h = 10
1 - - 0.7 - 1 1 1 1 1 1 1 1
2 - - 0.4 - 0.7512 0.7692 0.7892 0.8346 0.5974 0.5958 0.6344 0.7824
3 - - -0.5 - 0.9866 0.9902 0.9944 0.9964 0.9518 0.9588 0.9732 0.9918
4 0.5 0.3 - - 1 1 0.9998 1 0.9994 0.9996 0.9996 1
5 1.2 -0.73 - - 1 1 1 1 1 1 1 1
6 - - 1 -0.6 1 1 1 1 1 1 1 1
7 - - 0.24 0.1 0.1032 0.1158 0.1140 0.0982 0.0850 0.0950 0.0874 0.1060
8 0.6 - 0.4 - 1 1 1 1 0.9998 1 0.9998 1
9 0.5 - -0.7 - 0.7748 0.7820 0.8314 0.8258 0.5966 0.6078 0.7168 0.8164
10 -0.2 - -0.6 - 1 1 1 1 1 1 1 1
11 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 1
12 1 -0.35 0.1 - 1 1 1 1 1 1 1 1
13 0.4 - -0.6 0.3 0.9848 0.9850 0.9848 0.9876 0.9540 0.9546 0.9548 0.9866
14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1
15 0.4 -0.3 -0.3 1.1 1 1 1 1 1 1 1 1
10. Ejemplo Ilustrativo: Tasas de consumo personal en los
Esta-dos UniEsta-dos.
Para validar los resultados del estudio de simulaci´on, aplicamos las pruebas de portmanteau para probar la adecuaci´on de los modelos ajustados sobre un conjunto de datos reales. Se utiliza la base de datos usconsumption del paquete fpp la cual contiene los cambios porcentuales en el gasto de consumo personal trimestral y el ingreso personal disponible para los Estados Unidos, 1970 a 2010. Por facilidad solo se trabajara con la variable el consumo.
10.1. Exploraci´
on de los datos
En la figura 4 se muestra el gr´afico de la serie de tiempo junto con la funci´on de autocorrelaci´on (ACF) y la funci´on de auto correlaci´on parcial (PACF), esta serie presenta considerables fluctuaciones a lo largo del tiempo, no parece haber tendencia por lo que un modelo estacionario parece razonable. Para comprobar estas hip´otesis utilizamos la prueba de Dickey Fuller para la serie del consumo personal en EE.UU., el estad´ıstico de prueba obtenido es -4.2556 y el p valor es 0.01. Con la hip´otesis nula de no estacionariedad en la serie, esto proporciona una fuerte evidencia de que la serie no tien ra´ız unitaria.
10.2. Ajustando el Modelo Apropiado
Nos encontramos ante una serie no estacional, y que no tiene tendencia observando la tabla 3, la funci´on de autocorrelaci´on muestral extendida (EACF) parece apropiado ajustar un modelo ARMA(0,3), por otra parte la funci´on auto.arima del paquete forecast de R que devuelve el mejor modelo ARIMA acorde al valor delAICc tambi´en indica que el mejor modelo es el MA(3).
Años
V
ar
iación porcentual del gasto
1970 1980 1990 2000 2010
−2
−1
0
1
2
Años
V
ar
iación porcentual del gasto
1970 1980 1990 2000 2010
−2
−1
0
1
2
1 2 3 4 5
−0.1
0.1
0.3
Rezago
A
CF
1 2 3 4 5
−0.1
0.1
0.3
Rezago
A
CF
1 2 3 4 5
−0.1
0.1
0.3
Rezago
P
ar
tial A
CF
1 2 3 4 5
−0.1
0.1
0.3
Rezago
P
ar
tial A
CF
Figura 4: Variaci´on porcentual trimestral en el gasto de consumo personal en EE.UU.
Tabla 5: EACF para la serie de consumo personal EE.UU. MA
0 1 2 3 4 5 6 7 8 9 10 11 12 13
AR
0 x x x o o o o o o o o o o o
1 x o x o o o o o o o o o o o
2 x o x o o o o x o o o o o o
3 x x o o o o o x o o o o o o
4 x o o o o o o x o o o o o o
5 x x o o x o o o o o o o o o
6 x o x o x o o o o o o o o o
7 x o x x x o o o o o o o o x
para el modelo ARMA(0,3). La Tabla 4 muestra los valores de p de las pruebas Portmanteau para los rezagos seleccionados, h = 5, 10, 15 y 20 con α= 0.05 oα =0.1. Claramente, el resultado indica que para todos los rezagos, todas las pruebas Portmanteau no tienen suficiente evidencia para rechazar la hip´otesis nula de la adecuaci´on del modelo, es decir, todas las pruebas tienen el mismo resultado para los diagn´osticos de autocorrelaci´on y detectan correctamente el modelo ajustado.
10.3. Ajustando un Modelo Inapropiado ARMA(2,0)
Ahora, supongamos que los datos de la serie temporal de consumo personal trimestral en EE.UU est´a mal ajustada por el modelo ARMA(2,0). Realizamos las pruebas mencionadas anteriormente para el modelo ajustado ARIMA(2,0). La Tabla 5 muestra los valores p de las pruebas Portmanteau para los rezagos, h = 5, 10, 15 y 20 conα=0.1. Claramente, los resultados indican que para el reazgo 5, todas las pruebas Portmanteau rechazan la hip´otesis nula de la adecuaci´on del modelo, es decir, todas las pruebas tienen el mismo resultado para los diagn´osticos de autocorrelaci´on.
idonei-dad del modelo, aunque para h = 5, la pruebaQM muestra que el modelo ajustado ARMA(2,0) parece ser inadecuado, sin embargo para m = 10, 15 y 20 la prueba de QM hay evidencia significativa para apoyar la hip´otesis nula de adecuaci´on del modelo. Mientras que las pruebas cl´asicas Ljung-Box QLB y Box-Pierce QBP dan valores p similares h. Sin embargo para un α=0.1, QBP rechazar´ıa H0 para h = 5 y 10. Mientras QLB con α, rechazar´ıa la hip´otesis nula para h=5,10 y 15, pero no para h=20. La estad´ıstica propuesta es la que tiene mejor resultado, pues para unα=0.1, rechaza la hip´otesis nula en todos los casos, es decir que detecta que el modelo no es el adecuado.
Tabla 6: Valores p de la prueba Portmanteau para los residuales del modelo ajustado.
Modelo h QBP QLB QM Qm0.5 Modelo QBP QLB QM Qm0.5
ARMA(0,3) 5 0.3419 0.3287 0.3470 0.2039 ARMA(2,0) 0.0397 0.0354 0.0422 0.0292
ARMA(0,3) 10 0.3468 0.3085 0.2309 0.2657 ARMA(2,0) 0.3468 0.0684 0.1002 0.0315
ARMA(0,3) 15 0.3839 0.3164 0.3150 0.3120 ARMA(2,0) 0.3839 0.0966 0.1157 0.0516
ARMA(0,3) 20 0.5762 0.4849 0.5518 0.3540 ARMA(2,0) 0.5762 0.1737 0.3287 0.0740
11. Conclusiones
Se compararon cuatro pruebas de Portmanteu, con diferentes tama˜nos de muestra T, rezagosh y con diferentes modelos ARMA(p,q) conp,q 62, lo qu proporciono una amplio espectro de resultados un total de 180 escenarios diferentes. Con la simulaci´on de MonteCarlo, se concluyo que los valores m´as altos de potencia para todas las pruebas se encuentran en muestras grandes (T = 500).
Las pruebas son sensibles al valor del rezagoh, pues entre mayor sea el rezago la potencia disminuye, manteniendo el mismo tama˜no de muestra.
Para los modelos ARMA(p,q), el rendimiento de la prueba deQM es mejor que la prueba deQLB si el orden del componente del promedio m´ovil se subestima, mientras que QLBfunciona mejor si se subestima el orden del componente autorregresivo.
La distribuci´on de la estad´ıstica propuesta se aproxima asint´oticamente a una distribuci´on gama. La estad´ıstica propuesta en este estudio mostr´o ser m´as potente que las pruebas cl´asicas en general en todos los escenarios, parece funcionar mejor cuandoh yT son grandes.
11.1. Futuras Investigaciones y Limitaciones del Estudio
Para pr´oximas oportunidades primero se busca encontrar el valor de δ, que maximic´e la potencia de la prueba para un escenario especifico. Por otra parte se podr´ıa pensar en hacer una extensi´on de esta prueba para los modelos generalizados auto regresivos condicionalmente heteroced´astico(GARCH) y los modelos autorregresivos de umbrales (TAR). Segundo, ampliar la investigaci´on para examinar la relaci´on entre los coeficientes ARMA(p,q) y la potencia de las pruebas de bondad de ajuste en series de tiempo.
Agradecimientos
En primer lugar quiero agradecer al padre eterno (Hashem), por permitirme vivir este momento y darme la oportunidad de cursar esta carrera aqu´ı en la Universidad Santo Tom´as. Tambi´en quiero agradecer a mi directora de tesis la profesora Hanwen Zhang, por el apoyo incondicional y constante seguimiento brindado durante el proceso de elaboraci´on de este documento, aportes y correcciones al mismo. Finalmente quiero agradecer a mi familia, mis padres y hermano por ser los cimientos de mi vida y darme las fuerzas necesarias para terminar esta carrera. Pero principalmente a mi madre Roci´o Bonilla, por financiar mis estudios.
Tabla 7: Potencia de las pruebas Portmanteau con T = 50, h=10 y 15,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 10 h = 15
1 - - 0.7 - 0.2112 0.3244 0.4196 0.5208 0.1516 0.2964 0.3328 0.4660
2 - - 0.4 - 0.1062 0.1038 0.1046 0.1262 0.0636 0.1138 0.0898 0.1186 3 - - -0.5 - 0.1488 0.1678 0.1680 0.2346 0.0922 0.1664 0.1458 0.2064
4 0.5 0.3 - - 0.1350 0.1782 0.1624 0.2688 0.1464 0.1854 0.1230 0.2386
5 1.2 -0.73 - - 0.9786 0.9826 0.9828 0.9962 0.1548 0.9752 0.9692 0.9912
6 - - 1 -0.6 0.1968 0.2928 0.3556 0.4694 0.1494 0.2810 0.2766 0.4320
7 - - 0.24 0.1 0.0234 0.0574 0.0578 0.0424 0.0282 0.0654 0.0524 0.0486 8 0.6 - 0.4 - 0.1762 0.2634 0.2822 0.4076 0.1384 0.2520 0.2044 0.3592
9 0.5 - -0.7 - 0.0480 0.0946 0.1140 0.1210 0.1024 0.1042 0.0926 0.1214
10 -0.2 - -0.6 - 0.2084 0.3132 0.4088 0.5268 0.1556 0.2948 0.3196 0.4688
11 0.7 0.2 -0.5 - 0.1698 0.2650 0.2576 0.3646 0.1552 0.2352 0.2062 0.3382
12 1 -0.35 0.1 - 0.4566 0.5716 0.5484 0.7124 0.1490 0.5210 0.4432 0.6614
13 0.4 - -0.6 0.3 0.0980 0.1048 0.0948 0.1212 0.0502 0.1068 0.0794 0.1136
14 0.9 -0.3 1.3 -0.5 0.6132 0.7152 0.8418 0.9260 0.1498 0.6492 0.7384 0.8902
15 0.4 -0.3 -0.3 1.1 0.2584 0.3778 0.7146 0.6854 0.1556 0.3618 0.6274 0.6722
Tabla 8: Potencia de las pruebas Portmanteau con T = 200, h=10 y 20,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 10 h = 20
1 - - 0.7 - 0.9580 0.9662 0.9964 0.9990 0.8186 0.8516 0.9690 0.9940
2 - - 0.4 - 0.2138 0.2460 0.2618 0.3890 0.1536 0.1908 0.1822 0.2988
3 - - -0.5 - 0.4808 0.5110 0.5902 0.7512 0.3224 0.3860 0.4188 0.6316
4 0.5 0.3 - - 0.8050 0.8338 0.8410 0.9230 0.6636 0.7148 0.6836 0.8756
5 1.2 -0.73 - - 1 1 1 1 1 1 1 1
6 - - 1 -0.6 0.9222 0.9360 0.9764 0.9934 0.7734 0.8254 0.9160 0.9808
7 - - 0.24 0.1 0.0478 0.0716 0.0612 0.0598 0.0486 0.0692 0.0572 0.0676 8 0.6 - 0.4 - 0.8362 0.8568 0.8962 0.9662 0.6666 0.6996 0.7652 0.9212
9 0.5 - -0.7 - 0.2078 0.2280 0.2924 0.3644 0.1530 0.1852 0.2094 0.3090
10 -0.2 - -0.6 - 0.9508 0.9528 0.9872 0.9988 0.8068 0.8474 0.9382 0.9932
11 0.7 0.2 -0.5 - 0.9906 0.9922 0.9920 0.9988 0.9688 0.9760 0.9712 0.9956
12 1 -0.35 0.1 - 0.9958 0.9974 0.9982 0.9998 0.9798 0.9866 0.9864 0.9990
13 0.4 - -0.6 0.3 0.4866 0.5138 0.5044 0.6564 0.3452 0.4166 0.3668 0.5636
14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1
15 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9854 0.9924 1 1
Tabla 9: Potencia de las pruebas Portmanteau con T = 500, h=15 y 20,α=0.05 y ajuste ARMA(1,0).
Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5
h = 15 h = 20
1 - - 0.7 - 1 1 1 1 1 1 1 1
2 - - 0.4 - 0.4860 0.5030 0.5324 0.7406 0.4262 0.4356 0.4650 0.6760
3 - - -0.5 - 0.8998 0.9038 0.9346 0.9868 0.8500 0.8528 0.8916 0.9806 4 0.5 0.3 - - 0.9978 0.9986 0.9978 0.9996 0.9964 0.9944 0.9946 0.9996
5 1.2 -0.73 - - 1 1 1 1 1 1 1 1
6 - - 1 -0.6 1 0.9998 1 1 0.9994 1 1 1
7 - - 0.24 0.1 0.0728 0.0888 0.0734 0.1008 0.0674 0.0796 0.0764 0.0996
8 0.6 - 0.4 - 0.9990 0.9990 0.9992 1 0.9946 0.9972 0.9992 1
9 0.5 - -0.7 - 0.4896 0.5050 0.6180 0.7740 0.4212 0.4438 0.5440 0.7212
10 -0.2 - -0.6 - 1 1 1 1 0.9998 1 1 1
11 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 1
12 1 -0.35 0.1 - 1 1 1 1 1 1 1 1
13 0.4 - -0.6 0.3 0.9120 0.9200 0.9156 0.9802 0.8698 0.8874 0.8706 0.9688
14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1
Referencias
Anderson, R. L. (1942), ‘Distribution of the serial correlation coefficient’, The Annals of Mathematical Statistics13(1), 1–13.
Arranz, M. A. (2005), ‘Portmanteau test statistics in time series’,Time Orientated Languagepp. 1–8. Box, G. E. & Jenkins, G. M. (1976),Time series analysis: forecasting and control, revised ed, Holden-Day. Box, G. E. & Pierce, D. A. (1970), ‘Distribution of residual autocorrelations in autoregressive-integrated moving average time series models’,Journal of the American statistical Association65(332), 1509– 1526.
Davies, N., Triggs, C. & Newbold, P. (1977), ‘Significance levels of the box-pierce portmanteau statistic in finite samples’,Biometrika64(3), 517–522.
Fisher, T. J. (2011), ‘Testing adequacy of arma models using a weighted portmanteau test on the residual autocorrelations’,Contributed Paper327, 2011.
Fisher, T. J. & Gallagher, C. M. (2012), ‘New weighted portmanteau statistics for time series goodness of fit testing’,Journal of the American Statistical Association107(498), 777–787.
Imhof, J. (1961), ‘Computing the distribution of quadratic forms in normal variables’, Biometrika 48(3/4), 419–426.
Lin, J.-W. & McLeod, A. I. (2006), ‘Improved peˇna–rodriguez portmanteau test’,Computational Statis-tics & Data Analysis51(3), 1731–1738.
Ljung, G. M. & Box, G. E. (1978), ‘On a measure of lack of fit in time series models’, Biometrika pp. 297–303.
Mahdi, E. & Ian McLeod, A. (2012), ‘Improved multivariate portmanteau test’,Journal of Time Series Analysis33(2), 211–222.
McLeod, A. I. & Li, W. K. (1983), ‘Diagnostic checking arma time series models using squared-residual autocorrelations’,Journal of Time Series Analysis4(4), 269–273.
Monti, A. C. (1994), ‘A proposal for a residual autocorrelation test in linear models’,Biometrikapp. 776– 780.
Pe˜na, D. & Rodr´ıguez, J. (2002), ‘A powerful portmanteau test of lack of fit for time series’,Journal of the American Statistical Association97(458), 601–610.
Safi, S. K. & Al-Reqep, A. A. (2014), ‘Comparative study of portmanteau tests for the residuals autoco-rrelation in arma models’,Journal of Applied Mathematics and Statistics2(1), 1–13.
Satterthwaite, F. E. (1941), ‘Synthesis of variance’,Psychometrika6(5), 309–316.
Satterthwaite, F. E. (1946), ‘An approximate distribution of estimates of variance components’, Biome-trics bulletin2(6), 110–114.
Slutzky, E. (1937), ‘The summation of random causes as the source of cyclic processes’, Econometrica: Journal of the Econometric Societypp. 105–146.
Whitle, P. (1951),Hypothesis testing in time series analysis, Vol. 4, Almqvist & Wiksells.
Wold, H. (1938), A study in the analysis of stationary time series, PhD thesis, Almqvist & Wiksell. Yule, G. U. (1926), ‘Why do we sometimes get nonsense-correlations between time-series?–a study in
sampling and the nature of time-series’,Journal of the royal statistical society89(1), 1–63.
A. C´
odigos
Serie larain (Annual rainfall in Los Angeles / time series) del paquete TSA. Annual precipitation (in inches) in Los Angeles, 1878-1992.
# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # C ´o d i g o s T e s i s # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #
l i b r a r y( TSA ); d a t a ( l a r a i n ) # S e r i e de t i e m p o e j e m p l o
par( mar =c(3,3,2,2) , mgp =c(1.6,.6,0))
p l o t( larain , y l a b ='P r e c i p i t a c i ´o n', x l a b ='A~no', t y p e ='o', col = 4)
r e c t(par(" usr ")[1] , par(" usr ")[3] ,par(" usr ")[2] ,par(" usr ")[4] ,col=g r a y(.9,.9) , b o r d e r ='w h i t e');g r i d( lty =1, col='w h i t e');par(new = T )
p l o t( larain , y l a b ='P r e c i p i t a c i ´o n', x l a b ='A~no', t y p e ='o', col = 4)
#
-Funci´on que incluye las pruebas Portmanteau utilizadas en est´a tesis. ”Box-Pierce (1970)”, ”Ljung-Box(1978)”, ”Monti(1994)”, ”La Estad´ıstica Propuesta(2017)”.
# T e s t P o r t a m n t e a u p a r a la i n d e p e n d e n c i a de los r e s i d u a l e s de un m o d e l o A R M A ( p , q ).
P o r t m a n t e a u < - f u n c t i o n( y , h =5, m e t o d o = " Box - P i e r c e ",p ,q){
i f e l s e( m e t o d o == " Qm ",d < -0.5,i f e l s e( m e t o d o ==" M o n t i ",d < -0,d < -1)) Ti < - l e n g t h ( y )
mod < - a r i m a ( y ,o r d e r=c( p ,0,q) , m e t h o d = " ML ")
ri < - acf ( mod$res ,p l o t = F , lag .max = h , na.a c t i o n = na. p a s s ) pi < - p a c f ( mod$res ,p l o t = F , lag .max = h , na.a c t i o n = na. p a s s )
if( m e t o d o == " Box - P i e r c e "){ p a r a m e t r o = h - p -q; wi < - 1}
if( m e t o d o == " Ljung - Box " | m e t o d o == " M o n t i "){ wi < - ( Ti +2)/seq( Ti -1, Ti - h ); p a r a m e t r o = h - p -q}
e l s e if( m e t o d o == " Qm "){
wi < - ( Ti +2)/seq( Ti -1, Ti - h )*( h -1: h +1)/ h
s h a p e = (3/4)*( h ^2+ h -2*( h -1)*( p +q))^2/(2* h ^3+3* h ^2+ h -6*( h ^2-2* h -1)*( p +q));
s c a l e = (2/3)*(2* h ^3 +3* h ^2+ h -6*( h ^2-2* h -1)*( p +q) ) / ( h *( h ^2+ h -2*( h -1)*( p +q) ) ) ;
p a r a m e t r o = c( shape ,s c a l e)}
Q < - Ti *( d *sum( wi * i d e n t i t y ( ri$acf [1: h ]^2) ) + (1- d )*sum( wi * i d e n t i t y ( pi$acf [1: h ]^2)))
i f e l s e( m e t o d o == " Box - P i e r c e " | m e t o d o == " Ljung - Box " | m e t o d o == " M o n t i ", vp < - p c h i s q(Q, p a r a m e t r o ,l o w e r. t a i l = F ) ,
vp < - p g a m m a(Q, s h a p e = shape ,s c a l e=scale,l o w e r. t a i l = F ))
l i s t(" Q "= Q," P a r ´a m e t r o "= p a r a m e t r o ," vp "= vp )}
#
-Los 15 modelos ARMA(p,q) estacionarios e invertibles, simulados en el estudio conp,q62. Algunos de estos modeloes fueron extraidos del estudio de Safi & Al-Reqep en el 2014.
# # # # # # # # # # # L i s t a de los 1 5 m o d e l o s p r p u e s t o s A R M A ( p , q ) con p , q <= 2 # # # # # # # # # # #
mod = l i s t(l i s t( ma =0.7) , # M o d e l o _1 MA (1)
l i s t( ma =0.4) , # M o d e l o _2 MA (1)
l i s t( ma = -0.5) , # M o d e l o _3 MA (1)
l i s t( ar =c(0.5,0.3)) , # M o d e l o _4 AR (2)
l i s t( ar =c(1.2, -0.7 3)) , # M o d e l o _5 AR (2)
l i s t( ma =c(1, -0.6)) , # M o d e l o _6 MA (2)
l i s t( ma =c(0.2 4,0.1)) , # M o d e l o _7 MA (2)
l i s t( ar =0.6, ma =0.4) , # M o d e l o _8 A R M A (1,1)
l i s t( ar =0.5, ma = -0.7) , # M o d e l o _9 A R M A (1,1)
l i s t( ar = -0.2, ma = -0.6) , # M o d e l o _1 0 A R M A (1,1)
l i s t( ar =c(0.7,0.2) , ma = -0.5) , # M o d e l o _1 1 A R M A (2,1)
l i s t( ar =c(1, -0.3 5) , ma =0.1) , # M o d e l o _1 2 A R M A (2,1)
l i s t( ar =0.4, ma =c( -0.6,0.3)) , # M o d e l o _1 3 A R M A (1,2)
l i s t( ar =c(0.9, -0.3) , ma =c(1.3, -0.5)) ,# M o d e l o _1 4 A R M A (2,2)
l i s t( ar =c(0.4, -0.3) , ma =c( -0.3,1.1)))# M o d e l o _1 5 A R M A (2,2)
-Ajuste Emp´ırico de las distribuciones utilizando los 15 modelos propuestos. Gr´aficas de los Histogramas con ajuste de la densidad y prueba K-S.
# # # # # # # # # # # # # # # # # # # # # # # A j u s t e E m p ´ı r i c o de la E s t a d ´ı s t i c a # # # # # # # # # # # # # # # # # # # # # #
AR < - c(0,0,0,2,2,0,0,1,1,1,2,2,1,2,2) MA < - c(1,1,1,0,0,2,2,1,1,1,1,1,2,2,2) N s i m < - 1 0 0 0 0
s y s t e m.t i m e(for( i in 1: N s i m ){for( j in 1:1 5){
Q[ i , j ] = P o r t m a n t e a u ( a r i m a . sim ( n =5 0 0, m o d e l= mod [[ j ]]) , h = 3 0, m e t o d o =" Qm ", p = AR [ j ] ,q= MA [ j ])$Q}})
# H i s t o g r a m a s de la e s t a d ´ı s t i c a Qm
par( m f r o w =c(3,5) , mar =c(2.8,2.5,2.5,2) , mgp =c(1.6,.6,0) , xpd =T R U E)
# G r ´a f i c a s
Sh < - c(rep(1 1.0 3 1 5 7,3) ,rep(1 0.6 4 9 9 3,7) ,rep(1 0.2 9 7 2,3) ,rep(9.9 8 5 3 2 5,2)) Sc < - c(rep(1.3 1 7 4 3 1,3) ,rep(1.2 7 3 8 7 4,7) ,rep(1.2 2 3 6 3 3,3) ,rep(1.1 6 5 0 4 3,2))
for( i in 1:1 5){
h i s t(Q[ , i ] , f r e q = F , col = " b l a c k ", b o r d e r =" w h i t e ", m a i n = " ", x l a b =" ")
c u r v e(d g a m m a( x , s h a p e = Sh [ i ] , s c a l e= Sc [ i ]) , add= T , col = " b l u e ", lwd =2)}
# P r u e b a de K o l m o g o r v o S m i r n o v
KS < - N U L L
for( i in 1:1 5){
KS [ i ] = ks . t e s t (Q[ , i ] ," p g a m m a ", s h a p e = Sh [ i ] , s c a l e = Sc [ i ])$p . val }
c b i n d( M o d e l o = 1:1 5," K - S . PV " = r o u n d( KS ,4))
#
-Potencia de las pruebas Portmanteau, evaluando en los 15 modelos para datos peque˜nos t = 50, para datos medianos t = 200, para datos grandes t = 500, con rezagos h=5,10,15 y 20. Ajustando un modelo ARMA(1,0) para todos los casos y Con 10.000 simulaciones montecarlo para un nivel de significancia del α=0.05.
# # # # # # # # # # # # # # # # # # # # # # P o t e n c i a de las P r u e b a s P o r t m a n t e a u # # # # # # # # # # # # # # # # # # # # #
N s i m < - 1 0 0 0 0 # N ´u m e r o de s i m u l a c i o n e s
t = 5 0 # t =2 0 0; t =5 0 0 l o n g i t u d de la s e r i e
l = 5 # l = 1 0; l = 1 5; l = 2 0 r e z a g o s
vp1< - vp2< - vp3< - vp4< -m a t r i x( NA ,n r o w = Nsim , n c o l = l e n g t h ( mod ))
for( i in 1: N s i m ){
for( j in 1: l e n g t h ( mod )){
vp1[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Box - P i e r c e ", p =1,q=0)$vp vp2[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Ljung - Box ", p =1,q=0)$vp vp3[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" M o n t i ", p =1,q=0)$vp vp4[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Qm ", p =1,q=0)$vp }} Box . P = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp1[1: Nsim , i ] <0.0 5) ) ) ) L j u n g = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp2[1: Nsim , i ] <0.0 5) ) ) ) M o n t i = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp3[1: Nsim , i ] <0.0 5) ) ) ) m _0.5 = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp4[1: Nsim , i ] <0.0 5) ) ) ) Res < - c b i n d(1:1 5, Box . P , Ljung , Monti , m _0.5)
c o l n a m e s( Res ) < - c(" M o d e l o "," Q _ BP "," Q _ LB "," Q _ M "," Q _ m ");p r i n t( Res )
#
-# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# E j e m p l o D a t o s R e a l e s u s c o n s u m p t i o n -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -#
l i b r a r y( fpp )
d a t a (" u s c o n s u m p t i o n ")
par( mar =c(3,3,1,2) , mgp =c(1.6,.6,0));l a y o u t(r b i n d(c(1, 1) , c(2, 3)))
p l o t( u s c o n s u m p t i o n [ ,1] , y l a b = 'V a r i a c i ´o n p o r c e n t u a l del g a s t o', x l a b = 'A ~n o s', t y p e = 'o',col=4) # G r ´a f i c o s e r i e t e m p o r a l
acf ( u s c o n s u m p t i o n [ ,1] , x l a b = " R e z a g o ", m a i n = " ", lag .max = 2 0)# G r ´a f i c o ACF
p a c f ( u s c o n s u m p t i o n [ ,1] , x l a b = " R e z a g o ", m a i n = " ", lag .max = 2 0)# G r ´a f i c o P A C F
fit < - a u t o . a r i m a ( u s c o n s u m p t i o n [ ,1] , s e a s o n a l =F A L S E)
s u m m a r y( fit )
e a c f ( u s c o n s u m p t i o n [ ,1])