Una nueva prueba Portmanteau para modelos ARMA en series de tiempo

(1)

Una nueva prueba Portmanteau para modelos ARMA en series

de tiempo

A new Portmanteau test for ARMA models in time series

Rafael Eduardo D´ıaz Bonillaa

Autor

Hanwen Zhangb

Director

Resumen

Uno de los supuestos que se debe validar en todo modelamiento de series de tiempo es que los residuales sean aproximadamente incorrelacionados. Las pruebas existentes utilizan en su mayor´ıa las correlaciones muestrales, mientras que la prueba de Monti utiliza las correlaciones parciales. En este estudio se pro-pone una nueva prueba que utilice tanto las correlaciones muestrales como las correlaciones parciales, a partir de la familia de estad´ısticas para analizar la independencia entre los residuales descrita por Box y Jenkins en 1976. La estad´ıstica propuesta se comportan de manera asintótica como una combinación lineal de variables aleatorias chi-cuadrado y su distribución asintótica se puede aproximar mediante una distribución gamma. Para mirar el ajuste emp´ırico de la distribución y estudiar su potencia frente a otras pruebas de uso común, se realizó un ejercicio de simulación con 15 modelos ARMA(2,2) con p,q₆2 es-tacionario e invertible para datos pequeños medianos y grandes, con longitud de la serie de 50, 200 y 500 respectivamente. La potencia se calculó para las cuatro pruebas con rezagos fijos deh= 5, 10, 15 y 20. Posteriormente se realizo un pequeño ejercicio con los datos reales de la variación del consumo personal en EE.UU, para los años 1970 a 2010. Como principal resultado se encontró que el método propuesto se comporta de mejor manera que las pruebas clásicas y muestra ser más potente que las pruebas de Box-Pierce, Ljung-Box y Monti.

Palabras clave:Pruebas Portmanteau, autocorrelaci´on muestral, autocorrelaci´on parcial, Potencia,

mo-delos ARIMA..

Abstract

One of the assumptions that must be validated in all time series modeling is that the residuals are approximately incorrect. Existing tests use mostly sample correlations, while Monti’s test uses partial correlations. In this study we propose a new test that uses both the sample correlations and the partial correlations, from the family of statistics to analyze the independence between the residuals described by Box and Jenkins in 1976. The proposed statistics behave asymptotically a linear combination of random chi-square variables and their asymptotic distribution can be approximated by a gamma distribution. To look at the empirical adjustment of the distribution and study its power against other commonly used tests, a simulation exercise was carried out with 15 models ARMA (2,2) with p,q ₆2 stationary and invertible for medium and large small data, with length of the series of 50, 200 and 500 respectively. Power was calculated for the four tests with fixed lags ofh = 5, 10, 15 and 20. Subsequently, a small exercise was performed with the real data of the variation of personal consumption in the US, for the 1970s. 2010. As a main result, it was found that the proposed method behaves in a better way than the classic tests and it shows to be more powerful than the Box-Pierce, Ljung-Box and Monti tests.

Keywords:Pruebas Portmanteau, autocorrelaci´on muestral, autocorrelaci´on parcial, Potencia, modelos

ARIMA..

(2)

1. Introducci´

on

En análisis de series temporales, la construcción de un modelo consta de tres etapas (identificación, es-timación y verificación de supuestos) según la metodolog´ıa desarrollada por Box & Jenkins (1976). La primera etapa, consiste en identificar y seleccionar el modelo adecuado, si es necesario realizar transfor-maciones para que la serie sea estacionaria e identificar el componente estacional si lo hay, para finalmente elegir el modelo ARIMA, que mejor se ajuste. En la segunda etapa se estiman los parámetros del modelo ARIMA seleccionado, comúnmente se utilizan los métodos de máxima verosimilitud y m´ınimos cuadra-dos, obteniendo los errores estándar y los residuos del modelo. Finalmente sigue la última etapa y una de las más importantes consiste en verificar que el modelo seleccionado proporciona un ajuste adecuado y cumple los supuestos básicos. En particular el diagnóstico del modelo es una de las etapas más importan-tes en la construcción de este. Para examinar el adecuado ajuste de un modelo estad´ıstico, a menudo se realiza un análisis de los residuales. En particular nos interesa encontrar que los residuos del modelo, son un ruido blanco es decir que son independientes y por lo tanto el proceso no presenta ninguna correlación serial. Además la media y la varianza deben ser constantes en el tiempo. En caso de no cumplirse los supuestos, se realizan las modificaciones necesarias y se repiten las etapas anteriores hasta obtener el mejor modelo.

El método usual consiste en gráficar las funciones de los ACF y PACF de los residuales, que permi-te mostrar que rezagos son significativos, y también si hay alguna estructura en general. Sin embargo estos gráficos presentan dos problemas, primero solo mostraran estructuras dependientes lineales, y es probable que en muchos casos las estructuras no sean lineales. El segundo problema es que en presencia de datos at´ıpicos (outliers), la función de auto correlación muestral (ACF) y la función de auto correlación parcial (PACF), no son robustas, por lo que la estructura de correlación es seriamente perturbada (Chan & Wei, 1992; Bonifazi & Méndez, 2014; Duerre et al, 2014; Bonifazi, 2015). Por esta razón la segunda op-ción, es construir una estad´ıstica de prueba para probar la hipótesis nula, de que los residuales del modelo son independientes hasta un rezagoh. Con el fin de encontrar estructuras lineales y no lineales, en media y varianza. Estas estad´ısticas conocidas como portmanteau iniciaron con el trabajo de Box y Pierce, en la década de los 70. Si se ha elegido el modelo apropiado, habrá una autocorrelación de cero. En esta última etapa de verificación de los supuestos, la metodolog´ıa propuesta por Box y Jenkins, parte de la idea de que todo modelo es erróneo, debido a que el modelo desea representar un fenómeno real, de la manera más simple. Evidentemente, si se debe seleccionar un modelo, este debe ser aquel que viole menos supuestos, o los menos importantes; es por esto que se evalúan a todos los modelos para encontrar sus posibles fallas. Entonces las pruebas portmanteau se utilizan para probar la bondad de ajuste de modelos ARMA en series de tiempo. Las estad´ısticas iniciales de las pruebas portmanteau demostraron ser muy ineficientes para detectar desviaciones de los supuestos, pero ha aumentado el interés en el campo y ha aparecido recientemente una nueva variedad de estad´ısticas (ver Li y McLeod 1983, McLeod 1994, Monti 1994, Hong 1996, Peña y Rodr´ıguez 2002 entre otras). Hay muchos art´ıculos que analizan el comportamiento de las pruebas, ver por ejemplo (Safi & Al-Reqep 2014), sin embargo no parece haber un consenso claro de cuál es la mejor prueba, es por esta razón que es pertinente proponer un nuevo método más eficiente en términos de potencia que las pruebas clásicas.

(3)

2. Objetivos

2.1. General

Proponer una nueva prueba para el an´alisis de la dependencia de los residuales en modelos ARMA, m´as potente que las pruebas de Ljung-Box y Monti.

2.2. Espec´ıficos

Determinar cual de las pruebas portmanteau, m´as populares que se usan en la actualidad es la de mayor potencia en diferentes escenarios.

Analizar el efecto de los rezagosh, en la potencia de las pruebas utilizadas en este estudio. Encontrar la distribución teórica y mostrar el ajuste emp´ırico de la estad´ıstica propuesta a esa distribución.

3. Marco T´

eorico

3.1. Series Temporales

Por serie de tiempo nos referimos a datos estad´ısticos o secuencia de datos que se recopilan, observan o registran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros) y ordenados cronológicamente. Los datos pueden estar espaciados a intervalos iguales o desiguales. Las series de tiempo son extremadamente comunes. En los negocios, observamos tasas de interés semanales, precios de cierre diarios, ´ındices de precios mensuales, cifras de ventas anuales, etc. En meteorolog´ıa, observamos temperaturas altas y bajas diarias, ´ındices anuales de precipitación y sequ´ıa y velocidades de viento por hora. En agricultura, registramos cifras anuales de producción agr´ıcola y ganadera, erosión del suelo y ventas de exportación. En las ciencias biológicas, observamos la actividad eléctrica del corazón a intervalos de milisegundos. En ecolog´ıa, registramos la abundancia de una especie animal. La lista de áreas en las que se estudian las series temporales es prácticamente infinita. El propósito del análisis de series de tiempo es generalmente doble: entender o modelar el mecanismo estocástico que da lugar a una serie observada y predecir los valores futuros de una serie basada en la historia de esa serie.

Año

Precipitación

1880

1900

1920

1940

1960

1980

10

20

30

40 Año

Precipitación

1880

1900

1920

1940

1960

1980

10

20

30

40

(4)

En la figura 1, se observa un ejemplo de serie temporal de la precipitación de la lluvia anual para la ciudad de Los Ángeles, durante el per´ıodo 1878-1992 tomado del paquete TSA de R. En el gráfico, se pueden observar años extremadamente húmedos como 1883, y otros extremadamente secos 1983, el objetivo ser´ıa modelar está serie, con el fin de pronosticar la precipitación en años próximos. Para modelar estas series Box & Jenkins propusieron una metodolog´ıa que se muestra a continuación.

3.2. Metodolog´ıa Box

&

Jenkins

En el análisis de series de tiempo, la metodolog´ıa de Box-Jenkins, nombrada as´ı en honor a los estad´ısticos George E. P. Box y Gwilym Jenkins, se aplica a los modelos autorregresivos de media móvil ARMA o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.

El método original utiliza un enfoque de modelado iterativo en tres etapas, usando datos de un horno de gas. Estos datos son conocidos como datos de Box-Jenkins del horno de gas para la evaluación comparativa de modelos de predicción.

Las tres etapas del modelado iterativo son las siguientes:

1. Identificación y selección del modelo: asegurarse de que las variables son estacionarias, la identifi-cación de la estacionalidad de la serie dependiente (diferenciación estacional, para cierto per´ıodo, si es necesario), y el uso de los gráficos de las funciones de autocorrelación y de autocorrelación parcial de la serie de tiempo se utilizan para decidir cuál componente (si es el caso) se debe utilizar en el modelo, el promedio autorregresivo (AR) o un promedio móvil (MA).

2. Estimación de parámetros usando algoritmos de cálculo para tener coeficientes que mejor ajusten el modelo ARIMA seleccionado. Los métodos más comunes usan estimación de máxima verosimilitud o m´ınimos cuadrados no lineales.

3. Comprobar el modelo mediante el ensayo, si el modelo estimado se ajusta a las especificaciones de un proceso univariado estacionario. En particular, los residuos deben ser independientes el uno del otro, además, la media y la varianza deben ser constantes en el tiempo. (Para identificar los errores de especificación son útiles la graficación de la media y la varianza de los residuos a través del tiempo y la realización de una prueba de Ljung-Box o bien por medio del trazado de autocorrelación y autocorrelación parcial de los residuos.) Si la estimación es inadecuada, tenemos que volver al paso uno e intentar buscar un modelo mejor.

4. Modelos para series estacionarias

En esta sección se discute los conceptos básicos de una clase amplia de modelos de series de tiempo paramétricos de los modelos autorregresivos de medias móviles (ARMA). Estos modelos han asumido gran importancia en el modelado de procesos del mundo real.

4.1. Proceso de Medias M´

oviles

Un modelos de medias m´oviles de orden(q), denotado como MA(q) describe una serie temporal estacio-naria, los primeros en considerarlo fue Slutzky (1937) y Wold (1938), puede ser escrito como sigue.

Xt=µ+t+θ1t−1+· · ·+θqq−1 (1)

(5)

En la práctica, la información disponible para poder estimar los modelos y luego predecir con ellos son las propias observaciones de la serie. Por ello, vamos a exigir que los modelos MA sean invertibles. La propiedad de invertibilidad establece que el valor presente de ytpueda expresarse como una combinación lineal convergente de observaciones pasadas.

En general, en un modelo MA(q), la condici´on de invertibilidad viene dada porque las soluciones de la siguiente ecuaci´on:

1+θ1x+· · ·+θqxq=0 (2)

Proceso de medias m´oviles de primer orden:

Consideramos el caso más simple del proceso de medias móviles, el MA(1) es decir orden 1 ya que tiene un solo paramétroθsiµ=0 se define a continuación.

Xt=µ+t+θt−1

dondeµes la media de la serie,θes el par´ametro del modelo yt,t−1 son los t´erminos de error (ruido blanco). El valor esperadoE(Yt) =0 y su varianza Var(Yt) =σ2e(1+θ2), con Cov(Yt,Yt−1) = −θσ2e y

Cov(Yt,Yt−1) =0. Ya que no hay e0scon ´ındice com´un entre Yt yYt−2. An´alogamente se obtiene que

Cov(Yt,Yt−k = 0)siempre que k2, es decir, el proceso no tiene una correlación más allá del rezago 1. Este hecho será importante en el momento que tengamos que elegir modelos adecuados para datos reales. En el caso concreto de la propiedad de invertibilidad para el modelo MA(1) significa que |θ1| < 1, es decir 1+θ1x=, entonces la solución esx= −1/θ1.

4.2. Procesos Autorregresivos

Los procesos autorregresivos propuestos por Yule (1926) son como su nombre sugiere: son regresiones sobre s´ı mismos. Espec´ıficamente, un proceso autorregresivoXtde ordenpsatisface la siguiente ecuaci´on:

Xt=c+φ1Xt−1+· · ·+φpXt−p+t (3)

En un modelo AR(p) en valor en el momentot de la serie se expresa como una combinación lineal de las p observaciones anteriores de la serie más el termino de innovación t, el cual se asume que son independientes deYt−1,Yt−2,Yt−3, ..., y que incorpora todo lo nuevo de la serie en el momentotque no se explica por los valores pasados. Sea el polinomio caracter´ıstico del modelo AR(p).

φ(x) =1−φ1x−φ2x2−· · ·−φpxp (4)

y correspondiente ecuaci´on caracter´ıstica del AR

1−φ1x−φ2x2−· · ·−φpxp=0 (5)

Como se señaló anteriormente, suponiendo que t es independiente de Yt−1,Yt−2,Yt−3, ... existe una solución estacionaria a la ecuación 6 si y solo si laspra´ıces de la ecuación caracter´ıstica AR exceden cada una 1 en valor absoluto (módulo). Se pueden usar otras relaciones entre ra´ıces y coeficientes polinómicos para mostrar que las siguientes dos desigualdades son necesarias para la estacionariedad. Es decir, para que las ra´ıces sean mayores que 1 en módulo, son necesarias ambas, pero no suficiente

φ1+φ2+· · ·+φp<1

y |φp|<1

(6)

Proceso Autorregresivo de primer orden:

(6)

Xt=c+φXt−1+t

donde t es un proceso de ruido blanco con media cero y varianza σ2. El proceso es de covarianza es estacionario si y solo si |φ|< 1. Si φ =1, entonces Xt tiene una ra´ız unitaria. El requisito de |φ| <1 generalmente se denomina condici´on de estacionariedad para el proceso AR(1)ver Box & Jenkins (1976).

En este caso la media marginal va estar dad por E(Xt) = c+φE(Xt−1) ⇒ µ = ₁₋c_φ, en particular si

c=0, la media es 0, y con varianzaVar(Xt) =γ0= σ

2

e

1−φ2, dondeσe es la desviaci´on est´andar det.

4.3. Modelo autorregresivo de medias m´

oviles ARMA(p,q)

La notación ARMA(p, q) se refiere al modelo con p términos autorregresivos y q términos de media móvil. Este modelo contiene los modelos AR(p) y MA(q).

Xt=c+ p X

i=1

φiXt−i+t+ q X

i=1

θit−i (7)

El modelo ARMA general fue descrito en la tesis de 1951 de Whitle, pero fueron popularizados en 1971 por George E. P. Box y Jenkins, quienes expusieron en su libro un método iterativo (Box-Jenkins) para elegir el número de parámetros y estimarlos. El modelo ARMA permite recoger efectos más duraderos de las innovaciones con menos restricciones, que el AR(p) y permite conservar sus efectos a diferencia delMA(q), en el cual las innovaciones dejan de tener efectos después deqperiodos.

Proceso Autorregresivo de de medias m´oviles de orden (1,1)

El caso m´as simple de estos modelos mixtos es el ARMA(1,1), definiendo la ecuaci´on puede ser escrito:

Xt=c+φXt−1+t+t−1 (8) La condición de estacionariedad indica que la parte autorregresiva es estacionaria, esto es si|φ|<1, y la condición de invertibilidad se cumple si su componente de medias móviles es invertible, es decir |θ|<1. En este caso la media de E(Xt)esµ= ₁₋c_φ y la función de autocorrelación.

ρ(h) =

(1+φθ)(φ+θ)

1+θ2₊_2φθ ,h=1

φρ(h−1) ,h_>1 (9)

5. Pruebas de Bondad de Ajuste

En esta sección se consideran siguientes pruebas de bondad de ajuste para el análisis de la independencia de los residuales en modelos de series de tiempo, Box-Pierce, Ljung-Box y Monti. Estas también son llamadas pruebas portmanteau, y asumimos bajo la hipótesis nula que el modelo ajustado es el correcto, y los residuales se comportan como un proceso ruido blanco.

Sea{Xt}un proceso generado por un modelo ARMA(p,q) estacionario e invertible, de la formaφ(B)Xt=

θ(B)εt dondeε∼N(0,σ2ε), conφ(B)yθ(B)son polinomios de ordenpyq respectivamente, dados por

φ = 1−φ1B−· · ·−φpBp y θ = 1−θ1B−· · ·−θqBq donde B es el operador de rezago definido

comoBk_X

(7)

ˆrk= T X

t=k+1 ˆ εtˆεt−k

.XT

t=1 ˆ

ε2t parak=1, 2, ...,h6T−1 (10)

Si los órdenes p y q están adecuadamente identificados, cada rk ≈ 0 para k = 1, ...,h donde h se elige lo suficientemente grande como para detectar una correlación significativa en los datos. Basados en estos coeficientes estimados, Box y Jenkins propusieron una familia de estad´ısticas para analizar la independencia entre los residuales en el año 1976,tomado de (Zhang 2015) como sigue:

Q=T

δ

h X

k=1

wkg(ˆr2k) + (1−δ) h X

k=1

ωkg(πˆ2k)

(11)

Donde los ˆπk son los coeficientes de autocorrelaci´on parcial estimados de los residuales, 06δ61,h <

T,wk>0,ωk>0, y ges una funci´on de suavizamiento no decreciente con g(0) =0. Algunos miembros conocidos de esta familia cuandog(x) =xson:

Box & Pierce (1970), cuando δ=1 ywk=1

Ljung & Box (1978), cuando δ=1 ywk= (T +2)/(T−k) Monti (1994), cuandoδ=0 yωk= (T+2)/(T−k)

Estos estad´ısticos pueden ser resumidos como:

QBP=T h X

k=1

ˆr2k QLB=T h X

k=1

(T+2) (T −k)ˆr

2

k QM=T

h X

k=1

(T+2) (T −k)πˆ

2

k (12)

DondeQBP es la estad´ıstica de Box & Pierce (1970),QLB la estad´ıstica de Ljung & Box (1978), y QM es la estad´ıstica de Monti (1994).

5.1. Prueba de Box y Pierce

La propuesta cl´asica de las pruebas portmanteau es una de las dadas por Box-Pierce.

QBP =T h X

k=1 ˆ

r2_k (13)

Entonces QBP es la estad´ıstica de prueba, donde ˆrk es la autocorrelación muestral de orden k del residual,hes el número de rezagos que se están probando yT es el tamaño de la muestra.

Esta estad´ıstica se utiliza para probar la correlación significativa hasta el un rezagoh. Sabemos que para datos independientes e idénticamente distribuidos, cuando T →∞, las autocorrelaciones se comportan como variables aleatorias independientes con distribución normal, y por lo tanto bajo la hipótesis nula (modelo correctamente ajustado) se muestra queQBP es una variable aleatoria asimtóticamente distri-buida de Chi-cuadrado con h−p−q grados de libertad, donde p y q son el orden de los términos autorregresivos y de media móvil estimados en el modelo ajustado, respectivamente.

(8)

5.1.1. Distribuci´on Asint´otica de QBP

Sea {Xt} un proceso ARMA(p,q) donde los términos de error {ε} son ruido blanco. Ahora bien, si el orden del modelo (p,q) fuera correctamente identificado y ajustado, y los ε0s para la muestra de la serie se calcularan utilizando los valores de parámetros verdaderos, entonces estosε0sser´ıan desviaciones aleatorias no correlacionadas, y sus primerashautocorrelaciones muestralesr= (r1,r2, ...,rh)0, dondeh es pequeño en relación a T y

rk= T X

t=k+1

εtεt−k

.XT

t=1

ε2 (14)

paraTsuficientemente granderse acerca a una distribución normal (Box & Pierce 1970) como si el modelo fuera de orden(p+q, 0). También se puede demostrar fácilmente que los{rk}no están correlacionados con varianza

Var(rk) =

T −k

T(T +2) ≈1/T (15)

Es decir que el vector de autocorrelaci´on de los residuales es aproximadamente una transformaci´on lineal de una variable normalr∼N(0,(1/T)I). Por lo cual se desprende en particular que la estad´ısticaT(T + 2)Ph_k₌₁(T−k)−1_r2

k, para unT grande se distribuyeχ2conhgrados de libertad; como una aproximaci´on adicional de TPh_k₌₁r2

k∼χ2h. Box y Pierce hicieron una representaci´on deˆr como transformaci´on lineal der, conˆr= (I−V)r, dondeV=X(X0X)−1_X0 _{es una matriz de dimensi´}_on_h_{− (}_p₊_q_{), y}_X_{es una matriz}

h×p+qcuyo(i,j)-´esimo elemento es cero sii < jyψjsii>j, con coeficientesψ(B) = [φ(B)θ(B)]−1. Por lo tantoˆr∼N(0,(1/T)[I−V], y la estad´ısticaQBP=T

Ph k=1ˆr

2 k∼χ

2 h−p−q.

5.2. Prueba de Ljung-Box

Despu´es de algunas discusiones sobre la distribuci´on para la muestra finita de la estad´ıstica de prueba propuesta por Box y Pierce y su rendimiento conservador.

Ljung y Box (1978) propusieron una versión modificada de esa prueba, mejorando esta aproximación sustituyendo los coeficientes de autocorrelación ˆrk en (13) por sus valores estandarizados

˜r2_k= (T+2) (T −k)ˆr

2

k (16)

Obteniendo la estad´ıstica

QLB=T h X

k=1

(T+2) (T−k)ˆr

2

k (17)

La estad´ıstica QLB tiene una distribución para una muestra finita que está mucho más cerca de la de la distribuciónχ2 con h−p−q grados de libertad, que la estad´ısticaQBP. La intuición indica que se está ajustando cada ˆrk en la estad´ıstica QBP por su varianza asintótica. Sin embargo, esta modifica-ción no carece de cr´ıtica, ya que se ha demostrado, según (Arranz 2005), que su varianza podr´ıa ser sustancialmente mayor que la de su distribución asintótica.

5.2.1. Distribuci´on Asint´otica de QLB

(9)

de que la varianza de losrk esT−1y es una aproximación de la cantidadVar(rk) = (T−k)/(T(T+2)). Esta aproximación de la varianza fue utilizada por la dificultad de derivar la distribución nula deQBP. Sin embargo el resultado de Box & Pierce provee una buena aproximación para un T relativamente grande con respecto ah, generalmente tomando a hcomo 15 o 20, pero este requerimiento dif´ıcilmente se mantiene en la practica, esta observación fue notada por (Prothero & Wallis, 1976, citado por Davies, 1977 p. 518) quién propone usar la estad´ıstica QLBcomo alternativa aQBP. Ljung & Box demostraron queQLB, se distribuye aproximadamenteχ2conh−p−qgrados de libertad conE(QLB)'h−p−qy

V(QLB) =2h 1+ h−_T10

y aunque la varianza deQLBexcede a 2h los estudios de simulación de Ljung & Box (1978) indican que para propósitos prácticos la aproximación es adecuada.

5.3. Prueba de Monti

Las estad´ısticas dadas en (13) y (17), están basadas sobre los coeficientes de autocorrelación muestral. Monti (1994) propuso un estad´ıstico alternativo utilizando los coeficientes de autocorrelación parcial, ˆπk,

k=1, 2, ...,h. El estad´ıstico propuesto es

QM=T h X

k=1

(T +2) (T−k)πˆ

2

k (18)

dondeT es la longitud de la serie.

En 1994 Monti demostró que si el modelo ARMA ajustado es el adecuado, entoncesQM se distribuye asintóticamente como una variable aleatoria χ2_h₋_p₋_q. Además Monti (1994) demostro bajo simulación que el rendimiento deQMes comparable al deQLBy mejor si el orden del promedio móvil es subestimado. Por otro lado,QLBfunciona mejor si el orden de la parte autorregresiva es el subestimado.

5.4. Propiedades Asint´

oticas de

Q

M

Sea rk el k-ésimo coeficiente de autocorrelación muestral de los errores y πk el k-ésimo coeficiente de correlación parcial de ˆt. Sea r = (r1,r2, ...,rh)0 y π = (π1,π2, ...,πh)0. Por el algoritmo de Durbin-Levinson, el vector πse puede obtener como una función der,π=ψ(r), con el k-ésimo elemento dado por

πk=ψk(r) =

rk−r₍0_k₋₁₎R−₍_k1₋₁₎r∗₍_k₋₁₎ 1−r₍0_k₋₁₎Rh−₍_k1₋₁₎r(k−1)

(19)

Donde Rk is la matriz Toeplitz k×k, tal que Rk = (r|i−j|)i,j=1,2,...,k, con r∗k = (rk,rk−1, ...,r1)0. Sea ˆ

π= (πˆ1, ˆπ2, ..., ˆπh)0, el vector de los primerosh autocorrelaciones parciales de los residuales. Entonces ˆ

πk puede ser obtenido, análogamente aπk, reemplazando las autocorrelaciones del error por las autoco-rrelaciones del residual en la ecuación (17). Monti afirma quesi el modelo es correctamente identificado, QM se distribuye asintóticamente como una variable aleatoriaχ2h−p−q.La demostración es como sigue: Si las autocorrelaciones del error son cero, rk = Op(T−

1

2)(k = 1, 2, ...). Adem´as R_k = I_k+O_p(T−12) por (12).

π=r+Op(T−1) (20)

La expansi´on de Taylor deψ(ˆr)alrededor der

ˆ

π=ˆr+ ∂π

∂r(ˆr−r) +Op(T

−1₎ ₍₂₁₎

Ya que∂π/∂r=I+Op(T−

1

(10)

ˆ

π=ˆr+Op(T−1) (22)

Ahoraˆrpuede ser aproximado por una transformaci´on lineal singular der,ˆr= (Ih−V)r+Op(T−1), donde

Ves una matriz idempotente con rangosp+q(Box & Pierce 1970), yT12rest´a distribuida asint´oticamente como una variable normal multivariada con vector de medias cero y matriz de covarianzas diagonal Σh con

Var(T12_r_k_{) =} T−k

T+2 (23)

Consecuentemente,T12Σ− 1

2πˆ es asintóticamente normal multivariada con vector de medias cero y matriz de covarianzas(Ih−V) yQM es asintóticamente unaχ2h−p−q. Bajo la hipótesis nula, QLB y QM son asintóticamentes equivalentes, pero obviamente, algunas diferencias pueden esperarse en sus comporta-mientos en muestras pequeñas. En particular, sus resultados bajo la hipótesis alternativa pueden ser sustancialmente diferentes, como se muestra en (Monti 1994).

6. Estad´ıstica Propuesta

Sea{Xt}un proceso de media cero generado por un modelo ARMA(p,q), es decirφ(B)Xt=θ(B)εt, donde

Bes el operador de rezago,φ(B)es un polinomio de ordenp, yθ(B)es un polinomio de ordenq, yεtes ruido blanco. Donde ˆε1, ˆε2, ..., ˆεT son los residuales obtenidos después de estimar el modelo ARMA(p,q) en una muestra de tamañoT, y sea ˆrk los coeficientes de autocorrelación estimada de los residuales como en (10). La estad´ıstica propuesta parte de asignar un valor aδ y awk,ωk en la estad´ıstica Q, dada en (11) diferente a los usualmente utilizados en las estad´ısticas clásicas. Se tomo el valor de 0.5 para δ y pesos,

wk=ωk=

(T+2) (T −k)

(h−k+1)

h (24)

Los pesos (T +2)/(T −k)son tomados como enQLB y QM, para la parte restante(h−k+1)/hson derivados al usar técnicas de análisis multivariado sobre la matriz de autocorrelación (similar a Peña & Rodr´ıguez (2002)). Observe que la autocorrelación al rezago 1, ˆr1, está dada por el peso h/h = 1. La autocorrelación muestral aal rezago 2, ˆr2está dada por el peso(h−1)/h <1. Se puede interpretar que los pesos hacen más énfasis sobre la primera autocorrelación, y menor énfasis sobre la autocorrelación al rezagohque corresponde a 1/h. Esto coincide con la intuición sobre las estimaciones pues la primera autocorrelaciónr1se calcula usando información de todas lasnobservaciones. La segunda autocorrelació se basa enn−1 observaciones, y lah-ésima autocorrelación se basa enn−hobservaciones. Intuitivamente, tiene sentido poner más énfasis en la primera autocorrelación, ya que deber´ıa ser la más precisa. Esta idea también es válida para las autocorrelaciones parciales. La estad´ıstica se puede resumir como sigue:

Qm0.5 =T (T+2)

2h

h X

k=1

(h−k+1) (T−k) (ˆr

2 k+πˆ

2

k) (25)

Alternativamente a las pruebas de Ljung-Box y Monti, las cuales utilizan los coeficientes de correlación muestral y parcial, respectivamente. Esta mixtura pretender combinar coeficientes de correlación muestral y parcial, asignandoles la misma ponderació a través deδ. En la siguiente sección, se muestra cual es la distribución asintótica deQmδ.

6.1. Distribuci´

on Asint´

oticas de

Q

mδ

Seaˆr= (ˆr1, ..., ˆrh)0y ˆπ= (πˆ1, ..., ˆπh)0 y usando los resultados de Ljung y Box (1978) y Monti (1994) que √

(11)

dondeV=XΨ−1_X0_{, es la matriz de informaci´}_{on para los par´}_ametros_φ_y_θ_{, y}_X_{es una matriz}_h_×(_p₊_q₎

con los elementosφyθdefinidos por _φ1₍_B =PφiBi y _θB1 = P

θiBi.

Teorema 1. Bajo la hip´otesis nula de un modelo adecuadamente ajustado, las estad´ısticas ˜QLB y ˜QMse distribuyen asint´otica mente comoPh_k₌₁λkχ2kdonde

χ2_k son variables aleatorias chi-cuadrado indepen-dientes con un grado de libertad yλk= (k=1, ...,h)son los valores propios de(I−V)W, dondeWes una matriz diagonal con elementoswii= (k−i+1)/h(i=1, ...,h). Defiendo a ˜QLB= T(T_h+2)

Ph k=1

(h−k+1) T−k ˆr

2 k

y ˜QM= T(T+ 2) h

Ph k=1

(h−k+1) T−k πˆ

2 k.

Demostraci´on teorema 1. Tanto ˜QLBcomo ˜QMpueden ser expresado como formas cuadr´atica. Definiendo aW como una matriz diagonal de pesos.

W =



   

1 0 · · · 0

0 h_h−1 · · · 0

..

. · · · . .. ...

0 · · · 0 _h1



   

Entonces ˜QLB y ˜QM son asint´otica mente expresados como formas cuadr´aticas ˜QLB'Tˆr0Wˆry ˜QM'

Tˆr0Wˆr cuandoT →∞. DondeA0 denota la operación transpuesta de un vector o matrizAyˆr, ˆπes un vector h×1 de la (autocorrelación parcial) desde un rezago 1 hasta h. De el resultado en Box(1954), ambas formas cuadraticas se distribuyen una combinación lineal de variables aleatoria chi cuadrados independientes por su respectivo valor propio como se muestra a continuación

h X

k=1

λkχ2k (26)

Losλkson loshvalores propios de la matriz(I−V)Wdonde(I−V)es la matriz de covarianza de ambos √

Tˆr y √Tπˆ. Box Pierce(1970) y McLeod(1978) aproximaron la matriz V con la matriz de proyecci´on X(X0X)−1X0 cuandoh es suficientemente grande.

Observamos que las estad´ısticas ˜QLBy ˜QM siguen la misma distribución nula asintótica que la de Peña y Rodr´ıguez(2002, 2006) y esta distribución es similar a la de Mahdi y McLeod (2012). La densidad es dif´ıcil de escribir en forma expl´ıcita, pero la aproximación de la distribución ha sido discutida por muchos autores. Imhof (1961) hab´ıa demostrado que las probabilidades se pueden encontrar a través de la integración numérica. Peña y Rodr´ıguez(2006) sugirieron una aproximación normal usando una generalización de la transformación de ra´ız cúbica Wilson-Hilferty de una variable aleatoria chi-cuadrado. Lin y McLeod (2006) y Mahdi y McLeod (2012) sugirieron un método de Monte Carlo para determinar los puntos cr´ıticos y los valores p. Para facilidad computacional, como la de Peña y Rodr´ıguez (2002), recomendamos una aproximación usando una distribución gamma descrita en Satterthwaite (1941,1946) y Box (1954) con parámetros de forma y escala

α= 3h(h+1) 2

4(2h2₊₃_h₊₁₋₆_h₍_p₊_q₎₎, (27)

β= 2(2h

2₊₃_h₊₁₋₆_h₍_p₊_q₎

h(h+1) (28)

(12)

McLeod (2012), pero en la práctica si h es grande en relación con T, sus estad´ısticas pueden volverse numéricamente inestables.

Teorema 2. Sea {Yt} un proceso ARMA(p,q) con secuencia de errores {t}. Si h = O(Tδ) para alg´un 0< δ <1 talqueh/T →0 yE[8]<∞, entonces bajo la hip´otesis nula cuandoT →∞,(Q˜LB−k1)/

√ K2 converge a variable normal est´andar, dondeK1 yK2 son dados por (29) y (30) respectivamente.

Aproximación gamma. Box(1954) y Satterthwaite(1941,1946) demostraron que la distribución de esta forma cuadrática en general puede ser aproximado porcχ2_k, o por la distribución gama. Los parámetros son escogidos tal que la distribución tiene los mismos dos primeros cumulan tes que la forma cuadrática. En particular, considere los parámetros de forma y escala para la distribución gama:

α= K 2 1

K2

y

β= K2 K1

dondeKies el i-ésimo cumulante de la distribución. Box (1954) proporciono una formula para los cumu-lantes y por simple manipulación algebraica de el resultado en Peña y Rodr´ıguez provee:

K1= h X

i=1

=tr((I−V)W) = h−1

2 − (p+q) + 1 h

h X

i=2

(i−1)vii

y

K2=2 h X

i=1

λ2_i =2tr((I−V)W(I−V)W)

= 1

3h(h+1)(2h+1) −2(p+q) + 4 h

h X

i=2

(i−1)vii− 4 h2

h X

i=2

(i−1)2vii+ 2 h2

h X

i=2 h X

j=2

(i−1)(j−1)v2_ij

donde vij es el elemento en la fila i, columna j de la matriz V. Pe˜na y Rodr´ıguez (2002) demostraron que cuando hes moderadamente grande los t´erminosO(h−₁₎_y_O₍_h−₂₎_{tienden a cero. Recomendamos}

usar un l´ımite superior en K1 ya que mejora la aproximación bajo la distribución nula y el argumento limitante paraK2de Peña y Rodr´ıguez

K1=

h+1

2 − (p+q) (29)

K2=

(h+1)(2h+1)

3h −2(p+q) (30)

Aplicando los teoremas de aproximación gamma descrito por Box(1954) y Satterthwaite(1941,1946), esto sugiere que la distribución bajo la hipótesis nula para la estad´ısticaQmδ es gamma con parámetrosα,β

dados por:

α= 3(h

2₊_h₋₂₍_h₋₁₎₍_p₊_q₎₎2

4(2h3₊₃_h2₊_h₋₆₍_h2₋₂_h₋₁₎₍_p₊_q₎₎ , β=

(13)

7. Metodolog´ıa

Se simularon quince modelos ARMA(p,q) para el valor deδ=0.5 yh=20 con longitud de la serie 300 con diferentes valores deφyθestacionarios e invertibles. Posteriormente se ajusta el modelo con el orden correcto, y se calcula el valor deQmδ, graficando los valores de la estad´ıstica en un histograma con ajuste

de la densidad para una distribuci´on gama 1 con par´ametrosαy βcomo en (31). Se utilizo la prueba de bondad de ajuste de Kolmogorov-Smirnov para verificar queQmδ se distribuye gama. Se compararon

las pruebas Box-Pierce, Ljung-Box y Monti con la la propuesta con el fin de encontrar el método más potente en diferentes escenarios. Se utilizaron tres tamaños de muestra para la longitud de la serie T, para datos pequeñosT = 50, para datos medianos T = 200 y para datos grandes T = 500 con rezagos h =5, 10, 15, 20. Los modelos ARMA(p,q) simulados con parámetrosφ yθ, estacionarios e invertibles conpyq₆2, donde ARMA(1,0) es ajustado en todos los casos. Por lo que el número total de escenarios evaluados fue de 180. Para el calculo del error de tipo I, se tomaron 6 de los modelos (1, 4, 6, 8, 13 y 14) propuestos. con longitud de la serie 50, 125, 200, 275, 350, 425 y 500. Finalmente se gráficaron para ver el comportamiento de cada una de las pruebas Portmanteu. El número de simulaciones montecarlo (Nsim)fue de 10.000, utilizando el software estad´ısticoR versión 3.4.2, para la potencia de las pruebas se utilizo un valorα=0.05.

8. Resultados

Esta secci´on se divide en tres partes. La primera parte muestra el ajuste emp´ırico de la estad´ısticaQmδ

a la curva de densidad de la distribución teóricaΓ(α,β), además se evalúa la bondad de ajuste con la ayuda de la prueba no paramétrica de Kolmogorov - Smirnov. En la segunda parte se evalúa el error de tipo I para las pruebas Portmanteau en 6 escenarios. Finalmente se calcula la potencia de las pruebas Portmanteau, bajo diferentes escenarios para datos pequeños, medianos y grandes.

8.1. Ajuste emp´ırico a la distribuci´

on gama

A continuación se muestran los resultados obtenidos por simulación montecarlo verificando emp´ıricamente que la distribución Γ(α,β) se ajusta adecuadamente a la distribución nula de Qmδ. En la figura 2 se

gr´afica ron 15 histogramas que corresponden al valor de la estad´ıstica Qmδ de los modelos ARMA(p,q)

propuestos en este este estudio. La aproximaci´on a la distribuci´on gamma parece la adecuada. Tabla 1: Pruebas de ajuste Kolmogorov-Smirnov a la estad´ısticaQmδ.

Modelo M´etodo α β δ φ1 φ2 θ1 θ2 D Valor p Alternativa

1 K-S 11.032 1.317 0.5 - - 0.7 - 0.010 0.258 Dos Colas

2 K-S 11.032 1.317 0.5 - - 0.4 - 0.008 0.591 Dos Colas

3 K-S 11.032 1.317 0.5 - - -0.5 - 0.010 0.247 Dos Colas

4 K-S 10.650 1.274 0.5 0.5 0.3 - - 0.013 0.055 Dos Colas

5 K-S 10.650 1.274 0.5 1.2 -0.73 - - 0.009 0.447 Dos Colas

6 K-S 10.650 1.274 0.5 - - 1 -0.6 0.010 0.240 Dos Colas

7 K-S 10.650 1.274 0.5 - - 0.24 0.1 0.010 0.253 Dos Colas

8 K-S 10.650 1.274 0.5 0.6 - 0.4 - 0.012 0.132 Dos Colas

9 K-S 10.650 1.274 0.5 0.5 - -0.7 - 0.008 0.558 Dos Colas

10 K-S 10.650 1.274 0.5 -0.2 - -0.6 - 0.012 0.128 Dos Colas

11 K-S 10.297 1.224 0.5 0.7 0.2 -0.5 - 0.026 0.051 Dos Colas

12 K-S 10.297 1.224 0.5 1 -0.35 0.1 - 0.012 0.111 Dos Colas

13 K-S 10.297 1.224 0.5 0.4 - -0.6 0.3 0.012 0.096 Dos Colas

14 K-S 9.9850 1.070 0.5 0.9 -0.3 1.3 -0.5 0.105 0.000 Dos Colas

15 K-S 9.9850 1.070 0.5 0.4 -0.3 -0.3 1.1 0.174 0.000 Dos Colas

(14)

Figura 2: Histograma de la estad´ısticaQm_δ, ajuste dist.Γ(α,β)

.

Los resultados de la figura reffig1, muestran el correcto ajuste de la estad´ıstica a la distribuciónΓ(α,β). Aunque en algunos casos el ajuste no fue tan bueno, por ejemplo para el modelo 15, en general la aproximación a la distribución gama parece adecuado. En la tabla 1., se observan los resultados obtenidos de la aplicación de la prueba de bondad de ajuste Kolmogorov - Smirnov a la distribución gama. En la mayor´ıa de casos el p valor fue mayor al nivel de significación, para unα=0.05, contrastando la hipótesis nulaF(x) =F(y)vsF(x)6=F(y), por lo que no hay suficiente evidencia estad´ıstica para rechazarH0 y se concluye que la estad´ıstica de prueba propuestaQmδ sigue en general una distribuciónΓ(α,β).

9. Tama˜

no de la Prueba

En esta sección se calcula el error tipo I, definido como laPr(Rechazar H0|H0 es verdadaera) o falso positivo, es el error que se comete cuando el investigador rechaza la hipótesis nulaH0siendo esta verdadera en la población. Se eligieron como casos particulares el modelo 1 un MA(1) con θ = 0.7, el modelo 4 un AR(2) φ1 = 0.5,φ2 = 0.3, modelo 6 un MA(2) con θ1 = 1,θ2 = −0.6, modelo 8 un ARMA(1,1)

φ00.6,θ=0.4, modelo 13 un ARMA(1,2) conφ=0.4,θ1= −0.6,θ2=0.3 y modelo 14 un ARMA(2,2) conφ1=0.9,φ2= −0.3,θ1=1.3,θ= −0.5. Los resultados obtenidos se muestran en la figura 3. El valor de αutilizado fue al 0.05. Como vemos las pruebas en general se comportan bastante bien movi´endose alrededor del 5 %, por lo que no hay inflaci´on del error de tipo I.

9.1. Estudio de Simulaci´

on para Datos Peque˜

nos

Generamos datos para un tamaño de muestra pequeño (T = 50) mediante el software estad´ıstico R y la potencia de las pruebas se calcula para los rezagos h= 5, 10, 15 y 20. Los resultados se presentan en la Tabla 2 para h = 5 y 20. Para los otros rezagos la Tabla 8 se encuentra en el apéndice.

(15)

Figura 3: Resultados del Error de tipo I cometido con los modelos ARMA ajustados.

rezagos h y alcanzan su máxima potencia cuando este esh = 5. Por ejemplo, en el modelo 1 MA(1), hay deficiencias de la potencia de la prueba para el caso QBP del rezago 5 al rezago 10, es igual a (0.3376−0.2112)/0.3376×100 % = 37.4 % y cálculos similares son utilizados para los otros modelos. Entonces, los promedios de la disminución de la potencia con respecto a h del rezago 5 al 10 es un 19.3 %, 12.3 %, 20.1 %, 0.4 % paraQBP,QLB,QM,Qm0.5 respectivamente, con excepción del modelo 7 en el cual la potencia no disminuyo sino aumento, paraQLB,QM,Qm0.5 yQm0−75.

Para losAR(p)yMA(q), los resultados muestran queQMes mejor queQLBsi el orden del componente del promedio m´ovil es subestimado (ver los modelos 1,2,3,6, y 7 para todos los rezagos seleccionados). Por otro ladoQLBtiene mejor rendimiento queQMsi el orden del componente autorregresivo es subestimado (ver modelos 4 y 5 para todos los rezagos.)

En la Tabla 2 se observa que la estad´ıstica propuestaQmδ, fue la m´as potente en los modelos 1, 3, 4, 8,

10, 12 y 14 para el rezago h = 5. Mientras que para el rezago h = 20, fue la prueba más potente excepto en el modelo 2 y 7. En la general los resultados muestran que a medida que aumenta los rezagos h, el resultado de la estad´ıstica propuesta es más potente que las demás. Para tener una visión general de los resultados calculamos el promedio de la potencia para cada prueba Portmanteau teniendo en cuenta los 15 modelos propuestos en los cuatro rezagos seleccionados h=5,10,15 y 20 los resultados fueron los siguiente. ParaQBPfue de 21.92 %, paraQLBfue de 32.76 %, paraQMfue de 34.92 % y para 41.94 %, lo que muestra una mejora considerable con respecto a las pruebas clásicas, si comparamos con Box-Pierce la mejora fue de un 47.7 % y se la comparamos con la prueba de Monti la mejora fue de un 16.7 %.

9.2. Estudio de Simulaci´

on para Datos Medianos

Se generaron datos con tamaño de muestra mediano (T = 200) por medio del software estad´ıstico R y la potencia de las pruebas se calculo parah=5, 10,15 y 20. Los resultados son presentados en la Tabla 3, para los rezagosh=5 y 15, los otros rezagos se encuentran disponibles en el apéndice en la Tabla 9. El estudio de simulación muestra que la potencia de las pruebas Portmanteu aumenta cuando T=200, en comparación con T=50. La potencia de las pruebas decrece con respecto al rezago h 5 a 10 en 11.7 %, 9.4 %, 9.2 %, 0.7 % para QBP,QLB,QM y Qmδ respectivamente, con excepción de los modelos

5,14 y 15 pues todas tienen la misma potencia aproximadamente 100 %.

(16)

Tabla 2: Potencia de las pruebas Portmanteau con T = 50, h=5 y 20,α=0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5 QBP QLB QM Qm0.5

h = 5 h = 20

1 - - 0.7 - 0.3376 0.3984 0.5700 0.5794 0.1228 0.2832 0.2554 0.4232

2 - - 0.4 - 0.0812 0.1212 0.1330 0.1286 0.0312 0.1182 0.0662 0.1206 3 - - -0.5 - 0.1392 0.1944 0.2388 0.2456 0.0538 0.1670 0.1136 0.1902

4 0.5 0.3 - - 0.1992 0.2434 0.2436 0.3110 0.0716 0.1824 0.0978 0.2104

5 1.2 -0.73 - - 0.9910 0.9960 0.9932 0.9960 0.9254 0.9676 0.9410 0.9894

6 - - 1 -0.6 0.3304 0.3762 0.4984 0.4854 0.1142 0.2820 0.2298 0.3870

7 - - 0.24 0.1 0.0310 0.0440 0.0586 0.0350 0.0122 0.0728 0.0458 0.0552 8 0.6 - 0.4 - 0.2650 0.3140 0.3836 0.4524 0.1084 0.2540 0.1744 0.3244

9 0.5 - -0.7 - 0.0642 0.0906 0.1362 0.1082 0.0284 0.1136 0.0748 0.1166

10 -0.2 - -0.6 - 0.3288 0.3974 0.5526 0.5776 0.1232 0.2838 0.2584 0.4336

11 0.7 0.2 -0.5 - 0.2778 0.3576 0.3750 0.3734 0.0878 0.2384 0.1690 0.3046

12 1 -0.35 0.1 - 0.6084 0.6586 0.6700 0.7646 0.3050 0.5070 0.3798 0.6306

13 0.4 - -0.6 0.3 0.0756 0.1062 0.1270 0.1062 0.0260 0.1148 0.0714 0.1140 14 0.9 -0.3 1.3 -0.5 0.7868 0.8392 0.9376 0.9566 0.3862 0.6196 0.6612 0.8566

15 0.4 -0.3 -0.3 1.1 0.4336 0.5404 0.7580 0.6168 0.1322 0.3554 0.5252 0.6218

modelos 1, 2, 3, 6 y 7 para todos los rezagos seleccionados en las Tablas 3 y 9). En cuanto a los resultados de la estad´ıstica propuesta Qmδ para el rezago h = 5, fue la m´as potente para los modelos 1, 3, 4, 8,

10, 12 y 14. Sin embargo si el número de rezagos aumenta hasta h = 20, fue igual o más potente que las pruebas clásicas en todos los modelos, (ver Tabla 9 con h=20). Como resultado global para todos los rezagos comparamos el promedio de la potencia obtenida por cada prueba, fueron los siguientes 71.06 %, 72.91 %, 74.81 %, 79.71 %, para QBP, QLB, QM y Qmδ respectivamente. se aprecia que el incremento

en la potencia varia desde 6.1 % hasta 10.8 % si lo comparamos con las pruebas cl´asicas de Monti o Box-Pierce.

h = 5 h = 15

1 - - 0.7 - 0.9952 0.9964 0.9990 0.9992 0.8908 0.9028 0.9852 0.9992

2 - - 0.4 - 0.3252 0.3466 0.3746 0.4174 0.1768 0.2204 0.2102 0.3450

3 - - -0.5 - 0.6662 0.6968 0.7488 0.7836 0.3840 0.4466 0.4972 0.6968

4 0.5 0.3 - - 0.9104 0.9152 0.9216 0.9544 0.7412 0.7546 0.7438 0.9026

5 1.2 -0.73 - - 1 1 1 1 1 1 1 1

6 - - 1 -0.6 0.9868 0.9852 0.9936 0.9938 0.8424 0.8806 0.9468 0.9896

7 - - 0.24 0.1 0.0592 0.0738 0.0740 0.0540 0.0514 0.0738 0.0634 0.0614 8 0.6 - 0.4 - 0.9370 0.9372 0.9648 0.9784 0.7366 0.7752 0.8272 0.9462

9 0.5 - -0.7 - 0.3126 0.3310 0.4084 0.3770 0.1648 0.1940 0.2506 0.3374

10 -0.2 - -0.6 - 0.9928 0.9932 0.9972 0.9992 0.8856 0.8998 0.9680 0.9930

11 0.7 0.2 -0.5 - 0.9968 0.9972 0.9978 0.9974 0.9810 0.9862 0.9818 0.9954

12 1 -0.35 0.1 - 0.9990 0.9992 0.9994 0.9994 0.9888 0.9898 0.9934 0.9992

13 0.4 - -0.6 0.3 0.6312 0.6546 0.6410 0.6692 0.4038 0.4508 0.4368 0.6062

14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1

15 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9960 0.9982 1 1

9.3. Estudio de Simulaci´

on para Datos Grandes

Se generaron datos de tama˜no de muestra grandes con (T = 500) por medio del software estad´ıstico R y la potencia de las pruebas se calcula para h=5, 10, 15 y 20. Los resultados se presentan en la Tabla 4 para h= 5 y 15, para los rezagos 10 y 20 los resultados se encuentran en la Tabla 10 que esta en el ap´endice. Todas las pruebas presentan sensibilidad al valor del rezago escogidoh.

En promedio la potencia de las pruebas decrece en cuando se pasa del rezago h = 5 a h = 10, en

(17)

mejores resultados que las pruebas cl´asicas para los rezagos h = 10, 15 y 20. En general el promedio de la potencia obtenido por las pruebas Portmanteau fue de 87.11 %, 87.44 %, 88.32 %, 90.76 % para las estad´ısticasQBP,QLB,QMyQm0.5 respectivamente, por lo tanto la mejora en potencia que ofreceQmδ

es entre 2.7 % a 4 % con respecto a las pruebas cl´asicas.

h = 5 h = 10

1 - - 0.7 - 1 1 1 1 1 1 1 1

2 - - 0.4 - 0.7512 0.7692 0.7892 0.8346 0.5974 0.5958 0.6344 0.7824

3 - - -0.5 - 0.9866 0.9902 0.9944 0.9964 0.9518 0.9588 0.9732 0.9918

4 0.5 0.3 - - 1 1 0.9998 1 0.9994 0.9996 0.9996 1

5 1.2 -0.73 - - 1 1 1 1 1 1 1 1

6 - - 1 -0.6 1 1 1 1 1 1 1 1

7 - - 0.24 0.1 0.1032 0.1158 0.1140 0.0982 0.0850 0.0950 0.0874 0.1060

8 0.6 - 0.4 - 1 1 1 1 0.9998 1 0.9998 1

9 0.5 - -0.7 - 0.7748 0.7820 0.8314 0.8258 0.5966 0.6078 0.7168 0.8164

10 -0.2 - -0.6 - 1 1 1 1 1 1 1 1

11 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 1

12 1 -0.35 0.1 - 1 1 1 1 1 1 1 1

13 0.4 - -0.6 0.3 0.9848 0.9850 0.9848 0.9876 0.9540 0.9546 0.9548 0.9866

14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1

15 0.4 -0.3 -0.3 1.1 1 1 1 1 1 1 1 1

10. Ejemplo Ilustrativo: Tasas de consumo personal en los

Esta-dos UniEsta-dos.

Para validar los resultados del estudio de simulaci´on, aplicamos las pruebas de portmanteau para probar la adecuaci´on de los modelos ajustados sobre un conjunto de datos reales. Se utiliza la base de datos usconsumption del paquete fpp la cual contiene los cambios porcentuales en el gasto de consumo personal trimestral y el ingreso personal disponible para los Estados Unidos, 1970 a 2010. Por facilidad solo se trabajara con la variable el consumo.

10.1. Exploraci´

on de los datos

En la figura 4 se muestra el gráfico de la serie de tiempo junto con la función de autocorrelación (ACF) y la función de auto correlación parcial (PACF), esta serie presenta considerables fluctuaciones a lo largo del tiempo, no parece haber tendencia por lo que un modelo estacionario parece razonable. Para comprobar estas hipótesis utilizamos la prueba de Dickey Fuller para la serie del consumo personal en EE.UU., el estad´ıstico de prueba obtenido es -4.2556 y el p valor es 0.01. Con la hipótesis nula de no estacionariedad en la serie, esto proporciona una fuerte evidencia de que la serie no tien ra´ız unitaria.

10.2. Ajustando el Modelo Apropiado

Nos encontramos ante una serie no estacional, y que no tiene tendencia observando la tabla 3, la función de autocorrelación muestral extendida (EACF) parece apropiado ajustar un modelo ARMA(0,3), por otra parte la función auto.arima del paquete forecast de R que devuelve el mejor modelo ARIMA acorde al valor delAICc también indica que el mejor modelo es el MA(3).

(18)

Años

V

ar

iación porcentual del gasto

1970 1980 1990 2000 2010

−2

−1

0

1

2

Años

V

ar

iación porcentual del gasto

1970 1980 1990 2000 2010

−2

−1

0

1

2

1 2 3 4 5

−0.1

0.1

0.3

Rezago

A

CF

1 2 3 4 5

−0.1

0.1

0.3

Rezago

A

CF

1 2 3 4 5

−0.1

0.1

0.3

Rezago

P

ar

tial A

CF

1 2 3 4 5

−0.1

0.1

0.3

Rezago

P

ar

tial A

CF

Figura 4: Variaci´on porcentual trimestral en el gasto de consumo personal en EE.UU.

Tabla 5: EACF para la serie de consumo personal EE.UU. MA

0 1 2 3 4 5 6 7 8 9 10 11 12 13

AR

0 x x x o o o o o o o o o o o

1 x o x o o o o o o o o o o o

2 x o x o o o o x o o o o o o

3 x x o o o o o x o o o o o o

4 x o o o o o o x o o o o o o

5 x x o o x o o o o o o o o o

6 x o x o x o o o o o o o o o

7 x o x x x o o o o o o o o x

para el modelo ARMA(0,3). La Tabla 4 muestra los valores de p de las pruebas Portmanteau para los rezagos seleccionados, h = 5, 10, 15 y 20 con α= 0.05 oα =0.1. Claramente, el resultado indica que para todos los rezagos, todas las pruebas Portmanteau no tienen suficiente evidencia para rechazar la hipótesis nula de la adecuación del modelo, es decir, todas las pruebas tienen el mismo resultado para los diagnósticos de autocorrelación y detectan correctamente el modelo ajustado.

10.3. Ajustando un Modelo Inapropiado ARMA(2,0)

Ahora, supongamos que los datos de la serie temporal de consumo personal trimestral en EE.UU está mal ajustada por el modelo ARMA(2,0). Realizamos las pruebas mencionadas anteriormente para el modelo ajustado ARIMA(2,0). La Tabla 5 muestra los valores p de las pruebas Portmanteau para los rezagos, h = 5, 10, 15 y 20 conα=0.1. Claramente, los resultados indican que para el reazgo 5, todas las pruebas Portmanteau rechazan la hipótesis nula de la adecuación del modelo, es decir, todas las pruebas tienen el mismo resultado para los diagnósticos de autocorrelación.

(19)

idonei-dad del modelo, aunque para h = 5, la pruebaQM muestra que el modelo ajustado ARMA(2,0) parece ser inadecuado, sin embargo para m = 10, 15 y 20 la prueba de QM hay evidencia significativa para apoyar la hipótesis nula de adecuación del modelo. Mientras que las pruebas clásicas Ljung-Box QLB y Box-Pierce QBP dan valores p similares h. Sin embargo para un α=0.1, QBP rechazar´ıa H0 para h = 5 y 10. Mientras QLB con α, rechazar´ıa la hipótesis nula para h=5,10 y 15, pero no para h=20. La estad´ıstica propuesta es la que tiene mejor resultado, pues para unα=0.1, rechaza la hipótesis nula en todos los casos, es decir que detecta que el modelo no es el adecuado.

Tabla 6: Valores p de la prueba Portmanteau para los residuales del modelo ajustado.

Modelo h QBP QLB QM Qm0.5 Modelo QBP QLB QM Qm0.5

ARMA(0,3) 5 0.3419 0.3287 0.3470 0.2039 ARMA(2,0) 0.0397 0.0354 0.0422 0.0292

ARMA(0,3) 10 0.3468 0.3085 0.2309 0.2657 ARMA(2,0) 0.3468 0.0684 0.1002 0.0315

ARMA(0,3) 15 0.3839 0.3164 0.3150 0.3120 ARMA(2,0) 0.3839 0.0966 0.1157 0.0516

ARMA(0,3) 20 0.5762 0.4849 0.5518 0.3540 ARMA(2,0) 0.5762 0.1737 0.3287 0.0740

11. Conclusiones

Se compararon cuatro pruebas de Portmanteu, con diferentes tamaños de muestra T, rezagosh y con diferentes modelos ARMA(p,q) conp,q ₆2, lo qu proporciono una amplio espectro de resultados un total de 180 escenarios diferentes. Con la simulación de MonteCarlo, se concluyo que los valores más altos de potencia para todas las pruebas se encuentran en muestras grandes (T = 500).

Las pruebas son sensibles al valor del rezagoh, pues entre mayor sea el rezago la potencia disminuye, manteniendo el mismo tama˜no de muestra.

Para los modelos ARMA(p,q), el rendimiento de la prueba deQM es mejor que la prueba deQLB si el orden del componente del promedio m´ovil se subestima, mientras que QLBfunciona mejor si se subestima el orden del componente autorregresivo.

La distribución de la estad´ıstica propuesta se aproxima asintóticamente a una distribución gama. La estad´ıstica propuesta en este estudio mostró ser más potente que las pruebas clásicas en general en todos los escenarios, parece funcionar mejor cuandoh yT son grandes.

11.1. Futuras Investigaciones y Limitaciones del Estudio

Para próximas oportunidades primero se busca encontrar el valor de δ, que maximicé la potencia de la prueba para un escenario especifico. Por otra parte se podr´ıa pensar en hacer una extensión de esta prueba para los modelos generalizados auto regresivos condicionalmente heterocedástico(GARCH) y los modelos autorregresivos de umbrales (TAR). Segundo, ampliar la investigación para examinar la relación entre los coeficientes ARMA(p,q) y la potencia de las pruebas de bondad de ajuste en series de tiempo.

Agradecimientos

En primer lugar quiero agradecer al padre eterno (Hashem), por permitirme vivir este momento y darme la oportunidad de cursar esta carrera aqu´ı en la Universidad Santo Tomás. También quiero agradecer a mi directora de tesis la profesora Hanwen Zhang, por el apoyo incondicional y constante seguimiento brindado durante el proceso de elaboración de este documento, aportes y correcciones al mismo. Finalmente quiero agradecer a mi familia, mis padres y hermano por ser los cimientos de mi vida y darme las fuerzas necesarias para terminar esta carrera. Pero principalmente a mi madre Roció Bonilla, por financiar mis estudios.

(20)

h = 10 h = 15

1 - - 0.7 - 0.2112 0.3244 0.4196 0.5208 0.1516 0.2964 0.3328 0.4660

2 - - 0.4 - 0.1062 0.1038 0.1046 0.1262 0.0636 0.1138 0.0898 0.1186 3 - - -0.5 - 0.1488 0.1678 0.1680 0.2346 0.0922 0.1664 0.1458 0.2064

4 0.5 0.3 - - 0.1350 0.1782 0.1624 0.2688 0.1464 0.1854 0.1230 0.2386

5 1.2 -0.73 - - 0.9786 0.9826 0.9828 0.9962 0.1548 0.9752 0.9692 0.9912

6 - - 1 -0.6 0.1968 0.2928 0.3556 0.4694 0.1494 0.2810 0.2766 0.4320

7 - - 0.24 0.1 0.0234 0.0574 0.0578 0.0424 0.0282 0.0654 0.0524 0.0486 8 0.6 - 0.4 - 0.1762 0.2634 0.2822 0.4076 0.1384 0.2520 0.2044 0.3592

9 0.5 - -0.7 - 0.0480 0.0946 0.1140 0.1210 0.1024 0.1042 0.0926 0.1214

10 -0.2 - -0.6 - 0.2084 0.3132 0.4088 0.5268 0.1556 0.2948 0.3196 0.4688

11 0.7 0.2 -0.5 - 0.1698 0.2650 0.2576 0.3646 0.1552 0.2352 0.2062 0.3382

12 1 -0.35 0.1 - 0.4566 0.5716 0.5484 0.7124 0.1490 0.5210 0.4432 0.6614

13 0.4 - -0.6 0.3 0.0980 0.1048 0.0948 0.1212 0.0502 0.1068 0.0794 0.1136

14 0.9 -0.3 1.3 -0.5 0.6132 0.7152 0.8418 0.9260 0.1498 0.6492 0.7384 0.8902

15 0.4 -0.3 -0.3 1.1 0.2584 0.3778 0.7146 0.6854 0.1556 0.3618 0.6274 0.6722

h = 10 h = 20

1 - - 0.7 - 0.9580 0.9662 0.9964 0.9990 0.8186 0.8516 0.9690 0.9940

2 - - 0.4 - 0.2138 0.2460 0.2618 0.3890 0.1536 0.1908 0.1822 0.2988

3 - - -0.5 - 0.4808 0.5110 0.5902 0.7512 0.3224 0.3860 0.4188 0.6316

4 0.5 0.3 - - 0.8050 0.8338 0.8410 0.9230 0.6636 0.7148 0.6836 0.8756

5 1.2 -0.73 - - 1 1 1 1 1 1 1 1

6 - - 1 -0.6 0.9222 0.9360 0.9764 0.9934 0.7734 0.8254 0.9160 0.9808

7 - - 0.24 0.1 0.0478 0.0716 0.0612 0.0598 0.0486 0.0692 0.0572 0.0676 8 0.6 - 0.4 - 0.8362 0.8568 0.8962 0.9662 0.6666 0.6996 0.7652 0.9212

9 0.5 - -0.7 - 0.2078 0.2280 0.2924 0.3644 0.1530 0.1852 0.2094 0.3090

10 -0.2 - -0.6 - 0.9508 0.9528 0.9872 0.9988 0.8068 0.8474 0.9382 0.9932

11 0.7 0.2 -0.5 - 0.9906 0.9922 0.9920 0.9988 0.9688 0.9760 0.9712 0.9956

12 1 -0.35 0.1 - 0.9958 0.9974 0.9982 0.9998 0.9798 0.9866 0.9864 0.9990

13 0.4 - -0.6 0.3 0.4866 0.5138 0.5044 0.6564 0.3452 0.4166 0.3668 0.5636

14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1

15 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9854 0.9924 1 1

h = 15 h = 20

1 - - 0.7 - 1 1 1 1 1 1 1 1

2 - - 0.4 - 0.4860 0.5030 0.5324 0.7406 0.4262 0.4356 0.4650 0.6760

3 - - -0.5 - 0.8998 0.9038 0.9346 0.9868 0.8500 0.8528 0.8916 0.9806 4 0.5 0.3 - - 0.9978 0.9986 0.9978 0.9996 0.9964 0.9944 0.9946 0.9996

5 1.2 -0.73 - - 1 1 1 1 1 1 1 1

6 - - 1 -0.6 1 0.9998 1 1 0.9994 1 1 1

7 - - 0.24 0.1 0.0728 0.0888 0.0734 0.1008 0.0674 0.0796 0.0764 0.0996

8 0.6 - 0.4 - 0.9990 0.9990 0.9992 1 0.9946 0.9972 0.9992 1

9 0.5 - -0.7 - 0.4896 0.5050 0.6180 0.7740 0.4212 0.4438 0.5440 0.7212

10 -0.2 - -0.6 - 1 1 1 1 0.9998 1 1 1

11 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 1

12 1 -0.35 0.1 - 1 1 1 1 1 1 1 1

13 0.4 - -0.6 0.3 0.9120 0.9200 0.9156 0.9802 0.8698 0.8874 0.8706 0.9688

14 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 1

(21)

Referencias

Anderson, R. L. (1942), ‘Distribution of the serial correlation coefficient’, The Annals of Mathematical Statistics13(1), 1–13.

Arranz, M. A. (2005), ‘Portmanteau test statistics in time series’,Time Orientated Languagepp. 1–8. Box, G. E. & Jenkins, G. M. (1976),Time series analysis: forecasting and control, revised ed, Holden-Day. Box, G. E. & Pierce, D. A. (1970), ‘Distribution of residual autocorrelations in autoregressive-integrated moving average time series models’,Journal of the American statistical Association65(332), 1509– 1526.

Davies, N., Triggs, C. & Newbold, P. (1977), ‘Significance levels of the box-pierce portmanteau statistic in finite samples’,Biometrika64(3), 517–522.

Fisher, T. J. (2011), ‘Testing adequacy of arma models using a weighted portmanteau test on the residual autocorrelations’,Contributed Paper327, 2011.

Fisher, T. J. & Gallagher, C. M. (2012), ‘New weighted portmanteau statistics for time series goodness of fit testing’,Journal of the American Statistical Association107(498), 777–787.

Imhof, J. (1961), ‘Computing the distribution of quadratic forms in normal variables’, Biometrika 48(3/4), 419–426.

Lin, J.-W. & McLeod, A. I. (2006), ‘Improved peˇna–rodriguez portmanteau test’,Computational Statis-tics & Data Analysis51(3), 1731–1738.

Ljung, G. M. & Box, G. E. (1978), ‘On a measure of lack of fit in time series models’, Biometrika pp. 297–303.

Mahdi, E. & Ian McLeod, A. (2012), ‘Improved multivariate portmanteau test’,Journal of Time Series Analysis33(2), 211–222.

McLeod, A. I. & Li, W. K. (1983), ‘Diagnostic checking arma time series models using squared-residual autocorrelations’,Journal of Time Series Analysis4(4), 269–273.

Monti, A. C. (1994), ‘A proposal for a residual autocorrelation test in linear models’,Biometrikapp. 776– 780.

Pe˜na, D. & Rodr´ıguez, J. (2002), ‘A powerful portmanteau test of lack of fit for time series’,Journal of the American Statistical Association97(458), 601–610.

Safi, S. K. & Al-Reqep, A. A. (2014), ‘Comparative study of portmanteau tests for the residuals autoco-rrelation in arma models’,Journal of Applied Mathematics and Statistics2(1), 1–13.

Satterthwaite, F. E. (1941), ‘Synthesis of variance’,Psychometrika6(5), 309–316.

Satterthwaite, F. E. (1946), ‘An approximate distribution of estimates of variance components’, Biome-trics bulletin2(6), 110–114.

Slutzky, E. (1937), ‘The summation of random causes as the source of cyclic processes’, Econometrica: Journal of the Econometric Societypp. 105–146.

Whitle, P. (1951),Hypothesis testing in time series analysis, Vol. 4, Almqvist & Wiksells.

Wold, H. (1938), A study in the analysis of stationary time series, PhD thesis, Almqvist & Wiksell. Yule, G. U. (1926), ‘Why do we sometimes get nonsense-correlations between time-series?–a study in

sampling and the nature of time-series’,Journal of the royal statistical society89(1), 1–63.

(22)

A. C´

odigos

Serie larain (Annual rainfall in Los Angeles / time series) del paquete TSA. Annual precipitation (in inches) in Los Angeles, 1878-1992.

# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # C ´o d i g o s T e s i s # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #

l i b r a r y( TSA ); d a t a ( l a r a i n ) # S e r i e de t i e m p o e j e m p l o

par( mar =c(3,3,2,2) , mgp =c(1.6,.6,0))

p l o t( larain , y l a b ='P r e c i p i t a c i ´o n', x l a b ='A~no', t y p e ='o', col = 4)

r e c t(par(" usr ")[1] , par(" usr ")[3] ,par(" usr ")[2] ,par(" usr ")[4] ,col=g r a y(.9,.9) , b o r d e r ='w h i t e');g r i d( lty =1, col='w h i t e');par(new = T )

p l o t( larain , y l a b ='P r e c i p i t a c i ´o n', x l a b ='A~no', t y p e ='o', col = 4)

#

-Funci´on que incluye las pruebas Portmanteau utilizadas en est´a tesis. ”Box-Pierce (1970)”, ”Ljung-Box(1978)”, ”Monti(1994)”, ”La Estad´ıstica Propuesta(2017)”.

# T e s t P o r t a m n t e a u p a r a la i n d e p e n d e n c i a de los r e s i d u a l e s de un m o d e l o A R M A ( p , q ).

P o r t m a n t e a u < - f u n c t i o n( y , h =5, m e t o d o = " Box - P i e r c e ",p ,q){

i f e l s e( m e t o d o == " Qm ",d < -0.5,i f e l s e( m e t o d o ==" M o n t i ",d < -0,d < -1)) Ti < - l e n g t h ( y )

mod < - a r i m a ( y ,o r d e r=c( p ,0,q) , m e t h o d = " ML ")

ri < - acf ( mod$res ,p l o t = F , lag .max = h , na.a c t i o n = na. p a s s ) pi < - p a c f ( mod$res ,p l o t = F , lag .max = h , na.a c t i o n = na. p a s s )

if( m e t o d o == " Box - P i e r c e "){ p a r a m e t r o = h - p -q; wi < - 1}

if( m e t o d o == " Ljung - Box " | m e t o d o == " M o n t i "){ wi < - ( Ti +2)/seq( Ti -1, Ti - h ); p a r a m e t r o = h - p -q}

e l s e if( m e t o d o == " Qm "){

wi < - ( Ti +2)/seq( Ti -1, Ti - h )*( h -1: h +1)/ h

s h a p e = (3/4)*( h ^2+ h -2*( h -1)*( p +q))^2/(2* h ^3+3* h ^2+ h -6*( h ^2-2* h -1)*( p +q));

s c a l e = (2/3)*(2* h ^3 +3* h ^2+ h -6*( h ^2-2* h -1)*( p +q) ) / ( h *( h ^2+ h -2*( h -1)*( p +q) ) ) ;

p a r a m e t r o = c( shape ,s c a l e)}

Q < - Ti *( d *sum( wi * i d e n t i t y ( ri$acf [1: h ]^2) ) + (1- d )*sum( wi * i d e n t i t y ( pi$acf [1: h ]^2)))

i f e l s e( m e t o d o == " Box - P i e r c e " | m e t o d o == " Ljung - Box " | m e t o d o == " M o n t i ", vp < - p c h i s q(Q, p a r a m e t r o ,l o w e r. t a i l = F ) ,

vp < - p g a m m a(Q, s h a p e = shape ,s c a l e=scale,l o w e r. t a i l = F ))

l i s t(" Q "= Q," P a r ´a m e t r o "= p a r a m e t r o ," vp "= vp )}

#

-Los 15 modelos ARMA(p,q) estacionarios e invertibles, simulados en el estudio conp,q₆2. Algunos de estos modeloes fueron extraidos del estudio de Safi & Al-Reqep en el 2014.

# # # # # # # # # # # L i s t a de los 1 5 m o d e l o s p r p u e s t o s A R M A ( p , q ) con p , q <= 2 # # # # # # # # # # #

mod = l i s t(l i s t( ma =0.7) , # M o d e l o _1 MA (1)

l i s t( ma =0.4) , # M o d e l o _2 MA (1)

l i s t( ma = -0.5) , # M o d e l o _3 MA (1)

l i s t( ar =c(0.5,0.3)) , # M o d e l o _4 AR (2)

l i s t( ar =c(1.2, -0.7 3)) , # M o d e l o _5 AR (2)

l i s t( ma =c(1, -0.6)) , # M o d e l o _6 MA (2)

l i s t( ma =c(0.2 4,0.1)) , # M o d e l o _7 MA (2)

l i s t( ar =0.6, ma =0.4) , # M o d e l o _8 A R M A (1,1)

l i s t( ar =0.5, ma = -0.7) , # M o d e l o _9 A R M A (1,1)

l i s t( ar = -0.2, ma = -0.6) , # M o d e l o _1 0 A R M A (1,1)

l i s t( ar =c(0.7,0.2) , ma = -0.5) , # M o d e l o _1 1 A R M A (2,1)

l i s t( ar =c(1, -0.3 5) , ma =0.1) , # M o d e l o _1 2 A R M A (2,1)

l i s t( ar =0.4, ma =c( -0.6,0.3)) , # M o d e l o _1 3 A R M A (1,2)

l i s t( ar =c(0.9, -0.3) , ma =c(1.3, -0.5)) ,# M o d e l o _1 4 A R M A (2,2)

l i s t( ar =c(0.4, -0.3) , ma =c( -0.3,1.1)))# M o d e l o _1 5 A R M A (2,2)

(23)

-Ajuste Emp´ırico de las distribuciones utilizando los 15 modelos propuestos. Gr´aficas de los Histogramas con ajuste de la densidad y prueba K-S.

# # # # # # # # # # # # # # # # # # # # # # # A j u s t e E m p ´ı r i c o de la E s t a d ´ı s t i c a # # # # # # # # # # # # # # # # # # # # # #

AR < - c(0,0,0,2,2,0,0,1,1,1,2,2,1,2,2) MA < - c(1,1,1,0,0,2,2,1,1,1,1,1,2,2,2) N s i m < - 1 0 0 0 0

s y s t e m.t i m e(for( i in 1: N s i m ){for( j in 1:1 5){

Q[ i , j ] = P o r t m a n t e a u ( a r i m a . sim ( n =5 0 0, m o d e l= mod [[ j ]]) , h = 3 0, m e t o d o =" Qm ", p = AR [ j ] ,q= MA [ j ])$Q}})

# H i s t o g r a m a s de la e s t a d ´ı s t i c a Qm

par( m f r o w =c(3,5) , mar =c(2.8,2.5,2.5,2) , mgp =c(1.6,.6,0) , xpd =T R U E)

# G r ´a f i c a s

Sh < - c(rep(1 1.0 3 1 5 7,3) ,rep(1 0.6 4 9 9 3,7) ,rep(1 0.2 9 7 2,3) ,rep(9.9 8 5 3 2 5,2)) Sc < - c(rep(1.3 1 7 4 3 1,3) ,rep(1.2 7 3 8 7 4,7) ,rep(1.2 2 3 6 3 3,3) ,rep(1.1 6 5 0 4 3,2))

for( i in 1:1 5){

h i s t(Q[ , i ] , f r e q = F , col = " b l a c k ", b o r d e r =" w h i t e ", m a i n = " ", x l a b =" ")

c u r v e(d g a m m a( x , s h a p e = Sh [ i ] , s c a l e= Sc [ i ]) , add= T , col = " b l u e ", lwd =2)}

# P r u e b a de K o l m o g o r v o S m i r n o v

KS < - N U L L

for( i in 1:1 5){

KS [ i ] = ks . t e s t (Q[ , i ] ," p g a m m a ", s h a p e = Sh [ i ] , s c a l e = Sc [ i ])$p . val }

c b i n d( M o d e l o = 1:1 5," K - S . PV " = r o u n d( KS ,4))

#

-Potencia de las pruebas Portmanteau, evaluando en los 15 modelos para datos peque˜nos t = 50, para datos medianos t = 200, para datos grandes t = 500, con rezagos h=5,10,15 y 20. Ajustando un modelo ARMA(1,0) para todos los casos y Con 10.000 simulaciones montecarlo para un nivel de significancia del α=0.05.

# # # # # # # # # # # # # # # # # # # # # # P o t e n c i a de las P r u e b a s P o r t m a n t e a u # # # # # # # # # # # # # # # # # # # # #

N s i m < - 1 0 0 0 0 # N ´u m e r o de s i m u l a c i o n e s

t = 5 0 # t =2 0 0; t =5 0 0 l o n g i t u d de la s e r i e

l = 5 # l = 1 0; l = 1 5; l = 2 0 r e z a g o s

vp1< - vp2< - vp3< - vp4< -m a t r i x( NA ,n r o w = Nsim , n c o l = l e n g t h ( mod ))

for( i in 1: N s i m ){

for( j in 1: l e n g t h ( mod )){

vp1[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Box - P i e r c e ", p =1,q=0)$vp vp2[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Ljung - Box ", p =1,q=0)$vp vp3[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" M o n t i ", p =1,q=0)$vp vp4[ i , j ]= P o r t m a n t e a u ( a r i m a . sim (m o d e l= mod [[ j ]] , n =t) , h = l , m e t o d o =" Qm ", p =1,q=0)$vp }} Box . P = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp1[1: Nsim , i ] <0.0 5) ) ) ) L j u n g = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp2[1: Nsim , i ] <0.0 5) ) ) ) M o n t i = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp3[1: Nsim , i ] <0.0 5) ) ) ) m _0.5 = as .m a t r i x(s a p p l y(1: l e n g t h ( mod ) ,f u n c t i o n( i ) r b i n d(m e a n( vp4[1: Nsim , i ] <0.0 5) ) ) ) Res < - c b i n d(1:1 5, Box . P , Ljung , Monti , m _0.5)

c o l n a m e s( Res ) < - c(" M o d e l o "," Q _ BP "," Q _ LB "," Q _ M "," Q _ m ");p r i n t( Res )

#

-# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# E j e m p l o D a t o s R e a l e s u s c o n s u m p t i o n -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -# -#

l i b r a r y( fpp )

d a t a (" u s c o n s u m p t i o n ")

par( mar =c(3,3,1,2) , mgp =c(1.6,.6,0));l a y o u t(r b i n d(c(1, 1) , c(2, 3)))

p l o t( u s c o n s u m p t i o n [ ,1] , y l a b = 'V a r i a c i ´o n p o r c e n t u a l del g a s t o', x l a b = 'A ~n o s', t y p e = 'o',col=4) # G r ´a f i c o s e r i e t e m p o r a l

acf ( u s c o n s u m p t i o n [ ,1] , x l a b = " R e z a g o ", m a i n = " ", lag .max = 2 0)# G r ´a f i c o ACF

p a c f ( u s c o n s u m p t i o n [ ,1] , x l a b = " R e z a g o ", m a i n = " ", lag .max = 2 0)# G r ´a f i c o P A C F

fit < - a u t o . a r i m a ( u s c o n s u m p t i o n [ ,1] , s e a s o n a l =F A L S E)

s u m m a r y( fit )

e a c f ( u s c o n s u m p t i o n [ ,1])