5. Estimaci´ on Restringida Basada en M´ etodos de Subespacios 88
6.1. Modelos Univariantes
6.1.1. Tr´ afico de Pasajeros de L´ıneas A´ ereas (Box y Jenkins, 1976) 102
La serie temporal de Tr´afico de Pasajeros de L´ıneas A´ereas (yt) ha sido em- pleada por Box y Jenkins (1976) para ilustrar la modelizaci´on de la estacionalidad.
En su an´alisis, ´estos y otros autores identifican una estructura IMA doble.
Partiendo de la transformaci´on Box-Cox (Box y Cox, 1964) de la serie original, zt = log(yt), el ejercicio se presenta de la siguiente manera: 1) se decide la trans- formaci´on estacionaria de la serie, 2) se identifican los ´ordenes de los subsistemas regular y estacional y 3) se estima y depura el modelo propuesto.
Al tratarse de una serie mensual y teniendo en cuenta el aspecto gr´afico de la serie (donde puede observarse una estacionalidad evidente), se lleva a cabo la transformaci´on de la serie zt que se propone en el apartado 3.1.1 del trabajo. Es decir:
S(B)zt=wt (6.1.1)
eliminando la parte m´as persistente de la estacionalidad de la serie y dondeS(B) = 1 +B+...+B11. De esta forma, es posible usar el algoritmo de detecci´on de ra´ıces unitarias e identificaci´on del orden regular sobre la serie wt. Al aplicar NID, se detecta al menos una ra´ız unitaria en la serie transformada, por lo que se repite la operaci´on sobre su primera diferencia, ∇wt. Los resultados se presentan en el Cuadro 6.1.1.
El criterio de detecci´on de ra´ıces unitarias encuentra tambi´en indicios de no estacionariedad en ∇wt, por lo que se introduce en NID, ∇2wt. Esta vez, el algo- ritmo no detecta se˜nales de no estacionariedad. La salida se expone en el Cuadro 6.1.2 que adem´as ofrece la identificaci´on del orden regular.
Cuadro 6.1.1: Salida del algoritmo NID aplicado a ∇wt Ra´ıces unitarias
1
Resultado de los diferentes criterios
n AIC SBC HQ SV CΩ2 NIDC χ2(95 %) 0 -6.13 -6.10 -6.12 10.74 10.74 - 1 -8.44 -8.38 -8.42 0.15 0.13 1.00 2 -8.41 -8.30 -8.37 0.22 0.17 0.85 3 -8.38 -8.23 -8.32 0.23 0.16 0.94
Orden regular estimado
1 1 1 1 1 1
Cuadro 6.1.2: Salida del algoritmo NID aplicado a ∇2wt Ra´ıces unitarias
0
Resultado de los diferentes criterios
n AIC SBC HQ SV CΩ2 NIDC χ2(95 %) 0 -8.29 -8.27 -8.28 0.24 0.24 - 1 -8.43 -8.36 -8.40 0.16 0.14 1.00 2 -8.40 -8.29 -8.36 0.21 0.17 0.93 3 -8.38 -8.22 -8.31 0.24 0.17 0.80
Orden regular estimado
1 1 1 1 1 1
Con la ayuda del Cuadro 6.1.2, se establece: i) la transformaci´on estacionaria de la serie, ∇2S(B)zt=∇∇12zt, y ii) la dimensi´on del subsistema regular, ˆnr= 1.
Para estimar el orden del subsistema estacional, introducimos la transformaci´on estacionaria previamente elegida, en el algoritmo de identificaci´on. Sin embargo, ahora se especifica tambi´en en NID la periodicidad de la serie, s= 12. El algorit- mo, que trabaja entonces con las matrices Block-Hankel Estacionales, devuelve el Cuadro 6.1.3. Con la informaci´on ofrecida, se decide iii) la dimensi´on del subsiste- ma estacional, ˆns = 1.
Cuadro 6.1.3: Salida del algoritmo NID (s= 12) aplicado a ∇∇12zt Resultado de los diferentes criterios
n AIC SBC HQ SV CΩ2 NIDC χ2(95 %) 0 -3.32 -3.30 -3.32 0.39 0.3 - 1 -3.57 -3.50 -3.58 0.11 0.09 0.99 2 -3.54 -3.43 -3.56 0.17 0.13 0.66 3 -3.51 -3.36 -3.53 0.24 0.17 0.66
Orden estacional estimado
1 1 1 1 1 1
A continuaci´on, se aplica el algoritmo de estimaci´on mediante subespacios a la serie transformada especificando los ´ordenes de los subsistemas regular y estacional previamente estimados. Como resultado, se obtiene el siguiente modelo equilibrado:
(1−.06
(.21)B)(1−.08
(.17)B12)∇∇12zt= (1−.43
(.21)B)(1−.58
(.16)B12)ˆa1t, σˆa1 = 3.68 % (6.1.2) donde entre par´entesis se ofrecen las desviaciones t´ıpicas de los par´ametros y donde ˆ
σa1 denota la desviaci´on t´ıpica porcentual del error.
Si se est´a interesado en depurar el modelo de par´ametros no significativos y obtener, sin un alto coste computacional, una estimaci´on final m´as precisa o buenas condiciones iniciales para una estimaci´on m´aximo-veros´ımil, es posible incorporar las restricciones sobre coeficientes en el algoritmo SUBEST2. El resultado de esta estimaci´on es el siguiente:
∇∇12zt = (1−.39B)(1−.52B12)ˆa2t, σˆa2 = 3.68 % (6.1.3) En cualquier caso, se precise o no esta segunda estimaci´on, es oportuno realizar una diagnosis de los residuos. En este ejemplo, los coeficientes estimados son muy pr´oximos y los resultados apenas var´ıan entre los modelos (6.1.2) y (6.1.3). Como ilustraci´on, se muestra la diagnosis de los errores de la segunda estimaci´on (6.1.3).
Para ello, se aplica NID tanto para s= 1 como para s= 12, comprobando que no existe estructura din´amica regular ni estacional en los residuos ˆa2t. Los Cuadros 6.1.4 y 6.1.5 reproducen el resultado ofrecido.
A la luz de los resultados, los residuos ˆa2t no presentan indicios de una mala especificaci´on ni en su parte regular, ni en su parte estacional. El criterio propuesto para la estimaci´on del orden del sistema,N IDC, es el ´unico criterio que sugiere la existencia de estructura en la parte regular. Esto no es muy sorprendente ya que
Cuadro 6.1.4: Salida del algoritmo NID aplicado a ˆa2t Ra´ıces unitarias
0
Resultado de los diferentes criterios
n AIC SBC HQ SV CΩ2 NIDC χ2(95 %) 0 -3.77 -3.74 -3.76 0.12 0.12 - 1 -3.76 -3.69 -3.73 0.14 0.12 0.64 2 -3.73 -3.62 -3.68 0.18 0.13 0.77 3 -3.71 -3.56 -3.65 0.23 0.17 0.57
Orden regular estimado
0 0 0 0 1 0
Cuadro 6.1.5: Salida del algoritmo NID (s= 12) aplicado a ˆa2t Resultado de los diferentes criterios
n AIC SBC HQ SV CΩ2 NIDC χ2(95 %) 0 -3.77 -3.74 -3.76 0.04 0.04 - 1 -3.74 -3.67 -3.71 0.11 0.09 0.71 2 -3.72 -3.61 -3.68 0.16 0.12 0.34 3 -3.69 -3.54 -3.63 0.23 0.17 0.24
Orden estacional estimado
0 0 0 0 0 0
sobreestima ligeramente en muestras relativamente cortas (ver Cap´ıtulo 4). Como puede observarse, el modelo estimado corresponde con la estructura identificada por Box y Jenkins (1976). La estimaci´on por MVE, a partir de las condiciones iniciales del segundo modelo, resulta
∇∇12zt= (1− .40
(.08)
B)(1− .56
(.08)
B12)ˆat, σˆa= 3.67 % (6.1.4) Consecuentemente, del an´alisis de este caso puede concluirse que el criterio de discriminaci´on de ra´ıces unitarias ha conducido a una decisi´on correcta sobre la transformaci´on estacionaria de la serie. Adem´as, el proceso de identificaci´on de la serie revela la existencia de una representaci´on ARMA multiplicativa acorde con la literatura. Resulta relevante comentar la proximidad entre los coeficientes estimados por los dos algoritmos de subespacios y los m´aximo veros´ımiles. Aunque en sistemas univariantes la metodolog´ıa propuesta no ofrece tantas ventajas como
en el an´alisis de series m´ultiples, cabe resaltar la simplicidad para automatizar los pasos desarrollados en este apartado. Esto permite llevar a cabo el seguimiento masivo de procesos univariantes a un bajo coste computacional y de esfuerzo del analista.
6.1.2. Identificaci´ on semi-autom´ atica de modelos para se- ries temporales reales y simuladas
En este segundo apartado se muestran los resultados intermedios y finales de la utilizaci´on de la metodolog´ıa propuesta, usando nueve series temporales habitual- mente modelizadas en la literatura. En el Cuadro 6.1.6, se describen brevemente las series analizadas, mientras que en los Cuadros 6.1.7, 6.1.8 y 6.1.9 se presentan los resultados de estimaci´on obtenidos.
En primer lugar, en todos los procesos estudiados, ya sean o no estaciona- les, se detecta correctamente la transformaci´on estacionaria con el procedimiento propuesto. En cuanto al orden del sistema, en la mayor´ıa de las series sin estacio- nalidad, su estimaci´on coincide en los seis criterios usados, con el encontrado en el an´alisis gr´afico de la metodolog´ıa de Box y Jenkins (1976). Esto no ocurre en la serie D, donde el criterioSBC de Schwartz (1978) sugiere un orden del proceso igual a 1, mientras que el resto encuentra ˆn = 2 lo que coincide con el orden de din´amica de la serie simulada. Este resultado es consistente con el comportamiento mostrado por el criterio SBC en las simulaciones del Cap´ıtulo 4, donde el criterio infraestima claramente con el modelo AR(2) con ra´ıces imaginarias escogido. En las series que presentan estacionalidad (series B, G y H) se siguen los pasos especi- ficados en el apartado 4.1.2. En B, todos los criterios y el contraste indican ˆns= 1 y ˆnr= 1 al igual que en la literatura. En cambio, al aplicar NID a la serie G no se encuentra, en un primer momento, estructura estacional (tan s´olo el criterio AIC de Akaike (1976) y el testχ2de Tiao y Tsay (1989) muestran ˆns = 1). Sin embargo, todos coinciden en que la din´amica regular es ˆnr = 1. Una vez introducida la parte regular del modelo, el an´alisis de residuos se˜nala la existencia de din´amica estacio- nal: todos los criterios indican ˆns = 1 sobre los residuos. Con lo que se identifica el mismo modelo que el que propone la literatura. Finalmente, el an´alisis de la serie H genera ˆns= 1 para todos los criterios utilizados y ˆnr= 0 para AIC,SBC, HQ (Hannan y Quinn, 1979) y el test χ2 (tanto SV CΩ2 como N IDC sobreesti- man, mostrando ˆnr= 2) que coincide con el an´alisis manual realizado por el autor.
La ´unica diferencia significativa entre la estimaci´on final a partir de la especi- ficaci´on semi-autom´atica y la de la literatura se presenta en la serie H. Obs´ervese que el modelo estimado por SUBEST2 y el que propone Wei (1990) son iguales,
con ciertas diferencias en el valor de los par´ametros. Sin embargo, al estimar es- te modelo por MVE, el componente MA estacional converge a la unidad. Esto ocurre porque la serie presenta una estacionalidad determinista que podr´ıa tam- bi´en modelizarse en niveles con un par´ametro estacional para cada trimestre. Los residuos del modelo no presentan indicios de mala especificaci´on, al ser los valores del estad´ıstico Q de autocorrelaci´on residual, Q(10) = 9.6 en el modelo estimado por MVE y Q(10) = 9.9 el valor proporcionado por el autor. Adem´as, el valor de la funci´on de verosimilitud en el ´optimo es inferior al del modelo estimado que propone Wei (1990) (lM V E = 47.4 por lW ei = 48.0), por lo que se concluye que el modelo estimado en este trabajo representa adecuadamente los datos.
Los resultados expuestos en las Cuadros 6.1.7, 6.1.8 y 6.1.9 detallan los pasos realizados con la metodolog´ıa de identificaci´on de series temporales propuesta. Es- ta es extremadamente flexible, pues permite finalizar el an´alisis con modelos m´as o menos precisos dependiendo del uso de los mismos. Obs´ervese que a˜nadiendo un bajo coste de esfuerzo del analista y avanzando en la metodolog´ıa, se obtienen modelos muy similares a los propuestos por los autores. Sin embargo, los modelos de los Cuadros 6.1.7 o 6.1.8 pueden ser adecuados, por ejemplo, para prever.
Como se ha demostrado, los resultados obtenidos y la ganancia en tiempo/esfuerzo humano y computacional, son relevantes en el caso univariante, no obstante la aportaci´on metodol´ogica resulta m´as atractiva cuanto mayor es la dimensi´on del sistema y m´as compleja su modelizaci´on.
Cuadro6.1.6:SeriestemporalesutilizadasenlosCuadros6.1.7,6.1.8y6.1.9 SerieTDescripci´on A45Burr(1976):PromedioDiariodeDefectosenlaFabricaci´ondeCamiones B? 150Wei(1990):SerieTrimestralSimulada C35Wei(1990):Desempleadasentre16-19a˜nosporMes,enEEUU;Enero1961-Diciembre1985 D? 200Wold(1964):SerieSimuladano 2; E226BoxyJenkins(1976):SerieC-TemperaturadeunProcesoQu´ımico,medidacadaminuto F197BoxyJenkins(1976):SerieA-Concentraci´ondeunProcesoQu´ımico,medidacada2horas G178O’Donovan(1983):N´umeroMensualdeEmpleadosenlaProducci´ondeAlimentosenel EstadodeWisconsin,Enero1961-Octubre1975 H32Wei(1990):Producci´onTrimestraldeCervezaenEEUU;ITrim.1975-IVTrim.1982 I? 36Makridakisetal.(1983):SerieSimulada ? Lastresseriessonsimuladas.Sinembargo,enlosCuadros6.1.7,6.1.8y6.1.9,lasseriesByCpresentanlosprocesos generadoresdelosdatos,mientrasquelaserieIofrecelaespecificaci´onyestimaci´ondelautor.
Cuadro6.1.7:ModelosUnivariantes.Resumendelaidentificaci´onsemi-autom´aticademodelosparaseriesrealesy simuladas(1).Entrepar´entesissepresentanlasdesviacionest´ıpicasdelospar´ametrosyˆσ2 aeslavarianzaresidual estimada.NIDidentificalatransformaci´onestacionariaylos´ordenesdedin´amicaregularyestacional.SUBEST1 estimamediantesubespacioselmodeloidentificadoporNID. SerieTEspecificaci´onyestimaci´onenlaliteraturaNID+SUBEST1 A45(1−.43 (.13)B)(Zt−1.79 (.07))=at(1−.61 (.30)B)(Zt−3.94 (.13))=(1−.24 (.31)B)at ˆσ2 a=.21ˆσ2 a=.21 B150∇∇4Zt=(1−.80B)(1−.60B4)at(1+.22 (.13)B)(1+.21 (.13)B4)∇∇4Zt=(1−.56 (.13)B)(1−.49 (.12)B4)at ˆσ2 a=1.00ˆσ2 a=.97 C35∇Zt=(1−.51B (.05))at(1−.00B (.11))∇Zt=(1−.51B (.11))at ˆσ2 a=1397.27ˆσ2 a=1380.35 D200(1−.70B+.49B2 )Zt=at(1−.84 (.11)B+.51 (.10)B2 )Zt=(1−.16 (.11)B+.05 (.11)B2 )at ˆσ2 a=.60ˆσ2 a=.66 E226(1−.82 (.04)B)∇Zt=at(1−.82 (.06)B)∇Zt=(1−.02 (.08)B)at ˆσ2 a=.02ˆσ2 a=.02 F197(1−.92 (.04)B)Zt=1.45+(1−.58 (.08)B)at(1−.88 (.09)B)Zt=2.08 (.02)+(1−.50 (.10)B)at ˆσ2 a=.10ˆσ2 a=.10 G178(1−.79 (.05)B)∇12Zt=(1−.76 (.05)B12)at(1−.56 (.10)B)(1−.05 (.18)B12)∇12Zt=−2.11 (.10)+(1−.18 (.11)B)(1−.35 (.17)B12)at ˆσ2 a=1.24ˆσ2 a=1.54 H32∇4Zt=1.49 (.09)+(1−.87 (.16)B4)at(1−.14 (.26)B4)∇4Zt=1.21 (.30)+(1−.71 (.23)B4)at ˆσ2 a=2.39ˆσ2 a=2.03 I36Zt=51.03 (4.84)+atZt=47.31 (4.77)+at ˆσ2 a=818.81ˆσ2 a=790.54
Cuadro6.1.8:ModelosUnivariantes.Resumendelaidentificaci´onsemi-autom´aticademodelosparaseriesrealesy simuladas(2).ˆσ2 aeslavarianzaresidualestimada.Semuestranlosresultadosdelaestimaci´onmedianteSUBEST2 eliminandolospar´ametrosnosignificativosdelosmodelosdelCuadro6.1.7.Noseofrecendesviacionest´ıpicasde lasestimacionesyaque,enestecaso,seutilizaSUBEST2´unicamenteparaobtenercondicionesinicialesynocomo estimaci´onfinal(aunqueestotambi´enesposible). SerieTEspecificaci´onyestimaci´onenlaliteraturaNID+SUBEST1+SUBEST2 A45(1−.43 (.13)B)(Zt−1.79 (.07))=at(1−.35B)(Zt−1.87)=at ˆσ2 a=.21ˆσ2 a=.21 B150∇∇4Zt=(1−.80B)(1−.60B4)at∇∇4Zt=(1−.74B)(1−.66B4)at ˆσ2 a=1.00ˆσ2 a=.88 C35∇Zt=(1−.51B (.05))+at∇Zt=(1−.50B)+at ˆσ2 a=1397.27ˆσ2 a=1393.54 D200(1−.70B+.49B2)Zt=at(1−.71B+.42B2)Zt=at ˆσ2 a=.60ˆσ2 a=.66 E226(1−.82 (.04)B)∇Zt=at(1−.81B)∇Zt=at ˆσ2 a=.02ˆσ2 a=.02 F197(1−.92 (.04)B)Zt=1.45+(1−.58 (.08)B)at(1−.88B)Zt=2.07+(1−.51B)at ˆσ2 a=.10ˆσ2 a=.10 G178(1−.79 (.05)B)∇12Zt=(1−.76 (.05)B12 )at(1−.68B)∇12Zt=.07+(1−.56B12 )at ˆσ2 a=1.24ˆσ2 a=1.37 H32∇4Zt=1.49 (.09)+(1−.87 (.16)B4)at∇4Zt=1.36+(1−.59B4)at ˆσ2 a=2.39ˆσ2 a=2.15 I36Zt=51.03 (4.84)+atZt=51.03+at ˆσ2 a=818.81ˆσ2 a=796.68
Cuadro6.1.9:ModelosUnivariantes.Resumendelaidentificaci´onsemi-autom´aticademodelosparaseriesrealesy simuladas(3).Entrepar´entesissepresentanlasdesviacionest´ıpicasdelospar´ametrosyˆσ2 aeslavarianzaresidual estimada.Seofrecelaestimaci´onfinalmedianteM´aximaVerosimilitudExacta(MVE)apartirdelamodelizaci´on propuesta. SerieTEspecificaci´onyestimaci´onenlaliteraturaNID+SUBEST1+SUBEST2+MVE A45(1−.43 (.13)B)(Zt−1.79 (.07))=at(1−.42 (.15)B)(Zt−1.81 (.07))=at ˆσ2 a=.21ˆσ2 a=.21 B150∇∇4Zt=(1−.80B)(1−.60B4)at∇∇4Zt=(1−.75 (.06)B)(1−.63 (.07)B4)at ˆσ2 a=1.00ˆσ2 a=.91 C35∇Zt=(1−.51B (.05))at∇Zt=(1−.51B (.05))at ˆσ2 a=1397.27ˆσ2 a=1393.12 D200(1−.70B+.49B2 )Zt=at(1−.72 (.06)B+.41 (.06)B2 )Zt=at ˆσ2 a=.60ˆσ2 a=.66 E226(1−.82 (.04)B)∇Zt=at(1−.82 (.04)B)∇Zt=at ˆσ2 a=.02ˆσ2 a=.02 F197(1−.92 (.04)B)Zt=1.45+(1−.58 (.08)B)at(1−.92 (.04)B)Zt=1.45 (.67)+(1−.60 (.08)B)at ˆσ2 a=.10ˆσ2 a=.10 G178(1−.79 (.05)B)∇12Zt=(1−.76 (.05)B12)at(1−.77 (.05)B)∇12Zt=(1−.61 (.07)B12)at ˆσ2 a=1.24ˆσ2 a=1.31 H32∇4Zt=1.49 (.09)+(1−.87 (.16)B4)at∇4Zt=1.55 (.13)+∇4at ˆσ2 a=2.39ˆσ2 a=1.64 I36Zt=51.03 (4.84)+atZt=51.03 (4.84)+at ˆσ2 a=818.81ˆσ2 a=818.86