• No se han encontrado resultados

Análisis de series de tiempo y pronóstico

N/A
N/A
Protected

Academic year: 2021

Share "Análisis de series de tiempo y pronóstico"

Copied!
34
0
0

Texto completo

(1)

Análisis de series de tiempo y pronóstico

Víctor José Espinoza Hernández

Universidad Nacional Autónoma de Nicaragua, León

25 de octubre de 2018

(2)

Índice

1. Introducción 6 2. Método 6 3. Resultados 8 3.1. Análisis de la serie . . . 8 3.1.1. Análisis de la varianza . . . 8 3.1.2. Descomposición de la serie . . . 9

3.2. Modelo autorregresivo integrado de medias moviles (Arima) . 13 3.2.1. Análisis inicial de estacionariedad y estacionalidad . . 13

3.2.2. Identificación del proceso AR y MA . . . 18

3.2.3. Estimación del modelo . . . 20

3.2.4. Verificación del modelo . . . 21

3.2.5. Pronóstico . . . 24

3.2.6. Validación del pronóstico . . . 24

4. Comentarios 26

5. Referencias bibliográficas 27

6. Apéndices 28

A. Serie de tiempo utilizada 28

B. Funciones creadas para el estudio 29

(3)

Índice de figuras

1. Consumo trimestral real para Nicaragua, periodo 2006 al 2017 8

2. Comportamiento de la serie consumo por año . . . 9

3. Descomposición de la serie consumo . . . 11

4. Índices estacionales de la serie consumo . . . 12

5. Comportamiento de la serie consumo por trimestre . . . 12

6. Función de autocorrelación simple para la serie consumo . . . 14

7. Consumo trimestral real en Nicaragua en primeras diferencias regulares . . . 15

8. Función de autocorrelación simple para la serie consumo en primeras diferencias regulares . . . 16

9. Consumo trimestral en Nicaragua en primeras diferencias es-tacionales . . . 17

10. Consumo trimestral en Nicaragua en primeras diferencias es-tacionales y regulares . . . 18

11. Función de autocorrelación simple para la serie consumo en primeras diferencias regulares y estacionales . . . 19

12. Función de autocorrelación parcial para la serie consumo en primeras diferencias regulares y estacionales . . . 20

13. Histograma de los residuos del modelo Arima . . . 22

14. Círculos unitarios del modelo Arima . . . 22

15. Función de autocorrelacion simple para los residuos del modelo 23 16. Función de autocorrelacion parcial para los residuos del modelo 23 17. Pronóstico de la serie consumo trimestral real en Nicaragua para los siguientes 3 trimestres . . . 24 18. Serie consumo trimestral real en nicaragua observado y ajustado 25

(4)

Índice de cuadros

1. Comportamiento de la serie consumo por año . . . 10

2. Índices estacionales de la serie consumo . . . 11

3. Comportamiento de la serie consumo por trimestre . . . 13

4. Prueba de raíz unitaria para la serie consumo . . . 14

5. Prueba de raíz unitaria para la serie consumo en primeras diferencias regulares . . . 15

6. Prueba de raíz unitaria para la serie consumo en primeras diferencias estacionales . . . 17

7. Prueba de raíz unitaria para la serie consumo en primeras diferencias estacionales y regulares . . . 18

8. Modelo SARIMA (0, 1, 1)(0, 1, 1)4 propuesto para la serie con-sumo trimestral real en Nicaragua para el período 2006 a 2017 20 9. Significancia estadística de los coeficientes . . . 21

10. Prueba de normalidad de los residuos del modelo Arima . . . 21

11. Prueba de ruido blanco para los residuos del modelo Arima . . 24

12. Pronóstico de la serie consumo trimestral real en Nicaragua para los siguientes 3 trimestres . . . 25

13. Indicadores de error de pronóstico para el modelo Arima . . . 25 14. Consumo trimestral real en Nicaragua (millones de córdobas) 28

(5)

Resumen

Las series de tiempo son un tipo de variables que encontramos a lo largo de toda la ciencia económica y es necesario conocer su com-portamiento para llevar a cabo un correcto pronóstico de las mismas. El consumo es uno de los componentes del PIB y las políticas econó-micas orientadas a alterar los niveles de consumo en Nicaragua deben tomar en cuenta el comportamiento futuro de esta serie, con este ob-jetivo se utiliza el consumo real trimestral de Nicaragua en el periodo 2006(I)-2017(I) en millones de córdobas con año base 2006, la varian-za no es constante por lo que se utilivarian-za un modelo multiplicativo para la descomposición, la serie presenta tiene una tendencia positiva, los mayores indices estacionales se ubican en los últimos 2 trimestres del año, el valor medio del consumo es mayor en el cuarto trimestre con C$35,520 millones de córdobas constantes. La serie en niveles no es estacionario pero la serie en diferencias estacionales y regulares si es estacionaria. Las pruebas de función de autocorrelación simple y fun-ción de autocorrelafun-ción parcial demuestran que el proceso generador de datos del modelo SARIMA es (0, 1, 1)(0, 1, 1)4.Los Pronóstico de los siguientes 3 periodos son de C$42,566, C$44,501 y C$45,484 mi-llones de córdobas constante respectivamente.

Palabras clave: Serie de tiempo, SARIMA, Pronostico, Consumo, Nicaragua

(6)

1. Introducción

A lo largo del componente de política económica se desarrollan temas acerca de los instrumentos utilizados para el análisis de las políticas econó-micas, partiendo del análisis de la elaboración de la política hasta el efecto que tienen los retardos sobre la efectividad de las políticas desarrolladas. Se plantea la política monetaria a dos niveles como un método necesario para el correcto seguimiento de los efectos que tienen los instrumentos sobre los ob-jetivos últimos. Dentro de la política fiscal se detallan las distintas posturas que existen sobre el efecto del financiamiento del déficit público, además de tomar en cuenta los llamados déficit gemelos al introducir el análisis del sec-tor exterior. El componente finaliza con un análisis de las políticas de rentas y las políticas micro-económicas.

En el análisis de las políticas económicas debemos considerar el compor-tamiento de las variables que pretendemos utilizar como objetivo de nuestros instrumentos.

El pronóstico de estas variables permite: «...obtener resultados para an-ticipar posibles acontecimientos futuros desfavorables y mitigar la incerti-dumbre sobre las variables económicas exploradas. De igual manera permite ayudar a establecer políticas para regular el consumo y la producción en cualquier actividad y manejar sistemas de inversión y planificación macro-económica» (Rosales, Perdomo, Morales & Urrego, 2013).

Los modelos de series temporales “...son conocidos como modelos en forma reducida o no estructurales, ya que no han sido derivados de un modelo teó-rico económico o financiero. Estos modelos son de bastante uso en finanzas, porque usualmente las predicciones obtenidas con estos modelos son mejores que las obtenidas con los modelos estructurales” (Court & Rengifo, 2011)

2.

Método

Para la serie de tiempo analizada se lleva a cabo un análisis de la varianza y la tendencia con el uso de tablas y gráficas de polígonos de frecuencia y boxplot agrupados sugeridos por Véliz (2011).

(7)

Se utiliza el método Box-Jenkins, también conocido como ARIMA para pronosticar el valor de cada serie para los siguientes tres periodos. Con este objetivo se toman en cuenta los pasos planteados por Rosales et al. (2013) iniciando por el análisis inicial de la estacionariedad y componente estacional de la serie en estudio utilizando la prueba aumentada de Dickey-Fuller y la función de autocorrelación simple y parcial, a continuación se procede a la identificación del proceso AR y MA para detectar el proceso generador de datos con la ayuda de las gráficas de función de autocorrelación simple y parcial de la serie, con esta información se estima el modelo. Antes de llevar a cabo el pronóstico se determina si el modelo es adecuado a través de la verificación del mismo utilizando la prueba de normalidad de Jarque-Bera, el círculo unitario, la prueba de Ljung-Box y la función de autocorrelación simple y parcial para demostrar que los residuos son ruido blanco. Después de esta etapa es posible llevar a cabo el pronóstico y su validación a través de los indicadores de error de pronóstico.

(8)

3. Resultados

3.1.

Análisis de la serie

La serie que se desarrolla se obtiene a partir de los datos del Banco Cen-tral de Nicaragua (BCN), y representa el consumo total de Nicaragua en millones de córdobas en términos reales (año base 2006) para el periodo del primer trimestre del 2006 al primer trimestre del 2017(ver figura 1). La va-riable se denota a lo largo del documento con la letra «C»

30000 35000 40000 2006 2008 2010 2012 2014 2016 Time C

Figura 1: Consumo trimestral real para Nicaragua, periodo 2006 al 2017

3.1.1. Análisis de la varianza

Véliz (2011) sugiere que se identifique la varianza a través de una análisis de serie agrupado, utilizando el año en el que se encuentra el valor como factor de agrupación (ver cuadro 1), en el que podemos concluir que la media no es constante a lo largo de los años al igual que la varianza, esto últi-mo nos permite concluir que debeúlti-mos utilizar un últi-modelo multiplicativo (ver ecuación 1). El análisis gráfico sustentan esta afirmación (ver figura 2) en el que podemos observar como la mediana aumenta cada año. Es importante mantener al margen el valor del año 2017, ya que solo tenemos el valor del primer trimestre.

(9)

Y = Serie de tiempo

T = Componente tendencia S = Componente estacional I = Componente irregular

Todos estos aspectos son básicos para determinar si la serie es o no estacio-naria aunque más adelante se utilizarán las pruebas estadísticas apropiadas para llegar a declaraciones concluyentes.

30000 35000 40000 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Año Serie

Figura 2: Comportamiento de la serie consumo por año

3.1.2. Descomposición de la serie

Como primer paso para desarrollar el pronóstico de una serie de tiempo Véliz (2011) propone analizar el comportamiento de la serie de manera más detalla a través de la descomposición de la serie a través de medias móviles utilizando una función multiplicativa, lo cual nos permite conocer el compor-tamiento de esta variable de manera mas exacta (ver figura 3), se observa que la serie tiene una tendencia 1 positiva, es decir que a lo largo de los años

en estudio el consumo a aumentado. Para el componentes estacional de la serie se lleva a cabo el análisis de los indices estacionales.

Los indices estacionales calculados a partir de medias móviles nos mues-tran que el comportamiento de la serie en los primeros trimestres son menores

1Anderson, Sweeney y Williams (2012) también llaman a este componente como

(10)

Cuadro 1: Comportamiento de la serie consumo por año x

Year mean sd var max min

2006 28677 1223.3 1496396 30178 27442 2007 29795 1363.6 1859527 31159 28536 2008 30957 1076.9 1159780 31944 29702 2009 31486 1434.3 2057211 32723 29985 2010 32398 944.3 891782 33250 31526 2011 33296 1072.8 1150888 34802 32299 2012 34653 1779.0 3164764 36300 32739 2013 36063 1671.3 2793302 37524 34189 2014 37688 1382.3 1910631 39042 36365 2015 39731 1812.0 3283506 41696 37709 2016 42040 1419.9 2015984 43946 40751 2017 42338 N A N A 42338 42338

a la tendencia estimada, algo que no ocurre con los últimos trimestres del año (ver figura 4). Véliz (2011) propone interpretar los indices estacionales en base a la tendencia estimada. En consideración a esto se utiliza la interpre-tación para analizar el valor de los indices desarrollada por Anderson et al. (2012) y podemos concluir que: el consumo en el primer y segundo trimestre es 2 % y 3 % menor a la tendencia respectivamente. Mientras que en el tercer y cuarto trimestre el consumo aumenta en 3 % y 2 % respectivamente con respecto a la tendencia. Lind, Marchal y Wathen (2012) propone el análisis de estos indices en comparación a la media. Es decir que el valor del índice estacional del primer trimestre nos muestra que el consumo del primer tri-mestre es 2 % por debajo del promedio anual2.

Para analizar como se comporta esta serie por cada trimestre calculamos algunos estadísticos descriptivos de la serie (ver cuadro 3) utilizando el tri-mestre como factor de agrupación, método sugerido por Hanke y Wichern (2010), en los cuales podemos observar que el trimestre en el que se presenta mayor consumo es el cuarto con 35,520 millones de córdobas en términos reales, ademas de ser este trimestre aquel que presenta mayor variación con respecto a esta media (medido a través de la desviación estandar). También

(11)

data seasonal trend remainder 2006 2008 2010 2012 2014 2016 30000 35000 40000 0.98 0.99 1.00 1.01 1.02 32000 36000 40000 0.97 0.98 0.99 1.00 1.01 1.02 Time

Decomposition of multiplicative time series

Figura 3: Descomposición de la serie consumo Cuadro 2: Índices estacionales de la serie consumo

ts season figure diff

1 1 0.98 −0.02

2 2 0.97 −0.03

3 3 1.03 0.03

(12)

−0.02 −0.01 0.00 0.01 0.02 1 2 3 4 Periodo Indices estacionales − 1 multiplicative Figura 4: Índices estacionales de la serie consumo

es posible apreciar este comportamiento a través de la mediana (ver figura 5), aunque en este caso es el tercer trimestre el que presenta mayor consumo3

30000 35000 40000 1 2 3 4 Periodo Serie

Figura 5: Comportamiento de la serie consumo por trimestre

3Se recomienda al lector un análisis más exhaustivo a través de la asimetría y curtosis

(13)

Cuadro 3: Comportamiento de la serie consumo por trimestre x

Season mean sd max min

1 33812 4838 42338 27442

2 33204 4086 41201 27962

3 35250 4191 42263 29125

4 35520 4544 43946 30178

3.2. Modelo autorregresivo integrado de medias

movi-les (Arima)

3.2.1. Análisis inicial de estacionariedad y estacionalidad

Rosales et al. (2013) plantea que como primer paso se debe determi-nar si la serie es estaciodetermi-naria. Es posible utilizar la prueba de Kwiatkowski-Phillips-Schmidt-Shin (KPSS) cuya hipótesis nula es que la serie es estacio-naria (Hyndman & Athanasopoulos, 2014).

H0: La serie es estacionaria. el orden de integración es 0 (Yt∼ I(0)), no tiene raíz unitaria.

Aunque la prueba KPSS plantea una prueba de estacionariedad, la prue-ba aumentada de Dickey-Fuller (ADF) es la prueprue-ba mayormente utilizada y muy documentada por Gujarati (2010) y Rosales et al. (2013).La hipótesis nula es que la serie contiene raíces unitarias es decir no es estacionaria, la se-rie es de orden de integración 1, que se denota como: Yt ∼ I(1). Esta prueba nos permite plantear cual es el orden de integración del modelo Arima 4.

H0:La serie no es estacionaria. el orden de integración es 1 (Yt ∼ I(1)), tiene raíz unitaria.

Es importante señalar que todas las pruebas ADF aplicadas en este docu-mento son elaboradas sin intercepto y sin tendencia a menos que se establezca lo contrario y todas pruebas de hipótesis se comparan con un valor de signi-ficancia α = 0.05.

4Existe la prueba de Phillips Perron (PP) que planeta la misma hipótesis nula que la

(14)

Aplicamos la prueba ADF a la serie sin intercepto o tendencia a la serie de tiempo del consumo trimestral real (ver cuadro 4). Tomando en considera-ción el p-valor y comparando con un nivel de significancia podemos concluir que la serie no es estacional.

Cuadro 4: Prueba de raíz unitaria para la serie consumo ADF test

data: C

ADF(1) = 1.7362, p-value = 0.9784 alternative hypothesis: true delta is less than 0

sample estimates: delta 0.01091035

Además de la prueba ADF podemos desarrollar la gráfica de la función de autocorrelación simple para determinar si la serie es estacional (ver figu-ra 6). Podemos observar que el coeficiente de autocorrelación de los rezagos disminuye lentamente. −0.3 0.0 0.3 0.6 0.9 4 8 12 16 Lag A CF

Series: C

Figura 6: Función de autocorrelación simple para la serie consumo Para lograr que la serie se convierta en estacionaria se recomienda dife-renciar la serie, esto con el objetivo de eliminar la tendencia (Rosales et al.,

(15)

2013). Se lleva a cabo la diferencia regular de la serie (∆Y = Yt− Yt−1) La serie diferenciada (ver figura 7) no presenta ninguna tendencia y grá-ficamente parece tener media y varianza constante.

−2000 0 2000 2006 2008 2010 2012 2014 2016 Time dif f(C)

Figura 7: Consumo trimestral real en Nicaragua en primeras diferencias re-gulares

Las aseveraciones anteriores parecen ser correcta al compararlas con los resultados obtenidos con la prueba ADF aplicadas a las diferencias regulares de la serie (ver cuadro 5) en la cual el p valor es menor al nivel de significancia.

Cuadro 5: Prueba de raíz unitaria para la serie consumo en primeras diferen-cias regulares

ADF test data: diff(C)

ADF(1) = -9.1453, p-value < 2.2e-16 alternative hypothesis: true delta is less than 0

sample estimates: delta -1.704417

Para poder concluir si la serie es estacionara es necesario llevar a cabo el análisis de los coeficientes de la función de autocorrelación simple (acf) de la serie en estudio. En este caso podemos concluir que la serie en diferencias

(16)

regulares (ver figura 8) posee un componente estacional, debido a que los coeficientes en los rezagos estacionales5 (S) son significativos (Hanke &

Wi-chern, 2010). En este caso los coeficientes de los rezagos 4, 8, 12, 16, es decir la serie de consumo trimestral real es estacional. En este punto todavía no podemos concluir si la serie es estacionaria ya que debido a que la serie tiene un componente estacional, la prueba de raíz unitaria ADF aplicada ante-riormente no es correcta, ya que debemos eliminar el componente estacional antes de aplicar esta prueba (Rosales et al., 2013).

−0.4 0.0 0.4 4 8 12 16 Lag A CF

Series: diff(C)

Figura 8: Función de autocorrelación simple para la serie consumo en prime-ras diferencias regulares

Con el objetivo de eliminar el componente estacional de la serie, procede-mos a calcular la la serie con diferencias estacionales es decir: ∆S = Yt−Yt−S, en el caso del consumo real trimestral tendremos ∆4 = Ct−Ct−4. La serie con diferencias estacionales presenta una pequeña tendencia a lo largo del tiempo (ver figura 9). Lo cual se complementa con la prueba ADF (ver cuadro 6), con lo que podemos concluir que la serie con diferencias estacionales no es estacionaria.

Debido a que la serie aun contiene una tendencia debemos llevar a cabo la diferencia regular de la diferencia estacional, y llevar a cabo el procedimiento anterior. El análisis gráfico de esta nueva serie (ver figura 10) nos permite decir que la serie no posee tendencia de ningún tipo.

(17)

0 1000 2000 3000 2008 2010 2012 2014 2016 Time sdif fC

Figura 9: Consumo trimestral en Nicaragua en primeras diferencias estacio-nales

Cuadro 6: Prueba de raíz unitaria para la serie consumo en primeras diferen-cias estacionales

ADF test data: sdiffC

ADF(1) = -0.77984, p-value = 0.3719 alternative hypothesis: true delta is less than 0

sample estimates: delta -0.07013953

La prueba ADF (ver cuadro 7) nos permite concluir que la serie es estacio-nal. Aunque al diferenciar la serie de manera estacional y regular obtuvimos una serie estacional, Hyndman y Athanasopoulos (2014) recomienda que se utilice algún tipo de transformación Box-Cox en el caso que la varianza cam-bie da lo largo del tiempo6. En caso de ser necesaria la transformación

Box-Cox, se recomienda utilizar el logaritmo de la serie, que equivale a la función Box-Cox con λ = 0, es decir que tendríamos que representar la función de autocorrelación simple y parcial de la serie: ∆∆4C = ∆(log(C)t− log(C)t−4) para el caso en estudio.

6Gujarati (2010) plantea un ejemplo de transformación logaritmica de la serie PIB

trimestral de estados unidos, que equivale a una transformación Box-Cox con λ = 0 (lambda)

(18)

−2000 −1000 0 1000 2000 2008 2010 2012 2014 2016 Time dif fsdif fC

Figura 10: Consumo trimestral en Nicaragua en primeras diferencias estacio-nales y regulares

Cuadro 7: Prueba de raíz unitaria para la serie consumo en primeras diferen-cias estacionales y regulares

ADF test data: diffsdiffC

ADF(1) = -7.8215, p-value = 3.145e-13 alternative hypothesis: true delta is less than 0

sample estimates: delta -2.150443

Tomando en consideración la estructura del modelo Arima (p, d, q)(P, D, Q)s, hasta este momento conocemos de la necesidad de diferenciar de manera es-tacional (D) y regular la serie (d), cuya frecuencia(S) es trimestral, por lo que el modelo tiene hasta este punto la forma: Arima(p, 1, q)(P, 1, Q)4

3.2.2. Identificación del proceso AR y MA

Hyndman y Athanasopoulos (2014) proponen escribir un ARIMA(p,d,q) de la forma en que se muestra en la ecuación 2:

dYt= c + ϕ1∆dYt−1+ ... + ϕpdYt−p+ +θ1et−1+ θqet−q+ et (2) Mientras que para un modelo SARIMA(p, d, q)(P, D, Q)S nos muestra la

(19)

ecuación 3 como ejemplo a un modelo SARIMA (1, 1, 1)(1, 1, 1)4:

(1− ϕ1)(1− Φ1B4)(1− B)(1 − B4)Yt= (1 + θ1B)(1 + Θ1B4)et (3) Para llevar a cabo el modelo propuesto se utilizará la notación:

SARIMA(p, d, q)(P, D, Q)S. En donde:

p = orden del proceso autorregresivo regular

d = orden de integración regular (diferencia regular) q = orden del proceso de medias moviles regular P = orden del proceso autorregresivo estacional

D = orden de integración estacional (diferencia estacional) Q = orden del proceso de medias moviles estacional

−0.6 −0.4 −0.2 0.0 0.2 4 8 12 16 Lag A CF

Series: diffsdiffC

Figura 11: Función de autocorrelación simple para la serie consumo en pri-meras diferencias regulares y estacionales

A través de la función de autocorrelación simple (ver figura 11) y la función de autocorrelación parcial (ver figura 12) es posible identificar el proceso generador de datos (Rosales et al., 2013). Este es un proceso iterativo y por ello en el presente documento solo se muestran los detalles del modelo final escogido en el cual se aplica el principio de parsimonia.

«El principio de parsimonia se refiere a la preferencia por los modelos sencillos por encima de los modelos complejos» (Hanke & Wichern, 2010)

(20)

−0.6 −0.4 −0.2 0.0 0.2 4 8 12 16 Lag P A CF

Series: diffsdiffC

Figura 12: Función de autocorrelación parcial para la serie consumo en pri-meras diferencias regulares y estacionales

3.2.3. Estimación del modelo

El modelo SARIMA (0, 1, 1)(0, 1, 1)4 fue el mejor candidato para la serie

consumo trimestral real (ver cuadro 8), basados en el principio de parsimonia y el criterio de información de Akaike (AIC) más bajo7 para seleccionar el

mejor modelo (Hanke & Wichern, 2010)

Cuadro 8: Modelo SARIMA (0, 1, 1)(0, 1, 1)4 propuesto para la serie consumo

trimestral real en Nicaragua para el período 2006 a 2017 Model 1 ma1 −0.63 (0.12) sma1 −0.57 (0.18) AIC 639.40 AICc 640.06 BIC 644.46 Log Likelihood -316.70 ∗∗∗p < 0.001,∗∗p < 0.01,p < 0.05

(21)

3.2.4. Verificación del modelo

Rosales et al. (2013) proponen como uno de los pasos para la verificación del modelo, determinar si los coeficientes son estadísticamente distintos a cero, utilizando como Hipótesis nula: Ho = El coeficiente es igual a 0 (cero). Al llevar a cabo la prueba de significancia (ver cuadro 9) podemos concluir que se rechaza la hipótesis nula, los coeficientes en el modelo son distintos a cero (son estadísticamente significativos).

Cuadro 9: Significancia estadística de los coeficientes Model 1 ma1 −0.63∗∗∗ (0.12) sma1 −0.57∗∗ (0.18) ∗∗∗p < 0.001,∗∗p < 0.01,p < 0.05

Hanke y Wichern (2010) propone como primer paso para verificar la ido-neidad del modelo, una histograma (ver gráfica 13) y una prueba formal de normalidad. Para este último objetivo Rosales et al. (2013) sugiere utilizar la prueba de Jarque-Bera (ver cuadro 10) para demostrar que los residuos tienen una distribución normal con la hipotesis nula: H0 : La variable tiene

una distribución normal. Podemos comprobar que el modelo propuesto cum-ple con la condición de normalidad.

Rosales et al. (2013) propone que dentro de la verificación del modelo se desarrolle el análisis de las raíces inversas del proceso AR y MA, esto nos permite comprobar que la serie se estacionaria e invertible. Las raíces inversas del los procesos del modelo ARIMA(0, 1, 1)(0, 1, 1)4 utilizado para

la serie en estudio (ver figura 14) nos muestra que todas las raíces inversas se encuentran dentro del círculo unitario, por lo que el modelo es invertible,

Cuadro 10: Prueba de normalidad de los residuos del modelo Arima Jarque Bera Test

data: model$residuals

(22)

0.0 2.5 5.0 7.5 10.0 12.5 −2000 −1000 0 1000 2000 model$residuals count

Figura 13: Histograma de los residuos del modelo Arima

es decir no es explosivo (Court & Rengifo, 2011). Es debido aclarar que el modelo, al poseer solamente un proceso MA (y no contener el proceso AR), es estacionario y no se necesita demostrar esta última condición.

● ● ● ● ● −1.0 −0.5 0.0 0.5 1.0 −1.0 −0.5 0.0 0.5 1.0 Real Imaginary UnitCircle ● Within

Inverse MA roots

Figura 14: Círculos unitarios del modelo Arima

Hanke y Wichern (2010) nos plantea analizar las autocorrelaciones resi-duales en primer lugar de forma individual, advirtiendo que las aucorrelacio-nes de los residuos deben ser pequeñas y generalmente dentro del intervalo de confianza ±2√n (ver figura 15 y figura 16). Como podemos observar los

residuos no presentan problema de autocorrelación en el análisis individual. Para desarrollar el análisis residual como grupo (hipótesis conjunta), se

(23)

−0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 4 8 12 16 Lag A CF

Series: model$residuals

Figura 15: Función de autocorrelacion simple para los residuos del modelo

−0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 4 8 12 16 Lag P A CF

Series: model$residuals

Figura 16: Función de autocorrelacion parcial para los residuos del modelo debe aplicar la prueba de Ljung-Box (ver ecuación 4), con una distribución chi cuadrada con m-r grados de libertar, donde m es el número de retrasos que se evalúan y r es el número de parámetros estimados en el modelo (Hanke & Wichern, 2010). Q = n(n + 2) mk=1 r2k(e) n− k ∼ χ 2 m−r (4)

Al aplicar esta prueba se utiliza como hipótesis nula: H0 : Los residuos

son ruido blanco (ρ1 = ρ2 = ... = 0)8. Al aplicar el test de Ljung-Box para los

(24)

Cuadro 11: Prueba de ruido blanco para los residuos del modelo Arima Ljung-Box test

data: Residuals from ARIMA(0,1,1)(0,1,1)[4] Q* = 6.3743, df = 6, p-value = 0.3826

Model df: 2. Total lags used: 8

residuos del modelo Arima estimado (ver cuadro 11) podemos concluir que se acepta la hipótesis nula, por lo que el residuo se comporta como ruido blanco.

3.2.5. Pronóstico

Al terminar la etapa de diagnóstico del modelo procedemos a la etapa del pronóstico, para el segundo trimestre del año 2017 se pronostica que el valor del consumo real en Nicaragua llegará a C$ 42,566 millones de córdobas. Los valores pronosticados y sus intervalos de confianza son estimados al 95 % y 80 % (ver cuadro 12 y figura 17)

30000 35000 40000 45000 2007.5 2010.0 2012.5 2015.0 2017.5 Time C level 80 95

Forecasts from ARIMA(0,1,1)(0,1,1)[4]

Figura 17: Pronóstico de la serie consumo trimestral real en Nicaragua para los siguientes 3 trimestres

3.2.6. Validación del pronóstico

Rosales et al. (2013) plantean como último paso para la creación del mo-delo Arima, la validación del pronóstico a través del análisis de los errores.

(25)

Cuadro 12: Pronóstico de la serie consumo trimestral real en Nicaragua para los siguientes 3 trimestres

round Point Forecast Lo 80 Hi 80 Lo 95 Hi 95

2017 Q2 42566 41717 43414 41268 43864

2017 Q3 44501 43596 45405 43118 45883

2017 Q4 45484 44527 46440 44021 46946

Con este objetivo podemos utilizar varios indicadores del error del pronóstico

9. Para la serie utilizada podemos observar que los pronósticos en el modelo

Arima tienen un error de 1.38 % medido a través del error porcentual abso-luto medio (MAPE por sus siglas en ingles).

Cuadro 13: Indicadores de error de pronóstico para el modelo Arima

as.data.frame ME RMSE MAE MPE MAPE MASE ACF1

Training set 105.6 608.55 488.69 0.24 1.38 0.36 −0.18

Rosales et al. (2013) establecen la necesidad de graficar los valores obser-vados y los estimados para determinar si el modelo estima de manera correcta los valores de la serie.

30000 35000 40000 2007.5 2010.0 2012.5 2015.0 2017.5 tiempo serie tipo ajustado C

Figura 18: Serie consumo trimestral real en nicaragua observado y ajustado

(26)

4. Comentarios

La serie de tiempo de consumo trimestral en Nicaragua en terminos reales presenta un comportamiento estacional, por lo que aplicar un modelo Arima sin tomar en cuenta estas diferencias produce problemas con la prueba de raices unitarias, por lo que es necesario llevar a cabo las diferencias estacio-nales y regulares, el modelo SARIMA (0, 1, 1)(0, 1, 1)4 utilizado cumple con

todos los supuestos necesarios dentro de este tipo de modelo, es por lo tanto una herramienta util para pronóstico de la serie de tiempo en estudio. El consumo real en Nicaragua aumentará en los proximos trimestres con res-pecto al trimestre del año anterior, presenta por lo tanto tendencia positiva. Para la toma de decisiones de política económica es necesario considerar el efecto que podría provocar cambios en los instrumentos utilizados por las autoridades monetarias (cambio en el nivel de impuestos), que tienen efecto sobre la propensión marginal a consumir de los nicaraguenses.

(27)

5. Referencias bibliográficas

Referencias

Anderson, D. R., Sweeney, D. R. & Williams, T. A. (2012). Estadística para

negocios y economía (decimo primera). México: CENGAGE Learning.

Court, E. & Rengifo, E. W. (2011). Estadísticas y Econometría financiera (primera). Argentina: CENGAGE Learning.

Gujarati, D. N. (2010). Econometria (quinta). McGRAW-HILL.

Hanke, J. & Wichern, D. (2010). Pronósticos en los negocios (novena). Mé-xico: Pearson Educación.

Hyndman, R. & Athanasopoulos, G. (2014). Forecasting: principles and

prac-tice: OTexts. Recuperado desde https://books.google.com.ni/books?

id=gDuRBAAAQBAJ

Lind, D. A., Marchal, W. G. & Wathen, S. A. (2012). Estadística aplicada a

los negocios y la economía (decima quinta). México: McGraw-Hill.

Rosales, R. A., Perdomo, J. A., Morales, C. A. & Urrego, J. A. (2013).

Fun-damentos de Econometría intermedia, Teoría y aplicaciones. Colombia:

Uniandes.

Véliz, C. (2011). Estadística para la administración y los negocios (primera). México: Pearson Educación.

(28)

6. Apéndices

A.

Serie de tiempo utilizada

Cuadro 14: Consumo trimestral real en Nicaragua (millones de córdobas)

df year Qtr1 Qtr2 Qtr3 Qtr4 1 2006 27442.12 27961.73 29125.24 30177.58 2 2007 28711.40 28536.13 30773.84 31159.36 3 2008 29701.71 30421.89 31943.98 31758.93 4 2009 29985.33 30533.37 32703.83 32722.53 5 2010 31637.89 31525.88 33249.70 33180.05 6 2011 32298.92 32865.64 34801.75 33218.39 7 2012 33544.44 32739.41 36028.48 36299.71 8 2013 34188.61 35119.46 37420.14 37523.99 9 2014 36365.25 36635.85 38708.14 39042.44 10 2015 38784.87 37708.63 40732.11 41696.49 11 2016 40750.63 41201.22 42263.37 43945.79 12 2017 42337.60

(29)

B. Funciones creadas para el estudio

# ts_plot_season ts_plot_season <- function(x = x) { season <- cycle(x) season.factor <- factor(season) ggplot() +

geom_boxplot(mapping = aes(x = season.factor, y = x)) +

labs(x = "Periodo", y = "Serie") }

# ts_plot_year

ts_plot_year <- function(x = x) { t <- time(x)

year <- trunc.Date(x = t, units = "year") factor.year <- factor(year)

ggplot() +

geom_boxplot(mapping = aes(x = factor.year, y = x)) + labs(x = "Año", y = "Serie")

}

# ts_plot_figures

ts_plot_figures <- function(x = x, type = "m") { d <- decompose(x = x, type = type)

figure <- d$figure ggplot() +

geom_col(mapping = aes( x = 1:length(figure), y = figure - 1)) +

labs(x = "Periodo", y = "Indices estacionales - 1", caption = d$type) + scale_x_continuous(breaks = 1:length(d$figure)) } library(tables) #ts_table_season ts_table_season <- function(x) { tables::tabular(Heading("Season")*factor(cycle(x)) ~ x*(mean + sd + max + min))}

(30)

#ts_table_year

ts_table_year <- function(x) {

tables::tabular(Heading("Year")*factor(trunc(time(x))) ~ x*(mean + sd + var + max + min))} #ts_table_figures

ts_table_figures <- function(x = x, type = "m"){ d <- decompose(x,type)

data.frame(season = 1:length(d$figure),

figure = round(x = d$figure, digits = 2), diff = round(x = d$figure - 1, digits = 2))}

(31)

C.

Código utilizado para elaborar el estudio

df <- read.csv(file.choose())

C <- df$con_t_real

C <- ts(data = C, start = 2006, frequency = 4) C library(ggplot2) library(forecast) library(tseries) library(CADFtest) library(texreg)

autoplot(object = C) + theme_gray(base_family = "serif")

ggsave(filename = "C.pdf", device = "pdf",width = 4, height = 2)

autoplot(decompose(x = C, type = "m")) + theme_gray(base_family = "serif") ggsave(filename = "decompose.pdf", device = "pdf",width = 4, height = 5) ts_plot_figures(x = C, type = "m") + theme_gray(base_family = "serif") ggsave(filename = "figures.pdf", device = "pdf",width = 4, height = 2) ts_plot_season(x = C) + theme_gray(base_family = "serif")

ggsave(filename = "season.pdf", device = "pdf",width = 4, height = 2) ts_plot_year(x = C) + theme_gray(base_family = "serif")

ggsave(filename = "year.pdf", device = "pdf",width = 4, height = 2) ts_table_figures(x = C,type = "m") latex(ts_table_figures(x = C,type = "m")) ts_table_season(x = C) latex(ts_table_season(x = C)) ts_table_year(x = C) latex(ts_table_year(x = C)) library(CADFtest)

(32)

CADFtest::CADFtest(model = C, type = "none") ggAcf(C) + theme_gray(base_family = "serif")

ggsave(filename = "acfC.pdf", device = "pdf",width = 4, height = 2) # diferencia del C ####

autoplot(diff(C)) + theme_gray(base_family = "serif")

ggsave(filename = "diffC.pdf", device = "pdf",width = 4, height = 2) CADFtest::CADFtest(model = diff(C), type = "none")

ggAcf(diff(C)) + theme_gray(base_family = "serif")

ggsave(filename = "acfdiffC.pdf", device = "pdf",width = 4, height = 2)

sdiffC <- diff(x = C, lag = 4)

# diferencia estacional del C####

autoplot(sdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "sdiffC.pdf", device = "pdf",width = 4, height = 2) CADFtest::CADFtest(model = sdiffC, type = "none")

diffsdiffC <- diff(x = sdiffC, lag = 1)

autoplot(object = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "diffsdiffC.pdf", device = "pdf",width = 4, height = 2) CADFtest::CADFtest(model = diffsdiffC, type = "none")

ggAcf(x = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "acfdiffsdiffC.pdf", device = "pdf",width = 4, height = 2) ggPacf(x = diffsdiffC) + theme_gray(base_family = "serif")

ggsave(filename = "pacfdiffsdiffC.pdf", device = "pdf",width = 4, height = 2) # Modelo ####

(33)

model <- forecast::Arima(y = C, order = c(0,1,1),seasonal = c(0,1,1)) texreg(model)

library(lmtest)

texreg(coeftest(model))

autoplot(model) + theme_gray(base_family = "serif")

ggsave(filename = "modelur.pdf", device = "pdf",width = 4, height = 2)

ggAcf(x = model$residuals) + theme_gray(base_family = "serif")

ggsave(filename = "acfmodel.pdf", device = "pdf",width = 4, height = 2) ggPacf(x = model$residuals) + theme_gray(base_family = "serif")

ggsave(filename = "pacfmodel.pdf", device = "pdf",width = 4, height = 2) forecast::checkresiduals(model)

forecast::gghistogram(x = model$residuals,add.normal = T)

ggsave(filename = "normal.pdf", device = "pdf",width = 4, height = 2) tseries::jarque.bera.test(model$residuals)

forecast::forecast(object = model, h = 3)

latex(round(as.data.frame(forecast::forecast(object = model, h = 3)))) autoplot(forecast(object = model, h = 3))

ggsave(filename = "forecast.pdf", device = "pdf",width = 4, height = 2)

(34)

ajustado <- model$fitted serie <- c(C,ajustado)

tipo <- c(rep("C",length(C)),rep("ajustado",length(ajustado))) tiempo <- rep(time(C),2)

df.plot <- data.frame(tiempo,serie,tipo)

ggplot(data = df.plot) + geom_line(aes(x = tiempo,y = serie,color = tipo)) + theme_gray(base_family = "serif")

Referencias

Documento similar

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de