Una estrategia de pronóstico para el PIB

Texto completo

(1)CENTRO DE INVESTIGACIÓN Y DOCENCIA ECONÓMICAS, A.C.. UNA ESTRATEGIA DE PRONÓSTICO PARA EL PIB. TESINA. QUE PARA OBTENER EL TÍTULO DE. LICENCIADO EN POLÍTICAS PÚBLICAS. PRESENTA. JOSÉ SANTIAGO CASTILLO VARGAS. DIRECTOR DE LA TESINA: DRA. DANIELA MOCTEZUMA Y DR. DANIEL VENTOSA. AGUASCALIENTES, AGS.. SEPTIEMBRE, 2017.

(2) Para Doña Lucia Bravo Pulido y Don José Santiago Castillo Peña..

(3) Resumen En este trabajo se presenta una comparación de pronósticos del PIB con Modelos Autoregresivos de Media Móviles (ARMA) y Métodos de aprendizaje computacional. Para el pronóstico del PIB se propone una estrategia: realizar una trasformación Box-Cox de los datos, una desestacionalización con filtro X-12 ARIMA, pruebas de raíz unitaria y quiebre estructural. La estrategia de pronóstico presentada en esta tesina mejora los modelos ARMA y proporciona el mejor pronóstico para el PIB. Sin embargo, no mejora los pronósticos de los modelos SVR. Palabras clave: Modelos Autoregresivos de Media Móviles, Máquinas de Soporte Vectorial, filtro X-12, transformación Box-Cox, Pruebas de raíz unitaria, Quiebre estructural. Clasificación JEL:C52.

(4) Contenido. 1. Introducción. 1. 2. Revisión de Literatura. 4. 2.1. Teorías sobre la estabilización . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 2.2. Teorías alternativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.3. Competencias de pronósticos y funciones de perdida . . . . . . . . . . . . . .. 6. 3. El caso mexicano. 8. 3.1. Importancia de las proyecciones en México . . . . . . . . . . . . . . . . . . .. 8. 3.2. Características de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 3.3. Variables habituales en los modelos predictivos del PIB . . . . . . . . . . . . .. 9. 3.4. Estimación a la mexicana . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 4. Los datos. 12. 5. Metodología. 17. 5.1. Transformación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17. 5.2. Desestacionalidad de las series . . . . . . . . . . . . . . . . . . . . . . . . . .. 19. 5.3. Estimación del quiebre estructural . . . . . . . . . . . . . . . . . . . . . . . .. 20. 5.4. Pruebas de estacionariedad . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 5.5. Estimación del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 5.5.1. 22. Modelos Autoregresivos con Medias Móviles . . . . . . . . . . . . . . i.

(5) 5.5.2 6. Support Vector Regression (SVR) y Kernel Ridge Regression (KRR) .. 23. Resultados. 25. 6.1. Modelos Autoregresivos con Medias Móviles . . . . . . . . . . . . . . . . . .. 25. 6.1.1. Aproximación con modelos ARMA . . . . . . . . . . . . . . . . . . .. 26. 6.1.2. Aproximación con modelos ARMAX . . . . . . . . . . . . . . . . . .. 27. 6.1.3. Aproximación con modelos que utilizan la trasformación Box-Cox, el. 6.2. 6.3. filtro X − 12 y el ajuste de quiebre estructural de Bai y Perron . . . . .. 27. Métodos de aprendizaje computacional . . . . . . . . . . . . . . . . . . . . . .. 29. 6.2.1. Aproximación con SVR radiales . . . . . . . . . . . . . . . . . . . . .. 29. 6.2.2. Aproximación con modelos KRR . . . . . . . . . . . . . . . . . . . .. 31. Comparación de pronósticos intramuestrales y extramuestrales . . . . . . . . .. 33. 7. Implicaciones de Política Pública. 40. 8. Conclusiones. 42. Referencias. 44. ii.

(6) Lista de figuras 4.1. Gráficas temporales del PIB-IGAE . . . . . . . . . . . . . . . . . . . . . . . .. 14. 4.2. Gráficas temporales del PIB-INPC subyacente . . . . . . . . . . . . . . . . . .. 14. 4.3. Gráficas temporales del PIB-IPC . . . . . . . . . . . . . . . . . . . . . . . . .. 15. 4.4. Gráficas de las primeras diferencias del PIB-Precio del petróleo . . . . . . . . .. 16. 4.5. Gráficas de las primeras diferencias del PIB-Tipo de cambio . . . . . . . . . .. 16. 5.1. Optimización de la trasformación Box-Cox . . . . . . . . . . . . . . . . . . .. 18. 5.2. Filtro X-12 ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 5.3. Quiebre estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 5.4. Muestreo y trasformación de los datos de los métodos de aprendizaje computacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23. 5.5. Support Vector Regression y Kernel Ridge Regression . . . . . . . . . . . . .. 24. 6.1. Estimación intramuestral del PIB . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 6.2. Curva de aprendizaje de los modelos que usan datos originales . . . . . . . . .. 30. 6.3. Curva de aprendizaje de los modelos que usan datos tratados . . . . . . . . . .. 30. 6.4. Curva de aprendizaje de los modelos que usan primeras diferencias . . . . . . .. 31. 6.5. Curva de aprendizaje de los mejores tres modelos . . . . . . . . . . . . . . . .. 32. 6.6. Estimación intramuestral del PIB con modelos KRR . . . . . . . . . . . . . . .. 32. 6.7. Pronóstico ARMAX intra y extra-muestral . . . . . . . . . . . . . . . . . . . .. 33. 6.8. PIB original con respecto al pronóstico intramuestral de KRR . . . . . . . . . .. 34. 6.9. PIB con respecto al pronóstico intramuestral ARMAX con datos tratados . . .. 35. iii.

(7) 6.10 Pronóstico ARMAX extramuestral . . . . . . . . . . . . . . . . . . . . . . . .. 36. 6.11 Pronóstico KRR extramuestral . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 6.12 PIB con respecto al pronóstico extramuestral ARMAX con datos tratados . . .. 37. 6.13 PIB con respecto al pronóstico extramuestral KRR con datos originales . . . .. 38. iv.

(8) Lista de tablas 4.1. Resumen de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 13. 6.1. Resumen de modelos ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 6.2. Resumen de modelos ARMAX . . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 6.3. Modelo ARMAX con tratamiento de cambio estructural . . . . . . . . . . . . .. 28. 6.4. Ajuste Mínimo Cuadrático de los pronósticos intramuestrales. . . . . . . . . .. 35. 6.5. Ajuste Mínimo Cuadrático de los pronósticos extramuestrales . . . . . . . . .. 38. v.

(9) Capítulo 1 Introducción Las predicciones del comportamiento del PIB o Ingreso Nacional 1 se han realizado con modelos comúnmente utilizados en macroeconomía, Elguézabal (2004b). Estos modelos se centran en la relación causal de Ingreso-Gasto sin tomar en cuenta los cambios estructurales del comportamiento del PIB, Singh y Sahni (1984). De tal forma, las predicciones sobre el PIB tienen que modificarse constantemente. Por citar un ejemplo, considerando la previsión del Banco de México (Banxico) del 19 de noviembre de 2014 hasta el primer trimestre del 2017, ya se han realizado cuatro ajustes. El pronóstico original consideraba un rango de crecimiento de 3.2 a 4.2 por ciento. Durante el año 2015 se realizaron los primeros dos ajustes: el primero fue el 18 de febrero donde el rango de crecimiento disminuyo quedando en 2.9 a 3.9 por ciento y el segundo se realizó el 19 de mayo quedando en 2.5 a 3.5 por ciento. Durante el 2016 se realizó una modificación el 3 de marzo, el nuevo ajuste dejo el pronóstico de crecimiento en 2 a 3 puntos porcentuales. Por último, el primero de marzo del 2017 Banxico redujo su expectativa de crecimiento a un rango de 1.3 a 2.3 por ciento, Capistrán y López-Moctezuma (2010). Los estudios sobre la estimación del ingreso nacional muestran diversas estrategias respecto a la forma de predicción. Para fines prácticos de esta tesis, estos estudios son clasificados en dos categorías: i) las teorías que intentan estabilizar los movimientos estocásticos y ii) las teorías 1. Sin distinción para efectos de esta tesina. 1.

(10) que proveen alternativas al modelo de los movimientos estocásticos. En la primera categoría se encuentran los modelos de estimación que se concentran en la reducción de incertidumbre provocada por el quiebre estructural y raíz unitaria. En la segunda categoría se encuentran los modelos que parten de la estandarización del error estocástico para aumentar la capacidad predictiva. Mejor dicho, los modelos que transforman los datos en múltiples dimensiones con el objetivo de encontrar una solución global que minimice el error en la predicción. El objetivo de esta tesina es evaluar los modelos de predicción del PIB a través de las nuevas aportaciones en macro-econometría y aprendizaje computacional sobre el estudio del comportamiento estocástico. La pregunta que guía esta tesis es ¿la estandarización del error estocástico mejorará la predicción del PIB? Para responder a la pregunta anterior se realiza una comparación de dos tipos de modelos: 1) los modelos que se concentran en el tratamiento de quiebre estructural y raíz unitaria y 2) los modelos que estandarizan el error estocástico a través de la trasformación de los datos en hiperplanos. En concreto, se modelará el comportamiento del PIB de México con datos comprendidos de 1994 hasta 2016. Para esto, se utilizan tres modelos de series de tiempo y dos modelos de máquinas de soporte vectorial (SVM por sus siglas en ingles) para predecir el comportamiento del PIB. Posteriormente se utilizan funciones de pérdida para evaluar la capacidad predictiva de los modelos. Este trabajo es relevante en el ámbito público y privado. En lo que concierne a la relevancia del sector público destacan tres ejemplos: primero, el presupuesto de egresos de la federación, segundo, la ley de ingresos y tercero, la oferta de dinero del Banxico. Primero, los pronósticos son relevantes en la Ley de Ingresos de la Federación porque mediante la diferencia entre la estimación del PIB y el presupuesto de Egresos aprobado por la Cámara de Diputados se determina el monto de deuda pública, Amparán y Palacio (2003). Tener estimaciones más precisas permitirá reducir los costos financieros sobre la deuda. Según la SHCP en Hernández Veleros (2011), el costo financiero por un sobreendeudamiento constituye hasta un 0.9 porciento del PIB (aproximadamente 120 mil millones de pesos). Segundo, los pronósticos son relevantes para el presupuesto de Egresos principalmente por. 2.

(11) dos razones. Por un lado, los pronósticos del PIB ayudan a realizar escenarios sobre las principales variables macroeconómicas del año siguiente como la inflación, la tasa de interés, el crecimiento económico y el precio del petróleo, Elguézabal (2004b). Por otro lado, se realiza una jerarquía de las políticas públicas y el mondo a designar con base en las estimaciones del PIB. Inclusive, pronósticos del PIB son utilizados para ajustar el monto correspondiente a los programas y proyectos vigentes, de La Federación y del presupuesto de las asignaciones (2015). Tercero, mejorar las predicciones del PIB tiene implicaciones en la evaluación de reformas estructurales en materia económica y en la efectividad de las políticas públicas. Mas específicamente, la capacidad de predecir el PIB tiene implicaciones directas en política monetaria, Gutiérrez Lara (2015). Las variaciones en el PIB determinan la oferta de dinero en la economía. Por lo tanto, una predicción más precisa sobre las variaciones del PIB podría aumentar la efectividad de la política monetaria, y consecuentemente, ayudar a mantener un mejor control sobre la estabilidad económica del país. Los resultados de este trabajo son dos: 1) la estrategia de pronóstico que se propone en esta tesis mejora las estimaciones de los modelos autoregresivos de medias móviles y 2) los modelos que utilizan la estandarización del error estocástico, SVR, funcionan mejor con la variación entre las observaciones. Esta tesina se divide en seis secciones: la primera sección es una introducción al problema; la segunda sección realiza una revisión de la literatura sobre los modelos para predecir el ingreso nacional; en la tercera sección se describen los modelos utilizados en México; la cuarta sección explica las variables utilizadas; en la quinta sección se describe la metodología de predicción utilizada; en la sexta sección se evalúan los modelos utilizados para la predicción del PIB; en la séptima y octava sección se describen las implicaciones sobre política pública y conclusiones, respectivamente.. 3.

(12) Capítulo 2 Revisión de Literatura Los estudios sobre la estimación de series de tiempo son muy diversos respecto a la forma de predecir. En esta tesis, los estudios que proponen distintas formas de estimación son clasificados en dos grandes categorías: i) las teorías que intentan estabilizar los movimientos estocásticos, y ii) las teorías que proveen alternativas al modelo de los movimientos estocásticos.. 2.1. Teorías sobre la estabilización. Las teorías que estabilizan los movimientos estocásticos primordialmente están documentadas en los estudios de Singh y Sahni (1984), Enders (2004) y Hamilton (1994). En estos estudios, los modelos de estimación se concentran en la reducción de incertidumbre provocada por el quiebre estructural y la raíz unitaria, conocen los cambios estructurales y analizan las raíces de la serie. En concreto, las estimaciones de los modelos resuelven problemas como estacionariedad y ergodicidad de la serie, Box y Jenkins (1976). No obstante, es difícil modelar cuando la serie tiene combinaciones de cambios estructurales. El problema de estos modelos es que la capacidad predictiva se limita a un periodo de tiempo limitado, Cowpertwait y Metcalfe (2009). Además, la modelación de la volatilidad ocasiona sesgos en las predicciones o aumenta el intervalo de confianza, Sargan y Bhargava (1983). En suma, los modelos utilizados en esta categoría suelen 4.

(13) tener deficiencias con los cambios estructurales de las series de tiempo.. 2.2. Teorías alternativas. Entre las teorías que proveen alternativas al modelo de movimientos estocásticos, principalmente, se encuentran los estudios que matematizan la parte estocástica de los modelos y los modelos que aumentan la dimensión de los datos en búsqueda de una solución global que minimice el error. Por un lado, los estudios de Revuz y Yor (1999) y Kleinert (2004) proponen la matematización del error estocástico para reducir la parte estocástica de los modelos. En otras palabras, buscan una función matemática como unidad de medida de los errores estocásticos. Este tipo de modelos se concentra en la series con alta volatilidad y choques estocásticos. Estos modelos le dan mayor preponderancia al estudio de la parte estocástica cuando no hay variables conocidas que puedan ser utilizadas en el modelo. Sin embargo, la metodología que emana de estos modelos es complicada. El número de observaciones necesario para implementar estos modelos suele ser mayor a los modelos comunes, Cowpertwait y Metcalfe (2009). En suma, los costos por aprender estas técnicas son altos y no hay incentivos para su utilización. Por otro lado, estudios de Cao (2003), Qiu, Suganthan, y Amaratunga (2017), Rüping (2001), Thissen, Van Brakel, De Weijer, Melssen, y Buydens (2003) proponen las máquinas de soporte vectorial (SVM por sus siglas en inglés) para analizar datos de serie temporal. Las máquinas de soporte vectorial están basados en el trabajo de Vapnik y Vapnik (1998) sobre la teoría del aprendizaje estadístico. Estos modelos transforman los datos en múltiples dimensiones en búsqueda de una representación más simple de ellos. Después, proponen distintos modelos que minimizan una función de pérdida. En general, solamente hay una solución global que minimiza la función de pérdida y las máquinas de soporte vectorial encuentran la solución que minimiza dicha función.. 5.

(14) Los Support Vector Regresion (SVR) pueden encontrar relaciones no lineales entre los datos y estabilizan los comportamientos erráticos de las series no ergódicas, Welling (2013). Específicamente, este tipo de modelos pueden ofrecer una alternativa a los problemas de no estacionariedad y volatilidad de la serie. No obstante, es común el problema de sobreajuste del modelo, Cao (2003). Esto pasa cuando el modelo parece ajustarse demasiado bien a los pronósticos dentro de la muestra pero no pasa lo mismo con los pronósticos fuera de la muestra.. 2.3. Competencias de pronósticos y funciones de perdida. En otro orden de ideas, la elección de ciertos modelos para pronosticar una serie suele ser complementaria. Los modelos de predicción pueden integrar varias estrategias de predicción con el único fin de reducir la incertidumbre en sus pronósticos. Con este objetivo, los expertos en competencias de pronósticos como Makridakis et al. (1982) frecuentemente combinan las ventajas comparativas de los modelos, aumentando la capacidad predictiva y evaluando el comportamiento con series particulares. Las competencias de pronósticos contribuyen con formas innovadoras para comparar la precisión en la extrapolación, Neter, Kutner, Nachtsheim, y Wasserman (1996). Tales competencias incentivan la investigación y nuevas formas de estudiar el comportamiento de los modelos. Las formas más usuales para comparar son las funciones de pérdida. La contribución particular de este trabajo se concentra en la utilización de ambas categorías para desarrollar un modelo de predicción de PIB. El desarrollo de un modelo de predicción que combine las dos categorías es innovador en dos sentidos. Primero, hay un ahorro de tiempo considerable desde el desarrollo del modelo hasta la predicción. Segundo, los modelos pueden realizarse de forma independiente y combinarse en el momento de predecir. La contribución general de esta tesina se enfoca en la explicación de ciertos procesos y conceptos para influenciar la utilización de los modelos alternativos del movimiento estocástico. Incluso, analizar el comportamiento de los nuevos modelos en la predicción de series reales.. 6.

(15) La evaluación de los modelos se realizará tomando en cuenta los métodos de comparación utilizados en las competencias de pronósticos. El estudio empírico del comportamiento de los modelos propicia a una mejor utilización de las ventajas comparativas. En conclusión, la hipótesis que guía este trabajo es que los modelos combinados que utilizan diversas estrategias para el tratamiento del error estocástico tienden a tener mayor capacidad de predicción, comparado con los modelos que no lo utilizan.. 7.

(16) Capítulo 3 El caso mexicano 3.1. Importancia de las proyecciones en México. La medición del ingreso nacional es esencial para el análisis macroeconómico y la toma de decisiones, Elizondo (2012). En concreto, el Producto Interno Bruto es uno de los indicadores económicos más importantes de las cuentas nacionales y de la economía, debido a que representa una medida amplia de la actividad económica y proporciona señales de la dirección general de la actividad económica agregada, Elguezabal (1995).. 3.2. Características de los datos. El PIB es influenciado por múltiples factores económicos y exógenos a la economía, Ize y Salas (1983). Por un lado, entre los factores económicos se encuentran las reestructuras fiscales, reformas políticas, políticas públicas y política monetaria. Por otro lado, entre los factores exógenos se encuentran los desastres naturales, enfermedades epidémicas, amenazas de guerra, entre otros. Los datos del PIB son publicados cada trimestre. Sin embargo, la frecuencia de los datos trae problemas en la estimación, Elguezabal (1995). Por un lado, la frecuencia de los datos no permite conocer el estado de la economía entre los periodos trimestrales. Por otro lado, la fre8.

(17) cuencia del PIB limita los modelos econométricos que pueden ser utilizados para la predicción. No obstante, en búsqueda de solucionar el problema se realizan algunas estrategias de carácter metodológico. Una muy obvia consiste en modificar la frecuencia2 de las variables que pueden explicar el PIB, Elguézabal (2004a). También, la utilización de otras variables para predecir los periodos entre cada trimestre, Elguézabal (2004b). Incluso, cambiar la frecuencia del PIB (trimestral a mensual) mediante distintos métodos, Elizondo (2012).. 3.3. Variables habituales en los modelos predictivos del PIB. Los modelos utilizados por los responsables de la política económica (Banxico) consideran frecuentemente dos variables para la aproximación del PIB, Elizondo (2012). La primera variable a considerar es el Indicador Global de la Actividad Económica (IGAE) . El IGAE es información preliminar sujeta a datos auto reportados de empresas y organismos públicos. Este indicador permite conocer y dar seguimiento a la evolución del sector real de la economía, en el corto plazo. Aunque no incluye toda la información de las actividades económicas contenidas en el PIB, la utilidad del IGAE es determinar la tendencia de la actividad económica a corto plazo. La segunda variable a considerar es el Índice Nacional de Precios al Consumidor (INPC). Hay evidencia del impacto del INPC sobre variables económicas reales, Elguézabal (2004a). Específicamente, el índice permite conocer ciertos impactos temporales en la economía nacional. Por ejemplo, la inflación puede generar expectativa sobre el cambio de tendencia de la economía. En consecuencia, el INPC es una variable determinante en la estimación del PIB.. 3.4. Estimación a la mexicana. Actualmente, en México, se utilizan diversas metodologías para el tratamiento del PIB, los métodos comúnmente utilizados pueden enmarcarse en tres categorías 3 : 1) Los modelos derivados 2. La estimación determinística y el método de Denton son los métodos para cambiar la frecuencia de los datos. Más adelante se explica la intuición de estos métodos. 3 Véase en Elizondo (2012). 9.

(18) del método de Denton, 2) los modelos derivados del filtro de Kalman y 3) la especificación de cambios estructurales múltiples. A continuación se explica cada categoría. Primero, el método de Denton construye el PIB a partir de otra variable relacionada. Este método constituye una alternativa formal para la proyección de datos de baja frecuencia utilizando una serie de alta frecuencia. Es decir, se obtiene un algoritmo a través de los datos mensuales de una variable relacionada con el PIB (puede ser IGAE o precio del petróleo, entre otras) y a partir de ahí, se realizan las estimaciones trimestrales subsecuentes del PIB. Metodológicamente, el método de Denton combina las series de alta frecuencia relacionadas con el PIB y una serie que minimiza el residual (la diferencia entre la observación real y la predicción). No obstante, esta aproximación es solo intuitiva pues sirve para marcar una tendencia a corto plazo sin importar que los estimadores cumplan algún supuesto. Segundo, los modelos que se derivan del filtro de Kalman utilizan la misma variable a estimar y un conjunto de variables relacionadas con la ella. Elaboran un estimador recursivo basado en la estimación de un sistema estocástico con las variables relacionadas y observables. El filtro de Kalman combina toda la información observada en un periodo determinado y el conocimiento previo del sistema. En otras palabras, utiliza la información histórica de la serie del PIB y la información histórica de otras variables relacionadas con el PIB (puede ser IGAE, inflación o precio del petróleo) para predecir una observación contemporánea o futura. Tercero, la especificación de cambios estructurales múltiples fragmenta la serie histórica del PIB para darle un tratamiento específico. Mejor dicho, divide la serie de tiempo en periodos que aproximadamente tienen las mismas propiedades estadísticas para crear un modelo local adecuado. Este tipo de modelos contempla los choques exógenos y su utilización es la más frecuente para predecir variables como el PIB. A partir de la descripción anterior, se destacan dos problemas. El primer problema proviene de los modelos derivados del método de Denton, mientras que el segundo problema es resultado de los modelos derivados del filtro de Kalman y la especificación de cambios estructurales múltiples, Ize y Salas (1983).. 10.

(19) El principal problema de los modelos que se derivan del método de Denton es que la frecuencia de los datos suele aumentar el ruido en la serie de nuestra variable de interés, Elguézabal (2004a). Mejor dicho, los intervalos de confianza de este tipo de modelos suele ser más amplios y la predicción es menos precisa que los modelos de las otras dos categorías. El problema de los otros dos modelos reside en la capacidad explicativa de las variables utilizadas. Los modelos econométricos suelen utilizar otras variables para extrapolar el valor del PIB, sin embargo, la información de las variables explicativas no es suficiente para poder explicar totalmente el comportamiento del PIB, Elguézabal (2004b). En otras palabras, tendríamos que incluir una gran cantidad de variables que explican relativamente poco sobre PIB pero son necesarias para aumentar la precisión de la estimación. En otros términos, los modelos no son parsimoniosos y suele ser complicado tener actualizadas todas las variables explicativas. De tal forma, la elaboración de estos modelos suele ser compleja y costosa en términos de tiempo. En este sentido, este trabajo plantea una nueva metodología basada en la combinación de diversos modelos econométricos. En concreto, la propuesta de este trabajo es demostrar la combinación de estimadores que modelan los cambios estructurales, estrategias que optimizan la correlación entre las variables y métodos para estimar y limpiar el error estocástico, suele comportarse mejor que los modelos descritos con anterioridad.. 11.

(20) Capítulo 4 Los datos Se utilizaron siete series de tiempo para las estimaciones del PIB a precios constantes. Las series de tiempo utilizadas tienen una frecuencia trimestral o mensual. Para empezar, los datos longitudinales del PIB son los únicos que tienen una frecuencia trimestral y son desestacionalizados4 para el periodo de marzo de 1993 a enero 2017. Estos datos, con el año base en el 2003, están conformados por 97 observaciones y fueron obtenidos del INEGI. Entre las series de tiempo que tienen datos mensuales se encuentran: 1) Índice Nacional de Precios al Consumidor (INPC), 2) Indicador Global de la Actividad Económica (IGAE), 3) Tipo de cambio (peso-dólar), 4) Precio del petróleo y 5) el Índice de Precios y Cotizaciones. A continuación se detallará los pormenores de cada una de ellas. Se utilizaron dos series de INPC: datos originales y subyacentes5 . Los datos del INPC registran el precio de la canasta básica a través del tiempo, es decir, miden la inflación. Estos datos tienen una frecuencia mensual para el periodo 1993 a 2017, lo que corresponde a 312 observaciones para cada serie. El año base para ambas series es el año 2003 y los datos fueron obtenidos del INEGI. El IGAE provee información básica sobre la actividad económica y no incluye todas las actividades como lo hace el PIB. Sin embargo, provee información preliminar para indicar la 4. En las series desestacionalizadas se remueve a influencia de los factores estacionales y periódicos. La influencia de los factores estacionales suele dificultar el pronóstico de una serie económica. 5 Los datos del INPC subyacente no incluyen los bienes temporales.. 12.

(21) dirección de la actividad económica del país. Los datos del IGAE tienen una frecuencia mensual desde 1994 hasta 2016. Las 279 observaciones fueron obtenidas del INEGI. El tipo de cambio y el precio del petróleo representan la influencia del comercio internacional en la economía nacional. Ambas series tienen una frecuencia mensual desde el año 2003 al 2017, con 322 y 319 observaciones, respectivamente. Los datos de ambas series fueron obtenidos del banco de datos del Banco de México. Por último, el IPC representa la valoración del mercado de las principales empresas en el país. Tal indicador provee información acerca de las expectativas sobre el mercado mexicano y las oportunidades de inversión. Este índice tiene una frecuencia mensual y se utilizan en la estimación de datos desde 1993 hasta 2017, correspondiente a 321 observaciones. Los datos sobre el IPC fueron obtenidos del Banco de México. La tabla 4.1 resume las características importantes sobre los datos a utilizados: Datos. Frecuencia. Numero de Observaciones. PIB* INPC(subyacente) INPC IGAE Tipo de cambio Precio del Petróleo IPC. Trimestral Mensual Mensual Mensual Mensual Mensual Mensual. 97 312 312 279 322 319 321. Fuente INEGI INEGI INEGI INEGI Banxico Banxico Banxico. Tabla 4.1: Resumen de los Datos Para ver la relación entre las variables, se presenta las Figuras 4.1, 4.2 y 4.3 en donde se observa el comportamiento del PIB desestacionalizado comparado con el IGAE, el IPC y con el INPC subyacente. La figura superior muestra que el IGAE es un buen pronosticador; es fácil identificar que el IGAE tiene la misma dirección que los movimientos del PIB. La Figura 4.2 muestra que el INPC subyacente tiene la misma tendencia que el PIB. Asi mismo, la Figura 4.3 muestra que el IPC converge en la misma dirección que el producto interno bruto. La relación gráfica entre las variables que se representa en la figuras es un indicio de que las variables IGAE 13.

(22) e INPC pueden ser utilizadas para el pronostico del PIB. Figura 4.1: Gráficas temporales del PIB-IGAE. 15 14. 1.2. PIB (izquierda) IGAE (derecha). 1.1 1. 12 11. 0.9. 10. 0.8. Millones de pesos. Millones de pesos. 13. 9 0.7. 8 7. 0.6 1995. 2000. 2005. 2010. 2015. Años. Figura 4.2: Gráficas temporales del PIB-INPC subyacente. 15. 1.2. PIB (izquierda) INPC subyacente (derecha). 14. 1 0.8. 12 11. 0.6. 10. 0.4. 9 0.2. 8 7. 0 1990. 1995. 2000. 2005 Años. 14. 2010. 2015. Millones de pesos. Millones de pesos. 13.

(23) Figura 4.3: Gráficas temporales del PIB-IPC. 50000. 15. IPC (izquierda) PIB (derecha). 45000. 14. 40000. 12. 30000 25000. 11. 20000. 10. 15000. Millones de pesos. 13. 35000. 9. 10000. 8. 5000 0. 7 1990. 1995. 2000. 2005. 2010. 2015. Años. En la Figura 4.4 y 4.5 se realizaron primeras diferencias6 en las series para mostrar mejor las relaciones entre variables PIB con el precio del petróleo y PIB con el tipo de cambio. La gráfica superior muestra que la primera diferencia del precio del petróleo está relacionada con la primera diferencia del PIB. Lo mismo pasa con la primera diferencia del tipo de cambio con la primera diferencia del PIB. En suma, la relación del PIB con el petróleo y el tipo de cambio es menos identificable que la relación del PIB con el IGAE y el INPC. En resumen, se tendrán siete series temporales para realizar modelos de estimación del PIB. Seis series tienen frecuencia mensual: 1) Índice Nacional de Precios al Consumidor (INPC), 2) INPC subyacente, 3) Indicador Global de la Actividad Económica (IGAE), 4) Tipo de cambio (peso-dólar), 5) Precio del petróleo y 6) el Índice de Precios y Cotizaciones. Además, una serie con frecuencia trimestral: PIB. Los datos históricos del PIB son utilizados para predecir su comportamiento en el futuro mediante una especificación autoregresiva7 . 6. La primera diferencia de una serie es necesaria para quitar la tendencia. La diferencia es el resultado del valor presente menos el valor pasado. Es decir, ∆P IB = P IBt − P IBt−1 . 7 La función de autocorrelación encuentra patrones repetitivos dentro de una serie para proyectar los patrones en el futuro.. 15.

(24) Figura 4.4: Gráficas de las primeras diferencias del PIB-Precio del petróleo. PIB (izquierda) Precio del Petróleo (derecha). 0.4. 40. 20. 0. 0. -0.2. -20. -0.4. -40. -0.6. Dolares por barril. Millones de pesos. 0.2. -60 1990. 1995. 2000. 2005. 2010. 2015. Años. Figura 4.5: Gráficas de las primeras diferencias del PIB-Tipo de cambio. 5. PIB (izquierda) Tipo de cambio (derecha). 0.4. 4 3. 0. 2. -0.2. 1 0. -0.4. -1 -0.6 1990. 1995. 2000. 2005 Años. 16. 2010. 2015. Pesos por dolar. Millones de pesos. 0.2.

(25) Capítulo 5 Metodología En esta sección, se describe el procedimiento econométrico utilizado para la predicción del PIB. Para predecir el PIB trimestral se utilizó una combinación de estrategias para pronósticos: 1) Trasformaciones de variables Box y Cox (1964); 2) Desestacionalización de las series con un filtro X12 ARIMA de Bureau (2002); 3) Tratamiento de cambios estructurales con la prueba Bai y Perron (1998) y 4) Pruebas de estacionariedad de la serie. Posteriormente, se utilizaron dos tipos de modelos: 1) Modelos econométrico auto regresivo con medias móviles y con variables exógenas (ARMAX por sus siglas en ingles) y 2) Modelos de aprendizaje computacional. A continuación se explica cada estrategia y cada modelo utilizado. Para comenzar la explicación, es importante destacar que para cada una de las series, descritas en la sección anterior, se realizaron las cuatro estrategias de pronósticos. Sin embargo, se ejemplifica cada estrategia únicamente con el tratamiento de la variable dependiente PIB. La finalidad de las cuatro estrategias es optimizar el modelo ARMAX e incrementar la capacidad predictiva del modelo.. 5.1. Transformación de variables. En primer lugar, se realizó una trasformación Box y Cox (1964) de cada variable explicativa. Esta trasformación tiene el objetivo de mejorar la correlación entre las variables al garantizar el 17.

(26) cumplimiento de todos los supuestos del modelo lineal. Es decir, que las variables explicativas tengan una varianza homogénea y su distribución de probabilidad se parezca a una distribución normal. Figura 5.1: Optimización de la trasformación Box-Cox. Las trasformaciones Box-Cox están dadas por:. Y (λ) =.   . (Y λ −1) (λ×GM λ−1). cuando.   GM (ln(Y )) Donde:. cuando. λ 6= 0 λ=0. GM = (Y1 Y2 Y3 . . . Yn )1/n. Donde se elige una lambda que minimice la diferencia de la distribución de los datos al 18.

(27) compararla con una distribución normal. Esta lambda se estima con un modelo de máxima verosimilitud y se selecciona la lambda que acerque la distribución de los datos a una normal. La Figura 5.1 muestra la elección de la lambda óptima para la variable PIB, donde se minimiza la varianza de la distribución de la variable exógena en comparación con una distribución normal. Esta transformación mejora la correlación entre el PIB y las otras variables. En consecuencia, mejora la predicción del PIB.. 5.2. Desestacionalidad de las series. El filtro X-12 ARIMA desarrollado por Yule’s y Yule’s (n.d.) para efectuar la desestacionalización de la serie, supone que está compuesta por:. Xt = T Ct + Et + It Dónde: Xt = serie original T Ct = componente tendencia-ciclo Et = componente estacional It = componente irregular Los métodos de promedios móviles presuponen que tanto la tendencia como la estacionalidad tienen comportamientos dinámicos con el paso del tiempo. En consecuencia, la tendencia y el componente estacional, en un punto determinado del tiempo, se estima como promedio de las observaciones previas y futuras. La desestacionalización elimina el componente estacional y el componente de tendenciaciclo con el objetivo de eliminar la influencia de factores exógenos como: variaciones climáticas estacionales, convenciones sociales o reglas administrativas (como las vacaciones). La desestacionalidad elimina la irregularidad de la variable para dejar limpio el efecto de la variable PIB. 19.

(28) Figura 5.2: Filtro X-12 ARIMA. 16 15. PIB PIB despues del filtro(X-12 ARIMA). 14 Millones de pesos. 13 12 11 10 9 8 7 1995. 2000. 2005. 2010. 2015. Años. La Figura numero 5.2 muestra la desestacionalización del PIB trimestral. En la gráfica superior se muestra la gráfica del PIB antes del proceso de desestacionalización y en la línea azul se muestra la misma gráfica del PIB después del tratamiento de desestacionalización con el filtro X-12 ARIMA.. 5.3. Estimación del quiebre estructural. Un cambio estructural existe cuando hay un cambio inesperado en una serie de tiempo. Los cambios estructurales pueden ser un cambio en la constante o un cambio en la tendencia. La estimación de quiebres estructurales de Bai y Perron (1998) recolecta varias muestras de la serie, introduce un cambio estructural y estima un modelo lineal de mínimos cuadrados. Posteriormente, la prueba indica el punto en el tiempo donde la suma de los residuales al cuadrado es mínima. La Figura 5.3 muestra el tratamiento de quiebre estructural de la variable PIB. Como puede observarse, la línea azul representa las distintas tendencias a lo largo de la serie. Los saltos 20.

(29) de la línea azul representan los quiebres estructurales de la serie. Mediante esta estimación de cambios de constante y tendencia podemos definir mejor los cambios abruptos del PIB. Se encontró que la variable PIB tiene tres quiebres estructurales. Las fechas son: 1995:1, 2007:4 y 2009:1. Figura 5.3: Quiebre estructural. 500. Miles de millones de pesos. 450. PIB Linea de tendencia 2° quiebre: 2007/4. 400 350. 3° quiebre: 2009/1. 300 250. 1°quiebre: 1995/1. 200 150 1995. 2000. 2005. 2010. 2015. Años. 5.4. Pruebas de estacionariedad. Al correr una regresión es importante la estacionariedad8 de la variable dependiente y la variable independiente. La estacionariedad de la serie afecta las propiedades estadísticas de los estimadores. De tal forma, que una regresión con una que emplea variables no estacionarias puede generar inferencia sin sentido (lo que se conoce habitualmente como regresión espuria), Granger y Newbold (1974). Por lo consiguiente, antes de incluir las variables en el modelo econométrico es necesario investigar individualmente la estacionariedad de cada serie de tiempo. En este Estacionariedad en covarianzas se define como: sea {Y }∞ t=−∞ un proceso aleatorio. Si ni sus medias ni sus auto covarianzas (µt ni γjt ∀j = 1, 2, . . . ) dependen del instante t entonces el proceso es estacionario en covarianzas. 8. 21.

(30) proceso se hicieron cuatro pruebas de estacionalidad: 1) prueba de Dickey y Fuller (1979), 2) prueba Dickey-Fuller GLS , 3) prueba Phillips y Perron (1988) y 4) coeficiente de integración fraccional de Whittle (1951).. 5.5. Estimación del modelo. Después de realizar las cuatro estrategias, se utilizaron dos tipos de modelos para la predicción de la variable dependiente: Modelos autoregresivos con medias móviles y máquinas de soporte vectorial. La variable dependiente es el PIB trimestral. Mientras que las variables independientes son: 1) Índice Nacional de Precios al Consumidor (INPC), 2) INPC subyacente, 3) Indicador Global de la Actividad Económica (IGAE), 4) Tipo de cambio (peso-dólar), 5) Precio del petróleo y 6) el Índice de Precios y Cotizaciones. A continuación se explican las características de cada modelo en cuestión.. 5.5.1. Modelos Autoregresivos con Medias Móviles. El modelo ARMAX (p, q, b) se refiere al modelo con p términos autoregresivos, q medias móviles y b variables exógenas. El modelo ARMAX tiene los mismos principios del modelo ARMA: se ponderan los rezagos que se correlacionan con la observación contemporánea AR (p) y también se ponderan los residuales que se correlacionan con el error contemporáneo MA (q). Adicionalmente, se incluye la correlación lineal de la combinación de variables exógenas (d). Xt = t +. p X. φi Xt−i +. q X. i=1. i=1. θi t−i +. b X. ηi dt−i. i=1. Donde: η1 . . . ηb son los parámetros de las variables exógenas (dt ).. 22.

(31) 5.5.2. Support Vector Regression (SVR) y Kernel Ridge Regression (KRR). Los SVR y KRR se refieren a algoritmos computacionales basados en la teoría de aprendizaje. Estos modelos realizan tres procedimientos para encontrar un modelo de clasificación parsimonioso: Primero, realizan una partición de los datos en regiones disconjuntas. Mediante un algoritmo determinan el número de muestras en los datos. Segundo, el modelo realiza representaciones de múltiples dimensiones de los datos. El objetivo es encontrar la representación más simple de los datos para disminuir la complejidad del modelo. Tercero, el algoritmo propone una función que minimice el error entre el valor real y el valor predicho. Figura 5.4: Muestreo y trasformación de los datos de los métodos de aprendizaje computacional. La Figura 5.4 muestra las dos primeras etapas del procedimiento de los SVR y KRR: En el panel izquierdo se ejemplifica el muestreo de los datos y la partición de los datos en regiones disconjuntas, mientras, el panel derecho muestra la segunda etapa donde se aumenta la dimensión de los datos para encontrar un relación más simple de ellos. Finalmente, en la Figura 5.5 se muestra el ajuste de los diferentes modelos: en el panel izquierdo se muestra el ajuste de un SVR y en el panel derecho se muestra el ajuste de un KRR. 23.

(32) Figura 5.5: Support Vector Regression y Kernel Ridge Regression. Existen múltiples tipos de SVR, o mejor dicho, existen SVR especializados en encontrar distintas funciones en los datos: lineales, radiales, logarítmicas, exponenciales, entre otras. En esta tesina se evalúa el comportamiento de los modelos SVR lineales, radiales y modelos no lineales, llamados Kernel Ridge Regression (KRR), Welling (2013). La técnica KRR propone una solución no lineal. Esta técnica parte de un espacio de entrada no lineal y propone una solución no lineal para moverse a un espacio de características lineales. La idea del KRR es semejante al SVR al hacer un muestreo de los datos de entrada y aumentar la dimensión de los datos hasta encontrar un modelo idóneo. La principal diferencia entre los modelos SVR y KRR es que los modelos SVR buscan dar ajuste a una regresión lineal mientras que los modelos KRR amplían el catalogo de funciones a las funciones no lineales.. 24.

(33) Capítulo 6 Resultados En esta sección se describen y evalúan los resultados provenientes de dos tipos de modelos. Por un lado están los resultados de los modelos Autoregresivos con medias móviles: 1) los modelos que utilizan solamente el modelo ARIMA, 2) los modelos que utilizan el modelo ARMAX y 3) los modelos que utilizan la trasformación Box-Cox, el filtro X −12 y el ajuste de quiebre estructural de Bai y Perron (2017). Por otro lado, están los resultados de los métodos de aprendizaje computacional: 1) SVR radiales y 2) KRR.. 6.1. Modelos Autoregresivos con Medias Móviles. La evaluación de los modelos de predicción se realiza tomando en cuenta dos aspectos. En primer lugar, el tamaño del periodo9 . Se parte de la idea generalizada que los modelos a corto plazo tienen más oportunidades de predicción que los de largo plazo. No obstante, la capacidad para extrapolar el modelo es mejor en los modelos de largo plazo que en los modelos de corto plazo. Por tal motivo, todos los modelos utilizan la muestra completa de los datos, Makridakis et al. (1982). 9. El tamaño del periodo puede ser corto o largo plazo. Aunque son términos comparativos, se considera un largo plazo cuando se utilizan todas las observaciones para predecir y en correspondencia, se considera corto plazo cuando se utiliza solamente una muestra para la predicción. Por ejemplo: si nuestra base de datos es de 1993 hasta 2016, un modelo de largo plazo utilizará este mismo periodo para predecir el año 2017. Mientras tanto, un modelo de corto plazo puede utilizar solamente el año 2016 para predecir el 2017.. 25.

(34) En segundo lugar, se toma en cuenta el porcentaje de error absoluto medio10 (MAPE por sus siglas en inglés). Este porcentaje puede ser utilizado para comparar los ajustes obtenidos de diferentes modelos. Los valores más pequeños indican un modelo de ajuste más adecuado.. 6.1.1. Aproximación con modelos ARMA. Para el primer tipo de modelos se considera la representación más sencilla de un modelo ARMA y se utiliza la misma variable del PIB rezagada para la predicción. El modelo ARMA utiliza la serie del PIB trimestral diferenciada para eliminar la tendencia de la serie y los quiebres estructurales. En el cuadro 6.1 se muestra un resumen de los resultados de los mejores modelos estimados a partir de los modelos ARIMA: Número Porcentaje de de error Observaciones medio. Modelos. Porcentaje de error absoluto medio. Datos tratados 1) α + θ1. 95. -0.098. 1.11. Datos originales 2) α + φ1 + φ3 + φ4 + φ6 + φ11. 78. -103.35. 210.19. Tabla 6.1: Resumen de modelos ARMA El cuadro 6.1 muestra que el modelo con mejor ajuste es el modelo que usa los datos con el tratamiento de la función Box Cox y el filtro X-12 ARIMA. Con base en el criterio del mínimo porcentaje de error absoluto medio y el porcentaje de error medio podemos observar que la utilización de datos tratados mejora la estimación de la serie dentro de la muestra. 10. El error porcentual absoluto medio es un indicador del desempeño del P pronóstico. El MAPE mide el tamaño del error absoluto en términos porcentuales. La fórmula del MAPE es: [( | (Yt − ŷt ) Yt |) /n] × 100 donde Yt es igual al valor real, es igual al valor ajustado y n es igual al número de observaciones.. 26.

(35) 6.1.2. Aproximación con modelos ARMAX. Para el segundo tipo de modelos se considera la representación más sencilla de los modelos ARMAX. Para predecir el PIB trimestral los modelos ARMAX utilizan cinco series de tiempo adicionales: 1) Índice Nacional de Precios al Consumidor (INPC), 2) Indicador Global de la Actividad Económica (IGAE), 3) Tipo de cambio (peso-dólar), 4) Precio del petróleo y 5) el Índice de Precios y Cotizaciones. En el cuadro 6.2 se muestra un resumen de los tres modelos ARMAX con el mejor ajuste. Número Porcentaje de de error Observaciones medio. Modelos. Porcentaje de error absoluto medio. Datos tratados 3) α + θ1 + θ2 +∆T ipodecambio + ∆IP C + ∆IGAE. 94. 0.054962. 0.67042. Datos originales 4) α + θ1 + θ2 +∆T ipodecambio + ∆IP C + ∆IGAE. 94. -4.1821. 133.73. Tabla 6.2: Resumen de modelos ARMAX El cuadro 6.2 muestra que el modelo con mejor ajuste ocurre cuando se utilizan los datos tratados. Según el mínimo porcentaje de error absoluto y el porcentaje de error medio, los modelos ARMAX con datos tratos son mejores para la estimación del PIB. Es importante destacar que todos los modelos estimados con el modelo ARMAX utilizan más datos y en general tienen un mejor ajuste que los modelos de largo plazo ARMA.. 6.1.3. Aproximación con modelos que utilizan la trasformación Box-Cox, el filtro X − 12 y el ajuste de quiebre estructural de Bai y Perron. Para el tercer tipo de modelos se considera el modelo ARMAX y el ajuste de quiebre estructural del PIB. Es importante destacar que tiene la misma especificación que el modelo ARMAX con los datos tratados de la clasificación anterior con la única diferencia que se estima los quiebres 27.

(36) estructurales. En el cuadro 6.3 se muestra que mejora la estimación del PIB. Según los criterios de Porcentaje de error Medio y el porcentaje de error absoluto medio podemos decir que este modelo es el mejor de los modelos presentados en este trabajo. La Figura 6.1.3 muestra el pronóstico dentro de la muestra realizado con el modelo. Se puede observar que la línea de predicción se asemeja a la variable observada. Número Porcentaje de de error Observaciones medio. Modelo Datos tratados 5) α + θ1 + θ2 + ∆T ipodecambio +∆IP C + ∆IGAE + SB∗. 94. 0.015425. Porcentaje de error absoluto medio 0.6519. Tabla 6.3: Modelo ARMAX con tratamiento de cambio estructural. Figura 6.1: Estimación intramuestral del PIB. 200 180. PIB observado PIB estimado (intramuestral). Billones de pesos. 160 140 120 100 80 60 40 1995. 2000. 2005 Años. 28. 2010. 2015.

(37) 6.2. Métodos de aprendizaje computacional. La evaluación de este tipo de modelos se realiza utilizando las curvas de aprendizaje. Las curvas de aprendizaje relacionan el tamaño de la muestra que el modelo utiliza para el entrenamiento y el error absoluto medio del modelo. Se parte de la idea que entre mayor sea el tamaño de la muestra mayor será la capacidad de predicción. No obstante, es conveniente usar las curvas de aprendizaje porque pueden mostrar el problema de ajuste en el modelo. Es decir, que el modelo no mejora la predicción aunque aumente la muestra para entrenamiento, por el contrario, la predicción empeora. Además, las curvas de aprendizaje puede mostrar gráficamente cuan mejor es un modelo respecto a otro. Por este motivo, estos gráficos brindan la mejor alternativa en el momento de comparar distintos modelos SVR y KRR.. 6.2.1. Aproximación con SVR radiales. Debido a las características cíclicas del PIB, el modelo radial es quien mejor predice el comportamiento del PIB comparado con el modelo lineal y polinomial. Los SVR radiales funcionan mejor con los datos originales. Los datos originales son los que tiene mayor varianza y es evidente el componente cíclico porque los datos no han sido desestacionalizados. Con base en la curva de aprendizaje 6.2 y 6.3 podemos apreciar que no hay diferencia entre mayor sea el porcentaje de los datos que el modelo utiliza para el entrenamiento. Es decir, que el modelo SVR radial suele comportarme mejor que los modelos KRR cuando la muestra de entrenamiento es pequeña (menos del 15 porciento de los datos). Además, el modelo SVR radial funciona mejor cuidando los principios de ergodicidad y estacionariedad de las series. Al utilizar las primeras diferencias de los datos se eliminó la tendencia y la sospecha de caminata aleatoria de la serie. Es importante destacar que las pruebas de estacionariedad dan prueba de la utilización de las primeras diferencias. Inclusive, la Figura 6.1 es evidencia que el modelo SVR radial funciona mejor con la primera diferencia de los datos. 29.

(38) Figura 6.2: Curva de aprendizaje de los modelos que usan datos originales. Figura 6.3: Curva de aprendizaje de los modelos que usan datos tratados. originales.. 30.

(39) 6.2.2. Aproximación con modelos KRR. Los modelos KRR resultaron ser los mejores con los datos originales, los tratados y las primeras diferencias. Este tipo de modelos amplia el catálogo de funciones lineales y no lineales que los modelos SVR, por tal motivo, resulta esperado que mejoren los pronósticos al encontrar más relaciones entre las variables. Figura 6.4: Curva de aprendizaje de los modelos que usan primeras diferencias. Los modelos KRR mejoran con el aumento de la muestra de datos para entrenamiento. El aumento en el ajuste del modelo aumenta exponencialmente después del 10 porciento del porcentaje de datos para el entrenamiento. Esto nos puede dar una idea del funcionamiento y de la utilización de estos modelos para predecir. En otras palabras, los modelos KRR son ideales cuando tenemos un mayor número de observaciones. Al igual que los modelos SVR radiales, el modelo KRR funciona mejor cuidando los principios de ergodicidad y estacionaridad de la serie. La Figura 6.5 da evidencia del sobreajuste del modelo KRR con los datos originales (línea amarilla). No obstante, el modelo KRR con los datos originales es el mejor modelo para pronóstico 31.

(40) Figura 6.5: Curva de aprendizaje de los mejores tres modelos. Figura 6.6: Estimación intramuestral del PIB con modelos KRR. 16 15. Millones de pesos. 14. PIB (sin desestacionalizar) KRR (primeras diferencias) KRR (datos originales). 13 12 11 10 9 8 7 1995. 2000. 2005. 2010. 2015. Años. del PIB intramuestral. La Figura 6.6 es prueba del mejor ajuste entre los modelos. Como puede observarse, los modelos KRR persiguen la misma tendencia que los movimientos del PIB, sin 32.

(41) embargo, hay un sesgo en el modelo que utiliza las primeras diferencias. Esto puede deberse a la perdida de la tendencia al momento de diferenciar la serie.. 6.3. Comparación de pronósticos intramuestrales y extramuestrales Figura 6.7: Pronóstico ARMAX intra y extra-muestral. 220. 200. PIB Predicción Intervalo de 95 por ciento. Billones de pesos. 180 Predicción intramuestral 160. 140 Predicción extramuestral 120. 100 2000. 2002. 2004. 2006. 2008. 2010. 2012. 2014. 2016. Años. En este apartado se muestran los resultados de los pronósticos intramuestrales y extramuestrales del mejor modelo ARMAX y el mejor modelo SVR. Los modelos ARMAX se evaluaron con el porcentaje de error medio y el porcentaje de error absoluto medio. Mientras, los modelos SVR se evaluaron con el coeficiente de determinación (R2 ). Además, el modelo ARMAX utiliza datos tratados con la trasformación Box-Cox y el filtro X-12 ARIMA, mientras, el modelo SVR utiliza los datos originales. Por tal motivo, la comparación de los modelos se realizó utilizando el gráfico XY (o línea de 45 grados) para observar la relación lineal entre las dos variables. Mejor dicho, se utiliza la línea de 45 grados para observar el ajuste del PIB observada y el PIB 33.

(42) estimada. Figura 6.8: PIB original con respecto al pronóstico intramuestral de KRR. 16 15. PIB Observado PIB Estimado. PIB original (Mdp). 14 13 12 11 10 9 8 7 8. 9. 10. 11. 12. 13. 14. KRR con datos originales (Mdp). La línea de 45 grados puede mostrar visualmente el ajuste del modelo a los datos. Mientras más alineados estén los datos observados (cruces rojas) a los datos estimados (línea recta) indica que el modelo es un buen estimador. Es más, se puede realizar una estimación de mínimos cuadrados ordinarios entre los datos observados y los datos estimados para saber el coeficiente de determinación del modelo. Todo esto con el objetivo de realizar la comparación entre dos tipos de modelos que utilizan diferentes formas de medir el ajuste y diferentes datos.. Pronósticos intramuestrales Los pronósticos intramuestrales se realizaron utilizando los datos de 1993 a 2015. Estos datos corresponden al 95 por ciento de la muestra. Las Figuras 6.6 y 6.1 muestran el ajuste de los modelos. Mientras, las Figuras 6.7 y 6.8 muestran de una manera más simple el ajuste de los modelos KRR y el modelo ARMAX. Visualmente podemos comparar en la línea de 45 grados que el ajuste ARMAX es mejor que el ajuste del modelo KRR porque las observaciones. 34.

(43) Figura 6.9: PIB con respecto al pronóstico intramuestral ARMAX con datos tratados. 220. PIB con datos tratados (Bdp). 200. PIB Observado PIB Estimado. 180 160 140 120 100 80 60 40 60. 80. 100. 120. 140. 160. 180. 200. ARMAX con datos tratados (Bdp). se alinean mejor en el modelo ARMAX. En el cuadro 6.4 se muestra el ajuste de mínimos cuadrados de la línea diagonal con las observaciones del PIB. En resumen, las gráficas y el cuadro indican que el mejor ajuste es el del modelo ARMAX. Número de observaciones. Coeficiente. R2. Datos tratados 5)α + θ1 + θ2 + ∆T ipodecambio +∆IP C + ∆IGAE + SB∗. 91. .999984***. .999627. Datos originales 6)KRR kernel = lineal, α = .1. 91. 1.0049***. .993341. Modelos. Tabla 6.4: Ajuste Mínimo Cuadrático de los pronósticos intramuestrales. 35.

(44) Figura 6.10: Pronóstico ARMAX extramuestral. 220 210. PIB estimada PIB obsevada. Billones de pesos. 200 190 180 170 160 150 140 2011. 2012. 2013. 2014. 2015. 2016. Años. Pronósticos extramuestrales Los pronósticos extramuestrales se realizaron utilizando el 70 por ciento de los datos para el entrenamiento del modelo y se utilizó el resto para probar el ajuste. Como puede observarse en la gráfica 6.9, la predicción extramuestral corresponde al primer trimestre del 2010 hasta el cuarto trimestre del 2016. Las gráficas 6.10 y 6.11 muestran el pronóstico del PIB extramuestral utilizando los modelos ARMAX y KRR, respectivamente. Además, las figuras 6.12 y 6.13 muestran gráficamente el ajuste de ambos modelos de manera más simple. Podemos observar que visualmente el ajuste del modelo ARMAX es mejor que el ajuste del modelo KRR. El cuadro 6.5 indica el mismo resultado, según el coeficiente de determinación.. Ventajas y desventajas La estrategia de pronóstico está adaptada para los modelos ARMA, la estrategia se encarga de optimizar la correlación entre las variables, limpiar los movimientos estacionales y los compo-. 36.

(45) Figura 6.11: Pronóstico KRR extramuestral. 15.5 15. PIB observado PIB estimado. Millones de pesos. 14.5 14 13.5 13 12.5 12 2011. 2012. 2013. 2014. 2015. 2016. Años. Figura 6.12: PIB con respecto al pronóstico extramuestral ARMAX con datos tratados. 220 210. PIB observada PIB estimada. PIB observada Bdp. 200 190 180 170 160 150 140 150. 160. 170. 180. 190. 200. PIB estimada Bdp. nentes estocásticos de la serie. Por tal motivo, es esperado que sea útil para los modelos ARMA y no lo sea para los modelos SVR. 37.

(46) Figura 6.13: PIB con respecto al pronóstico extramuestral KRR con datos originales. 15.5. PIB observada Mdp. 15. PIB observada PIB estimada. 14.5 14 13.5 13 12.5 12 12.5. 13. 13.5. 14. 14.5. PIB estimada Mdp. Número de observaciones. Coeficiente. R2. Datos tratados 7)α + θ1 + IGAE + IN P Csub +∆IP C1 + SB∗. 27. .93286***. .9979. Datos originales 8)KRR kernel = lineal, α = .1. 27. 1.02145***. .90017. Modelos. Tabla 6.5: Ajuste Mínimo Cuadrático de los pronósticos extramuestrales La construcción del mejor modelo presentado en esta tesis se realizó usando la metodología Box-Jenkins y se realizaron aproximadamente 70 modelos para encontrar el modelo óptimo. Este procedimiento tomo alrededor de 2 horas para cada modelo. La construcción y el ajuste de los modelos ARMAX mejoran con el aumento de observaciones. La estrategia de pronóstico tomo aproximadamente 8 horas para cada serie. El proceso de construcción es artesanal. Es decir, es necesario tener práctica y conocimientos previos para 38.

(47) poder modelar. La estrategia de pronóstico permite encontrar patrones en los movimientos de la serie que no son esenciales para la construcción de un modelo ARMA. En este sentido, la estrategia divide la serie en varios componentes que pueden ser tratados de una manera más especializada. Los modelos SVR constituyen un buen pronóstico instantáneo de una serie de tiempo. En particular los modelos KRR constituyen un mejor indicio que los modelos ARMA sin la estrategia de pronóstico. Estos modelos se nutren de la varianza de la serie y en consecuencia, la estrategia de pronostico no mejora los resultados del pronóstico. La construcción y ajuste de los modelos KRR toma alrededor de media hora. El modelo se auto ajusta a partir de una línea de comando. En este caso el pronóstico del modelo KRR solamente utilizo el 35 por ciento de los datos. En otra palabras, este tipo de modelos es útil en muestras pequeñas.. 39.

(48) Capítulo 7 Implicaciones de Política Pública La metodología propuesta en este trabajo establece guías de apoyo para mejorar los pronósticos. También, mejora la interpretación y conocimiento de los movimientos que son complejos en la series de tiempo. En esencia, reduce la incertidumbre y respalda las decisiones de los hacedores de política pública. Esta metodología es parte de un herramental para el diseño, construcción y evaluación de políticas públicas. Proporciona un estimado cuantitativo de la importancia de los movimientos estocásticos, los movimientos estacionales y los cambios en la tendencia natural de la serie. Ya que, es posible establecer la proporción y la influencia de diversos efectos en el comportamiento de las series. Esto es, se puede obtener un conocimiento más amplio de todos los efectos en lugar de establecerlos como un ruido blanco. Con base en los resultados obtenidos en este trabajo, las implicaciones directas que tiene la metodología propuesta en este documento son cuatro. En primer lugar, la metodología puede ser utilizada para otros datos de series de tiempo. Estas series pueden ser tan generales como específicas. Por ejemplo, población, clima, temperatura, nivel del mar, flujos de efectivo, ventas, entre otras. En segundo lugar, es posible realizar estimaciones sobre el impacto de ciertas políticas públicas. Es decir, mediante el estudio del quiebre estructural podemos saber el impacto de ciertas. 40.

(49) reformas, cambios o creación de políticas públicas. En este sentido, el cambio estructural puede mostrar cambios de una variable que representa un problema tratado con una política pública, puede mostrar la evolución del problema y el efecto de diversas soluciones. En tercer lugar, tener mejores mediciones puede mejorar el análisis de los problemas sociales y contribuir al desarrollo de soluciones. Inclusive, puede mejorar la toma de decisiones por parte de los hacedores de políticas y los diseñadores de programas sociales. Por ejemplo, se pueden realizar estimaciones intramuestrales y extramuestrales para tomar decisiones sobre la viabilidad de proyectos o sobre el comportamiento de variables con tendencia.. 41.

(50) Capítulo 8 Conclusiones En este documento se realizaron diferentes estimaciones del PIB trimestral dentro de la muestra utilizando dos tipos de modelos. Primero, los Modelos Autorregresivos de medias móviles: 1) modelos ARMA, 2) modelos ARMAX y 3) modelos ARMAX con estimación de quiebres estructurales. Segundo, Métodos de aprendizaje computacional: 1) SVR Radial y 2) KRR. Además, para las estimaciones se utilizaron dos tipos de datos: datos trimestrales originales y datos trimestrales tratados con la función de transformación Box Cox y el filtro X − − − 12 ARIMA. Por un lado, el propósito de utilizar dos tipos de datos fue mostrar los beneficios de la estrategia de predicción que aquí se presenta. La utilización de la trasformación Box-Cox permite optimizar la correlación entre las variables. Mientras tanto, el filtro X − 12 ARIMA permite estimar el componente cíclico de las series y limpiar el error estocástico. Por otro lado, se utilizaron datos trimestrales para no cambiar la frecuencia de los datos del PIB y aumentar el ruido en la serie. De las diferentes estimaciones del PIB dentro de la muestra, se encontró que la mejor aproximación se obtuvo con modelos ARMAX que utiliza el ajuste de quiebre estructural de Bai y Perron y los datos tratados con la trasformación Box-Cox y el filtro X − 12. La forma de evaluar los modelos fue comparando dos diferentes medidas de error: el porcentaje de error absoluto. 42.

(51) medio, r2 y el error absoluto medio. Cabe destacar que no fue posible evaluar la propuesta de estimación aquí presentada con la metodología utilizada por el Banco de México para la predicción del PIB. La razón es que la metodología del banco central está restringida al público.. 43.

(52) Referencias Amparán, J. P. G., y Palacio, Y. V. (2003). “Manual sobre la clasificación económica del gasto público.” Programa de Presupuesto y Gasto Público. Centro de Investigación y Docencia Económica. CIDE, AC. Bai, J., y Perron, P. (1998). “Estimating and testing linear models with multiple structural changes.” Econometrica, 47–78. Box, G. E., y Cox, D. R. (1964). “An analysis of transformations.” Journal of the Royal Statistical Society. Series B (Methodological), 211–252. Box, G. E., y Jenkins, G. M. (1976). “Time series analysis, rev. ed.” Holden, Oakland. Bureau, U. C. (2002). X12 arima reference manual (Tech. Rep.). Cao, L. (2003). “Support vector machines experts for time series forecasting.” Neurocomputing, 51, 321–339. Capistrán, C., y López-Moctezuma, G. (2010). “Las expectativas macroeconómicas de los especialistas. una evaluación de pronósticos de corto plazo en méxico.” El trimestre económico, 77(306), 275–312. Cowpertwait, P. S., y Metcalfe, A. V. (2009). Introductory time series with r. Springer Science & Business Media. de La Federación, D. O., y del presupuesto de las asignaciones. (2015). “Presupuesto de egresos de la federación para el ejercicio fiscal 2015.” Dickey, D. A., y Fuller, W. A. (1979). “Distribution of the estimators for autoregressive time series with a unit root.” Journal of the American statistical association, 74(366a), 427–. 44.

(53) 431. Elguezabal, A. P.-L. (1995). Un modelo de cointegracion para pronosticar el pib de mexico. Banco de Mexico. Elguézabal, A. P. L. (2004a). An econometric forecast model of private investment in mexico (Tech. Rep.). Banco de México. Elguézabal, A. P. L. (2004b). “Un modelo de pronósticos de la formación bruta de capital privada de méxico.” Elizondo, R. (2012). Estimaciones del pib mensual basadas en el igae (Tech. Rep.). Working Papers, Banco de México. Enders, W. (2004). “Applied econometric time series, by walter.” Technometrics, 46(2), 264. Granger, C. W., y Newbold, P. (1974). “Spurious regressions in econometrics.” Journal of econometrics, 2(2), 111–120. Gutiérrez Lara, A. A. (2015). “Gasto público y presupuesto base cero en méxico.” El Cotidiano(192). Hamilton, J. D. (1994). Time series analysis (Vol. 2). Princeton university press Princeton. Hernández Veleros, Z. S. (2011). “Finanzas públicas y crecimiento económico en los años 2003-2010: endeudamiento estatal y crisis económica.”. Ize, A., y Salas, J. (1983). El comportamiento macroeconómico de la economía mexicana entre 1961 y 1981: especificaciones, alternativas y pruebas de hipótesis (No. 53). Banco de México, Subdirección de Investigación Económica. Kleinert, H. (2004). “Option pricing for non-gaussian price fluctuations.” Physica A: Statistical Mechanics and its Applications, 338(1), 151–159. Makridakis, S., Andersen, A., Carbone, R., Fildes, R., Hibon, M., Lewandowski, R., . . . Winkler, R. (1982). “The accuracy of extrapolation (time series) methods: Results of a forecasting competition.” Journal of forecasting, 1(2), 111–153. Neter, J., Kutner, M. H., Nachtsheim, C. J., y Wasserman, W. (1996). Applied linear statistical models (Vol. 4). Irwin Chicago.. 45.

(54) Phillips, P. C., y Perron, P. (1988). “Testing for a unit root in time series regression.” Biometrika, 75(2), 335–346. Qiu, X., Suganthan, P., y Amaratunga, G. A. (2017). “Short-term electricity price forecasting with empirical mode decomposition based ensemble kernel machines.” Procedia Computer Science, 108, 1308–1317. Revuz, D., y Yor, M. (1999). Continuous martingales and brownian motion, vol. 293 of grundlehren der mathematischen wissenschaften [fundamental principles of mathematical sciences]. Springer-Verlag, Berlin. Rüping, S. (2001). Svm kernels for time series analysis (Tech. Rep.). Technical Report, SFB 475: Komplexitätsreduktion in Multivariaten Datenstrukturen, Universität Dortmund. Sargan, J. D., y Bhargava, A. (1983). “Testing residuals from least squares regression for being generated by the gaussian random walk.” Econometrica: Journal of the Econometric Society, 153–174. Singh, B., y Sahni, B. S. (1984). “Causality between public expenditure and national income.” The Review of economics and Statistics, 630–644. Thissen, U., Van Brakel, R., De Weijer, A., Melssen, W., y Buydens, L. (2003). “Using support vector machines for time series prediction.” Chemometrics and intelligent laboratory systems, 69(1), 35–49. Vapnik, V. N., y Vapnik, V. (1998). Statistical learning theory (Vol. 1). Wiley New York. Welling, M. (2013). “Kernel ridge regression.” Max Welling’s Classnotes in Machine Learning, 1–3. Whittle, P. (1951). “Hypothesis testing in time series analysis-hafner.” New York, 1951.–136 p. Yule’s, I., y Yule’s, K. (n.d.). “X-12-arima.”. 46.

(55)