UNIVERSIDAD NACIONAL DE PIURA
FACULTAD DE CIENCIAS
ESCUELA PROFESIONAL DE ESTADÍSTICA
TESIS:
PRONÓSTICO DE LOS INGRESOS TRIBUTARIOS MENSUALES
DEL GOBIERNO CENTRAL PERUANO APLICANDO REDES
NEURONALES Y MODELOS SARIMA, EN BASE A LOS AÑOS
2003 – 2018.
Presentado por:
Br. Andy Paul Ramos Inga
PARA OPTAR EL TITULO PROFESIONAL DE:
Licenciado en Estadística
Línea de investigación: Matemáticas y Estadística
Piura, Perú
2020
iii
DECLARACIÓN JURADA DE ORIGINALIDAD DE LA TESIS
Yo, ANDY PAUL RAMOS INGA, identificado con DNI N° 72012936, Bachiller de la Escuela Profesional de Estadística de la Facultad de Ciencias y domiciliado en la calle Juan Velasco Alvarado N° 128 – Caserío Pozo de los Ramos, del Distrito de Cura Mori, Provincia y Departamento de Piura, con celular N° 999509893 y E-mail [email protected].
DECLARO BAJO JURAMENTO: que la tesis que presento es original e inédita, no siendo copia parcial ni total de una tesis desarrollada, y/o realizada en el Perú o en el Extranjero, en caso contrario de resultar falsa la información que proporciono, me sujeto a los alcances de lo establecido en el Art. N° 411 del código penal, concordante con el Art. N° 32 de la Ley N° 27444 y Ley del Procedimiento Administrativo General y las Normas Legales de Protección a los Derechos de autor
En fe de lo cual firmo la presente
Piura, 12 de enero de 2020
_________________________ ANDY PAUL RAMOS INGA
DNI N° 72012936
Articulo N° 411.- El que, en un procedimiento administrativo, hace una falsa declaración en relación con hechos o circunstancias que le corresponde probar, violando la presunción de veracidad establecida por ley, será reprimido con pena privativa de libertad no menos de uno ni mayor de cuatro años.
Art. 4. Inciso 4.12 del Reglamento del Registro Nacional de Trabajos de investigación para optar grados académicos y títulos profesionales –RENATI Resolución de consejo directivo N° 033-2016-SUNEDU-CD
vi DEDICATORIA
vii AGRADECIMIENTO
A mi asesor, por su gran apoyo para la elaboración de ésta tesis, y
viii
ÍNDICE
RESUMEN ... 1 ABSTRACT ... 2 INTRODUCCIÓN ... 3 I. ASPECTOS DE LA PROBLEMATICA ... 41.1. Descripción de la realidad problemática ... 4
1.2. Formulación del problema de investigación ... 4
1.2.1. Problema general ... 4 1.3. Justificación ... 5 1.4. Objetivos ... 5 1.4.1. Objetivo general ... 5 1.4.2. Objetivos específicos ... 5 1.5. Delimitación de la investigación ... 6
II. MARCO TEÓRICO ... 7
2.1. ANTECEDENTES DE LA INVESTIGACIÓN ... 7 2.1.1. Antecedentes Internacionales ... 7 2.1.2. Antecedentes Nacionales ... 8 2.1.3. Antecedentes locales... 9 2.2. Bases teóricas ... 10 2.2.1. Pronósticos... 10 2.2.2. Serie de tiempo ... 10 2.2.3. Modelos ARIMA ... 14
2.2.4. Modelos ARIMA estacionales... 17
2.2.5. Redes neuronales ... 18
2.2.6. Sistema tributario peruano ... 27
2.3. Glosario de términos básicos ... 28
2.4. Hipótesis ... 29
2.5. Definición y operacionalización de variables ... 29
III. MARCO METODOLÓGICO ... 30
3.1. Enfoque ... 30
3.2. Diseño ... 30
3.3. Nivel ... 30
3.4. Tipo ... 30
ix
3.6. Métodos y procedimientos ... 30
3.7. Técnicas e instrumentos ... 32
IV. RESULTADOS Y DISCUSIÓN ... 33
4.1. Resultados de la investigación ... 33
4.1.1. Descripción del comportamiento de los ingresos tributarios del Gobierno Central 33 4.1.2. Estimación del modelo SARIMA ... 40
4.1.3. Validación del modelo SARIMA: Análisis de residuales ... 45
4.1.4. Estimación del modelo de Redes Neuronales ... 49
4.1.5. Selección de modelo y Pronóstico de los Ingresos Tributarios para el periodo 2019-2020 ... 50 4.2. Discusión... 53 CONCLUSIONES ... 54 RECOMENDACIONES ... 55 REFERENCIAS BIBLIOGRÁFICAS ... 56 ANEXOS ... 58
x ÍNDICE DE TABLAS
Tabla 1. Estadísticos descriptivos de los Ingresos Tributarios del Gobierno Central ... 34
Tabla 2. Prueba de Levene... 35
Tabla 3. Factor estacional multiplicativo de la serie de tiempo ... 35
Tabla 4. Tendencia de la serie de tiempo de los Ingresos Tributarios Mensuales ... 37
Tabla 5. Autocorrelaciones simples y parciales ... 38
Tabla 6. Función de Autocorrelación Simple y Parcial de la serie con diferencia (1,12). ... 41
Tabla 7. Parámetros de modelo SARIMA(2,1,1)(1,1,1)... 43
Tabla 8. Parámetros de modelo SARIMA(2,1,0)(1,1,1)... 44
Tabla 9. Medidas de precisión del modelo ... 44
Tabla 10. Función de autocorrelación simple y parcial de residuales ... 46
Tabla 11. Pruebas estadísticas para los residuales ... 48
Tabla 12. Indicadores de ajuste del modelo NNAR(2,1,5)[12] ... 49
Tabla 13. Medidas de precisión del modelo ... 50
Tabla 14. Ingresos Tributarios pronosticados con modelo SARIMA(2,1,0)(1,1,1) para el periodo 2019-2020. ... 51
xi ÍNDICE DE FIGURAS
Figura 1. Gráfica de un Ruido Blanco ... 14
Figura 2. Partes de la Neurona Biológica ... 19
Figura 3. Esquematización de una neurona artificial ... 20
Figura 4. Red multicapa totalmente conectada y de alimentación adelantada. ... 25
Figura 5. Ingreso Tributario mensual del Gobierno Central 2003-2018 ... 33
Figura 6. Ingreso tributario del gobierno central por años. ... 34
Figura 7. Componente Estacional de la serie de los Ingresos Tributarios... 36
Figura 8. Tendencia de la serie de tiempo de los ingresos Tributarios del Gobierno Central ... 36
Figura 9. Variación cíclica de los Ingresos Tributarios mensuales ... 37
Figura 10. Función de Autocorrelación de los Ingresos Tributarios 2003-2018 ... 38
Figura 11. Función de Autocorrelación parcial de los Ingresos Tributarios 2003-2018 39 Figura 12. Ingresos Tributarios mensuales con diferencia d=1 ... 40
Figura 13. Serie con diferencia d=1 y diferencia estacional D=1 ... 40
Figura 14. Función de Autocorrelación de serie diferenciada ... 42
Figura 15. Autocorrelación Parcial de serie diferenciada ... 42
Figura 16. Residuales del modelo SARIMA(2,1,0)(1,1,1)... 45
Figura 17. Función de Autocorrelación de residuales ... 47
Figura 18. Función de Autocorrelación parcial de residuales ... 47
Figura 19. Valores observados y Valores ajustados con modelo SARIMA ... 48
Figura 20. Valores Observados vs Valores Ajustados con el modelo NNAR(2,1,5)[12] ... 50
Figura 21. Ingresos Tributarios pronosticados con el modelo SARIMA(2,1,0)(1,1,1) para el periodo 2019-2020. ... 52
ÍNDICE DE ANEXOS ANEXO 1: Datos usados en la investigación... 58
ANEXO 2: Librería usada en R-Studio... 58
ANEXO 3: Lectura, evaluación de supuestos y transformación de la serie ... 58
ANEXO 4: Código para estimación y resultados del modelo SARIMA(2,1,1)(1,1,1) en R Studio ... 63
ANEXO 5: Código para estimación y resultados del nuevo modelo SARIMA(2,1,0)(1,1,1) en R Studio ... 64
ANEXO 6: Comandos de pronóstico y resultados con el modelo SARIMA en R Studio ... 66
1
RESUMEN
La presente investigación se realizó con la finalidad de evaluar la capacidad predictiva del modelo SARIMA y el modelo de redes neuronales artificiales (RNA) en base a los ingresos tributarios mensuales del gobierno central registrados desde enero del 2003 hasta diciembre del 2018 y con este resultado realizar pronósticos para los años 2019-2020.
Los datos de los ingresos tributarios mensuales del gobierno central peruano fueron obtenidos de la página web del Banco Central de Reserva del Perú. El tratamiento y análisis de los datos se realizó con el software estadístico de licencia libre R-Studio, el cual es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R.
La serie de ingresos tributarios mensuales presentó estacionalidad y tendencia creciente y lineal, la cual, se convirtió en una serie estacionaria a través de una diferencia simple y una diferencia estacional. Además, se detectó la presencia de variación cíclica dentro de la serie, con una duración mayor de un año. Después de analizar las funciones de autocorrelación simple y parcial de la serie diferenciada, se obtuvo el modelo SARIMA (2,1,0)(1,1,1), el cual contiene coeficientes estadísticos significativos con un R cuadrado 0.9578 y un error cuadrático medio de 445.852.
El modelo entrenado a través de redes neuronales es un NNAR(2,1,5)[12], el cual es de tipo autorregresivo y alcanzó un valor R cuadrado de 0.9514 y un error cuadrático medio de 482.679.
Se concluye finamente que el modelo SARIMA ofrece un mejor modelamiento de los ingresos tributarios del gobierno central peruano, y es el que se utilizó para realizar los pronósticos para el periodo 2019-2020.
Palabras clave: SARIMA, Redes Neuronales Artificiales, pronósticos, Ingresos tributarios.
2
ABSTRACT
This investigation was realized with the proposal of evaluation the predictive capacity of the SARIMA model and the model of Artificial Neural Networks (ANN) based on the monthly tax revenues of the central government recorded from January 2003 to December 2018 and with this result based on the results years 2019-2020.
The data of the monthly tax revenues of the Peruvian central government were obtained from the website of the Central Reserve Bank of Peru. The data processing and analysis was performed with the free R-Studio statistical software, which is an integrated development environment (IDE) for the programming language R.
The series of monthly tax revenues presented seasonality and growing and linear trend, which, through a simple difference and a seasonal difference, made the series stationary. In addition, the presence of cyclic variation within the series was detected, with a duration greater than one year. After analyzing the simple and partial autocorrelation functions of the differentiated series, the SARIMA model (2,1,0) (1,1,1) was obtained, which contains significant statistical coefficients with a square R 0.9578 and a quadratic error average of 445,852
The model trained through neural networks is a NNAR (2,1,5) [12], which is autoregressive and reached a square R value of 0.9514 and a mean square error of 482,679.
It is concluded that the SARIMA model offers a better modeling of the tax revenues of the Peruvian central government, and is the one that was used to make the forecasts for the period 2019-2020.
3
INTRODUCCIÓN
El análisis de series de tiempo con la metodología de Box – Jenkins (Box, 1994), es una de las técnicas estadísticas más utilizadas para predecir el comportamiento de un acontecimiento en el futuro. La utilidad de esta metodología se centra mayormente en el ámbito económico debido a la gran diversidad de información que se genera diariamente y que presentan gran variabilidad y cambio constante, lo que lo hace un sector propicio para la aplicación de estos modelos.
Estas metodologías requieren de un conocimiento amplio de los modelos de técnicas estadísticas que están asociadas a éstos, que hacen que los resultados sean más cercanos a la realidad. El uso de estos modelos requiere que los datos cumplan un conjunto de supuestos que deben verificarse previamente para poder aplicar adecuadamente la metodología de Box – Jenkins, y en el caso de no cumplirse se debe realizar alguna transformación que ayude a adecuar los datos y posteriormente calcular los parámetros, después de esto se evalúa el modelo obtenido y se realizan los pronósticos requeridos. Estos procedimientos pueden resultar muy largos, complejos o tediosos, y debido a esto se busca dar solución al problema mediante las nuevas técnicas computacionales que han ido tomando una gran aceptación y uso en los últimos años, como lo son las Redes Neuronales Artificiales.
Las redes neuronales artificiales o RNA, son técnicas que intentan imitar el pensamiento del ser humano para tomar mejores decisiones. Esta herramienta permite que los coeficientes del modelo se adapten dinámicamente y consigue estimaciones con un error muy pequeño, haciendo que su uso sea muy efectivo en diversas áreas de investigación.
Los dos métodos mencionados se han considerado en el estudio con el fin de comparar su capacidad predictiva y así, pronosticar los ingresos tributarios mensuales del gobierno central para los años 2019-2020.
En el Perú actualmente uno de los principales problemas que afectan la recaudación de impuestos es la evasión del IGV, el cual, según SUNAT, en el 2016 ascendía 35.9% del total estimado a recaudar. Esta evasión reduce el ingreso tributario y por ende el ingreso corriente del gobierno central, haciendo que en ocasiones genere déficit fiscal debido a que la cantidad de gasto público que el estado debe realizar es mayor a los ingresos obtenidos. Es por esta razón que se debe realizar continuamente pronósticos de los ingresos que percibirá el gobierno central en el futuro para poder realizar una adecuada planificación del presupuesto público y no generar problemas que afecten la economía del país.
4
I.
ASPECTOS DE LA PROBLEMATICA
1.1. Descripción de la realidad problemática
En toda organización pública o privada existe la necesidad de planificar sus recursos, es por ello que se requiere predecir el comportamiento de fenómenos o eventos relacionados de forma directa o indirecta con la actividad a la que se dedican.
En el Perú, el estado está organizado en 3 niveles de gobierno: Gobierno Nacional, Gobierno Regional y Gobierno Local; y cada uno de ellos agrupa diferentes unidades ejecutoras o productoras de bienes y servicios públicos cuyos costos operativos deben ser financiados con tributos.
El Sistema Tributario peruano es el conjunto ordenado de normas, principios e instituciones que regulan las relaciones procedentes de la aplicación de tributos en el país. Actualmente, la Superintendencia nacional de aduanas y administración tributaria (SUNAT) es la encargada de administrar y aplicar la política tributaria en todo el país.
El ingreso tributario representa una importante fuente de ingresos económicos con los que cuenta el gobierno central. Este tipo de ingreso forma parte de los ingresos corrientes que percibe el estado a través de las entidades públicas que integran el gobierno central, y con los cuales se realiza el presupuesto público anual.
El estado tiene la importante tarea de planificar su presupuesto fiscal anual a través de los ingresos que percibe, es por eso necesita predecir la cantidad de ingresos que recaudará para ese año fiscal y así poder usar de manera eficiente los recursos de los que dispone y tratar de reducir y no excederse con el gasto público para no tener problemas que generen un déficit fiscal que pueda afectar gravemente la economía del país.
1.2. Formulación del problema de investigación
1.2.1. Problema general
¿Cuál es la capacidad predictiva del modelo de Redes Neuronales y de los modelos SARIMA para modelar los valores históricos de los ingresos tributarios mensuales del gobierno central en el Perú, desde enero del 2003 a diciembre del 2018?
5 1.3. Justificación
La presente investigación tiene como finalidad evaluar la capacidad predictiva mediante dos métodos de pronóstico como son las redes neuronales y los modelos SARIMA, sobre los valores históricos de los ingresos tributarios del gobierno central durante los meses de enero del 2003 hasta diciembre del 2018. Éste resultado aportará modelos científicos de predicción que después de verificarse la efectividad de los mismos, pueden ser utilizados en otros trabajos de investigación y en otras instituciones.
Debido a la importancia que tiene la buena planificación y toma de decisiones en las empresas e instituciones, ésta investigación beneficia a las instituciones del estado encargadas de planificar el presupuesto fiscal anual y aquellas instituciones que están asociadas al estado directa o indirectamente, ya que al obtener los resultados se podrá conocer a futuro el comportamiento de los ingresos tributarios como principal variable de los ingresos corrientes y así prever el gasto público del estado.
Además, esta investigación se realiza con el propósito de aportar al conocimiento existente sobre el uso y la aplicación de los modelos SARIMA y las Redes Neuronales como métodos de predicción con mejor efectividad en los pronósticos para la correcta toma de decisiones, y dada la naturaleza del objetivo de este estudio se determinará cuál de los modelos es el más efectivo al momento de realizar los pronósticos.
1.4. Objetivos
1.4.1. Objetivo general
Determinar la capacidad predictiva del modelo de Redes Neuronales y del modelo SARIMA en base a los valores históricos de los ingresos tributarios mensuales del gobierno central del Perú, desde enero del 2003 a diciembre del 2018.
1.4.2. Objetivos específicos
Describir el comportamiento de los ingresos tributarios mensuales del gobierno central en el Perú, desde el año 2003 hasta el 2018.
Estimar un modelo SARIMA para pronosticar los ingresos tributarios mensuales del gobierno central en el Perú, a través los valores históricos desde el año 2003 hasta el 2018.
Validar los supuestos que debe cumplir la serie de tiempo para la aplicación del modelo SARIMA.
6
Estimar los parámetros óptimos de las Redes neuronales para pronosticar los ingresos tributarios mensuales del gobierno central en el Perú, a través los valores históricos desde el año 2003 hasta el 2018
Seleccionar el modelo que presenta mejor ajuste, teniendo en cuenta el Error Cuadrático Medio (ECM) para pronosticar los ingresos tributarios mensuales del gobierno central en el Perú del periodo 2019 – 2020.
1.5. Delimitación de la investigación
Se empleará la información histórica de los ingresos tributarios mensuales del gobierno central (en millones de s/), que se publican en la página web oficial del Banco Central de Reserva del Perú.
7
II.
MARCO TEÓRICO
2.1. ANTECEDENTES DE LA INVESTIGACIÓN
2.1.1. Antecedentes Internacionales
Roberto y German (2011), realizaron un estudio en Argentina denominado “Modelización y predicción de series de tiempo financieras usando Redes Neuronales”.
Este estudio tiene como objetivo la modelización y predicción de series temporales financieras utilizando redes neuronales. Al respecto, se seleccionó una red neuronal total recurrente con dos capas ocultas, una capa para la función umbral lineal y otra para función arcotangente. Las series utilizadas fueron los índices MERVAL (Argentina) y DOW JONES (USA). Los resultados, obtenidos con información correspondiente al período 1995-2006, se evaluaron en términos de su capacidad de predicción según la dirección de cambio del output y se exponen comparándolos con la metodología tradicional de predicción correspondiente a modelos de tipo ARIMA y con evidencia similar obtenida por otros investigadores, con lo cual se concluyó que las redes neuronales tienen una mejor performance predictiva, aunque en ciertas situaciones fue levemente superior a los métodos convencionales.
Cruz (2008), realizó un estudio en titulado “Pronósticos en el mercado de derivados utilizando redes neuronales y modelos ARIMA: una aplicación al Cete de 91 días en el MexDer”.
El objetivo de esta tesis es proponer un modelo que permita pronosticar la tendencia de la serie del futuro del Cete de 91 días en el MexDer con vencimiento en diciembre de 2008, aplicando redes neuronales y series de tiempo, y comparar los pronósticos obtenidos de esta forma con los que se obtendría con un modelo ARIMA tradicional, con el fin de conocer qué modelo ajusta mejor los datos dentro de muestra y que modelo pronostica mejor los datos fuera de muestra.
La principal aportación es demostrar que el modelo propuesto basado en redes neuronales es capaz de obtener buenas aproximaciones tanto en el ajuste como en el pronóstico, además de observar que, en este caso en particular, la aproximación resulta mejor que la generada por medio de la metodología ARIMA. Así también, la tesis contiene una propuesta metodológica para la aplicación de las redes neuronales a las series de tiempo financieras.
Los resultados y las pruebas de hipótesis, tanto de la bondad de ajuste representada por R2 , y los estadísticos de Akaike y Schwarz indican que el modelo basado en RNA es mejor que el modelo ARIMA calculado y empleado como referencia para dentro de muestra.
Para fuera de la muestra, también se logró una ligera mejora expresada por los estadísticos RMSE y U de Theil, sin embargo, el error medio
8 absoluto porcentual MAPE resultó mayor al planteado en la hipótesis, por lo que se considera que es mejor modelo para pronósticos, aunque no absolutamente.
Ruelas (2013), elaboró un estudio denominado “Comparación de predicción basada en redes neuronales contra métodos estadísticos en el pronóstico de ventas”.
La intención de la presente investigación es realizar la comparación y selección de un método para pronosticar las ventas de forma eficiente y que beneficie a organizaciones que ofrecen sus productos al mercado ya que los pronósticos de ventas son datos de entrada a diferentes áreas de la empresa y de ser imprecisos pueden generar gastos para la organización. El caso de estudio en este artículo fue llevado a cabo dentro de la empresa Productos Frugo S.A. de C.V., dedicada a la comercialización de productos alimenticios. Los métodos y metodologías utilizados y posteriormente comparados al pronosticar las ventas de la empresa antes mencionada son: Método de Holt, Winters, la metodología Box Jenkins (ARIMA) y una Red Neuronal Artificial. Los resultados muestran que la red neuronal artificial obtuvo un mejor desempeño logrando el menor error cuadrático medio, de esta forma es posible establecer un panorama adecuado para el uso de la inteligencia artificial dentro de la industria.
2.1.2. Antecedentes Nacionales
Zavala (2017), ejecutó en Trujillo un estudio titulado “Pronostico de la producción pesquera por Redes Neuronales y modelos ARIMA” El objetivo de este estudio es determinar la eficiencia de las redes neuronales en el pronóstico de la exportación pesquera en el Perú en comparación con los modelos ARIMA. El resultado de este trabajo concluye en que las redes neuronales son más eficientes para el pronóstico de la exportación pesquera en el Perú. Esto de comprueba a través del CME del modelo ARIMA, el cual el mayor en un 38.39% con respecto al CME del modelo de la red neuronal.
Angulo (2016), realizó un trabajo de investigación denominado “Modelo ARIMA para el pronóstico de la liquidez monetaria mensual en el Sistema Financiero peruano”
En este estudio, el objetivo era determinar un modelo de pronóstico para la liquidez monetaria mensual en el sistema financiero peruano basado en la serie histórica desde enero del 2003 – julio 2014. Se utilizó la metodología de Box-Jenkins y el programa E-Views 6.0. El modelo estimado fue un modelo ARIMA (3,1,0) (3,0,4) con un R cuadrado de 0.659, y un criterio de información de Akaike igual a 17.89.
9 Vásquez (2017), ejecutó un estudio denominado “Modelo de Box-Jenkins y Redes Neuronales para pronosticar el precio del dólar en el sistema bancario en moneda nacional Año 2015.”
Esta investigación tuvo como objetivo Estimar un modelo mediante la metodología de Box y Jenkins y Redes Neuronales Artificiales que permita pronosticar el precio del dólar del Sistema Bancario en moneda nacional año 2015. La investigación es de tipo descriptiva, predictiva-longitudinal. Los datos para el pronóstico del precio de la compra y venta del dólar se obtuvieron de la página web del BCRP, contando con un periodo de 11 años desde 2004 hasta 2014.
El modelo para el pronóstico que se obtuvo mediante la metodología de Box y Jenkins es un ARIMA (2, 2,3), con un RMSE igual 0.983 para la compra con un MAE de 0.008 y la venta un ARIMA (3, 1,2) con un RMSE de 0.982y con un MAE de 0.008 indicando un buen coeficiente.
Por lo tanto, el modelo de Redes Neuronales Artificiales tiene una estructura de (12:1:5:1) con RMSE 0.042 para la compra y para la venta con estructura de (12:1:6:1) con RMSE 0.038.
Villalobos (2014), realizo un estudio denominado “Pronóstico de ingresos tributarios recaudados de Impuestos Generales a las Ventas a nivel Nacional por la SUNAT, mediante la metodología de Box y Jenkins y Redes Neuronales Artificiales para el Año 2014”.
En este estudio tuvo como objetivo pronosticar los ingresos tributarios por IGV recaudados por la SUNAT a nivel nacional mediante la metodología de Box - Jenkins y Redes Neuronales Artificiales, y determinar cuál de estos modelos ofrece mejores pronósticos.
Los resultados de este estudio arrojaron un modelo SARIMA(0,1,1)(1,1,0) con un MAE de 51132.35 y un RMSE 66921.87; por otra parte, se obtiene un modelo de red neuronal de 26:1:4:1, en donde 26 son las covariables, 1 es la capa oculta, 4 son los nodos de capa oculta, y 1 es la salida, con un MAE de 12364.14 y un RMSE de 69921.87. De estos 2 modelos se concluye que las Redes Neuronales Artificiales ofrecen un mejor pronóstico.
2.1.3. Antecedentes locales
Yajahuanca (2016), elaboró en Piura un trabajo de investigación titulado “Predicción del presupuesto participativo anual del gobierno regional mediante el modelo ARIMA y Suavizamiento Exponencial Piura 2015.”
La investigación tuvo como objetivo principal elaborar el presupuesto participativo anual del Gobierno Regional mediante modelo ARIMA y Suavización exponencial entre los años 1980 al 2013.
Para el procesamiento de los datos de esta investigación, se empleó e Software estadístico STATGRAPHICS versión 5.1 y el software E-VIEWS versión 7.0., concluyendo que el Modelo ARIMA es más eficiente para los pronósticos del PPA del Gobierno Regional de Piura para los años 2014 – 2017.
10 Salazar (2015), “Pronóstico de la ejecución del presupuesto asignado al gobierno regional de Piura en la unidad ejecutora 001 sede central para el periodo 2013 y 2014 aplicando el modelo Holt Winters y los modelos ARIMA y SARIMA. Piura, Perú.”
La presente investigación tuvo como objetivo principal evaluar las capacidades predictivas de los modelos Holt Winters, ARIMA Y SARIMA en el pronóstico de la ejecución de presupuesto asignado en el Gobierno Regional de Piura en la unidad ejecutora 001 sede central para el periodo 2013 y 2014, para el procesamiento de los datos se usó el Software estadístico EVIEWS y la hoja de cálculo MICROSOFT EXCEL 2007, concluyendo que el modelo con menor Error Cuadrático Medio fue el modelo de Holt Winters multiplicativo, lo que lo convierte en la mejor opción para el pronóstico de los montos girados de la Región Grau. Este resultado conduce a aceptar la hipótesis de que en el corto y mediano plazo (periodos mensuales) el modelo de Holt Winters proporciona mejores pronósticos que el Modelo ARIMA y SARIMA.
2.2. Bases teóricas
2.2.1. Pronósticos
Los pronósticos son predicciones de lo que puede suceder o esperar, son premisas o suposiciones básicas en que se basan la planeación y la toma de decisiones.
El propósito del pronóstico consiste en reducir el margen de incertidumbre, haciendo el mejor uso de la información que se tiene para guiar las actividades de la empresa hacia el cumplimiento de sus metas y objetivos. Los pronósticos se basan en el uso de datos anteriores de una variable para predecir su desempeño futuro. A este respecto, los datos anteriores se dan generalmente en la forma de series de tiempo. Una hipótesis básica en la aplicación de las técnicas de pronóstico es que el desempeño de los datos. (Uriel, 1985)
2.2.2. Serie de tiempo
Una serie de tiempo consta de datos que se reúnen, registran u observan sobre incrementos sucesivos de tiempo. En el análisis de series de tiempo de datos, una tendencia inmediata consiste en intentar explicar o contabilizar el comportamiento de las series. La tendencia de una serie de tiempo es el componente de largo plazo que representa el crecimiento o disminución en la serie sobre un periodo amplio, el componente cíclico es la fluctuación en forma de onda alrededor de la tendencia, el componente estacional es un patrón de cambio que se
11 repite a sí mismo año tras año, el componente aleatorio mide la variabilidad de las series de tiempo después de retirar los otros componentes.
Una serie temporal (o simplemente una serie) es una secuencia de N observaciones (datos) ordenadas y equidistantes cronológicamente sobre una característica (serie univariante o serie escalar) o sobre varias características (serie multivariante o vectorial) de una unidad observable en diferentes momentos.
El nombre de “serie de tiempo” no es del todo apropiado para denotar un conjunto de datos registrados de manera ordenada respecto al tiempo, pues es particular el término serie se utiliza en matemáticas para nombrar a una suma infinita de valores de una variable. Quía una terminología más apropiada para referirse al conjunto de datos que interesa podría ser el de sucesiones cronológicas; sin embargo, se continuara haciendo mención a series de tiempo, debido a que esta es la terminología más usual y común. (Guerrero, 2009)
2.2.2.1. Componentes de una serie de tiempo
La tendencia
Es un componente de una serie temporal que refleja su evolución a largo plazo. Puede ser de naturaleza estacionaria o constante (se representa con una recta paralela al eje de las abscisas), de naturaleza lineal, parabólica, exponencial.
Las variaciones cíclicas
Es un componente de la serie que recoge oscilaciones periódicas de amplitud superior a un año. Estas oscilaciones periódicas no son regulares y se presentan en los fenómenos económicos cuando se dan de forma alternativa, etapas de prosperidad o de depresión.
Las variaciones estacionales
Es un componente de la serie que recoge oscilaciones que se producen alrededor de la tendencia, de forma repetitiva y en periodos iguales o inferiores a un año. Por ejemplo, el clima afecta a la venta de una serie de productos, los helados y refrescos se venden fundamentalmente en verano y la ropa de abrigo en invierno, entre los factores más importantes que originan variaciones estacionales, se encuentran las condiciones climáticas, las costumbres sociales y las fiestas religiosas.
Las variaciones accidentales y/o regulares
Aznar y Trivez (1993), menciona que: “Es una componente de la serie que recoge movimientos provocados por factores imprevisibles (un pedido inesperado a nuestra empresa, una huelga,
12 también se conoce con el nombre de variaciones irregulares, residuales o erráticas)”.
2.2.2.2. Uso de las series de tiempo
Una de las herramientas estadísticas para uso en pronósticos de sucesos futuros que están, en alguna forma, entrelazados con la economía es el análisis de series de tiempo. Los fabricantes están en extremo interesados en los ciclos de altibajos de la propia economía así de las economías extranjeras de modo que puedan predecir mejor la demanda de sus productos, que a su vez impacta sus niveles de inventarios, requerimientos de personal, flujos de efectivo y casi todas las demás actividades de negocios dentro de la empresa. “Los científicos políticos están interesados en el uso de análisis de series de tiempo para estudiar los patrones de cambio del gasto de gobierno en defensa y programas de bienestar social. Es obvio que estas tendencias tienen un gran impacto en el futuro de industrias complejas”. (Hanke, 1996).
2.2.2.3. Análisis de series de tiempo
El análisis de series de tiempo está dedicado al estudio de series; por lo general, los datos de dichas series son independientes, pero están correlacionados; se puede decir que existe una relación entre observaciones contiguas.
Es el análisis de una secuencia de medidas hechas a intervalos específicos. El tiempo es usualmente la dimensión dominante de los datos. Sirven para establecer la efectividad de medidas que afectan a grupos poblacionales teniendo en cuenta las variaciones naturales que puede haber en el tiempo. Son muy comunes en la evaluación de leyes en la población. Permiten una visión parcial de la relación causa efecto, pero no pueden extrapolar los hallazgos de la población a individuos específicos.
El análisis de series de tiempo consiste en una descripción, generalmente matemática, de los movimientos y componentes presentes.
De acuerdo a Chatfield (1995), son varios los objetivos por los cuales se desea analizar una serie de tiempo:
Descripción: Al tener una serie de tiempo, el primer paso en el análisis es graficar los datos y obtener medidas descriptivas simples de las propiedades principales de la serie.
Explicación: Cuando las observaciones son tomadas sobre dos o más variables, es posible usar la variación en una serie para explicar la variación en las otras series.
13 Predicción: Dada una serie de tiempo se intenta predecir los valores futuros de la serie. Este es el objetivo más frecuente en el análisis de series de tiempo.
Control: Si una serie de tiempo se genera por mediciones de calidad de un proceso, el objetivo del análisis puede ser el control del proceso.
2.2.2.4. Clasificación descriptiva de las series de tiempo
Series Estacionarias. - Una serie es estacionaria cuando es estable a lo largo del tiempo, es decir, cuando la media y varianza son constantes en el tiempo. Esto se refleja gráficamente en que los valores de la serie tienden a oscilar alrededor de una media constante y la variabilidad con respecto a esa media también permanece constante en el tiempo.
No estacionarias. - Son series en las cuales la tendencia y/o variabilidad cambian en el tiempo. Los cambios en la media determinan una tendencia a crecer o decrecer a largo plazo, por lo que la serie no oscila alrededor de un valor constante.
2.2.2.5. Modelo
Un modelo es expresado, en símbolos de forma matemática. Para la construcción de un buen modelo es necesario contar con el conjunto de datos observados. También es importante la experiencia, la intuición, la imaginación, la simplicidad y la habilidad para seleccionar el subconjunto más pequeño de variables. El primer paso es establecer el problema en forma clara y lógica delimitando sus fronteras, luego viene la recogida y la depuración de datos, el diseño del experimento; las pruebas de contraste; la verificación del modelo y la validación de las hipótesis.
Un modelo debe ser una buena aproximación al sistema real, debe incorporar los aspectos importantes del sistema y debe resultar fácil de comprender y manejar. Un factor muy importante es que debe presentar una alta correlación entre lo que predice el modelo y lo que actualmente ocurre en el sistema real.
2.2.2.6. Ruido blanco
Un ruido blanco es un caso simple de los procesos estocásticos, donde los valores son independientes e idénticamente distribuidos a lo largo del tiempo con media cero e igual varianza, se denota por 𝜺𝒕.
14 𝜺𝒕~ 𝐍(𝟎, 𝛔𝟐) 𝑪𝒐𝒗 (𝜺
𝒕𝒊, 𝜺𝒕𝒋) = 𝟎 ∀ 𝒕𝒊 ≠ 𝒕𝒋
Figura 1. Gráfica de un Ruido Blanco
2.2.2.7. Estacionalidad
La estacionalidad se define por una fluctuación cíclica o periódica de la serie temporal que se repite de forma regular. Desde un punto de vista analítico, la estacionalidad constituye una variación del proceso de debe ser extraída o controlada.
La mayoría de las series temporales, e ciencias psicológicas y sociales, quedarían bien representadas por los modelos de orden inferior, estos modelos cubren gran parte de los procesos temporales fácilmente identificables. Por desgracia, suele ocurrir que las series temporales presentan ciclos de carácter mensual, trimestral, anual, etc. De modo que se hallan afectados por fuertes componentes estacionales.
2.2.3. Modelos ARIMA
2.2.3.1. Modelos autorregresivos (AR)
Definimos un modelo como autorregresivo si la variable endógena de un periodo 𝒕es explicada por las observaciones de ella misma
15 correspondientes a periodos anteriores añadiéndose, como en los modelos estructurales, un término de error. En este caso de procesos estacionarios con distribución normal, la teoría estadística de procesos estocásticos afirma que, bajo determinadas condiciones previas, toda 𝒀𝒕puede expresarse como una
combinación lineal de sus valores pasados.
Los modelos autorregresivos se abrevian con la palabra AR tras la que se indica el orden del modelo: AR (1), AR (2), etc. el orden del modelo expresa el número de observaciones retrasadas de las series de tiempo analizadas que intervienen en la ecuación.
La expresión genérica de un modelo autorregresivo AR (p) seria de la siguiente forma:
𝒀𝒕 = ∅𝟏𝒀𝒕−𝟏+ ∅𝟐𝒀𝒕−𝟐+ ⋯ + ∅𝒑𝒀𝒕−𝒑+ 𝜺𝒕
Donde:
𝜺𝒕 ~ 𝑵(𝟎, 𝝈𝟐)
Los procesos AR (p), también se puede escribir de forma abreviada como:
∅𝒑(𝑳)𝒀𝒕 = 𝜹 + 𝜺𝒕
Donde ∅𝒑(𝑳) se le conoce como Operador polinomial de retardos:
∅𝒑(𝑳) = 𝟏 − ∅𝟏(𝑳) − ∅𝟐(𝑳𝟐) − ⋯ − ∅𝒑(𝑳𝟐)
Además, al término L, se le conoce como Operador de retardo, tal que al multiplicar una variable en 𝒕, dé el valor de la misma variable en 𝒕 − 𝟏:
𝑳𝒀𝒕 = 𝒀𝒕−𝟏
Normalmente, se suele trabajar con modelos autorregresivos de ordenes bajos: AR (1), AR (2), o bien con órdenes coincidentes con la prioridad de datos se la serie analizada, si es trimestral AR (4), si es mensual AR (12), Si resulta que, para datos mensuales, el modelo autorregresivo establece un modelo de índices estacionales que son los coeficientes estimados. Como se mencionó previamente, puede eliminarse el propio patrón estacional para investigar si hay otro modelo que abarca varios años, o si el modelo se extiende a un plazo más largo. Naturalmente, el modelo autorregresivo puede también revelar variaciones cíclicas menores de doce meses. Se debe tener en cuenta que es necesario imponer ciertas restricciones a los valores de los parámetros de este modelo para que funcione correctamente estacionario.
2.2.3.2. Procesos de medias móviles
Un modelo de Box-Jenkins denominados de medias móviles es aquel que explica el valor de una determinada variable en un periodo t, en función de un término independiente. Las medias móviles son indicadores que allanan o suavizan, en mayor o menor medida, de tal manera que eliminan determinadas fluctuaciones, sean a corto, medio o largo plazo. Estos modelos se denotan normalmente con las siglas MA, seguidos como en el caso de los modelos autorregresivos, del orden entre paréntesis. La notación, MA (q) que se refiere a un modelo de media móvil de orden q.
16 Entonces La expresión genérica de un modelo autorregresivo MA (q) seria de la siguiente forma:
𝒀𝒕 = 𝜇 + 𝜶𝒕 − 𝜽𝟏𝜶𝒕−𝟏− 𝜽𝟐𝜶𝒕−𝟐− ⋯ − 𝜽𝒒𝜶𝒕−𝒒
Dónde 𝜶𝒕es un ruido blanco con las propiedades ya definidas.
Obsérvese que el proceso de medias móviles corresponde a una combinación lineal de variables ruido blanco, siendo los coeficientes “theta” los “ponderadores” de la combinación lineal. Esto es, se asemeja a la definición de un “promedio” de las variables ruido blanco (aunque los coeficientes no sumen en general la unidad, una propiedad que deben cumplir los promedios).
Modelo MA(1)
𝒀𝒕 = 𝜶𝒕− 𝜽𝟏𝜶𝒕−𝟏 = (𝟏 − 𝜽𝟏𝑳)𝜶𝒕 Donde 𝜶𝒕es un ruido blanco.
2.2.3.3. Proceso autorregresivo de media móvil (ARMA)
La combinación de procesos AR y MA da lugar a los procesos mixtos ARMA. La notación ARMA (p,q), se refiere a un modelo con p términos autorregresivos y q términos de media móvil. La formulación general de un proceso ARMA (p,q), es:
𝒀𝒕 = 𝑪 + ∅𝟏𝒀𝒕−𝟏+ ∅𝟐𝒀𝒕−𝟐+ ⋯ + ∅𝒑𝒀𝒕−𝒑+ 𝜶𝒕− 𝜽𝟏𝜶𝒕−𝟏 − 𝜽𝟐𝜶𝒕−𝟐− ⋯ − 𝜽𝒒𝜶𝒕−𝒒
2.2.3.4. Procesos ARIMA no estacionarios
La mayor parte de las series económicas corresponden a procesos no estacionarios. Así, si se desea obtener un tratamiento de las series basado en el “análisis de series de tiempo” (modelos ARMA), es necesario discutir mecanismos de transformación de las series a procesos estacionarios.
En 1970, Box y Jenkins desarrollaron un cuerpo metodológico destinado a identificar, estimar y diagnosticar modelos dinámicos de series temporales en los que la variable tiempo juega un papel fundamental.
En principio pueden presentarse distintas (infinitas) formas por las que se introduce la no estacionariedad en un proceso estocástico. Sin embargo, interesa considerar solo algunas formas de la no estacionariedad que sean adecuados para describir el comportamiento de series temporales y, al mismo tiempo, posibles de ser transformados en procesos estacionarios.
17 2.2.3.5. Modelo ARIMA (p,d,q)
Un modelo ARIMA (p,d,q) es una serie temporal que se convierte en un ruido blanco después de ser diferenciada d veces. El modelo general ARIMA (p,d,q) denominado proceso autorregresivo integrado de medias móviles de orden p,d,q, toma la siguiente expresión:
(𝟏 − ∅𝟏𝑩 − ∅𝟐𝑩𝟐− ⋯ − ∅
𝒑𝑩𝒑)(𝟏 − 𝑩)𝒅𝒀𝒕
= (𝟏 − 𝒗𝟏𝑩 − 𝒗𝟐𝑩𝟐− 𝒗
𝒒𝑩𝒒)𝜶𝟏
Entendiendo que puede haber más de un proceso generador de la serie (en la parte regular y en la estacional) y escribiendo una combinación delos modelos MA (q) y AR (p) que han precisado de una serie de diferenciaciones "d" en la parte regular o "D" en la parte estacional para que fueran estacionarios.
2.2.4. Modelos ARIMA estacionales
En estadística, a menudo, las series temporales poseen un componente estacional que se repite en todas las observaciones. Para las observaciones mensuales s = 12 (12 en 1 año), para las observaciones trimestrales s = 4 (4 en 1 año). Para hacer frente a la estacionalidad, los procesos ARIMA han sido generalizados, estableciendo los modelos SARIMA (Seasonal Autoregressive Integrated Moving Average Model).
Un modelo estacional general será de la forma ARIMA(p,d,q)(P,D,Q)s, donde p,d y q son parámetros de la parte regular y P,D y Q son los parámetros de la parte estacional, Su ecuación general podría expresarse en términos del operador de diferencias B de la siguiente forma: (𝟏 − ∅𝟏𝑩𝒔− ∅ 𝟐𝑩𝟐𝒔− ⋯ − ∅𝒑𝑩𝒑𝒔)(𝟏 − ∅𝟏𝑩 − ∅𝟐𝑩𝟐− ⋯ − ∅𝒑𝑩𝒑)(𝟏 − 𝑩𝒔)𝑫(𝟏 − 𝑩)𝒅𝒀 𝒕 = (𝟏 − 𝜣𝟏𝑩𝒔− 𝜣𝟐𝑩𝟐𝒔− ⋯ − 𝜣𝑸𝑩𝑸𝒔)(𝟏 − 𝒗𝟏𝑩 − 𝒗𝟐𝑩𝟐− 𝒗𝒒𝑩𝒒)𝜶𝟏
Para detectar la estacionalidad en la práctica pueden utilizarse los siguientes caminos:
El grafico de la serie. Nos da una idea de los posibles periodos estacionales.
El grafico de las subseries estacionales. Identifica gráficamente los periodos estacionales presentando secciones sucesivas de los mismos.
18
El grafico de las subseries anuales. Valida gráficamente los periodos estacionales presentando comportamientos paralelos para cada estación.
Las funciones de autocorrelación simple y autocorrelación parcial estimadas. Validan los periodos estacionales de acuerdo a las siguientes consideraciones:
Los coeficientes de la FAC para retardos múltiplos del periodo estacional de la serie deben ser significativamente distintos de cero.
Para una cantidad grande de retardos de las FAC se configura en forma de abanico que completa su ciclo girando sobre el eje de abscisas para una cantidad de retardos igual al periodo estacional. La FACP debe presentar estructura de coeficientes significativos para retardos periódicos (largos). La FAC y la FACP deben considerarse a la vez, pues a veces
intercambian sus papeles en el comportamiento estacional.
El periodograma. Es una figura que transforma la serie temporal de su dominio natural (que es el tiempo) al dominio de las frecuencias (mediante transformaciones de Fourier a los valores). Se tendrá en cuenta la siguiente:
Si no hay picos destacables en el periodograma no hay estacionalidad.
Cada pico destacable identifica un periodo que incluso puede ser un ciclo.
A cada amplitud destacable le corresponde una frecuencia cuya inversa es el periodo estacional o el ciclo, con lo que el periodograma identifica la longitud del periodo estacional y en su caso el ciclo.
Las amplitudes más fuertes correspondientes a valores más bajos de las frecuencias suelen corresponder a ciclos y las menos fuertes suelen corresponder a estaciones. Si hay dudas entre ciclos y estaciones podemos apoyarnos de las funciones de autocorrelación para discriminar.
2.2.5. Redes neuronales
2.2.5.1. La neurona biológica
A finales del siglo XIX se logró una mayor comprensión del cerebro gracias a los de Ramón y Cajal en España y Charles Sherrington en Inglaterra, Investigación y Ciencia (1991). Cajal trabajo en la anatomía de las redes neuronales biológicas y demostró que el tejido de cerebro no es una masa continua sino una red de unidades discretas denominadas neuronas. Sherrington realizo investigaciones para entender el funcionamiento de la sinapsis o puntos de conexión entre neuronas.
Se estima que hay 26 000 millones de neuronas en el cerebro humano y en un área de un milímetro cuadrado hay
19 aproximadamente 50 000. E tamaño y forma de las neuronas es variable, pero todas poseen las mismas subdivisiones anatómicas.
Figura 2. Partes de la Neurona Biológica
La Figura 2, muestra una neurona biológica y sus partes. El soma o cuerpo de la célula, contiene el núcleo y es el encargado de las actividades metabólicas de toda la neurona, el soma puede recibir información de otras neuronas a través de la sinapsis en su superficie. Las dendritas son estructuras que parten del soma con ramificaciones, se especializan en la recepción de señales de otras células nerviosas por medio de conexiones sinápticas.
El axón permite enviar impulsos a otras células nerviosas. En algunas neuronas se inician en la unión del axón y el soma, luego se transmiten a lo largo del axón a otras células nerviosas. Cuando el axón está cerca de sus células de destino se divide en ramificaciones que forman sinapsis con el soma o axones de otras células.
La Sinapsis en una conexión entre dos células nerviosas. Las sinapsis pueden ser excitativas o inhibitorias según el neurotransmisor que se libere.
2.2.5.2. La neurona artificial
Una neurona artificial es un procesador elemental, en el sentido de que procesa un vector x (x1,x2,...xN) de entradas y produce un
respuesta o salida única. Los elementos clave de una neurona artificial los podemos ver en la siguiente figura:
20 Figura 3. Esquematización de una neurona artificial
Las entradas que reciben los datos de otras neuronas. En una neurona biológica corresponderían a las dendritas.
Los pesos sinápticos 𝑊𝑖𝑗 Al igual que en una neurona biológica se establecen sinapsis entre las dendritas de una neurona y el axón de otra, en una neurona artificial a las entradas que vienen de otras neuronas se les asigna un peso, un factor de importancia. Este peso, que es un número, se modifica durante el entrenamiento de la red neuronal, y es aquí por tanto donde se almacena la información que hará que la red sirva para un propósito u otro.
Una regla de propagación. Con esas entradas y los pesos sinápticos, se suele hacer algún tipo de operación para obtener el valor del potencial postsinaptico (valor que es función de las entradas y los pesos y que es el que se utiliza en último término para realizar el procesamiento).
2.2.5.3. Características básicas de una RNA
Las redes neuronales artificiales buscan simular las tres características básicas de una red neuronal biológica. (Hilera, 1995)
a) Procesamiento paralelo: capacidad de incorporar y analizar simultáneamente muchos datos.
b) Memoria distribuida: cada neurona tiene parte de la información necesaria para obtener una respuesta en la salida. c) Adaptabilidad: habilidad que poseen las neuronas de cambiar sus conexiones, dependiendo de la estimulación y la respuesta deseada.
21 Lo anterior les permite a las redes neuronales artificiales aprender y generalizar a partir de un conjunto de datos de relación matemática desconocida.
2.2.5.4. Funciones de activación
La selección de la función de activación (FA) depende del criterio del investigador y del problema en estudio. En muchas ocasiones se selecciona por ensayo y error. Existen diversos tipos de FA. Entre los más utilizados están:
Función paso: la salida de este tipo de FA puede ser 0 o 1, dependiendo si el parámetro de la función es positivo o negativo. Se usa para problemas de clasificación.
𝒇(𝒗) = { 𝟏 𝒔𝒊 𝒗 ≥ 𝟎 𝟎 𝒔𝒊 𝒗 < 𝟎 Función rampa: su salida está entre -1 y 1.
𝒇(𝒗) = {
−𝟏 𝒔𝒊 𝒗 ≤ −𝟏 𝒗 𝒔𝒊 − 𝟏 < 𝒗 < 𝟏
𝟏 𝒔𝒊 𝒗 ≥ 𝟏
Función logística o sigmoidea: su salida comprende valores entre 0 y 1. Es la FA más usada en redes neuronales y se recomienda para problemas de predicción.
𝒇(𝒗) =
𝟏
𝟏 + 𝒆
−𝒗Función tangente hiperbólica: es semejante a la función logística, pero su salida está entre -1 y 1. Se utiliza con frecuencia en redes multicapas.
𝒇(𝒗) = 𝑻𝒂𝒏𝒉(𝒗)
Función Gaussiana: Su rango está entre 0 y 1. Se utiliza en redes neuronales de función de base radial, las cuales pueden aplicarse a problemas de predicción.
𝒇(𝒙) = 𝒆
− 𝒗𝟐 𝝈𝟐 2.2.5.5. Características de operación de las RNALa RNA puede tener factores de peso fijo o adaptable: las que tienen pesos adaptables emplean leyes de aprendizaje para ajustar el valor de la fuerza de una interconexión con otras neuronas. Si las neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente definida. Los pesos serán determinados a partir de una descripción completa del problema. Por otra parte, los pesos
22 adaptables son esenciales si no se conoce previamente cuál deberá de ser su valor correcto.
Dos tipos de aprendizaje: existen dos tipos de aprendizaje: supervisado y no supervisado. El primero ocurre cuando se le proporciona a la red tanto la entrada como la salida correcta, y la red ajusta sus pesos tratando de minimizar el error de su salida calculada. Este tipo de entrenamiento se aplica, por ejemplo, en el reconocimiento de patrones. El entrenamiento no supervisado se presenta cuando a la red se le proporcionan únicamente los estímulos, y la red ajusta sus interconexiones basándose únicamente es sus estímulos y la salida de la propia red. Las leyes de aprendizaje determinan cómo la red ajustará sus pesos utilizando una función de error o algún otro criterio. La ley de aprendizaje adecuada se determina en base a la naturaleza del problema que se intenta resolver.
Dos fases de operación: las RNA adaptables tienen dos fases en su operación:
Entrenamiento de la red. El usuario proporciona a la red un número "adecuado" de estímulos de entrada, y de salida. La red entonces ajusta sus pesos de interconexión o sinapsis hasta que la salida de la red está "lo suficientemente cerca" de la salida correcta.
Recuperación de lo aprendido. A la red se le presenta un conjunto de estímulos de entrada y ésta simplemente calcula su salida. Cuando la red emplea entrenamiento no supervisado, algunas veces será necesario que reajuste su sinapsis durante la fase de recuperación.
No son algorítmicas. - La gran diferencia del empleo de las redes neuronales en relación con otras aplicaciones de la computación radica en que no son algorítmicas, es decir, no se programan haciéndoles seguir una secuencia predefinida de instrucciones. Las RNA generan ellas mismas sus propias "reglas", para asociar la respuesta a su entrada; es decir, aprende por ejemplos y de sus propios errores. El conocimiento de una RNA se encuentra en la función de activación utilizada y en los valores de sus pesos.
Asociar y generalizar sin reglas como en el cerebro humano. Las redes neuronales formadas por los perceptrones se interconectan en forma muy similar a como las neuronas humanas se disponen en la corteza cerebral humana, y lo más importante, son capaces de asociar y generalizar sin reglas. Han sido utilizadas con gran éxito para reconocer retornos de sonar bajo el agua, escritura a mano, voz, topografía de terrenos, controlar brazos de robots, evaluar datos personales, modelar fenómenos cognoscitivos, y, predecir tendencias financieras.
23 Requieren de algún tipo de patrón. - La clase de problemas que mejor se resuelven con las redes neuronales son los mismos que el ser humano resuelve mejor: asociación, evaluación y reconocimiento de patrones. Las redes neuronales son perfectas para problemas que son muy difíciles de calcular pero que no requieren de respuestas perfectas; sólo respuestas rápidas y buenas. Tal y como acontece con el escenario bursátil en el que se quiere saber ¿compro?, ¿vendo?, ¿mantengo?, o en el reconocimiento cuando se desea saber ¿se parece? ¿es el mismo, pero tienen una ligera modificación?
Por otra parte, las redes neuronales son muy malas para cálculos precisos, procesamiento serie, y no son capaces de reconocer nada que no tenga inherentemente algún tipo de patrón. Es por esto que no pueden predecir la lotería, que ya por definición es un proceso al azar.
2.2.5.6. Arquitectura de la red
El término arquitectura de red se refiere a la forma o estructura de una RNA. La arquitectura de un modelo de RNA incluye los siguientes componentes: entradas, capas y salidas; así mismo, la interconexión y dirección de la red, que se refiere a la forma en que se interrelacionan las neuronas. El algoritmo de aprendizaje está muy relacionado con la arquitectura de la red.
Componentes
Entradas: es el canal de alimentación de la red. Se deberán establecer el número de entradas de acuerdo al caso en estudio. Los datos de entradas son numéricos y en muchos casos puede ser conveniente escalarlos y/o pre-procesarlos. El escalamiento se refiere a un cambio de escala, convertirlos a datos entre 0 y 1, entre -1 y 1, o estandarizarlos, de acuerdo al rango de las funciones de activación involucradas. El pre-procesamiento se refiere a la aplicación de algún método estadístico de exploración de datos que permita cualquier transformación que mejora el conjunto original de datos en beneficio de un mejor desempeño de la red. Capas ocultas o intermedias: se refiere al conjunto de neuronas que se encuentran entre la entrada y salida de la red. Con frecuencia no es suficiente una sola neurona para resolver un problema, sino que se requiere de varias neuronas que operen en paralelo, lo que se denomina capa, e inclusive pudieran ser necesarias varias capas. A la red con una sola capa se le denomina red unicapa, mientras que a la red con dos o más capas se le denomina red multicapa. El número de capas y de neuronas o nodos que componen cada capa debe especificarse en la arquitectura. El número de capas deberá ser
24 mayor si el problema es no lineal y complejo, pero, en general, un problema podrá representase bastante bien con una o dos capas. El número de neuronas por capa puede variar entre una capa y otra. Aunque existen algunos criterios para determinar el número de nodos por capa, éstos deberán determinarse por ensayo y error.
Salidas: son neuronas o nodos de salida. El número de salidas de la red dependerá del problema en estudio. La salida de la red deberá estar expresada en la misma escala de los datos originales, es decir, si los datos fueron escalados, deberán ser regresados a su escala inicial. Si se realizó un pre-procesamiento deberá hacerse un post-pre-procesamiento.
Interconexión:
Las interconexiones entre capas de las redes pueden clasificarse como:
Totalmente conectadas: la salida de una neurona de la capa i es entrada a todas las neuronas de la capa i+1.
Localmente conectadas: la salida de una neurona de la capa i es entrada a una región de las neuronas de la capa i+1.
Dirección:
La dirección de la información de las redes puede clasificarse en:
Redes de alimentación adelantada: las salidas de las neuronas de una capa sólo se propagan a las neuronas de la capa siguiente. Es decir, la información fluye solamente de la entrada a la salida.
Redes retroalimentadas: las salidas de las neuronas de una capa pueden ser entradas de las neuronas de las capas anteriores.
Redes de alimentación lateral: las salidas de las neuronas puedes ser entradas de las neuronas de la misma capa.
25 Figura 4. Red multicapa totalmente conectada y de alimentación
adelantada.
2.2.5.7. Metodología para predicción de un modelo univariable (series de tiempo) con redes neuronales artificiales.
A continuación, se especifican los pasos que se sigue para construir, entrenar y probar una red neuronal para predecir valores futuros de una serie de tiempo, basada únicamente en sus valores pasados.
1) Escalamiento de los datos: transformar los datos a valores comprendidos entre 0 y 1, utilizando la siguiente fórmula, o utilizando alguna otra fórmula para la normalización de los datos.
𝒛𝒕 = 𝒚𝒕− 𝑴𝒊𝒏 𝑴𝒂𝒙 − 𝑴𝒊𝒏 Dónde:
𝒚𝒕: son los valores originales de la serie de tiempo
𝑴𝒊𝒏 𝒚 𝑴𝒂𝒙: Valor mínimo y máximo de la serie de tiempo respectivamente.
𝒛𝒕: Valores de la serie de tiempo transformados en valores entre 0 y 1.
2) Patrones de entrenamiento y de prueba
Los valores de la serie de tiempo se dividen en dos conjuntos de datos: patrones de entrenamiento, formado por el 80% de los datos y utilizados en el entrenamiento de la RNA; y patrones de prueba, formado por el 20% restante, utilizado para evaluar la capacidad de generalización o predicción de la red.
26 3) Determinación de las entradas
Pueden considerarse varias recomendaciones que ayudarán en la selección de las entradas a la RNA:
La periodicidad de los datos: como en este trabajo la información de la serie de tiempo es mensual, es lógico pensar en considerar 12 retrasos.
Pruebas de ensayo y error: en algunos casos considerar diferentes retrasos (6, 12, 18…) ayudaría a tener mayor precisión para la selección de la mejor topología de red neuronal.4) Determinación del número de nodos de la capa oculta Una regla ad hoc, descrita por Masters, que en experimentos previos ha resultado de utilidad, es asumir que el valor inicial del número de nodos de la capa oculta sea igual a la raíz cuadrada del número de entradas (m) y salidas (n), es decir, √𝑚. 𝑛 (si el valor obtenido es decimal se redondea).
Pueden realizarse pruebas por ensayo y error, agregando más nodos, y comparando los errores de ajuste y predicción (Ejm: 3, 4, 5, 6).
5) Algoritmo de entrenamiento: Retropropagación
6) Selección de los pesos iniciales: Escoger los pesos iniciales puede ser crucial y es recomendable probar con diferentes conjuntos de valores iniciales para tratar de obtener buenos resultados. Se selecciona el modelo que obtenga el menor promedio entre la raíz de cuadrados de los errores de ajuste y predicción.
7) Entrenamiento de la RNA seleccionada: Para entrenar la red es necesario establecer el número máximo de ciclos, el error permitido de convergencia y la tasa de aprendizaje. Una vez definida la RNA, con su ecuación se generan los valores de la serie de tiempo ajustada o producida por la red, utilizando los patrones de entrenamiento.
8) Predicción: Usando la ecuación de predicción definida por la RNA se obtiene el valor de predicción t+1. Para hacer predicciones más allá del periodo t+1, se utiliza ésta como entrada para producir la predicción t+2 y así sucesivamente, calculando el error de la predicción.
27 2.2.6. Sistema tributario peruano
El Sistema Tributario peruano es el conjunto ordenado de normas, principios e instituciones que regulan las relaciones procedentes de la aplicación de tributos en el país y que sirven de instrumento para la transferencia de recursos de las personas al Estado. Se rige bajo el Decreto Legislativo N° 771 (enero de 1994), denominado como la Ley Marco del Sistema Tributario Nacional.
Según la Constitución de 1993, el Estado es el poder político organizado en tres niveles de gobierno: nacional, regional y local, y cada uno de ellos agrupa diferentes unidades ejecutoras o productoras de bienes y servicios públicos cuyos costos operativos deben ser financiados con tributos.
2.2.6.1. Elementos del sistema tributario peruano
El Sistema Tributario peruano cuenta con 3 elementos principales, que sirven de columna para su funcionamiento eficiente:
Política tributaria:
Son aquellos lineamientos que dirigen el sistema tributario. Está diseñada por el Ministerio de Economía y Finanzas (MEF). La política tributaria asegura la sostenibilidad de las finanzas públicas, eliminando distorsiones y movilizando nuevos recursos a través de ajustes o reformas tributarias.
Norma tributaria:
La Política tributaria se implementa a través de las normas tributarias. Comprende el Código Tributario.
Administración tributaria
La constituyen los órganos del Estado encargados de aplicar la política tributaria. A nivel nacional, es ejercida por la Superintendencia Nacional de Aduanas Administración Tributaria (SUNAT).
2.2.6.2. Tributos administrados por el gobierno central
Impuesto a los ingresos: Comprende la recaudación por conceptos de pagos a cuenta y regularización del impuesto a la renta, que grava rentas que provengan del capital, del trabajo y de la aplicación conjunta de ambos factores, las ganancias de capital, otros ingresos que provengan de terceros y rentas imputadas de acuerdo a su normativa
28 Impuesto General a las Ventas: es el impuesto que se aplica a las operaciones de venta e importación de bienes muebles, prestación o utilización de servicios, los contratos de construcción y la primera venta de inmuebles que realicen los constructores de los mismos.
Impuesto Selectivo al Consumo: Tributo al consumo específico. Es el impuesto que se aplica solo a la de producción o importación de determinados productos como combustibles, cigarrillos, licores, cervezas, juegos, entre otros.
Impuesto Extraordinario de Solidaridad: Grava las remuneraciones que se abonan a los trabajadores mensualmente, y de quienes presten servicios sin relación de dependencia.
Impuesto a las Importaciones (Derechos Arancelarios): Son los derechos aplicados al valor de las mercancías que ingresan al país, contenidas en el arancel de aduanas.
2.2.6.3. Tributos administrados por el Gobierno Local
Impuesto Predial: Tributo de periodicidad anual que grava el valor de los predios urbanos y rústicos (terrenos, edificaciones e instalaciones fijas y permanentes). No aplica para propiedades de Universidades, centros educativos y concesiones mineras.
Impuesto de Alcabala: Grava la transferencia de inmuebles a título oneroso o gratuito.
Impuesto al Patrimonio Vehicular: Grava la propiedad de vehículos nacionales o importados, con antigüedad no mayor de 3 años. Son de periodicidad anual.
2.3. Glosario de términos básicos Ingreso tributario
Ingresos percibidos por el Estado, a través de impuestos. Están conformados por los tributos internos y aduaneros recaudados por SUNAT, excluidas las Contribuciones Sociales.
Gobierno central
Comprende las entidades públicas del Gobierno General que están bajo el ámbito de la Ley Anual del Presupuesto Público, excluyendo a la Oficina de Normalización Previsional (ONP), a los organismos reguladores, supervisores y de registros públicos y a los Gobiernos Locales. Conjunto de entidades constituidas por ministerios, oficinas y otros organismos bajo el ámbito del Poder ejecutivo
29 Pronóstico
Es la predicción de lo que sucederá con un elemento determinado dentro del marco de un conjunto dado de condiciones.
Red Neuronal Artificial (RNA)
Es un modelo computacional basado en un gran conjunto de unidades neuronales simples (neuronas artificiales) que tratan de imitar el comportamiento de las neuronas en los cerebros biológicos.
2.4. Hipótesis
En los periodos mensuales, el Modelo SARIMA proporciona mejores pronósticos que las Redes Neuronales.
2.5. Definición y operacionalización de variables
Ingresos Tributarios del Gobierno Central: están conformados por los tributos internos y aduaneros recaudados por SUNAT, excluidas las Contribuciones Sociales.
VARIABLE DEFINICION INDICADOR TIPO
Ingreso Tributario del gobierno central
Es la cantidad total mensual del Ingreso Tributario del gobierno central peruano (en millones de s/) - Ingreso Tributario mensual (en millones de s/) Cuantitativa continua