UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS ESCUELA PROFESIONAL DE ESTADÍSTICA
“Modelo pronóstico para la producción de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019”
TESIS
PARA OPTAR El TÍTULO PROFESIONAL DE INGENIERO ESTADÍSTICO
AUTOR : Valverde Nolasco, Lehder David ASESOR : Dr. Risco Dávila, Carlos Alfonso
TRUJILLO - PERÚ 2021
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Dedicatoria
A mis padres Rodolfo Valverde y Emiliana Nolasco que me apoyaron constantemente y por ello soy un profesional y una gran persona y soy lo que soy gracias a sus consejos, amor y ayuda en los momentos difíciles y también a mi esposa Suzumi León por su gran apoyo en mis momentos difíciles.
Esta tesis se la dedico a mi Dios que supo guiarme por el buen camino, darme fuerzas y no desmayar en los problemas que se me presentaron, enseñándome a encarar las adversidades sin perder nunca la dignidad ni fallecer en el intento.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Agradecimiento
Primeramente, te agradezco a ti mi Dios, por haberme permitido terminar el presente trabajo de tesis, por bendecirme, por llegar hasta donde he llegado, porque hiciste realidad mi sueño anhelado.
Agradezco a la Universidad Nacional de Trujillo por darme la oportunidad de estudiar y ser un profesional.
A mis padres, por su esfuerzo y dedicación, quienes, con sus conocimientos, su experiencia, su paciencia y motivación lograron que pueda terminar mis estudios con éxito, porque todos han aportado un granito de arena a mi trabajo.
A mi asesor de tesis, el Dr. Risco Dávila, Carlos Alfonso, por su aporte y dedicación en este trabajo porque gracias a sus conocimientos y orientaciones, he logrado concluir una etapa más de mi vida.
Son muchas las personas que han formado parte de mi vida profesional a las que me encantaría agradecerles su amistad, consejos, ánimo y compañía en los momentos más difíciles de mi vida. Algunos están junto a mí y otras en mi recuerdo y corazón, sin importar en dónde estén, quiero darles las gracias por formar parte de mí, por todo lo que me han brindado y por todas sus bendiciones.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
PRESENTACIÓN
De conformidad y cumplimiento con lo expuesto por el reglamento de grados y títulos de la Facultad de Ciencias Físicas y Matemáticas de la Escuela Profesional de Estadística de la Universidad Nacional de Trujillo, someto a vuestro elevado criterio a la evaluación de la siguiente tesis titulada: “ Modelo pronóstico para la producción de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019” , elaborando con el propósito de optar el título de Ingeniero Estadístico.
Confío en vuestro criterio profesional para la respectiva evaluación del presente trabajo, así mismo agradezco a los miembros del jurado: Dr. Risco Dávila, Carlos Alfonso en carácter de asesor, a la Dra. Chu Campos, Rosa Adriana y Dra. Lucy Angélica Yglesias Alva por las sugerencias y apreciaciones que hicieron al respecto.
Trujillo, febrero del 2021
Br. Lehder David Valverde Nolasco
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
RESUMEN:
“Modelo pronóstico para la producción de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019”.
Autor: Valverde Nolasco, Lehder David.
Asesor: Dr. Risco Dávila, Carlos Alfonso.
La presente investigación es de tipo descriptivo, siendo el objetivo principal determinar el modelo que mejor pronostica la producción mensual de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A. en el periodo enero 2012– noviembre 2019, para ello se realizó un muestreo no probabilístico, se obtuvo una muestra de 95 registros de los reportes mensuales de producción de caña de azúcar (toneladas métricas) en el periodo enero 2012 – noviembre 2019. La variable de estudio es la Producción de caña de azúcar (toneladas/mes), se realizó un modelo de serie de tiempo utilizando la metodología de Box-Jenkins hallándose que el modelo más apropiado fue un ARIMA (1, 1, 12), los coeficientes AR (-0.229527) y MA (0.726968) los cuales fueron altamente significativos con valores de P de 0.001 y 0.000 respectivamente. Se concluye que el modelo para la Producción de caña de azúcar de la Empresa Agroindustrial Laredo S.S.A. periodo enero 2012 – noviembre 2019
PALABRAS CLAVE: Modelo ARIMA, Serie de tiempo, Box-Jenkins, Producción de caña de azúcar.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
ABSTRACT:
"Forecast model for the production of sugarcane in the Agro-industrial Company Laredo S.A.A from January 2012 to November 2019".
Author: Valverde Nolasco, Lehder David.
Advisor: Dr. Risco Dávila, Carlos Alfonso.
This research is descriptive, the main objective being to determine the model that best predicts the monthly production of sugarcane in the Empress Agro-industrial Laredo S.A.A. in the period January 2012 - November 2019, a non-probability sampling was performed. A sample of 95 records was obtained from the monthly reports of sugarcane production (metric tons) in the period from January 2012 to November 2019. The variable of study was Production of sugar cane (tons / month), a time series model was performed using the Box-Jenkins methodology finding that the most appropriate model was an ARIMA (1, 1, 12), the AR coefficients (- 0.229527) and MA (0.726968) which were highly significant with P values of 0.001 and 0.000 respectively. It is concluded that the model for the Production of sugar cane of the Agro-industrial Company Laredo S.S.A. Period January 2012 - November 2019
KEY WORDS: ARIMA model, Time series, Box-Jenkins, Sugarcane production.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
ÍNDICE
Dedicatoria ... ii
Agradecimiento ... iii
PRESENTACIÓN ... iv
RESUMEN:... vi
ABSTRACT: ...vii
ÍNDICE ... viii
Índice figuras ... x
Índice de tablas ...xii
CAPITULO I: INTRODUCCIÓN ... 1
1.1. REALIDAD PROBLEMÁTICA: ... 1
1.2. PROBLEMA: ... 9
1.3. JUSTIFICACIÓN DEL PROBLEMA: ... 9
1.4. HIPÓTESIS:... 10
1.5. OBJETIVOS: ... 10
1.5.1. Objetivo general:... 10
1.5.2. Objetivos Específicos: ... 11
CAPITULO II: MARCO TEÓRICO ... 12
2.1. FUNDAMENTACIÓN TEÓRICA: ... 12
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
2.2. FUNDAMENTACIÓN ESTADÍSTICA ... 13
2.2.1. DEFINICIONES ESTADÍSTICAS: ... 13
2.2.2. MODELOS DE PRONÓSTICO CON UNA VARIABLE ... 17
2.2.3. METODOLOGÍA DE BOX-JENKINS ... 20
3.1. MATERIAL DE ESTUDIO: ... 32
3.1.1. POBLACIÓN: ... 32
3.1.2. MUESTRA: ... 32
3.1.3. VARIABLE DE ESTUDIO: ... 32
3.1.4. TIPO DE INVESTIGACIÓN: ... 32
3.1.5. DISEÑO DE CONTRASTACIÓN DE HIPÓTESIS: ... 33
3.1.6. UNIDAD DE ANÁLISIS:... 33
3.1.7. MARCO MUESTRAL: ... 33
3.2. MÉTODOS DE ESTUDIO: ... 34
3.2.1. RECOLECCIÓN DE DATOS: ... 34
3.2.2. ANÁLISIS ESTADÍSTICO: ... 34
3.2.3. PROCESAMIENTO DE DATOS: ... 36
CAPITULO IV: RESULTADOS ... 37
CAPÍTULO V: CONCLUSIONES Y RECOMENDACIONES ... 53 VI. REFERENCIAS ... 54
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Índice figuras
Figura 1Diagrama de flujo de la Metodología de Box-Jenkins. ... 23 Figura 2 Coeficientes de autocorrelación y autocorrelación parcial para un modelo AR (1), Hanke y Reitsch “Pronósticos en los negocios”. Pag 433. ... 24 Figura 3 Coeficientes de autocorrelación parcial para un modelo AR(2), (Hanke & Wichern, 2006, pág. 443) ... 24 Figura 4 Coeficientes de autocorrelación parcial para un modelo AR(2), (Hanke & Wichern, 2006, pág. 443) ... 25 Figura 5 Fuente (Hanke & Wichern, pronósticos en los negocios, pág. 383) ... 25 Figura 6 Guarati y Porter (2009), pág. 778. ... 34 Figura7 Producción de caña de azúcar de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 37 Figura 8 Producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 37 Figura 9 Primera diferenciación de producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 38 Figura 10 Correlograma para la producción de caña de azúcar en logaritmo de la Empresa
Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 40 Figura 11 Correlograma para la producción de caña de azúcar en logaritmo de la Empresa
Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 41 Figura 12 Prueba de Jarque-Bera para los errores del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figura 13 Correlograma para los residuos del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 45 Figura 14 Forecast del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en
logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. . 47 Figura 15 Series de la producción de caña de azúcar, de los residuos y del pronóstico mediante el modelo ARIMA (1, 1, 12) de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 48
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Índice de tablas
Tabla 1 Prueba de Raíz Unitaria para la producción de caña de azúcar en logaritmo de la
Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 39 Tabla 2 Modelo ARIMA (1,1,12) con intercepto para la producción de caña de azúcar en
logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. . 42 Tabla 3 Modelo ARIMA (1,1,12) sin intercepto para la producción de caña de azúcar en
logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. . 43 Tabla 4 Prueba de Heterocedasticidad de White para los errores en el modelo de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019... 44 Tabla 5 Prueba de Heterocedasticidad de White de los errores en el modelo de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019. ... 46
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
CAPITULO I: INTRODUCCIÓN
1.1. REALIDAD PROBLEMÁTICA:
La Empresa Agroindustrial Laredo S.A.A está incorporada en el grupo manuelita y se dedica principalmente a la producción de azúcar de una gran calidad orientada al sector Industrial peruano.
Sus labores se desarrollan en la capital de Trujillo, región La Libertad, Perú; y tiene un área de hectáreas cultivadas de 7.137 en caña de azúcar en las cuales más del 30% están sembradas en el desierto de la libertad, se utiliza una avanzada tecnología en el riego por goteo con aguas que derivan del canal CHAVIMOCHIC que trae agua de la sierra.
Como sub productos de la elaboración de la caña de azúcar, La Empresa mercantiliza bagazo, mieles, el alcohol industrial y extra fino, que se utiliza mayormente en la industria farmacéutica. Durante el 2009 logro procesar más de 1.1 millones de toneladas de caña de azúcar y producir más de 126.00 toneladas de azúcar.
La caña de azúcar antes de ser llevado al proceso de filtración, evaporación y clasificación viene por un proceso de molienda donde se extrae el jugo contenido en la fibra de la caña de azúcar. En los molinos donde se exprime la caña y se lava el bagazo aminorando el tamaño de las partículas que componen el bagazo, para obtener un bagazo desfibrado.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Misión: La empresa tiene como visión generar progreso y bienestar con empresas y con productos agroindustriales ejemplares a partir del aprovechamiento racional y sostenible de los recursos naturales
Visión: Crear valor a sus accionistas, mejorando la rentabilidad y crecimientos en productos, clientes y mercado. Incrementando su participación en el mercado azucarero, reforzando sus procesos agrícolas y fabriles desarrollando la gestión gremial, ambiental, comunitaria y reforzando el capital humano, organizacional y tecnológico.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Objetivo: Fortalecer la fidelización de sus clientes mejorando procesos y creando valor para nuestras partes interesadas. Busca dar continuidad al mejoramiento continuo de sus procesos y productos para ser reconocidos como la empresa azucarera peruana con los mas altos índices de calidad e inocuidad de sus productos, que ofrece el servicio postventa personalizado para todos sus clientes y ser el proveedor preferido por el mercado nacional.
La superficie cosechada a nivel de Empresa al año 2012, fue de 81,149 hectáreas cosechadas. Las empresas de Casa Grande, Cartavio, Laredo, Paramonga, Tumán, Pomalca tuvieron una participación del 80% en la superficie cosechada a nivel nacional.
El resto de empresas participaron con un 20%. Aquí también se encuentran los productores independientes que tienen áreas sembradas de caña de azúcar que al
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
momento de cosechar realizan la molienda en las empresas azucareras que les brindan el servicio (Bracamonte, 2012).
A nivel mundial el azúcar se comercializa en tres mercados diferentes: el mercado interno, el mercado externo de cuotas preferenciales y el mercado externo no preferencial. Se cultiva en 120 países y por la importancia que se le da como alimento, debido a que se trata de un componente de la dieta básica de los seres humanos, aproximadamente el 69% de la producción mundial de azúcar cruda se comercializa en los propios mercados internos. El 31% restante se negocia en el mercado internacional.
(Grain, 2009)
A partir de los 70’s Lambayeque sufrió las consecuencias de la drástica reducción de la producción de azúcar durante la gestión de las cooperativas azucareras, lo que felizmente se ha revertido desde hace unos años con la inyección de capital privado que ha permitido recuperar los niveles de rendimiento que se tenía antiguamente. Empresas como Tumán, Laredo y Agro Pucalá volvieron a ser rentables. (Tumán S.A.A, 2007)
La Empresa Laredo cuenta con un área neta de 7,935.48. Has.; para el cultivo de la caña de azúcar, de los cuales se distribuyen en la actualidad de la siguiente manera: área en cultivo 5,735.63 Has, área en preparación 1,114.34 Has, con manchas 1,088.50 Has y con una capacidad máxima de molienda diaria de 3,800 toneladas de caña para ser procesada en fabrica y también una dependencia de los sembradores (terceros) un 35% de la masa total de caña para moler (Laredo S.A.A , 2015).
La caña de azúcar es el principal cultivo de la región, representando más del 25 por ciento del producto agrícola de 2012. Las principales zonas de cultivo se encuentran en
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
los valles de Chicama y Santa Catalina donde se ubican importantes ingenios azucareros como Casa Grande S.A.A, Cartavio S.A. y Agroindustrial Laredo S.A. (Laredo S.A.A)
En México, el cultivo de caña de azúcar es una actividad agrícola de relevancia económica, que se genera en los 227 municipios colocados en los 15 estados, se obtiene el 13% (4000000 de gente dependen directamente de su cultivación); produce el 0.6% del producto bruto interno (PIB) nacional: 7.9% de PIB en un sector agropecuario, el 3.5%
de la producción. México es el sexto productor de azúcar en el mundo y en la zafra 2005- 2006 la superficie sembrada fue de 659 124 ha, con una producción total de caña molida alrededor de los 47 290 412 Mg, significando una producción azucarera de 5 282 088 Mg, con rendimientos de fábrica del 11.17% y de campo de 71.75 Mg ha-1 (Rivera, 2017).
Antecedentes
Ruiz & Rodríguez (2010), en su investigación referida a “Análisis de series de tiempo en el pronóstico de la producción de caña de azúcar” cuyo objetivo de este trabajo fue determinar el mejor modelo de pronóstico que explique el comportamiento de la zafra o cosecha de la caña del ingenio Independencia en México y pronosticar la zafra 2006- 2007; Siendo una investigación de tipo descriptivo, aplicada y longitudinal. Se realizo la metodología Box-Jenkins donde se construye un modelo de serie temporal llamado ARIMA para encontrar el mejor ajuste de la serie temporal de la producción de la caña de azúcar, a fin de que los pronósticos sean más acertados para los años 2006 y 2007. La población está constituida por el volumen de las cosechas de caña de azúcar, siendo la muestra obtenidas de las cosechas de caña de azúcar desde 1949 a 2006 y se utilizó el
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
programa Statistica. En los resultados el mejor modelo ARIMA (1,2,0) con el cual se pronosticó que la zafra 2006-2007 sería de 11 974 toneladas de azúcar, en contraste con la producción real de 12 736 toneladas, lo que indica que el pronóstico realizado con el modelo es preciso en un 94%, y este resultado estuvo influenciado por la disminución de la superficie sembrada en un 1.5%.
Vidal (2012), En su tesis Modelo SARIMA para el pronóstico de la masa mensual del río Jequetepeque, se trazó el objetivo de obtener un modelo adecuado de serie de tiempo que describa el comportamiento de la masa mensual del río Jequetepeque en la región La Libertad. Se empleó una serie comprendida desde el periodo de enero de 1944 a diciembre del 2014, el modelo de pronóstico identificado fue una serie estacionaria estacional y el modelo de pronóstico estimado fue un SARIMA (1,0,0) (3,0,0)12 cuya ecuación es: 𝑌 ̂ 𝑡 = 0.5510𝑌𝑡−1 − 0.7641𝑌𝑡−12 − 0.5797𝑌𝑡−24 − 0.3754𝑌𝑡−36, siendo probada la adecuacidad del modelo. Se pronosticó la masa mensual del Río Jequetepeque de enero a diciembre del 2014 y se evaluó los pronósticos con: la Desviación Absoluta Media (DAM) de 26.825 millones de m3, el Error Medio Cuadrático (EMC) de 1,786.915, el Porcentaje de Error Medio Absoluto (PEMA) de 0.311% y el Porcentaje Medio del Error (PME) de 0.405%.
Gonzáles (2016), En su investigación Modelos para estimar el rendimiento agrícola en Cuba a partir de la composición de cepas y la lluvia de mayo a octubre, se trazaron como objetivo mejorar las estimaciones del rendimiento agrícola del cultivo de caña de azúcar en Cuba. Para ello se empleó registros del rendimiento por cepas, el rendimiento total, el
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
área ocupada por cada cepa, el área total cañera y las precipitaciones de mayo a octubre, en 54 ingenios azucareros en el periodo de 1978 a 2012; se realizó cuatro modelos de regresión lineal múltiple, se comparó usando el coeficiente de determinación R2. Se concluyó que el modelo 3 es un buen estimador puntual del rendimiento agrícola del cultivo de caña de azúcar.
Pérez (2017), En su tesis Modelo de estimación de la producción de caña de azúcar a través de imágenes de satélite en ingenio madre tierra, se trazó como objetivo evaluar un modelo estimado de producción obtenido de imágenes satelitales Landsat 8 para caña de azúcar. Se correlacionó la variable índice de vegetación de diferencia normalizada con la variable rendimiento en toneladas de caña por hectárea, se generó un modelo de regresión lineal simple para quince escenarios distintos, el modelo con mayor coeficiente de determinación (R2=0.1070) fue el evaluado por la finca Limones temporada 2014-2015.
Palomino (2017), En su tesis modelo univariante para describir y predecir la extracción mensual de estaño en la Empresa Minera MINSUR S.A. del distrito de Antauta, período 2002 – 2017, se trazó como como objetivo determinar el mejor modelo univariante multiplicativo para describir y predecir el comportamiento de la serie histórica de la extracción de estaño. Se utilizó la Metodología de Box-Jenkins, se llegó a la conclusión de que el mejor modelo univariante para predecir fue el modelo integrado ARIMA (0,1,1) (0,1,1) tuvo mejor ajuste, respecto a la serie de la extracción mensual de estaño en la Empresa Minera San Rafael MINSUR S.A.
Rodríguez (2018), En su tesis pronósticos de ventas utilizando series temporales del producto nutrileche de la Empresa DECAR S.A. localizada en la ciudad de Machala. Se
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
trazó como objetivo determinar el pronóstico utilizando series de tiempo para la
estimación de ventas del producto en la empresa, para ello se utilizó la serie de volumen de ventas mensuales. La serie no presentó tendencia por lo que se el modelo obtenido fue pronóstico de suavización exponencial simple.
Ramírez & Santiago (2019), En su trabajo “Estimación del rendimiento del cultivo de Passiflora Edulis (Maracuyá) a partir de modelos estadísticos”, se trazaron como objetivo estimar el pronóstico del rendimiento utilizando dos modelos: ARIMA y Regresión Múltiple. Se empleó datos históricos entre 2007 y 2014 de las variables independientes agroclimáticas y el rendimiento del cultivo de maracuyá, se concluyó que el modelo de regresión múltiple subestima los picos de mayor rendimiento y el ajuste del modelo es bajo, siendo el modelo ARIMA el que mejor ajuste tiene a las series de tiempo analizado.
El modelo Arima cumple con modelar y reemplazar predicciones adecuadas, en su estudio utilizo la metodología de Box – Jenkins probando que el modelo ARIMA (1,1,1)(0,1,1)12 el cual según todas las funciones de autocorrelación y los criterios permite asegurar que esté explica el comportamiento de la producción de carbón por toneladas en Colombia en los años 1995 y 2015, además tiene la facultad de hacer predicciones de esta variable en un mediano plazo, lo que posibilita utilizar este modelo econométrico como instrumento para procurar conocer la evolución de la producción del carbón en Colombia y anticiparse en la toma de decisiones económicas.
Así, cabe señalar que algunos de los programas utilizados para realizar el pronóstico de la producción de caña de azúcar mediante el método de Box-Jenkins han sido EViews Gómez,( 2007).
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
El objetivo del presente trabajo fue generar un modelo de series de tiempo que sirviese para pronosticar la zafra 2006-2007 del ingenio Independencia. Así, se consideró el volumen de las cosechas obtenidas desde 1949 a 2006 y, mediante el programa Statistica se aplicó el modelo de Box-Jenkins y, con el modelo autorregresivo integrado de medias móviles (1,2,0) obtenido, se pronosticó que la zafra 2006-2007 sería de 11 974 toneladas de azúcar, en contraste con la producción real de 12 736 toneladas, lo que indica que el pronóstico realizado con el modelo es preciso en un 94%, y este resultado estuvo influenciado por la disminución de la superficie sembrada en un 1.5%. Ruiz & Rodríguez (2011).
Al cierre del 2018, ascendieron a 160,000 las hectáreas de caña de azúcar cultivadas en el país, que representaron un 17% más que al cierre del 2017 (136,000). Además de ampliar sus cultivos, los empresarios del rubro están invirtiendo cada vez más en tecnología (APAAD, 2018)
1.2. PROBLEMA:
¿Qué modelo pronostica mejor la producción mensual de caña de azúcar en la Empresa Agroindustrial Laredo S.A. periodo enero 2012 – noviembre 2019?
1.3. JUSTIFICACIÓN DEL PROBLEMA:
Este estudio, es importante porque busca desarrollar una propuesta de mejora en la predicción de la necesidad del recurso humano para la Empresa Agroindustrial Laredo S.A.A que produce caña de azúcar.
Una de las áreas de mayor desarrollo a nivel econométrico en los últimos años ha sido los modelos ARIMA o metodología de Box-Jenkins, no solo por el interés teórico en sí
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
mismo, esta propuesta considera la orientación de las nuevas herramientas decisionales, donde se enfatizan las técnicas de Box-Jenkins, diseñar novedosos y eficientes pronósticos, para producir soluciones adecuadas que se aproximen al óptimo, con esta
finalidad, la presente investigación tiene como propósito construir el mejor modelo de pronóstico para la producción mensual de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A.
Por lo expuesto, es importante la realización del presente trabajo de investigación, para así poder contar con una descripción de la metodología de predicción, que influya en la administración del recurso, y que contribuya en alguna medida a mejorar los niveles de eficiencia de la producción de la caña de azúcar.
1.4. HIPÓTESIS:
El modelo Arima pronostica mejor la producción de caña de azúcar en la Empresa Agroindustrial Laredo S.A. en el periodo enero 2012–noviembre 2019.
1.5. OBJETIVOS:
1.5.1. Objetivo general:
Determinar el modelo que mejor pronostica la producción mensual de caña de azúcar en la Empresa Agroindustrial Laredo S.A. en el periodo enero 2012–
noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
1.5.2. Objetivos Específicos:
➢ Obtener el modelo Arima en la serie de producción de la caña de azúcar, en la Empresa Agroindustrial durante el periodo enero 2012– noviembre
2018.
➢ Validar el modelo de la serie de producción de la caña de azúcar, en la Empresa Agroindustrial durante el periodo diciembre 2018– noviembre 2019.
➢ Pronosticar la producción mensual de caña de azúcar en la empresa Agroindustrial Laredo S.A de 6 meses del periodo diciembre 2019– mayo 2020.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
CAPITULO II: MARCO TEÓRICO
2.1. FUNDAMENTACIÓN TEÓRICA:
La experiencia ha demostrado que la mayoría de los fenómenos reales de carácter, ya sea económico o de otra índole, son complejos y es necesario para una representación más real de ésta, la aplicación de técnicas específicas que permitan una mayor flexibilidad a los modelos, introduciendo para estos una componente aleatoria.
El método Box-Jenkins de pronóstico es diferente de la mayoría de los métodos. Esta técnica no asume ningún patrón particular en los datos históricos de la serie a pronosticar.
Utiliza un enfoque iterativo de identificación de un modelo útil a partir de los modelos de tipo general. El modelo elegido se verifica contra los datos históricos para ver si describe la serie con precisión. El modelo se ajusta bien si los residuos entre el modelo de pronóstico y los puntos de datos históricos son residuos, distribuidos de manera aleatoria e independiente.
Una parte importante de esta metodología está pensada para liberar al investigador econometría de la tarea de especificación de los modelos dejando que los propios datos temporales de la variable a estudiar nos indiquen las características de la estructura probabilística subyacente. En parte, los procedimientos que vamos a analizar se contraponen a la "forma tradicional" de identificar y especificar un modelo apoyándonos en las teorías subyacentes al fenómeno analizado, aunque, convenientemente utilizados, los conceptos y procedimientos que examinaremos constituyen una herramienta útil para ampliar y complementar los conocimientos econométricos básicos.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
2.2. FUNDAMENTACIÓN ESTADÍSTICA 2.2.1. DEFINICIONES ESTADÍSTICAS:
Serie de tiempo Serie de tiempo se llama así a un conjunto de valores observados durante una serie de periodos temporales secuencialmente ordenada, tales periodos pueden ser días, meses, trimestres y años. (Gujatati & Porter, 2010)
Fundamentalmente, lo que se quiere con el estudio de las series temporales es el discernimiento de una variable a través del tiempo, a partir de este entendimiento y bajo el supuesto de que no se van a producir cambios estructurales, para poder realizar predicciones (Makridakis & Wheelwright, 2011).
Componentes de una serie de tiempo: los cuatro componentes que se encuentran en una serie de histórica son: (Hanke & Reitsch, 1996, pág. 319) Tendencia: Representa el comportamiento de series de tiempo a largo plazo sobre un extenso periodo de años.
Y(t)
0 t
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Variación cíclica: es el conjunto de fluctuaciones en forma de ondas o ciclos alrededor de la tendencia, representa la diferencia entre valores esperados de una variable (tendencia) y los valores reales la variación residual que fluctúa alrededor de la tendencia.
Y(t)
0 t
Variación estacional: las variaciones estacionales se localizan típicamente en datos ordenados por trimestres, mes o semana, la variación estacional se refiere a una muestra de cambio regularmente recurrente a través del tiempo.
Componente aleatorio: mide la variabilidad de la serie de tiempo después de que se retiran los otros componentes.
Y(T)
t
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Proceso estocástico: Es una familia de variables aleatorias que suponemos definidas en un mismo espacio de probabilidades.
Para un tiempo t fijo, yt constituye una variable aleatoria cuyos valores forman el espacio de estados y el conjunto de instantes en el tiempo del espacio parametral.
Se define la media y la varianza como:
E { yt }= mt V { yt }= s2t
Serie estacionaria: Una serie es estacionaria cuando es estable a lo largo del tiempo, en conclusión, cuando la media y la varianza son constantes en el tiempo. Esto se refleja gráficamente en que los valores de la serie tienden a oscilar alrededor de una media constante y la variabilidad con respecto a esa media también permanece constante en el tiempo.
Ergocidad: para realizar inferencia estadística sobre los parámetros se tiene una serie temporal de T observaciones. Al aumentar el número de observaciones aumentará el número de parámetros desconocidos. Se puede demostrar que, cuando un proceso estocástico cumple ciertas condiciones, es posible estimar consistentemente características a partir de una realización del mismo, los procesos que cumplen tales condiciones se denominan ergódicos Una condición suficiente es que el lim γk = 0 cuando k tiende a infinito.
Ruido blanco: Es una secuencia de variables aleatorias independientes e idénticamente distribuidas con media y varianza finita.
Su esperanza es constante, µ, e igual a cero Cov (a
BIBLIOTECA
t , ta+k) = 0 para todo k≠ 0DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Paseo aleatorio: Llamamos paseo aleatorio a un proceso estocástico cuyas primeras diferencias forman un proceso de ruido blanco.
Estacionariedad: Considerando una serie temporal como la realización de un proceso estocástico, se dirá que éste es estacionario en sentido débil si tiene momentos de primer y segundo orden finitos y que no varían en función del tiempo.
Función de autocorrelación (FAC): Es la correlación existente entre un variable desfasada uno o más periodo de la misma variable.
Función de autocorrelación parcial (FACP): Es una función que identifica el grado de relación entre los valores reales de una variable y los valores anteriores de la misma, mientras que se mantienen constante los efectos de las otras variables.
Error de pronóstico: o residual, es la diferencia entre valores observados y los valores de pronóstico.
et=Yt-Y̑t
Donde:
Yt: Valor de una serie de tiempo en el periodo t Y̑t: Valor de pronóstico para Yt
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
2.2.2. MODELOS DE PRONÓSTICO CON UNA VARIABLE
El modelo pronostica valores futuros en una serie de tiempo en los valores anteriores en una misma serie de tiempo. Cuando se usa el modelo univariable, los datos anteriores se examinan con el objetivo de reconocer un patrón de datos. Posteriormente, con el supuesto de este continuara en el futuro, con el objeto general de predicciones (Bowerman & O´ connell , 2007, pág. 11)
A. Modelos lineales estacionarios
a. Modelo Autorregresivo: AR(p)
Los modelos Autorregresivos (AR), expresan a Yt como una función lineal de un cierto número de valores reales a Yt, es decir escribimos en Yt en función de los valores pasados de la propia serie, e incluimos en la expresión de un término de perturbación o error, que suponemos que se comporta como un ruido blanco.
Sus funciones de autocorrelación descienden a cero en forma gradual, mientras que los coeficientes de autocorrelación parcial caen a cero después del primer periodo de retraso.
Modelo:
Yt= ϕ0 + ϕ1 Yt-1+ ϕ2 Yt-2 + …+ ϕpYt-p + ᶓt
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Donde:
Yt: variable dependiente
Yt-1, Yt-2, Yt-p: Variables dependientes que son desfasadas un numero especifico de periodos.
Φ0, Φ1, Φ2, … Φp: Coeficientes de Regresión.
ᶓt: Termino del residuo que representan sucesos aleatorios no explicados por el modelo.
p: Es el número de periodos de observaciones anteriores a incluir en el pronóstico del siguiente periodo.
b. Modelo de promedio móvil: MA(q)
Los modelos de promedio móvil (MA) proporcionan pronósticos de Yt con base en una combinación lineal de errores anteriores.
Su coeficiente de autocorrelación cae a cero después el “q” periodo de retraso y su coeficiente de autocorrelación parcial desciende a cero en forma gradual.
Modelo
Yt =
ω
0 +ᶓ
t -ω
1ᶓ
t-1 - …-ω
qᶓ
t-qDonde:
✓ Yt : Variable Dependiente
✓
ω
t-1,ω
t-2,ω
t-p:
peso especifico✓
ᶓ
t : Residuo o errorBIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
c. Modelo autorregresivo de modelo móvil: ARMA(p,q)
Los modelos autorregresivos y promedio móvil se combinan para formar el modelo general llamado ARMA.
En el modelo ARMA (p,q) habrá “p” términos Autorregresivos y “q” términos de medias móviles. Los modelos ARMA (p,q) ofrecen un potencial para ajustar modelos que no pudieron ajustarse en forma adecuada mediante los modelos AR y MA por sí solos.
Modelo:
Yt = C + ϕ1 Yt-1+ …+ ϕpYt-p + Ɵ2ᶓt-2 +…+Ɵq ᶓt-q + ᶓt Donde ᶓt es un proceso de ruido blanco, y c, ϕ1,…, ϕp , Ɵ1,….Ɵq, son los parámetros del modelo
B. Modelos lineales no estacionarios
a. Modelos Autorregresivos de Promedio Móvil Integrado: ARIMA(p,q,d)
Box-Jenkins (1970-1976) consideran una extensión del modelo ARMA para ocuparse de ciertos tipos especiales de series no estacionarias, considerando que dichas series estacionarias no pueden llegar a serlos si se le diferencia un número suficiente de veces, conduciendo a los modelos ARIMA.
Los modelos de promedio móvil autorregresivo integrado (ARIMA:
Autoregressive integrated moving average) constituyen una clase particular de procesos no estacionarios, donde “p” denota el número de términos autorregresivos, “d” el número de veces que la serie debe diferenciarse para
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
hacerse estacionaria y “q” el número de términos de promedio móviles y se defina como:
wt = ϕ0 + ϕYt-1 + …+ ϕpyt-p + ᶓt – ω1ᶓt-1 - … - ωqᶓt-q
Donde:
wt: Yt – Yt-d Variables dependientes
p: Números de términos Autorregresivos
d: Número de veces que la serie debe ser diferenciada “p” para hacerse estacionaria
q: Número de términos de media móvil.
2.2.3. METODOLOGÍA DE BOX-JENKINS
El método Box – Jenkins de pronóstico es diferente de la mayoría de los métodos. Esta técnica no asume ningún patrón particular en los datos históricos de la serie a pronosticar.
Utilizan un enfoque iterativo de identificación de un modelo útil a partir de modelos de tipo general. El modelo elegido se verifica contra los datos históricos para ver si describe la serie con precisión. El modelo se ajusta bien si los residuos entre el modelo de
pronostico y los puntos de datos históricos son reducidos, distribuidos de manera aleatoria e independiente, (Hanke & Reitsh, 1996, pág.431)
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Etapa1: identificación
En esta etapa encontramos los valores de apropiados de p,q,d.
Las herramientas principales en la identificación son:
• Gráfico de serie de tiempo:
Examen visual de la trayectoria de la serie a lo largo del tiempo puede dar una idea si es no estacionaria. Es una lista de fechas, cada una de las cuales se asocia a un valor (un número). Las series de tiempo son un modo estructurado de representar datos. Visualmente, es una curva que evoluciona a lo largo del tiempo. Por ejemplo, las ventas diarias de un producto pueden representarse como una serie de tiempo.
Prueba de raíz unitaria de Dickey-Fuller:
La hipótesis a probar es: H0: ρ=1 y para contrastar la hipótesis utilizaremos el siguiente estadístico:
Dónde:
ρ: Coeficiente obtenido de la regresión Yt sobre Yt-1 S: Error estándar de la regresión
Yt-1: Variable desfasada
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Si el valor calculado del estadístico t (el valor estático de t) excede a los valores absolutos críticos de Dickey y Fuller, no se rechaza la hipótesis de la serie de tiempo dada es estacionaria. Si, por el contrario, este valor es menor que el valor crítico, la serie de tiempo no es estacionaria y se tendría que diferenciar.
Por razones teóricas y prácticas, la prueba de Dickey-Fuller aumentada (ADF) se aplica a regresiones efectuadas en la siguiente forma.
Δy
i= μ + δy
t-1+ ᶓ
tPara contrastar hipótesis:
H0: Hay raíz unitaria (proceso no estacionario) H1: No hay raíz unitaria (proceso estacionario) Se rechaza H0 si |valor critico |
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 1Diagrama de flujo de la Metodología de Box-Jenkins.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 2 Coeficientes de autocorrelación y autocorrelación parcial para un modelo AR (1), Hanke y Reitsch
“Pronósticos en los negocios”. Pag 433.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 4 Coeficientes de autocorrelación parcial para un modelo AR(2), (Hanke & Wichern, 2006, pág. 443)
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
• Correlogramas: A través de la función de autocorrelación (FAC) y función de autocorrelación parcial (FACP) hallamos los correlogramas resultantes, que son simplemente los gráficos de FAC y de FACP respecto a la longitud del regazo.
ETAPA 2: Estimación
Tras identificar el modelo y los valores apropiados de p, y q, la siguiente etapa es estimar los parámetros de los términos autorregresivos y de promedios móviles incluidos en el modelo algunas veces este cálculo se efectúa mediante mínimos cuadrados simples, pero en otras hay que recurrir a métodos de estimación no lineal (en parámetros) (Gujarati & Porter, 2010, pág. 777)
Una vez hechas la estimación se elegirán los modelos que tengan menor suma de cuadrados del error y menor AIC (Criterio de información de Akike), AICc (Criterio de información de Akike corregido), BIC (Criterio de información Baseyano).
• Criterio de información a Akike (Shumway & Stoffer,2011, pág. 52)
𝐴𝐼𝐶 = 𝑙𝑜𝑔𝜎 ̂ K2 +(𝑛 + 2𝑘)/ 𝑛 Dónde:
σk2: Es la suma cuadrática de los residuos sobre n k: Número de parámetros en el modelo
n: Número de observaciones
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
• Criterio de información de Akike Corregido (Shumway & Stoffer,2011, pág. 53)
𝐴𝐼𝐶𝑐 = 𝑙𝑜𝑔𝜎 ̂K2 + (𝑛 + 2𝑘)/( 𝑛 − 𝑘 – 2) Dónde:
σk2: Es la suma cuadrática de los residuos sobre n k: Número de parámetros en el modelo
n: Número de observaciones
• Criterio de Información Bayesiano (Shumway & Stoffer,2011, pág. 53) Llamado también SIC (Criterio de Información de Schwarz)
BIC =
Dónde:
σ̑k2: Es la suma cuadrática de los residuos sobre n k: Numero de parámetros en el modelo
n: Numero de observaciones
Se evaluarán si los coeficientes del modelo son estadísticamente significativos:
Para ello se utilizarán el valor de la estadística p de cada coeficiente del modelo ARIMA ajustada, llegando a la conclusión que si p≤.05 de los coeficientes son estadísticamente significativos.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Etapa 3: Validación
Después de seleccionar un modelo y estimar sus parámetros, se trata de ver luego si el modelo seleccionado se ajusta a los datos en forma razonablemente buena. Para ello veremos lo siguiente.
• Un modelo sencillo para la adecuacidad del modelo en un ajuste razonable a los datos a obtener los residuos y calcular la FAC y FACP, si resultaran ser estadísticamente significativas para la mayoría de rezagos, se debe buscar otro modelo que represente mejor a la serie temporal.
• Los residuos del modelo estimado se aproxima el comportamiento de un ruido blanco.
La hipótesis a probar
H0 = ρ1 = ρ2 = ρ3 = … … … ρk = 0
Estadístico Q de Box y Pierce-Ljung, (Gujarati & Porter, 2009, págs. 753-754)
La estadística k está distribuida aproximadamente como una distribución ji cuadrada con k-p-q grados de libertad.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Dónde:
N: Longitud de la serie histórica.
K: Primera K autocorrelaciones que se verifican m: Número máximo de retrasos empleados.
Ρk: Función de autocorrelación de la muestra del K-ésimo término del residuo.
d: Grado de diferenciación para obtener una serie estacionaria.
Si el valor de Q calculado es mayor que X2 con k-p-q grados de libertad en nivel de significancia de a= 0.05, entonces se debe considerar que el modelo es inadecuado; es decir que los residuos no se aproximan al comportamiento de un proceso de ruido blanco.
Estadístico de Ljung-Box (LB), una variable del estadístico de Q de Box- Pierce teniendo mejores propiedades para muestras pequeñas que el estadístico Q
La estadística k esta distribuida aproximadamente como una distribución ji cuadrada con k-m (m: longitud del rezago) grados de libertad.
Si el modelo estimado supero satisfactoriamente todas las etapas antes
mencionadas, se estará en condiciones a utilizarlo en la predicción de valores futuros de la serie, en caso contrario se volverá en la etapa 1.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Etapa 4: Predicción
Una vez que se encontró un modelo adecuado, se puede utilizar el modelo para realizar pronósticos para uno o varios periodos a futuro. Debemos tener en cuenta que al haber más datos disponibles, se puede utilizar el mismo modelo para revisar los pronósticos, seleccionando otro periodo de origen y si la serie parece cambiar a través del tiempo, poder ser necesario recalcular los parámetros o incluso un modelo nuevo por completo (Reitsch & Hanke, 1996, pág. 441)
Desviación Absoluta Media (DAM): mide la precisión de un pronóstico mediante el promedio de los valores absolutos de cada error. Resulta de gran utilidad cuando el analista desea medir el error de pronóstico en las mismas unidades de la serie original.
DAM
Error Medio Cuadrado (EMC): Este enfoque penaliza los errores mayores de pronóstico ya que eleva cada uno al cuadrado, esto es importante pues en ocasiones pudiera ser preferible una técnica que produzca errores moderados a otra que por lo regular tenga errores pequeños, que ocasionalmente arroje algunos en extremos grandes.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Porcentaje de Error Medio Absoluto (PEMA): Este enfoque es útil cuando el tamaño o magnitud de la variable de pronóstico es importante en la evaluación de la precisión de pronóstico. El PEMA proporciona una indicación de que tan grande son los errores de pronóstico comparados con los valores reales de la serie. También se puede utilizar el PEMA para comparar la precisión de la misma u otra técnica sobre dos series completamente diferentes.
Porcentaje Medio de error (PME): Se emplea cuando se desea determinar si un método de pronóstico esta sesgado. Si el PME arroja un porcentaje cercano a cero, el enfoque de pronóstico no está sesgado. Si el resultado es un porcentaje negativo grande, el método de pronóstico esta sobreestimado de manera consistente. Si el Resultado es un
porcentaje positivo grande, el método de pronóstico esta subestimado de forma consistente.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
CAPÍTULO III: MATERIAL Y MÉTODOS
3.1. MATERIAL DE ESTUDIO:
3.1.1. POBLACIÓN:
La población objetivo está conformada por la producción mensual de caña de azúcar en la Empresa Agroindustrial Laredo S.A.A.
3.1.2. MUESTRA:
Esta metodología requiere que la serie de tiempo contenga al menos 60 datos (Pérez López, 2006); por el cual se trabajó con los reportes mensuales de producción de caña de azúcar (toneladas métricas) en el periodo enero 2012 – noviembre 2019 .
3.1.3. VARIABLE DE ESTUDIO:
Producción mensual de caña de azúcar (toneladas/mes).
3.1.4. TIPO DE INVESTIGACIÓN:
Enfoque cuantitativo porque usa la recolección de datos para probar hipótesis, con base en la medición numérica y el análisis estadístico, para establecer patrones de comportamiento y probar teorías. Así mismo es de tipo explicativa porque pretende establecer las causas de los eventos, o fenómenos que se estudian.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
3.1.5. DISEÑO DE CONTRASTACIÓN DE HIPÓTESIS:
La investigación pertenece a un diseño no experimental, según Hernández son estudios que se realizan sin la manipulación deliberada de variables y en los que sólo se observan los fenómenos en su ambiente natural para después analizarlos.
Diseño transaccional porque se recopilan datos en un momento único y correlacional causal, ya que describen relaciones entre dos o más categorías, conceptos o variables en un momento determinado, ya sea en términos correlacionales, o en función de la relación causa-efecto. (Hernandez &
Fernández, 2010, págs. 118-169) M: Yt --- Yt-1
Donde:
M: población
Yt: Variable Dependiente (La producción mensual en miles de toneladas de caña de azúcar en la empresa Agroindustrial Laredo S.A.A.
Yt-1: Rezagos de la Variable Dependiente.
3.1.6. UNIDAD DE ANÁLISIS:
Cada registro de la producción mensual de caña de azúcar (miles de toneladas/mes).
3.1.7. MARCO MUESTRAL:
Los 94 registros mensuales de la caña de azúcar (miles de toneladas/mes).
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
3.2. MÉTODOS DE ESTUDIO:
3.2.1. RECOLECCIÓN DE DATOS:
Para el desarrollo de este trabajo, los datos son obtenido directamente de la base de datos de la página BCRP para el periodo seleccionado en el estudio comprendido de enero 2012 – noviembre 2019
3.2.2. ANÁLISIS ESTADÍSTICO:
Se realizó empleando la metodología de Box-Jenkins, que comprende:
Figure 6 Guarati y Porter (2009), pág. 778.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Etapa 01: Identificación
• Determinar si la serie es estacionaria.
• Análisis gráfico.
• Emplear la prueba de Dickey – Fuller Aumentada para evaluar la presencia de raíz unitaria.
• Correlogramas de la función de autocorrelación (FAC) y función de autocorrelación parcial (FACP).
Etapa 02: Estimación
• Estimación de coeficientes.
• Criterio de información de Akaike.
• Criterio de información de Schwarz.
• Suma de cuadrados del Error.
• Coeficientes estadísticos significativos.
Etapa 03: Validación
• Correlogramas de la función de autocorrelación (FAC) y función de autocorrelación parcial (FACP) de los residuos.
• Evaluación de supuestos de Normalidad (Prueba de Jaque–Bera)
• Evaluación de supuesto de heteroscedasticidad (Prueba de White)
• Evaluación del supuesto de autocorrelación (Prueba de Breusch-Godfrey)
BIBLIOTECA
•DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Etapa 04: Pronostico
• Desviación Absoluta Media (DAM)
• Error Cuadrado Medio (EMC)
• Porcentaje del Error Medio Absoluta (PEMA)
• Porcentaje Medio del Error (PME)
3.2.3. PROCESAMIENTO DE DATOS:
El procesamiento de datos se realizó mediante el uso de los siguientes softwares Estadísticos:
EVIEWS 9.5: Para el modelamiento de la serie de producción por modelos Arima y cálculos de pronósticos.
MICROSOFT EXCEL 2016: Para comparar pronósticos de ambos modelos de los valores reales y pronosticados y obtener así el más eficiente.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
CAPITULO IV: RESULTADOS IDENTIFICACIÓN Y ESTIMACIÓN
200 400 600 800 1,000 1,200
2012 2013 2014 2015 2016 2017 2018 2019
Producción de caña de azucar (miles de TM)
5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0 7.2
producción de caña de azucar en logaritmos (miles de TM) Figura7 Producción de caña de azúcar de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
-.8 -.6 -.4 -.2 .0 .2 .4 .6
2012 2013 2014 2015 2016 2017 2018 2019
D1LPRODUCCION
Figure 9 Primera diferenciación de producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Tabla 1
Prueba de Raíz Unitaria para la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
Hipótesis Nula: LPRODUCCIÓN tiene una raíz unitaria Exógeno: Tendencia lineal constant
Longitud de retraso: 1 (Automática basada en SIC, MAXLAG=11)
t-estadística Prob.*
Estadística de prueba de Dickey-Fuller aumentada -5.173244 0.0003
Prueba de valores críticos: 1% level -4.060874
5% level -3.459397
10% level -3.155786
Nota. Fuente: Datos procedentes del Eviews 9.5
Ecuación de prueba Dickey-Fuller aumentada Variable dependiente: D(LPRODUCCION) Método: Mínimos cuadrados
Fecha: 03/09/20 Hora: 23:56
Muestra (equilibrada): 2012M03 2019M10 Observaciones incluidas: 92 después de ajustes
Variable Coeficiente Std. Error t-estadística Prob.
LPRODUCCION (-1) -0.39452 0.076262 -5.173244 0.0000
D(LPRODUCCION (-1)) 0.36009 0.099811 3.607763 0.0005
C 2.67413 0.517530 5.167119 0.0000
@trend (2012m01) -0.00024 0.000596 -0.410750 0.6823
R-cuadrado 0.252745 Var dependiente media 0.003882
R cuadrado ajustado 0.227270 S.D. variable dependiente 0.172120 S.E. de regresión 0.15130 Criterio de información Akaike -0.896567 Residuo suma al cuadrado 2.01453 Schwarz criterio -0.786924 Probabilidad de registro 45.2420 Hannan-Quinn criterio. -0.852314
F-estadistica 9.92145 Durbin-Watson estadistica 2.075938
Prob(F-estadistica) 0.00001
Nota. Fuente: Datos procedentes del Eviews 9.5
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 10 Correlograma para la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 11. Correlograma para la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
ETAPA DE VERIFICACIÓN Tabla 2
Modelo ARIMA (1,1,12) con intercepto para la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
Variable Coeficiente Std. Error z-estadistica Prob.
C -0.026623 0.013005 -2.047100 0.0406
AR(1) 0.123298 0.058234 2.117268 0.0342
MA(12) 0.579377 0.045805 12.64883 0.0000
Ecuación de varianza
C 0.005098 0.001783 2.859810 0.0042
RESID(-1)^2 1.476839 0.408156 3.618320 0.0003
R-cuadrado 0.191282 Var dependiente media 0.003882
R cuadrado ajustado 0.154100 S.D. variable dependiente 0.172120 S.E. de regresión 0.158304 Criterio de información de Akaike -1.141487 Residuo suma al cuadrado 2.180234 Criterio de Schwarz -1.004433 Probabilidad de registro 57.50839 Criterio de Hannan-Quinn. -1.086171 F-estadistica 5.144424 Estadistica de Durbin-Watson 2.283467 Prob(F-estadistica) 0.000909
Raíces AR invertidas .12
Raíces MA invertidas .92+.25i .92-.25i .68+.68i .68+.68i .25-.92i .25+.92i -.25-.92i -.25+.92i -.68-.68i -.68-.68i -.92-.25i -.92+.25i
Nota. Fuente: Datos procedentes del Eviews 9.5
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Tabla 3
Modelo ARIMA (1,1,12) sin intercepto para la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
Variable
Coeficien
te Std. Error z-estadistica Prob.
AR(1) -0.229527 0.066269 -3.463546 0.0005
MA(12) 0.726968 0.051704 14.06020 0.0000
Ecuación de varianza
C 0.007406 0.001785 4.148190 0.0000
RESIDUO (-1)^2 1.088166 0.332616 3.271535 0.0011
R cuadrado 0.236226 Var dependiente media 0.003882
R cuadrado ajustado 0.210188 S.D. var dependiente 0.172120 S.E. de regresión 0.152966 Criterio de información de Akaike -1.110427 Resid suma al cuadrado 2.059069 Criterio de Schwarz -1.000784 Probabilidad de registro 55.07963 Criterio de Hannan-Quinn. -1.066174 Durbin-Watson estadistica 1.859690
Raíces AR invertidas -.23
Raíces MA invertidas .94+.25i .94-.25i .69-.69i .69-.69i .25+.94i .25-.94i -.25-.94i -.25+.94i -.69+.69i -.69+.69i -.94-.25i -.94+.25i
Nota. Fuente: Datos procedentes del Eviews 9.5
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Tabla 4
Prueba de Heterocedasticidad de White para los errores en el modelo de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
Estadística de prueba Valor df Probabilidad F- estadística 93.25173 (4, 88) 0.0000
Chi- cuadrado 373.0069 4 0.0000
Resumen de hipótesis nula:
Restricción normalizada (= 0) Valor Est. Error.
C(1) -0.229527 0.066269
C(2) 0.726968 0.051704
C(3) 0.007406 0.001785
C(4) 1.088166 0.332616
Nota. Fuente: Datos procedentes del Eviews 9.5
0 2 4 6 8 10 12 14 16
-2 -1 0 1 2
Series: Standardized Residuals Sample 2012M03 2019M10 Observations 92
Mean -0.008526 Median -0.007382 Maximum 2.655368 Minimum -2.683126 Std. Dev. 1.005443 Skewness 0.287813 Kurtosis 3.755325 Jarque-Bera 3.457133 Probability 0.177539
Figure 12 Prueba de Jarque-Bera para los errores del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Figure 13 Correlograma para los residuos del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
Tabla 5
Prueba de Heterocedasticidad de White de los errores en el modelo de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.
Prueba de heterocedasticidad: ARCH
F-estadística 0.775949 Prob. F(1,89) 0.3808
Obs*R-cuadrada 0.786528 Prob. Chi-cuadrado(1) 0.3752
Ecuación de prueba:
Variable dependiente: WGT_RESID^2 Método: mínimos cuadrados
Dato: 03/11/20 Tiempo: 01:51
Muestra (ajustada): 2012M04 2019M10
Observaciones incluidas: 91 después de ajustes
Variable Coeficiente Std. Error t-estadistica Prob.
C 1.103807 0.205455 5.372496 0.0000
WGT_RESID^2(-1) -0.093006 0.105583 -0.880879 0.3808
R-cuadrado 0.008643 Var dependiente media 1.009783
R-cuadrado ajustado -0.002496 S.D. var dependiente 1.672573 S.E. de regresión 1.674659 Criterio de información de Akaike 3.890829 Resid suma al cuadrado 249.5990 Criterio de Schwarz 3.946013 Probabilidad de
registro -175.0327 Criterio de Hannan-Quinn . 3.913092 F-estadística 0.775949 Estadística de Durbin-Watson 2.001672 Prob (F-estadística) 0.380756
Nota. Fuente: Datos procedentes del Eviews 9.5
BIBLIOTECA DE
CIENCIAS
FÍSICAS
Y MATEMÁTICAS
ETAPA DE PREDICCIÓN
Figure 14 Forecast del modelo ARIMA (1, 1, 12) de la producción de caña de azúcar en logaritmo de la Empresa Agroindustrial Laredo S.A.A periodo enero 2012 – noviembre 2019.