Metodología en modelos ARIMA - Plan de análisis de información (datos)

CAPÍTULO 2: MARCO TEÓRICO

3.10 Plan de análisis de información (datos)

3.10.1 Metodología en modelos ARIMA

Para Pérez (2012) dentro de las estructuras de datos más importantes, típicas en el trabajo econométrico aplicado están las series de datos temporales, que no es más que un conjunto de datos de series temporales consiste en observaciones sobre una variable o distintas variables a lo largo del tiempo. El autor destaca que la tendencia se da debido al movimiento general que sucede a largo plazo de la serie, en ese marco suele ser útil eliminar la componente estacional con la finalidad de concentrarse en componentes más importantes, ejemplo: la tendencia, para lo cual se emplea

la “desestacionalización o ajuste estacional”, la serie resultante después de

este proceso se conoce como serie desestacionalizada.

Tendencia de una serie temporal

Según Pérez (2012) lo que se trata es de aislar el movimiento a largo plazo de la serie

 Método de ajuste analítico

Para hallar la tendencia de una serie temporal mediante “ajuste

analítico”, se efectúa una adaptación con regresión, para lo cual se emplea una función del tiempo menos compleja pero que a su vez reúna satisfactoriamente las características del fenómeno. (Pérez, 2012)

 Método de las medias móviles

Estudia la tendencia existente en una serie de tiempo partiendo del resumen de los valores iniciales a través de algunas medias de estos. (Pérez, 2012)

 Método de las diferencias

Radica en derivar una “serie nueva” a partir de la original, para ello

emplean diferencias tomándolas del valor de la variable entre el “momento actual” y el “momento inmediatamente anterior”. (Pérez, 2012)

Variaciones estacionales

Son movimientos que tienen lugar en un periodo fijo, es decir fluctuaciones que se generan en periodos iguales o inferiores a un año, pero que además se replican predeciblemente en los diferentes años, la razón para analizar la componente estacional se debe a que ocasiona distorsiones del movimiento verdadero de la serie, lo apropiado es entonces desestacionalizar la serie. (Pérez, 2012)

 Método de desestacionalización de la tendencia o método de las relaciones de medias mensuales respecto a la tendencia

Para Pérez (2012), este método consta de los siguientes pasos:

 Ajustar una recta por mínimos cuadrados a las medias anuales de los datos observados

 Calcular las medias mensuales en los diferentes años

 Aislar la componente estacional obteniendo la serie de medias mensuales corregidas

 Calcular la media global corregida

 Si el esquema es multiplicativo se calculan los índices de variación estacional y se desestacionaliza la serie dividiendo sus

valores por los índices de variación estacional. La componente

estacional es Eik=Ik/100

 Si el esquema es aditivo, la componente estacional del mes k es Eik=ӯtk-ӯt

 Método de desestacionalización del índice estacional

Pérez (2012) señala que consta de los siguientes pasos:

 Dada la serie cronológica por meses, estaciones, etc., en varios

años, se halla la tendencia mediante el “método de las medias

móviles” tomando un año de periodo

 Se centran los valores así obtenidos en los instantes de tiempo originales.

 Se elimina la tendencia y la variación cíclica en ella incluida, seccionando los datos de la serie original por los valores de la tendencia en cada instante del tiempo.

 Se eliminan las variaciones irregulares hallando las medias aritméticas de los valores observados en cada periodo de repetición anual.

 Sobre estos últimos valores se estiman los “índices de variación

estacional” en forma de porcentajes.

 Se dividen los valores de la serie original por los índices de variación estacional correspondientes, obteniéndose una serie temporal desestacionalizada.

 Método de desestacionalización de las medias móviles

Consiste en obtener la componente estacional mediante un ajuste de la serie original por medias móviles de orden m para eliminar las variaciones estacionales. (Pérez, 2012)

 Método de las diferencias estacionales

Posibilita suprimir gran parte del efecto estacional existente, para ello crea una serie nueva, esta vez de diferencias de orden m (periodo

estacional), cabe recordar que cada vez que diferenciamos se pierden m observaciones de la serie original. (Pérez, 2012)

 Variables ficticias

Consiste en la inclusión de variables ficticias dicotómicas. (Pérez, 2012)

Variaciones cíclicas

La componente cíclica de una serie de tiempo es la más difícil de detectar, pues no es fácilmente identificable en un periodo determinado e inclusive es variable, es frecuente la presencia de períodos superpuestos, lo cual dificulta aún más su identificación; para identificar ciclos suele eliminar la serie de tendencia y las variaciones estacionales. (Pérez, 2012)

Conforme lo señala Pérez (2012) toda predicción es un intento de anticipar el futuro, existen de dos tipos, condicionales e incondicionales, las primeras se efectúan en modelos causales, donde una variable depende de otra o Y se encuentra condicionada a X; las segundas se hacen mediante modelos autopredictivos, es decir el modelo de predicción solo incluye valores actuales, pasados y futuros de la propia serie en estudio, estos métodos pueden estar basados en enfoques deterministas (clásicos) o estocásticos

(modernos – Box y Jenkins)

Modelos ARIMA

Los autores de la modelización ARIMA (AutoRegresive Integrated Moving Average) son Box y Jenkis, se trata de un modelo estadístico estocástico predictivo que favorece el pronóstico de una variable en función de sus datos pasados sin necesitar de otra variable, cada valor en un instante

dado es “modelado” en función de sus datos previos (Pérez, 2012).

Conforme lo describe Pérez (2012) el nombre genérico ARIMA de estos

modelos se deriva de sus tres componentes “Autorregresivo (AR) Integrado

lineal de datos anteriores y errores aleatorios, es un modelo que debe contener todos los elementos necesarios para describir el fenómeno estudiado, Box y Jenkins recomiendan como mínimo 50 observaciones. La detección rápida de la estacionariedad en estos modelos se da a través del gráfico de la serie, dividiendo la serie en diferentes intervalos estimándose en cada caso media y varianza.

Modelos Autorregresivos AR(p)

Estos modelos describen el proceso en el cual “(…) las observaciones

en un momento dado son predecibles a partir de las observaciones previas del proceso más un término de error. El proceso autorregresivo de orden p,

representado por ARIMA (p,0,0) o simplemente AR(p) o de p orden” (Pérez,

2012).

Modelo de medias móviles MA(q)

Estos modelos describen una serie temporal estacionaria (siempre es

estacionario), conforme lo señala el autor es este modelo “(…) el valor actual

puede predecirse a partir de la componente aleatoria (…) y, en menor medida,

de los impulsos aleatorios anteriores. El proceso de medias móviles de orden

q, representado por ARIMA (0,0,q) o también por MA(q)” (Pérez, 2012).

Modelos ARMA (p,q)

Estos modelos son extensión natural de los AR(p) y MA(q),

comprenden aspectos “autorregresivos como de medias móviles y se definen

como ARMA (p,q) o también como ARIMA (p,0,q). (…) es estacionario si lo es

su componente autorregresiva, y es invertible si lo es su componente de

medias móviles” (Pérez, 2012).

Modelos ARIMA (p,d,q)

Estos modelos favorecen la descripción de una serie de observaciones posteriormente a haberse diferenciadas d veces, con la finalidad de obtener

los potenciales brotes de estacionalidad, “(…) Es una serie temporal que se

convierte en un ruido blanco (proceso puramente aleatorio) después de ser diferenciada d veces; el modelo general ARIMA (p,d,q) denominado proceso

autorregresivo integrado de medias móviles de orden p,d,q. (…) si hay alguna componente p,d,q igual a cero, se elimina el término correspondiente de la

fórmula general” (Pérez, 2012).

Metodología Box Jenkings en modelos ARIMA

Conforme lo detalla Pérez (2012) tanto Box como Jenkins en su desarrollo de modelos estadísticos para series temporales fijaron distintas fases para su modelado, la metodología propuesta empleada fue:

1. Recolección de datos, 2. Representación gráfica, 3. Transformación previa, 4. Supresión de la tendencia,

5. Identificación efectiva del modelo, 6. Cálculo de los coeficientes del modelo,

7. Contraste de validez del modelo o validación, 8. Análisis detallado de los errores,

9. Selección del modelo, 10. Predicción

Box y Jenkins propusieron numerosos test para constatar si el modelo escogido se acopla al conjunto de datos, uno de ellos es el estadístico Ljung y Box que también se distribuye como una Chi-cuadrado con m-p-q grados de libertad, si el modelo se aproxima adecuadamente a la serie analizada los residuos tienden a mostrarse como ruido blanco. (Pérez, 2012).

In document Factores económicos y sociales que influyen en la demanda de servicios públicos tributarios en la zona 7 del Ecuador, periodo 2015 – 2016 (página 190-195)