CAPÍTULO 2: MARCO TEÓRICO
3.10 Plan de análisis de información (datos)
3.10.1 Metodología en modelos ARIMA
Para Pérez (2012) dentro de las estructuras de datos más importantes, típicas en el trabajo econométrico aplicado están las series de datos temporales, que no es más que un conjunto de datos de series temporales consiste en observaciones sobre una variable o distintas variables a lo largo del tiempo. El autor destaca que la tendencia se da debido al movimiento general que sucede a largo plazo de la serie, en ese marco suele ser útil eliminar la componente estacional con la finalidad de concentrarse en componentes más importantes, ejemplo: la tendencia, para lo cual se emplea
la “desestacionalización o ajuste estacional”, la serie resultante después de
este proceso se conoce como serie desestacionalizada.
Tendencia de una serie temporal
Según Pérez (2012) lo que se trata es de aislar el movimiento a largo plazo de la serie
Método de ajuste analítico
Para hallar la tendencia de una serie temporal mediante “ajuste
analítico”, se efectúa una adaptación con regresión, para lo cual se emplea una función del tiempo menos compleja pero que a su vez reúna satisfactoriamente las características del fenómeno. (Pérez, 2012)
Método de las medias móviles
Estudia la tendencia existente en una serie de tiempo partiendo del resumen de los valores iniciales a través de algunas medias de estos. (Pérez, 2012)
Método de las diferencias
Radica en derivar una “serie nueva” a partir de la original, para ello
emplean diferencias tomándolas del valor de la variable entre el “momento actual” y el “momento inmediatamente anterior”. (Pérez, 2012)
Variaciones estacionales
Son movimientos que tienen lugar en un periodo fijo, es decir fluctuaciones que se generan en periodos iguales o inferiores a un año, pero que además se replican predeciblemente en los diferentes años, la razón para analizar la componente estacional se debe a que ocasiona distorsiones del movimiento verdadero de la serie, lo apropiado es entonces desestacionalizar la serie. (Pérez, 2012)
Método de desestacionalización de la tendencia o método de las relaciones de medias mensuales respecto a la tendencia
Para Pérez (2012), este método consta de los siguientes pasos:
Ajustar una recta por mínimos cuadrados a las medias anuales de los datos observados
Calcular las medias mensuales en los diferentes años
Aislar la componente estacional obteniendo la serie de medias mensuales corregidas
Calcular la media global corregida
Si el esquema es multiplicativo se calculan los índices de variación estacional y se desestacionaliza la serie dividiendo sus
valores por los índices de variación estacional. La componente
estacional es Eik=Ik/100
Si el esquema es aditivo, la componente estacional del mes k es Eik=ӯtk-ӯt
Método de desestacionalización del índice estacional
Pérez (2012) señala que consta de los siguientes pasos:
Dada la serie cronológica por meses, estaciones, etc., en varios
años, se halla la tendencia mediante el “método de las medias
móviles” tomando un año de periodo
Se centran los valores así obtenidos en los instantes de tiempo originales.
Se elimina la tendencia y la variación cíclica en ella incluida, seccionando los datos de la serie original por los valores de la tendencia en cada instante del tiempo.
Se eliminan las variaciones irregulares hallando las medias aritméticas de los valores observados en cada periodo de repetición anual.
Sobre estos últimos valores se estiman los “índices de variación
estacional” en forma de porcentajes.
Se dividen los valores de la serie original por los índices de variación estacional correspondientes, obteniéndose una serie temporal desestacionalizada.
Método de desestacionalización de las medias móviles
Consiste en obtener la componente estacional mediante un ajuste de la serie original por medias móviles de orden m para eliminar las variaciones estacionales. (Pérez, 2012)
Método de las diferencias estacionales
Posibilita suprimir gran parte del efecto estacional existente, para ello crea una serie nueva, esta vez de diferencias de orden m (periodo
estacional), cabe recordar que cada vez que diferenciamos se pierden m observaciones de la serie original. (Pérez, 2012)
Variables ficticias
Consiste en la inclusión de variables ficticias dicotómicas. (Pérez, 2012)
Variaciones cíclicas
La componente cíclica de una serie de tiempo es la más difícil de detectar, pues no es fácilmente identificable en un periodo determinado e inclusive es variable, es frecuente la presencia de períodos superpuestos, lo cual dificulta aún más su identificación; para identificar ciclos suele eliminar la serie de tendencia y las variaciones estacionales. (Pérez, 2012)
Conforme lo señala Pérez (2012) toda predicción es un intento de anticipar el futuro, existen de dos tipos, condicionales e incondicionales, las primeras se efectúan en modelos causales, donde una variable depende de otra o Y se encuentra condicionada a X; las segundas se hacen mediante modelos autopredictivos, es decir el modelo de predicción solo incluye valores actuales, pasados y futuros de la propia serie en estudio, estos métodos pueden estar basados en enfoques deterministas (clásicos) o estocásticos
(modernos – Box y Jenkins)
Modelos ARIMA
Los autores de la modelización ARIMA (AutoRegresive Integrated Moving Average) son Box y Jenkis, se trata de un modelo estadístico estocástico predictivo que favorece el pronóstico de una variable en función de sus datos pasados sin necesitar de otra variable, cada valor en un instante
dado es “modelado” en función de sus datos previos (Pérez, 2012).
Conforme lo describe Pérez (2012) el nombre genérico ARIMA de estos
modelos se deriva de sus tres componentes “Autorregresivo (AR) Integrado
lineal de datos anteriores y errores aleatorios, es un modelo que debe contener todos los elementos necesarios para describir el fenómeno estudiado, Box y Jenkins recomiendan como mínimo 50 observaciones. La detección rápida de la estacionariedad en estos modelos se da a través del gráfico de la serie, dividiendo la serie en diferentes intervalos estimándose en cada caso media y varianza.
Modelos Autorregresivos AR(p)
Estos modelos describen el proceso en el cual “(…) las observaciones
en un momento dado son predecibles a partir de las observaciones previas del proceso más un término de error. El proceso autorregresivo de orden p,
representado por ARIMA (p,0,0) o simplemente AR(p) o de p orden” (Pérez,
2012).
Modelo de medias móviles MA(q)
Estos modelos describen una serie temporal estacionaria (siempre es
estacionario), conforme lo señala el autor es este modelo “(…) el valor actual
puede predecirse a partir de la componente aleatoria (…) y, en menor medida,
de los impulsos aleatorios anteriores. El proceso de medias móviles de orden
q, representado por ARIMA (0,0,q) o también por MA(q)” (Pérez, 2012).
Modelos ARMA (p,q)
Estos modelos son extensión natural de los AR(p) y MA(q),
comprenden aspectos “autorregresivos como de medias móviles y se definen
como ARMA (p,q) o también como ARIMA (p,0,q). (…) es estacionario si lo es
su componente autorregresiva, y es invertible si lo es su componente de
medias móviles” (Pérez, 2012).
Modelos ARIMA (p,d,q)
Estos modelos favorecen la descripción de una serie de observaciones posteriormente a haberse diferenciadas d veces, con la finalidad de obtener
los potenciales brotes de estacionalidad, “(…) Es una serie temporal que se
convierte en un ruido blanco (proceso puramente aleatorio) después de ser diferenciada d veces; el modelo general ARIMA (p,d,q) denominado proceso
autorregresivo integrado de medias móviles de orden p,d,q. (…) si hay alguna componente p,d,q igual a cero, se elimina el término correspondiente de la
fórmula general” (Pérez, 2012).
Metodología Box Jenkings en modelos ARIMA
Conforme lo detalla Pérez (2012) tanto Box como Jenkins en su desarrollo de modelos estadísticos para series temporales fijaron distintas fases para su modelado, la metodología propuesta empleada fue:
1. Recolección de datos, 2. Representación gráfica, 3. Transformación previa, 4. Supresión de la tendencia,
5. Identificación efectiva del modelo, 6. Cálculo de los coeficientes del modelo,
7. Contraste de validez del modelo o validación, 8. Análisis detallado de los errores,
9. Selección del modelo, 10. Predicción
Box y Jenkins propusieron numerosos test para constatar si el modelo escogido se acopla al conjunto de datos, uno de ellos es el estadístico Ljung y Box que también se distribuye como una Chi-cuadrado con m-p-q grados de libertad, si el modelo se aproxima adecuadamente a la serie analizada los residuos tienden a mostrarse como ruido blanco. (Pérez, 2012).