• No se han encontrado resultados

TRAMO/SEATS: Aspectos conceptuales

In document Análisis de outliers: un caso a estudio (página 34-39)

2. Marco teórico sobre tratamiento de series

2.4. TRAMO/SEATS: Aspectos conceptuales

Una de las limitaciones del estudio de series temporales mediante la modelización ARIMA, y en concreto a través del enfoque Box-Jenkins, es la dificultad de identificar correctamente el modelo y, en su caso, seleccionar el más adecuado. El procedimiento de filtrado estándar para estimar el ciclo de negocios puede requerir algunas correcciones previas de las series7, dado que, de otro

modo, se podrían producir graves distorsiones en los resultados. Un destacado ejemplo es la corrección por outliers que es tratada, junto con el resto de ajustes previos, en el apartado 2.2. Para facilitar este problema, existe una metodología de análisis de series temporales que puede aplicar la identificación, estimación y predicción de forma automática de los modelos tipo ARIMA a través de procesos secuenciales informatizados.

El hecho comprobado de que los componentes de las series económicas como la tendencia y la componente estacional evolucionan en el tiempo y no siguen un curso fijo o previsible, ha llevado a la sustitución progresiva de los modelos basados en filtros deterministas por modelos basados en filtros estocásticos. La idea subyacente es que series con diferentes estructuras estocásticas requieren filtros diferentes.

Los modelos basados en procesos lineales estocásticos parametrizados con formatos del tipo ARIMA han demostrado ser los más adecuados para ajustar series y para la extracción de señal. Frecuentemente pueden ser vistos como un caso general de los filtros de tipo fijo8. Una característica de estos

modelos es que permiten resolver problemas adicionales que pueden ser relevantes para la extracción de señal como la corrección de valores atípicos (outliers), interpolación de datos perdidos, corrección por días laborales y efecto Pascua (efecto calendario), inclusión de variables de regresión e intervención y, por supuesto, predicción.

En este tipo de modelos las revisiones son óptimas porque las predicciones son óptimas9 y la estimación de los componentes no observables

también es óptima. Los modelos se adaptan a las series evitando los problemas del sobre-ajuste y la estimación espuria de los componentes.

Los programas basados en modelos identifican un modelo ARIMA para la serie original y luego derivan de esa estructura modelos ARIMA para cada uno

7 Se entiende por corrección previa de la serie temporal al estudio de los efectos calendario, los

outliers, así como las variables de intervención.

8 Así, por ejemplo, el filtro X11 puede ser aproximado por un modelo ARIMA(0,1,1)(0,1,1)12, véase

Gómez & Maravall, 2001b. El filtro HP (Hodrick-Prescott) para estimar tendencias puede ser aproximado por un filtro WK (Wiener-Kolmogorov) ARIMA(0,1,2)(0,1,1)12, véase Maravall &

del Río, 2001.

de los componentes no observables, lo que permite realizar predicciones tanto de la serie original como de cada uno de los componentes de una forma más eficiente. Un enfoque un tanto diferente se encuentra en los llamados “Modelos de series temporales estructurales”, puesto que especifican directamente los modelos de los componentes asumiendo una estructura particular para la serie original. Hay consenso en que ambos enfoques constituyen versiones diferentes de la clase general de modelos ARIMA de componentes no observables (UCARIMA), que asumen que una serie temporal puede expresarse como la suma de componentes ortogonales donde cada uno de ellos se expresa como un modelo ARIMA.

TRAMO/SEATS es un modelo basado en modelos estocásticos y fue desarrollado por Gómez y Maravall (1996) a partir del programa de J. P. Burman para el Banco de Inglaterra (1980). La metodología básica seguida es descrita en Gómez & Maravall (1992, 1994, 1996, 2001a), Gómez et al. (1999), y Maravall (2002a). El programa acepta varias periodicidades (mensual u otra frecuencia más baja), el máximo número de observaciones es 600 y el mínimo depende de la periodicidad de los datos, en concreto, 16 para datos trimestrales y 36 para datos mensuales.

TRAMO es un programa para estimación y predicción de series temporales incorporando la posibilidad de no estacionariedad, estacionalidad, efecto calendario, así como el estudio de los errores y valores perdidos en la serie objeto de análisis. El programa en el tratamiento previo de la serie interpola los valores omitidos, identifica y corrige las observaciones anómalas, y estima efectos especiales derivados del propio efecto temporal a los que se conoce, en general, como efecto calendario, así como efectos provenientes de variables de intervención.

Por su parte, SEATS es un programa para estimación de componentes inobservados en series temporales siguiendo el método basado en el modelo ARIMA (AMB). Los componentes básicos en que se desagregan las series son componentes ciclo-tendencia, estacional e irregular (aunque pueden aparecer componentes adicionales).

Cuando se usan para ajuste estacional, TRAMO preajusta las series que después serán tratadas con SEATS. Los programas se pueden usar de manera separada pero, lo normal, es usarlos conjuntamente de manera secuencial para realizar un análisis en profundidad de las series en cuestión de una manera totalmente automática aunque, como se ve más tarde, se pueden modificar las especificaciones que el programa introduce por defecto.

El programa funciona según los siguientes pasos (véase Caporello et al., 2002; y Caporello & Maravall, 2004b):

1. TRAMO identifica un modelo para la serie y la extiende automáticamente en dos años.

2. TRAMO detecta outliers y otras variables (no estocásticas) de regresión como efecto día laborable y efecto Pascua. También puede estimar datos

omitidos o perdidos. Contempla los cuatro tipo de outliers enumerados a continuación y que han sido tratados con más profundidad en apartado 2.2:

a. Aditivo (AO): el evento extraordinario sólo afecta en el periodo t. b. Cambio en nivel (LS): el evento afecta el nivel de la serie a partir del

periodo t.

c. Cambio temporal (TC): el evento afecta a partir del periodo t pero va perdiendo fuerza conforme a un factor de amortiguación.

d. Innovativo (IO): el evento afecta a todo el modelo.

3. TRAMO pasa la serie linealizada (parte estocástica) a las subrutinas del SEATS.

4. En SEATS la función de densidad espectral del modelo estimado se descompone en la función de densidad espectral de los componentes no observables, los cuáles, se asumen ortogonales o no correlacionados entre sí.

5. SEATS estima los parámetros de los componentes ciclo-tendencia y estacional utilizando el filtro simétrico de dos vías WK (Wiener- Kolmogorov).

6. Por último, los outliers y otros efectos especiales se reincorporan a los componentes estocásticos estimados.

El valor crítico, por defecto, para la detección de outliers depende del número de observaciones de la serie en cuestión de la siguiente manera:

ƒ Si el número de observaciones es menor o igual que 50 el valor queda fijado en 3.0.

ƒ Si el número de observaciones está comprendido entre 50 y 450 el valor queda fijado en 3.0+0.0025×(Nº observaciones – 50).

ƒ Para 450 observaciones o más el valor se fija en 4.0.

En el experimento con series generadas del Capítulo 3 se puede comprobar como los valores críticos para la detección de outliers son 3.02, 3.17 y 3.62 para sesenta, ciento veinte y trescientas observaciones respectivamente.

En la etapa de estimación TRAMO/SEATS utiliza uno de estos tres métodos (véase Gómez & Maravall, 2001): mínimos cuadrados condicionales (para SEATS), mínimos cuadrados incondicionales (para TRAMO) y máxima verosimilitud exacta (para TRAMO y SEATS). Los programas TRAMO y SEATS actúan de una manera secuencial, mediante iteraciones, como se describe en la Figura 2.5.

Figura 2.5. Análisis Automático de Series Temporales mediante TRAMO-SEATS.

Las componentes de una serie temporal económica consideradas en SEATS son (véase Gómez & Taguas, 1995; Botargues & Pecar, 2002):

™ La componente tendencia, que es la que capta los movimientos a largo plazo de la serie, incluyendo los sucesivos puntos de giro, y presenta un pico en la frecuencia 0.

™ La componente ciclo, que recoge las oscilaciones suaves que contienen ciertas series debido a la actividad económica y cuya periodicidad va entre los dos y cinco años, y tiene un pico espectral en la frecuencia asociada, entre 0 y (2π/s), donde s es el número de estaciones en el año.

™ La componente estacional, que contiene oscilaciones intraanuales alrededor de la tendencia, que se repiten de manera muy similar en el mismo mes o en el mismo trimestre de cada año, por tanto, recoge los picos espectrales en las frecuencias estacionales. Estas oscilaciones son generalmente causadas por cuatro factores principales: el clima, el efecto calendario (efecto día laboral y efecto Pascua), la toma de decisiones y las expectativas.

™ La componente irregular, que está constituida por oscilaciones no sistemáticas que se caracterizan por tener una estructura puramente aleatoria y/o errática, del tipo ruido blanco, y tiene por tanto, un espectro plano. Estas oscilaciones en general sólo afectan a la serie en el momento en que ocurren y suelen ser de muy corta duración. En caso de, por ejemplo, huelga o algún otro evento repentino, estas fluctuaciones pueden afectar a la serie por más de un periodo.

La descomposición parte de la hipótesis de la ortogonalidad de los componentes, que a su vez siguen modelos ARIMA. Para identificar los componentes, se requiere que (excepto para el irregular) estén limpios de ruido blanco. Esta es la llamada propiedad “canónica”, que implica que no se puede extraer ruido blanco de los componentes distintos del irregular. Así, se maximiza la varianza del componente irregular y, por el contrario, se hacen tan estables como sea posible los componentes tendencia, estacional y ciclo, de acuerdo con la estructura estocástica del modelo ARIMA seguido por la serie temporal (véase Gómez & Taguas, 1995).

El modelo tratado por SEATS es el de una serie integrada lineal con innovaciones gaussianas. Como esta hipótesis puede que no se cumpla, TRAMO tratará previamente la serie, de ahí que hayan sido diseñados para ser usados conjuntamente de forma rutinaria (véase Gómez & Taguas, 1995).

In document Análisis de outliers: un caso a estudio (página 34-39)