Sobre el Pronóstico del Precio de la
Energía en Bolsa. Una comparación
entre ARX-NN y procesos ARMAX
Jorge Barrientos Marín Ph.D
Elkin Tabares M.Sc. & Esteban Velilla M.Sc. Universidad de Antioquia & UNAULA
Outline
•
Motivación
•
Objetivos
•
Datos
•
Metodología
•
Resultados
•
Conclusiones
Motivación I
La formación del precio de energía en mercados
eléctricos, es un proceso complejo e impone enormes retos en su modelación y pronóstico:
• Un bien que no se almacena
• Se transa en tiempo real
• Demanda variante intra-día e intra-semana
• Enorme componente hídrico del sistema
• Cost. fijos enormes comparados con los variables.
• Alta volatilidad
Motivación II
Importancia:
- Diseño de contratos y cobertura contra riesgos.
- Envía señal a inversionistas.
- Contiene información del mercado para la
expansión de la capacidad instalada.
Motivación III
Técnica
•
Estacionaridad de las variables involucradas.
•
Procesos generador de datos que mejor predice
el comportamiento del precio. ¿Lineal (familias
VARMA o no-lineal (Red Neuronal)?
Motivación IV
• Las predicciones del precio de energía en la literatura nacional trabaja sobre el supuesto de
ausencia de estacionaridad o de estacionaridad establecida mediante un ADF.
• Usando Modelos de Redes Neuronales y/o ARIMA: Botero & Cano (2008), Lira et.al (2009), Castaño y Sierra (2010), Barrientos et.al (2012), Agudelo et.al (2015), Barrientos y Toro (2015, 2016), entre otros.
Objetivos
•
Establecer la estacionaridad de las variables: ¿Se
comprueba la
𝐻
0: Raíz Unitaria?
•
Estimación de dos modelos aplicados a la serie
mensual del logaritmo del precio en bolsa de la
energía en Colombia.
•
Analizar la precisión del pronóstico del precio de
la energía de dos modelos alternativos (ARX-NN
& ARIMAX).
Datos
• Los datos utilizados son mensuales 01/2001 hasta 05/2016 (XM). • Precio Energía: promedio mensual de Bolsa ($/kWh)
• Reservas Hídricas: Vol. útil de los embalses (kWh).
• Aportes Hídricos: los aportes de los ríos energía (kWh).
• Demanda: Demanda del SIN (kWh mensual): Gen. Neta de las plantas. • Disponibilidad Declarada: la oferta en el mercado, y nos expresa la
máxima cantidad de potencia neta que un generador puede suministrar al sistema durante el intervalo de tiempo determinado.
• ENSO (Niño): Anomalía en la temperatura en la región del Niño 3.4. Valores: Niño (+) niña (-) (NOAA).
Metodología I
Contraste de Raíz Unitaria.
• Dickey & Fuller Aumentado (1981).
∆𝑦𝑡 = 𝛽0 + 𝛽1𝑡 + 𝛾𝑦𝑡−1 + 𝑝𝑖=1 𝛿∆𝑦𝑡−𝑖 + 𝜀𝑡
Estimación de 𝑝: se estiman todos los mod. 𝑝 = 0, … , 𝑝𝑚𝑎𝑥 (Schwert (1989)).
𝑝𝑚𝑎𝑥 = 12(𝑇/100)0.25, 𝑇 : es el tamaño de la muestra. Akaike (AIC) y Bayesiano (BIC).
Problema: el desempeño de las pruebas tradicionales (DFA) es afectado por los cambios de nivel presentes en la serie.
No se rechaza 𝐻0
Tabla 1. Test de raíz unitaria Dickey-Fuller Aumentado
N = 184
𝑡 1% 5% 10%
-2,2 -4,02 -3,45 -3,2
MacKinnon p-valor = 0,471
Modelo estimado
Coeficiente Error estándar Estadístico t
Tendencia 0,002* 0,001 2,505 L1 Precio -0,191* 0,086 -2,238 Constante 0,696* 0,320 2,172
* p<0,05 ** p<0,01 *** p<0,001
Controla por 13 retardos de la diferencia del ln. precio Elaboración propia
• Cavaliere y Georgiev (2006). Se basa en el siguiente modelo: 𝑋𝑡 = 𝜑′𝑍𝑡 + 𝑌𝑡 + 𝜇𝑡 𝑌𝑡 = 𝛼 𝑌𝑡−1 + 𝑢𝑡 𝑢𝑡 = 𝑝𝑖=1 𝛾𝑖𝑢𝑡−1 + 𝜀𝑖 Donde:
𝑋𝑡 es el proceso estocástico subyacente.
𝑌𝑡 es un proceso AR.
𝑍𝑡 es un vector 𝑝 × 1 desconocido de términos determinísticos (constante y/o tendencia).
𝜑 es un vector fijo conformable con 𝑍𝑡.
Cambio de Nivel
𝜇𝑡 = 𝑡𝑠=1 𝛿𝑠𝜃𝑠
𝛿𝑠 es una variable dummy que sólo toma el valor de 1, si en el momento 𝑡 ocurre un cambio de nivel.
𝜃𝑠 representa el cambio en dicho periodo 𝑡.
Caso 1. 𝜑 = 0 y 𝑝 es conocido. Se realiza una regresión de
∆𝑋𝑡 sobre 𝛿𝑠 incorporando.
𝜇 = 𝑡 𝑡𝑠=1 𝛿𝑠 ∆𝑋𝑡
Cuando no se conoce 𝛿𝑠 se estima realizando el proceso de detección de observaciones atípicas Chen y Tiao (1990) o de Chen y Liu (1993).
Construimos una nueva series (de-jumped):
𝑋𝑡𝛿 = 𝑋𝑡 − 𝜇𝑡
Finalmente se procede con la prueba tradicional ADF sobre
la serie 𝑋𝑡𝛿.
Caso 2. si 𝜑 ≠ 0 y 𝑝 es conocido, se obtiene la serie de-jumped y se aplica una pseudo des-tendencialización GLS a
dicha la serie (Elliot et al. (1996)).
Caso 3. si 𝑝 es desconocido inicialmente se toma
𝑝𝑚á𝑥 = 12 ∗ 𝑇/100 0.25, se encuentran los cambios de nivel
cuando no son conocidos y se obtiene la serie de-jumped. A
partir de la serie ajustada se emplea un criterio estándar
Tabla 2. Eventos exógenos en la serie del logaritmo del precio de la electricidad
Fecha Observaciones Descripción evento Jun 10 114- 124 La Niña
May 11 125-133
Se realizó Una transición de La Niña a condiciones de ENSO neutral. Sin embargo, las condiciones atmosféricas continúan recordando La Niña
Feb 12 134-139 La Niña se debilita
Ago 12 140-155 Transición hacia condiciones de El Niño. Se presentan condiciones al límite entre ENSO neutral y El Niño débil. Dic 13 156-159 ENSO neutral
Abr 14 160-162 Se presenta una continua evolución hacia El Niño
Jul 14 163-172 Disminuyen las probabilidades de El Niño- ENSO neutral May 15 173-176 El Niño
Sep 15 177-183 El Niño fuerte
Nota: Se toman los eventos que Castaño y Sierra (2012) identifican para el periodo comprendido entre 01/2001 hasta 05/2010, para identificar los eventos ocurridos. Posterior a 02/2010 consulta en el diagnóstico (ENSO) de la (NOAA).
Tabla 3. Test de raíz unitaria Dickey-Fuller Aumentado N = 184 Dickey-Fuller Interpolado 𝑡 1% 5% 10% -7,915 -3,483 -2,885 -2,575 MacKinnon p-valor = 0,00 Modelo estimado
Coeficiente Error estándar Estadístico t
L1 Dejumped -0,518*** 0,065 -7,915 Constante 2.210*** 0,279 7,909 Notas:
p<0,05 ** p<0,01 *** p<0,001 Doce retardos de diferencias incluidos. Elaboración propia.
El resultado de la prueba Cavaliere & Gioergiev (2006) confirma que los cambios de nivel presentes en la serie mensual del precio de la electricidad son inducidos por eventos exógenos
.
En otras palabras los cambios inducidos por eventos exógenos no implican memoria larga de los procesos estocásticos subyacentes
.
El mismo procedimiento se aplicó al resto de variables:
Precio Energía, Reservas Hídricas, Aportes Hídricos, Demanda y Disponibilidad Declarada.
Modelo ARMAX
Considere un proceso 𝐴𝑅𝑀𝐴(𝑝, 𝑞) que satisface:
𝜙 𝐿 𝑌𝑡 = 𝑐 + 𝑘𝑖=1 𝛽𝑖𝑥𝑡−𝑖 + 𝜃(𝐿)𝜀𝑡
𝑌𝑡 = 𝜙 1𝑐 + 𝐵(𝐿)𝑥𝜙(𝐿)𝑡 + 𝜙(𝐿)𝜃(𝐿) 𝜀𝑡 , 𝜙 1 ≠ 0 Donde 𝜀𝑡 es un Ruido Blanco. El pronóstico:
Red Neuronal
Se propone usar una (ARX-NN) con 1 cap. oc.:
𝑦𝑡 = 𝛽∗ + 𝐼𝑖=1 𝜑𝑖𝑥𝑡(𝑖) + 𝐻ℎ=1 𝛽ℎ𝐺 𝑤ℎ + 𝑒𝑡
𝐺 𝑤ℎ = 1
1 + 𝑒−𝑤ℎ
𝑤ℎ = 2𝜎𝑦 −1𝛼∗,ℎ + 𝐼𝑖=1 𝛼𝑖,ℎ𝑥𝑡(𝑖)
• Las NN son modelo obtenidos por ensayo y prueba.
• El entrenamiento de la Red es para ajustar sus parámetros (pesos y umbrales).
Penalización por sobre ajuste (regularización) en el
entrenamiento:
𝑅 𝑊 =
𝑇𝑡=1(𝑦
𝑡− 𝑦
𝑡)
2+ 𝜆𝜉
𝑐(𝑊)
𝜉
𝑐𝑊 = 𝜔
ℎ,𝑝 2=
𝐻ℎ=1 𝑃𝑝=1𝜔
𝑝,ℎ2El procedimiento de descomposición de pesos, opera sobre algunos pesos inhibidores neuronas de la red, forzándolos a tomar valores cercanos a 0
.
Diebold-Mariano Test
•
Considere dos pronósticos (
ℎ
periodos
adelante) provenientes de diferentes modelos:
𝑦
𝑡+ℎ|𝑡1y
𝑦
𝑡+ℎ|𝑡2•
Calculamos los errores de pronóstico,
𝜀
𝑡+ℎ|𝑡1= 𝑦
𝑡+ℎ− 𝑦
𝑡+ℎ|𝑡1𝜀
𝑡+ℎ|𝑡 2= 𝑦
𝑡+ℎ− 𝑦
𝑡+ℎ|𝑡2Cada error tiene media cero, pues la regla de
pronóstico óptima es la media condicional.
Considerando una función de pérdida cuadrática,
𝐿 𝜀
𝑡+ℎ|𝑡𝑖𝑖 = 1,2
, D&M proponen contrastar:
𝐻
0: 𝐸 𝐿 𝜀
𝑡+ℎ|𝑡1= 𝐸 𝐿 𝜀
𝑡+ℎ|𝑡2𝐻
1: 𝐸 𝐿 𝜀
𝑡+ℎ|𝑡1≠ 𝐸 𝐿 𝜀
𝑡+ℎ|𝑡2O en términos de la diferencias,
𝐻
0: 𝐸[𝑑
𝑡] = 0
v.s
𝐻
1falsa, donde
Bajo
𝐻
0cierta, el estadístico de contraste
𝑆 =
𝑑𝐶𝑜𝑣 (𝑑𝑡,𝑑𝑡−𝑗)
→ 𝑁(0,1)
cuando
𝑇 → ∞
Con
𝑑
es un estimador consistente de
𝐸[𝑑
𝑡]
.
165 204 161 117 124 171 227.5 195.2 187.7 238.8 164.99 217.92 192 200 242
sep-16 oct-16 nov-16 dic-16 ene-17
Comparación del Precio observado y el Pronósticado
Conclusiones
• Las series del mercado de energía usadas no tienen una raíz
unitaria.
• El pronóstico dentro de la muestra funciona bastante bien.
Fuera de ella, el desempleo es inferior, pero sigue el patrón y tendencia del precio observado.
• Mas aún las series pronosticadas indican que el procedimiento
captura también posibles cambios de nivel.
• El M&D Test indica que no hay diferencias significativas en la
precisión de los modelos.
• Se sigue ajustar los parámetros de ambos modelos y usar
modelos adicionales para pronosticar (Machine Learning, Vectorial Sup. Mach.).