Sobre el Pronóstico del Precio de la Energía en Bolsa. Una comparación entre ARX-NN y procesos ARMAX

(1)

Sobre el Pronóstico del Precio de la

Energía en Bolsa. Una comparación

entre ARX-NN y procesos ARMAX

Jorge Barrientos Marín Ph.D

Elkin Tabares M.Sc. & Esteban Velilla M.Sc. Universidad de Antioquia & UNAULA

(2)

Outline

• Motivación

• Objetivos

• Datos

• Metodología

• Resultados

• Conclusiones

(3)

Motivación I

La formación del precio de energía en mercados

eléctricos, es un proceso complejo e impone enormes retos en su modelación y pronóstico:

• Un bien que no se almacena

• Se transa en tiempo real

• Demanda variante intra-día e intra-semana

• Enorme componente hídrico del sistema

• Cost. fijos enormes comparados con los variables.

• Alta volatilidad

(4)

(5)

(6)

Motivación II

Importancia:

- Diseño de contratos y cobertura contra riesgos.

- Envía señal a inversionistas.

- Contiene información del mercado para la

expansión de la capacidad instalada.

(7)

Motivación III

Técnica

• Estacionaridad de las variables involucradas.

• Procesos generador de datos que mejor predice

el comportamiento del precio. ¿Lineal (familias

VARMA o no-lineal (Red Neuronal)?

(8)

Motivación IV

• Las predicciones del precio de energía en la literatura nacional trabaja sobre el supuesto de

ausencia de estacionaridad o de estacionaridad establecida mediante un ADF.

• Usando Modelos de Redes Neuronales y/o ARIMA: Botero & Cano (2008), Lira et.al (2009), Castaño y Sierra (2010), Barrientos et.al (2012), Agudelo et.al (2015), Barrientos y Toro (2015, 2016), entre otros.

(9)

Objetivos

• Establecer la estacionaridad de las variables: ¿Se

comprueba la

𝐻

₀

: Raíz Unitaria?

• Estimación de dos modelos aplicados a la serie

mensual del logaritmo del precio en bolsa de la

energía en Colombia.

• Analizar la precisión del pronóstico del precio de

la energía de dos modelos alternativos (ARX-NN

& ARIMAX).

(10)

Datos

• Los datos utilizados son mensuales 01/2001 hasta 05/2016 (XM). • Precio Energía: promedio mensual de Bolsa ($/kWh)

• Reservas Hídricas: Vol. útil de los embalses (kWh).

• Aportes Hídricos: los aportes de los ríos energía (kWh).

• Demanda: Demanda del SIN (kWh mensual): Gen. Neta de las plantas. • Disponibilidad Declarada: la oferta en el mercado, y nos expresa la

máxima cantidad de potencia neta que un generador puede suministrar al sistema durante el intervalo de tiempo determinado.

• ENSO (Niño): Anomalía en la temperatura en la región del Niño 3.4. Valores: Niño (+) niña (-) (NOAA).

(11)

Metodología I

Contraste de Raíz Unitaria.

• Dickey & Fuller Aumentado (1981).

∆𝑦_𝑡 = 𝛽₀ + 𝛽₁𝑡 + 𝛾𝑦_𝑡−1 + 𝑝_𝑖=1 𝛿∆𝑦_𝑡−𝑖 + 𝜀_𝑡

Estimación de 𝑝: se estiman todos los mod. 𝑝 = 0, … , 𝑝_𝑚𝑎𝑥 (Schwert (1989)).

𝑝_𝑚𝑎𝑥 = 12(𝑇/100)0.25, 𝑇 : es el tamaño de la muestra. Akaike (AIC) y Bayesiano (BIC).

Problema: el desempeño de las pruebas tradicionales (DFA) es afectado por los cambios de nivel presentes en la serie.

(12)

No se rechaza 𝐻₀

Tabla 1. Test de raíz unitaria Dickey-Fuller Aumentado

N = 184

𝑡 1% 5% 10%

-2,2 -4,02 -3,45 -3,2

MacKinnon p-valor = 0,471

Modelo estimado

Coeficiente Error estándar Estadístico t

Tendencia 0,002* 0,001 2,505 L1 Precio -0,191* 0,086 -2,238 Constante 0,696* 0,320 2,172

* p<0,05 ** p<0,01 *** p<0,001

Controla por 13 retardos de la diferencia del ln. precio Elaboración propia

(13)

• Cavaliere y Georgiev (2006). Se basa en el siguiente modelo: 𝑋_𝑡 = 𝜑′𝑍_𝑡 + 𝑌_𝑡 + 𝜇_𝑡 𝑌_𝑡 = 𝛼 𝑌_𝑡−1 + 𝑢_𝑡 𝑢_𝑡 = 𝑝_𝑖=1 𝛾_𝑖𝑢_𝑡−1 + 𝜀_𝑖 Donde:

𝑋_𝑡 es el proceso estocástico subyacente.

𝑌_𝑡 es un proceso AR.

𝑍_𝑡 es un vector 𝑝 × 1 desconocido de términos determinísticos (constante y/o tendencia).

𝜑 es un vector fijo conformable con 𝑍_𝑡.

(14)

Cambio de Nivel

𝜇_𝑡 = 𝑡_𝑠=1 𝛿_𝑠𝜃_𝑠

𝛿_𝑠 es una variable dummy que sólo toma el valor de 1, si en el momento 𝑡 ocurre un cambio de nivel.

𝜃_𝑠 representa el cambio en dicho periodo 𝑡.

Caso 1. 𝜑 = 0 y 𝑝 es conocido. Se realiza una regresión de

∆𝑋_𝑡 sobre 𝛿_𝑠 incorporando.

𝜇 = _𝑡 𝑡_𝑠=1 𝛿_𝑠 ∆𝑋_𝑡

Cuando no se conoce 𝛿_𝑠 se estima realizando el proceso de detección de observaciones atípicas Chen y Tiao (1990) o de Chen y Liu (1993).

(15)

Construimos una nueva series (de-jumped):

𝑋_𝑡𝛿 = 𝑋_𝑡 − 𝜇_𝑡

Finalmente se procede con la prueba tradicional ADF sobre

la serie 𝑋_𝑡𝛿.

Caso 2. si 𝜑 ≠ 0 y 𝑝 es conocido, se obtiene la serie de-jumped y se aplica una pseudo des-tendencialización GLS a

dicha la serie (Elliot et al. (1996)).

Caso 3. si 𝑝 es desconocido inicialmente se toma

𝑝_𝑚á𝑥 = 12 ∗ 𝑇/100 0.25, se encuentran los cambios de nivel

cuando no son conocidos y se obtiene la serie de-jumped. A

partir de la serie ajustada se emplea un criterio estándar

(16)

Tabla 2. Eventos exógenos en la serie del logaritmo del precio de la electricidad

Fecha Observaciones Descripción evento Jun 10 114- 124 La Niña

May 11 125-133

Se realizó Una transición de La Niña a condiciones de ENSO neutral. Sin embargo, las condiciones atmosféricas continúan recordando La Niña

Feb 12 134-139 La Niña se debilita

Ago 12 140-155 Transición hacia condiciones de El Niño. Se presentan condiciones al límite entre ENSO neutral y El Niño débil. Dic 13 156-159 ENSO neutral

Abr 14 160-162 Se presenta una continua evolución hacia El Niño

Jul 14 163-172 Disminuyen las probabilidades de El Niño- ENSO neutral May 15 173-176 El Niño

Sep 15 177-183 El Niño fuerte

Nota: Se toman los eventos que Castaño y Sierra (2012) identifican para el periodo comprendido entre 01/2001 hasta 05/2010, para identificar los eventos ocurridos. Posterior a 02/2010 consulta en el diagnóstico (ENSO) de la (NOAA).

(17)

(18)

Tabla 3. Test de raíz unitaria Dickey-Fuller Aumentado N = 184 Dickey-Fuller Interpolado 𝑡 1% 5% 10% -7,915 -3,483 -2,885 -2,575 MacKinnon p-valor = 0,00 Modelo estimado

Coeficiente Error estándar Estadístico t

L1 Dejumped -0,518*** 0,065 -7,915 Constante 2.210*** 0,279 7,909 Notas:

p<0,05 ** p<0,01 *** p<0,001 Doce retardos de diferencias incluidos. Elaboración propia.

(19)

El resultado de la prueba Cavaliere & Gioergiev (2006) confirma que los cambios de nivel presentes en la serie mensual del precio de la electricidad son inducidos por eventos exógenos

.

En otras palabras los cambios inducidos por eventos exógenos no implican memoria larga de los procesos estocásticos subyacentes

.

El mismo procedimiento se aplicó al resto de variables:

Precio Energía, Reservas Hídricas, Aportes Hídricos, Demanda y Disponibilidad Declarada.

(20)

Modelo ARMAX

Considere un proceso 𝐴𝑅𝑀𝐴(𝑝, 𝑞) que satisface:

𝜙 𝐿 𝑌_𝑡 = 𝑐 + 𝑘_𝑖=1 𝛽_𝑖𝑥_𝑡−𝑖 + 𝜃(𝐿)𝜀_𝑡

𝑌_𝑡 = _{𝜙 1}𝑐 + 𝐵(𝐿)𝑥_𝜙(𝐿)𝑡 + _𝜙(𝐿)𝜃(𝐿) 𝜀_𝑡 , 𝜙 1 ≠ 0 Donde 𝜀_𝑡 es un Ruido Blanco. El pronóstico:

(21)

Red Neuronal

Se propone usar una (ARX-NN) con 1 cap. oc.:

𝑦_𝑡 = 𝛽_∗ + 𝐼_𝑖=1 𝜑_𝑖𝑥_𝑡(𝑖) + 𝐻_ℎ=1 𝛽_ℎ𝐺 𝑤_ℎ + 𝑒_𝑡

𝐺 𝑤_ℎ = 1

1 + 𝑒−𝑤_ℎ

𝑤_ℎ = 2𝜎_𝑦 −1𝛼_∗,ℎ + 𝐼_𝑖=1 𝛼_𝑖,ℎ𝑥_𝑡(𝑖)

• Las NN son modelo obtenidos por ensayo y prueba.

• El entrenamiento de la Red es para ajustar sus parámetros (pesos y umbrales).

(22)

Penalización por sobre ajuste (regularización) en el

entrenamiento:

𝑅 𝑊 =

𝑇_𝑡=1

(𝑦

_𝑡

− 𝑦

_𝑡

)

2

+ 𝜆𝜉

_𝑐

(𝑊)

𝜉

_𝑐

𝑊 = 𝜔

_ℎ,𝑝 2

=

𝐻_ℎ=1 𝑃_𝑝=1

𝜔

_𝑝,ℎ2

El procedimiento de descomposición de pesos, opera sobre algunos pesos inhibidores neuronas de la red, forzándolos a tomar valores cercanos a 0

.

(23)

Diebold-Mariano Test

• Considere dos pronósticos (

ℎ

periodos

adelante) provenientes de diferentes modelos:

𝑦

_{𝑡+ℎ|𝑡}1

y

𝑦

_{𝑡+ℎ|𝑡}2

• Calculamos los errores de pronóstico,

𝜀

_{𝑡+ℎ|𝑡}1

= 𝑦

_𝑡+ℎ

− 𝑦

_{𝑡+ℎ|𝑡}1

𝜀

_{𝑡+ℎ|𝑡} 2

= 𝑦

_𝑡+ℎ

− 𝑦

_{𝑡+ℎ|𝑡}2

Cada error tiene media cero, pues la regla de

pronóstico óptima es la media condicional.

(24)

Considerando una función de pérdida cuadrática,

𝐿 𝜀

_{𝑡+ℎ|𝑡}𝑖

𝑖 = 1,2

, D&M proponen contrastar:

𝐻

₀

: 𝐸 𝐿 𝜀

_{𝑡+ℎ|𝑡}1

= 𝐸 𝐿 𝜀

_{𝑡+ℎ|𝑡}2

𝐻

₁

: 𝐸 𝐿 𝜀

_{𝑡+ℎ|𝑡}1

≠ 𝐸 𝐿 𝜀

_{𝑡+ℎ|𝑡}2

O en términos de la diferencias,

𝐻

₀

: 𝐸[𝑑

_𝑡

] = 0

v.s

𝐻

₁

falsa, donde

(25)

Bajo

𝐻

₀

cierta, el estadístico de contraste

𝑆 =

𝑑

𝐶𝑜𝑣 (𝑑_𝑡,𝑑_𝑡−𝑗)

→ 𝑁(0,1)

cuando

𝑇 → ∞

Con

𝑑

es un estimador consistente de

𝐸[𝑑

_𝑡

]

.

(26)

(27)

(28)

(29)

(30)

(31)

(32)

(33)

165 204 161 117 124 171 227.5 195.2 187.7 238.8 164.99 217.92 192 200 242

sep-16 oct-16 nov-16 dic-16 ene-17

Comparación del Precio observado y el Pronósticado

(34)

Conclusiones

• Las series del mercado de energía usadas no tienen una raíz

unitaria.

• El pronóstico dentro de la muestra funciona bastante bien.

Fuera de ella, el desempleo es inferior, pero sigue el patrón y tendencia del precio observado.

• Mas aún las series pronosticadas indican que el procedimiento

captura también posibles cambios de nivel.

• El M&D Test indica que no hay diferencias significativas en la

precisión de los modelos.

• Se sigue ajustar los parámetros de ambos modelos y usar

modelos adicionales para pronosticar (Machine Learning, Vectorial Sup. Mach.).