• No se han encontrado resultados

Pronóstico de Avenidas a Mediano Plazo Utilizando Redes Neuronales Artificiales y Modelos Tipo ARMA-Edición Única

N/A
N/A
Protected

Academic year: 2017

Share "Pronóstico de Avenidas a Mediano Plazo Utilizando Redes Neuronales Artificiales y Modelos Tipo ARMA-Edición Única"

Copied!
143
0
0

Texto completo

(1)

Cuernavaca, Morelos a 21 de octubre de 2008.

Lic. Arturo Azuara Flores:

Director de Asesoría Legal del Sistema

Por medio de la presente hago constar que soy autor y titular de la obra titulada "Pronóstico de avenidas a mediano plazo utilizando redes neuronales artificiales y modelos tipo ARMA", en los sucesivo LA OBRA, en virtud de lo cual autorizo a el Instituto Tecnológico y de Estudios Superiores de Monterrey (EL INSTITUTO) para que efectúe la divulgación, publicación, comunicación pública, distribución y reproducción, así como la digitalización de la misma, con fines académicos o propios al objeto de EL INSTITUTO.

El Instituto se compromete a respetar en todo momento mi autoría y a otorgarme el crédito correspondiente en todas las actividades mencionadas anteriormente de la obra.

De la misma manera, desligo de toda responsabilidad a EL INSTITUTO por cualquier violación a los derechos de autor y propiedad intelectual que cometa el suscrito frente a terceros.

(2)

Pronóstico de Avenidas a Mediano Plazo Utilizando Redes

Neuronales Artificiales y Modelos Tipo ARMA-Edición Única

Title Pronóstico de Avenidas a Mediano Plazo Utilizando Redes Neuronales Artificiales y Modelos Tipo ARMA-Edición Única

Authors Esmeralda Pita Jiménez

Affiliation Tecnológico de Monterrey, Campus Cuernavaca Issue Date 2008-10-01

Item type Tesis

Rights Open Access

Downloaded 19-Jan-2017 01:52:03

(3)

SUPERIORES DE MONTERREY

Pronóstico de Avenidas a Mediano Plazo

Utilizando Redes Neuronales Artificiales y

Modelos Tipo ARMA

Autor:

Esmeralda Pita Jiménez

Sometido al Programa de Graduados en Informática y

Computación en cumplimiento parcial con los

requerimientos para obtener el grado de:

Maestra en Ciencias de la Computación

Asesores:

Dr. Juan Frausto Solís

M.C. Javier Lagunas Mendoza

(4)

PRONÓSTICO DE AVENIDAS A MEDIANO PLAZO

UTILIZANDO REDES NEURONALES ARTIFICIALES Y

MODELOS TIPO ARMA .

Presentada por:

Esmeralda Pita Jiménez

Aprobada por:

Dr. Juan Frausto Solís

Profesor/Investigador del Departamento de Tecnologías de Información y Mecatrónica

ITESM Campus Cuernavaca Asesor

M.C. Javier Lagunas Mendoza

Investigador de la Gerencia de Energías No Convencionales Instituto de Investigaciones Eléctricas

Asesor

Dr. Jesús Francisco Ponce Y Maldonado

Profesor del Departamento de Ingeniería y Ciencias ITESM Campus Cuernavaca

Sinodal

Dr. Hugo Gustavo González Hernández

Director del Departamento de Ingeniería Mecánica y Electrónica ITESM Campus Puebla

(5)

Dedicatoria

(6)

Agradecimientos

ƒ Quiero agradecer al Dr. Juan Frausto por su paciencia y valiosos consejos a lo largo de la maestría y en el desarrollo de la tesis, también quiero agradecer sus palabras de aliento para superar los problemas que parecían no tener solución.

ƒ A Javier Lagunas Mendoza, porque gracias a Dios compartimos una misma fe y por ser mi amigo en las buenas y en las malas y por su exhaustiva revisión de la tesis.

ƒ A mis profesores de la maestría, el Dr. Alberto Reyes, Dr. Andrés Rothhirsch, Dr. Jorge Hermosillo, Dra. Mónica Larre, Dr. Francisco Ponce, Dr. Mario di Marchis.

ƒ A mis sinodales el Dr. Jesús Francisco Ponce Y Maldonado y el Dr. Hugo Gustavo González Hernández por sus valiosos comentarios en la revisión de esta tesis.

ƒ Al Instituto de Investigaciones Eléctricas por el apoyo y la beca para estudiar la maestría.

ƒ Al Dr. Jorge M. Huacuz Villamar, Gerente de Energías No Convencionales por apoyarme.

ƒ A mis compañeros de la maestría, especialmente a Enlai.

ƒ A mis compañeros de trabajo en la Gerencia de Energías No Convencionales.

(7)

i

Resumen

El pronóstico de avenidas, ayuda a la toma de decisiones. Cuando se hace un pronóstico a corto plazo (horas o días), se pueden tomar medidas para prevenir inundaciones. Un pronóstico de avenidas a corto plazo es fundamental para la prevención de inundaciones; el pronóstico a mediano y largo plazo es muy útil para la administración del almacenamiento; así como también para la planeación y operación de la generación eléctrica. Por otra parte, un mejor entendimiento de los procesos de escurrimiento es fundamental para mejorar la habilidad de realizar los pronósticos de avenidas. Una forma de obtener un mejor conocimiento del este proceso es analizar los registros históricos de avenidas.

Existen dos métodos para llevar al cabo pronóstico de avenidas, los métodos orientados a proceso como son los modelos hidrológicos y los métodos orientados al análisis de los datos históricos. En esta tesis se centra en utilizar métodos orientados a datos para el pronóstico de series de tiempo hidrológicas mensuales (monovariable) a partir de los datos históricos del río Balsas en la República Mexicana.

El enfoque es un estudio comparativo, entre modelos de tipo Autorregresivo de Medias Móviles (ARMA), utilizados en pronóstico con series de tiempo y una técnica derivada de la inteligencia Artificial o inteligencia computacional como son las Redes Neuronales Artificiales (RNA) de tipo perceptrón multicapa (MLP) con el propósito de conocer cuál es el método que proporciona un pronóstico con mayor efectividad y más ventajas para la estimación de los volúmenes de los escurrimientos hacia una presa.

Los modelos ARMA son muy flexibles y pueden representar un amplio rango de características de las series de tiempo que ocurren en la realidad. La metodología para desarrollarlos esta ampliamente disponible, además, los pronósticos provienen directamente del modelo ajustado. Sin embargo, se ha encontrado que los datos disponibles pueden no ser suficientes para que el modelo logre un buen ajuste y por lo tanto tampoco una buena predicción. El diseño de modelos de RNA para una aplicación de pronóstico no es una tarea trivial, aunque existen paquetes de software que facilitan el esfuerzo de los usuarios en la construcción del modelo, sigue siendo todavía crítico para los pronosticadores el entender muchas cuestiones importantes que rodean el proceso de construcción de un modelo.

(8)

ii

CONTENIDO

PRONÓSTICO DE AVENIDAS A MEDIANO PLAZO UTILIZANDO REDES NEURONALES ARTIFICIALES Y MODELOS TIPO ARMA

1 Introducción……….1

1.1 Antecedentes ...2

1.2 Planteamiento del problema...3

1.3 Objetivos y alcance de la tesis ...5

1.4 Organización de la tesis ...6

2 Pronóstico de avenidas: Revisión...7

2.1 Modelos orientados al análisis del proceso físico ...8

2.1.1 Descripción del proceso de escorrentía ...8

2.1.1.1 Descripción del proceso de escorrentía y su importancia en el pronóstico de avenidas ... 9

2.1.1.2 Características de la cuenca ...10

2.1.1.3 Composición del hidrograma de una cuenca ...13

2.1.2 Modelo de bajo caudal...14

2.1.3 Modelo de precipitación-escorrentía ...14

2.2 Métodos orientados al análisis de datos...16

2.2.1 Modelo de regresión ...17

2.2.2 Modelo de series de tiempo ...18

2.2.3 Modelo de red neuronal artificial ...20

2.2.4 Otros métodos orientados al análisis de datos ...22

2.2.4.1 Lógica difusa ...22

2.2.4.2 Método del vecino más cercano ...22

2.3 Discusión ...23

3 Análisis de series de tiempo para el pronóstico de avenidas ...24

3.1 Introducción al análisis de series de tiempo ...25

3.2 Definición del problema tradicional...27

(9)

iii

3.2.1.1 Estacionariedad ...27

3.2.1.2 Tendencia ...29

3.2.1.3 Estacionalidad ...29

3.3 Clasificación de las series de tiempo...30

3.3.1 Series de tiempo monovariable ...30

3.4 Propiedades de las series hidrológicas...30

3.5 Método de Box & Jenkins ...32

3.5.1 Proceso Autorregresivo (AR)...33

3.5.2 Proceso de Promedio Móvil (MA) ...34

3.5.3 Proceso ARMA ...34

3.5.4 Proceso ARIMA...35

3.5.5 Herramientas para la determinación de los órdenes del modelo ...38

3.5.5.1 Función de autocorrelación simple (FAS) ...38

3.5.5.2 Función de autocorrelación parcial (FACP) ...40

3.6 Etapas del método de Box & Jenkins o metodología ARIMA ...41

3.6.1 Análisis exploratorio de la serie ...41

3.6.2 Identificación del modelo ...41

3.6.3 Estimación de los parámetros del modelo ...42

3.6.4 Adecuación del modelo ...42

3.6.5 Validación y predicción...43

3.7 Discusión ...44

4 Experimentos y resultados: modelo ARMA ...45

4.1 Área de estudio ...46

4.2 Metodología ARMA...47

4.2.1 Análisis exploratorio de la serie ...47

4.2.2 Identificación del modelo ...51

4.2.3 Estimación de parámetros...58

4.2.4 Comparación de series original y ajustada ...59

4.2.5 Validación ...60

(10)

iv

4.3 Discusión ...65

5 Redes Neuronales Multicapa para el pronóstico de avenidas ...66

5.1 Estructura y funcionamiento de las redes neuronales...67

5.2 Aprendizaje y validación ...69

5.3 Perceptrones (redes de una capa) ...70

5.3.1 Algoritmos de aprendizaje ...71

5.3.2 Mejoras y modificaciones ...72

5.4 Perceptrones multi-capa...73

5.4.1 El algoritmo de retro-propagación ...74

5.5 Metodología para predicción de avenidas con redes neuronales ...75

5.5.1 Escalamiento de los datos ...76

5.5.2 Patrones de entrenamiento y prueba...76

5.5.3 Topología de la RNA...77

5.5.3.1 Determinación de las entradas ...77

5.5.3.2 Determinación del número de nodos de la capa oculta ...78

5.5.4 Algoritmo de entrenamiento ...79

5.5.5 Selección de los pesos iniciales...79

5.5.6 Entrenamiento de la RNA seleccionada ...79

5.5.7 Predicción ...79

5.5.8 Comparación entre RNA con diferentes entradas ...80

5.6 Generalización de la red neuronal...80

5.6.1 Validación Cruzada ...80

5.6.2 Entrenamiento con Detención Temprana (Early Stopping) ...81

5.7 Discusión ...83

6 Experimentos y resultados con redes neuronales...84

6.1 Pronóstico de avenidas mensual con una RNA Normal ...85

6.1.1 Análisis de los indicadores de desempeño del pronóstico con el modelo RNA normal ... 87

(11)

v 6.2 Pronóstico de avenidas mensual con RNA utilizando

validación cruzada y detención temprana ... 91

6.2.1 Comparación por indicador de desempeño de los modelos de redes neuronales con validación cruzada y detención temprana ... 92

6.3 Discusión ...96

7 Conclusiones y trabajo futuro...97

7.1 Acerca de la metodología ARMA y el pronóstico ...97

7.2 Acerca de las redes neuronales artificiales y el pronóstico ...98

7.3 Sobre este trabajo de tesis ...98

7.4 Aportaciones ...99

7.5 Trabajos futuros... 100

Referencias……….101

(12)

vi

LISTA DE FIGURAS

Pág.

Figura 1.1 Localización de la Cuenca El Caracol... 3

Figura 2.1 Esquema simplificado del ciclo hidrológico ... 8

Figura 2.2 Proceso de Avenidas. University Corporation of Atmospheric Research ... 10

Figura 2.3 Área de una cuenca ... 11

Figura 2.4 Efecto de la forma de la cuenca en el pronóstico de avenidas... 11

Figura 2.5 Efecto de la pendiente de la cuenca en la escorrentía ... 12

Figura 2.6 Características de un hidrograma ... 13

Figura 2.7 Ejemplo de una serie de tiempo formada por un hidrograma... 13

Figura 2.8 Clasificación de los principales tipos de modelos para series de tiempo ... 20

Figura 3.1 Serie de tiempo con las ventas de vino Australiano ... 25

Figura 3.2 Gastos diarios del río Amarillo en China ... 26

Figura 3.3 Elementos característicos de las series de tiempo ... 29

Figura 3.4 Construcción de variables con rezagos de tiempo ... 39

Figura 4.1 Área de estudio. Río Balsas, estación hidrométrica San Juan Tetelcingo ... 46

Figura 4.2 Gasto de San Juan Tetelcingo desde 1996 a 2007 ... 48

Figura 4.3 Gráfico de la media de los valores de gasto mensual de San Juan Tetelcingo de 1996 a 2007 ... 48

Figura 4.4 Diagrama de caja de la serie con gasto mensual ... 49

Figura 4.5 Serie de tiempo diferenciada con una transformación logarítmica ... 50

Figura 4.6 Gráfico de la función de autocorrelación parcial de la serie original ... 53

Figura 4.7 Gráfico de la función de autocorrelación parcial de la serie original ... 54

(13)

vii Pág. Figura 4.9 Gráfico de la función de autocorrelación parcial con la

transformación logarítmica de la serie y primera

diferencia en la parte regular (d=1) ... 55 Figura 4.10 Gráfico de la función de autocorrelación simple con la

transformación logarítmica de la serie, primera diferencia en la parte regular (d=1) y primera diferencial en la

parte estacional (D=1) ... 55 Figura 4.11 Gráfico de la función de autocorrelación parcial con la

transformación logarítmica de la serie, primera diferencia en la parte regular (d=1) y primera

diferencial en la parte estacional (D=1) ... 56 Figura. 4.12 Gráfico de la función de autocorrelación simple (estacional)

con la transformación logarítmica de la serie, primera diferencia en la parte regular (d=1) y primera diferencia

en la parte estacional (D=1) ... 57 Figura. 4.13 Gráfico de la función de autocorrelación parcial (estacional)

con la transformación logarítmica de la serie, primera diferencia en la parte regular (d=1) y primera diferencia en la parte

estacional (D=1) ... 57 Figura 4.14 Comparación de series original y ajustada en el tramo de ajuste ... 60 Figura 4.15 Valores de residuo entre la serie ajustada y la serie original ... 60 Figura 4.16 Valores de residuo entre la serie pronosticada

y la serie original ... 61 Figura 4.17 Porcentaje de desviación de los residuos obtenidos

para cada mes con respecto a la suma total de los

valores absolutos de los residuos ... 62 Figura 4.18 Comparación de la serie original y de pronóstico del

flujo del río Balsas en la estación San Juan Tetelcingo

para el período enero 2007 a febrero 2008 ... 64

Figura 5.1 (a) Red neuronal multicapa y (b) la función procesadora

de una única neurona ... 68 Figura 5.2 Función de activación logística fc(x) = (1 + e−c x)−1 ... 69

(14)

viii Pág. Figura 6.1 Comparación de las curvas de de predicción de flujo

con los modelos de redes neuronales perceptrón multicapa

con 7 y 14 nodos y el modelo ARIMA ... 90 Figura 6.2 Comparación de las curvas de de predicción de flujo con

los modelos de redes neuronales de validación cruzada y

(15)

ix

ÍNDICE DE TABLAS

Pág.

Tabla 3.1 Patrones que se observan en los correlogramas simple y parcial ... 41

Tabla 4.1. Prueba de homogeneidad de varianza para serie de gasto de la estación San Juan Tetelcingo... 49

Tabla 4.2 Prueba de homogeneidad de varianza de la serie diferenciada ... 50

Tabla 4.3 Análisis de varianza para contraste de hipótesis nula de homogeneidad de medias ... 51

Tabla 4.4 Indicadores de ajuste de las variantes de los modelos ARIMA ... 58

Tabla 4.5 Parámetros del modelo ARIMA para el periodo de ajuste ... 59

Tabla 4.6 Parámetros del modelo ARIMA para el periodo de predicción ... 59

Tabla 4.7 Comparación entre valores de la serie de flujo original y los obtenidos con el modelo ARIMA ... 61

Tabla 4.8 Indicadores de desempeño del modelo ARIMA ... 64

Tabla 6.1 Número de entradas y nodos de capa oculta de la red neuronal ... 86

Tabla 6.2 Errores de ajuste y predicción para las seis redes seleccionadas ... 86

Tabla 6.3 Coeficiente de Eficiencia para modelos de redes neuronales perceptrón multicapa con diferente número de nodos en la capa oculta ... 87

Tabla 6.4 Valores del Error Medio Absoluto (MAE) para los modelos de redes neuronales perceptrón multicapa y el modelo ARIMA ... 88

Tabla 6.5 Valores del Error Medio Absoluto Porcentual (MAPE) para los modelos de redes neuronales perceptrón multicapa y el modelo ARIMA ... 89

Tabla 6.6 Valores de la Raíz del Error Cuadrado Medio (RMSE) para los modelos de redes neuronales perceptrón multicapa y el modelo ARIMA ... 89

Tabla 6.7 Valores de Error Relativo Cuadrado Medio (MSRE) para los modelos de redes neuronales perceptrón multicapa y el modelo ARIMA ... 90

(16)

x Pág. Tabla 6.9 Modelo aplicable para cada periodo como resultado de la

comparación entre la red neuronal perceptrón multicapa y el

modelo ARIMA ... 91 Tabla 6.10 Modelos de Redes Neuronales utilizados con validación

cruzada y detención temprana ... 92 Tabla 6.11 Errores de Ajuste y predicción para las redes seleccionadas ... 92 Tabla 6.12 Valores del Error Medio Absoluto (MAE) para los modelos de

redes neuronales con validación cruzada y el modelo previo ... 93 Tabla 6.13 Valores del Error Medio Absoluto Porcentual (MAPE)

para los modelos de redes neuronales con validación

cruzada y el modelo previo ... 93 Tabla 6.14 Valores de la Raíz del Error Cuadrado Medio (RMSE)

para los modelos de redes neuronales con validación

cruzada y el modelo previo ... 94 Tabla 6.15 Valores de Error Relativo Cuadrado Medio (MSRE) para los

modelos de redes neuronales con validación cruzada y el

modelo previo ... 94 Tabla 6.16 Valores del Coeficiente de Eficiencia (CE) para los modelos de

redes neuronales con validación cruzada y el modelo previo ... 95 Tabla 6.17 Modelo aplicable para cada período como resultado de la

comparación entre la red neuronal de validación cruzada y

(17)

Capítulo 1

Introducción

El pronóstico de avenidas consiste en estimar, con la mayor certeza posible, el flujo de agua que llevará el caudal de un río a futuro, en períodos de corto, mediano y largo plazo. La importancia del pronóstico de avenidas radica en que es fuente de información para la toma de decisiones en la prevención de desastres y la administración eficiente de los recursos hidráulicos. Cuando se hace un pronóstico a corto plazo (horas o días), se pueden tomar medidas para prevenir inundaciones. Por otro lado, el pronóstico a mediano y largo plazo (semanas o meses) es muy útil para la administración del almacenamiento de agua en las presas; y en consecuencia para la planeación y operación de la generación eléctrica en las centrales hidroeléctricas. Es necesario y fundamental un mejor entendimiento de los procesos de escurrimiento para mejorar la habilidad de realizar los pronósticos de avenidas. Una forma de obtener un mejor conocimiento de este proceso es analizar los registros históricos de avenidas.

(18)

Introducción 2 1.1 Antecedentes

En México, desde hace algunos años la Comisión Federal de Electricidad (CFE) mantiene el interés de modernizar sus estaciones hidrométricas y climatológicas con la finalidad de estimar los volúmenes de escurrimiento hacia sus presas.

Esto se hace necesario en la operación de las centrales hidroeléctricas para la ejecución anticipada de operaciones que permitan el manejo de los sistemas de dosificación de aguas, tanto para fines de generación eléctrica como de seguridad. Aunque el problema parece trivial, la decisión de enviar mayores cantidades de agua a las turbinas o a los sistemas de desfogue ante la presencia de eventos de entrada de agua dentro del vaso, es un problema de administración del recurso que tiene un enorme valor económico. Por ejemplo, ante la presencia de una avenida importante existe la opción de generar electricidad en la central hidroeléctrica y disminuir la producción de una central que utiliza combustibles fósiles. Esto significa un ahorro efectivo en la quema de combustibles y en las emisiones de CO2 a la atmósfera. De ahí que sea crucial conocer con la mayor certeza posible los volúmenes de los embalses hacia la presa con el tiempo suficiente que permita hacer la mejor administración de la descarga de agua [Lagunas 2003].

Debido a que el sistema eléctrico (interconectado) nacional genera grandes bloques de energía, con centrales principalmente termoeléctricas e hidroeléctricas, la administración adecuada de la energía es de vital importancia para la economía del país.

A diferencia de las centrales termoeléctricas que tienen una capacidad de almacenamiento de combustible conocido, en las centrales hidroeléctricas ocurren variaciones estacionales y eventuales que modifican la dinámica del llenado de los vasos. Si bien el máximo volumen de la presa es finito y conocido, la velocidad de cambio en los volúmenes de agua depende de las aportaciones al vaso y de la forma como se realice la descarga del mismo.

Mantener una coordinación entre la generación hidroeléctrica y termoeléctrica, económicamente óptima, se logra mediante el llenado racional de las presas en temporada de lluvia, que permita reemplazar generación termoeléctrica y un vaciado suficiente para que la nueva temporada se logre captar la mayor cantidad de agua que será luego transformada en energía de bajo costo. Este proceso de coordinación hidro-térmica impacta notablemente en la economía. Un punto clave de dicho proceso es, sin duda, el pronóstico de avenidas.

(19)

Figura 1.1 Localización de la Cuenca El Caracol.

Ahora bien, durante el año 2003 se llevó al cabo la modernización de la red de estaciones hidrométricas y climatológicas de CFE en la Cuenca de “El Caracol [Lagunas 2003]. Las estaciones que se automatizaron fueron Atenango del Río, Papalutla, San Juan Tetelcingo, Ixcamilpa, El Fraile y El Caracol ubicados en la Cuenca de El Caracol. La figura 1.1 muestra la localización de la Cuenca de El Caracol en la República Mexicana, así como su relación con otras cuencas del centro y sur del país.

La información obtenida en la red de estaciones permite contar con las bases de datos históricas para utilizar los datos hidrométricos en el pronóstico de avenidas. Para el caso de estudio se utilizan los datos históricos y actuales de la estación San Juan Tetelcingo, la cual se ubicada en la parte baja del río Balsas (Figura 1.1).

1.2 Planteamiento del problema

Un pronóstico es una predicción de eventos futuros que se utiliza con propósitos de planificación [Krajewski 2000]. Los métodos de pronóstico suelen basarse en modelos matemáticos que utilizan los datos históricos disponibles, en métodos cuantitativos extraídos de la experiencia o en una combinación de ambos.

Así mismo uno de los problemas fundamentales en la hidrología es la modelación del proceso lluvia-escurrimiento. Otro problema importante es la determinación de modelos que permitan pronosticar con oportunidad la avenida que podría presentarse ante una tormenta ocurrida a partir de los valores del escurrimiento en instantes previos al de interés [Domínguez 2004].

[Bowerman 1993] define dos tipos de pronóstico: pronóstico cualitativo y pronóstico cuantitativo. El pronóstico cualitativo es usado cuando no hay datos o éstos son poco confiables o muy difíciles de obtener. Por ejemplo: cuando se introduce un nuevo producto o tecnología, la experiencia pasada no constituye un criterio seguro para estimar cuáles serán los efectos a corto plazo. Este pronóstico implica el uso de

(20)

Introducción 4 juicios subjetivos y esquemas de clasificación para transformar la información cualitativa en estimaciones cuantitativas. La desventaja principal de este método radica precisamente en que depende de la persona o personas encargadas de llevar al cabo los juicios o las proyecciones, debido a que algunas personas suelen ser cautelosas, otras muy optimistas e incluso otras pueden llegar a involucrar sus intereses personales.

El pronóstico cuantitativo obtiene un modelo del pasado y se utiliza cuando se cuenta con suficientes datos estadísticos confiables para especificar las relaciones existentes entre variables fundamentales.

Dentro del pronóstico cuantitativo existen dos metodologías de solución como son pronósticos basados en la extrapolación (para casos monovariable) y las redes neuronales artificiales, RNA´s, (para casos monovariable y multivariable).

El pronóstico basado en la extrapolación recurre a las tendencias pasadas o presentes a fin de proyectar los acontecimientos futuros. Así, por ejemplo, los registros de ventas en los últimos años podrían servir para proyectar el patrón de ventas para el próximo año. De la misma forma, los registros históricos de los datos de gasto y nivel de agua en los ríos permiten llevar al cabo el pronóstico de avenidas.

Una metodología clásica para llevar al cabo este tipo de pronóstico, también definida por [Bowerman 1993], es el uso de series de tiempo, las cuales son secuencias de observaciones sobre una variable en particular.

Las series de tiempo juegan un papel importante en la hidrología, ya que se usan para construir modelos matemáticos que generan registros históricos, para detectar tendencias y cambios en los registros hidrológicos y para rellenar datos faltantes en los registros. Los modelos de series de tiempo utilizados para el pronóstico de avenidas se pueden dividir en dos categorías, de acuerdo con el número de series de tiempo involucradas en el modelo: modelos de una sola variable y modelos que incorporan variables exógenas [Wen 2006].

Los modelos más utilizados para el pronóstico de avenidas son los de extrapolación tipo ARMA (por sus siglas en inglés, AutoRegressive Moving Average) y sus variantes. Éste tipo de modelos se utilizan para pronosticar flujos anuales, mensuales y semanales.

Otra de las metodologías utilizadas para realizar pronósticos con series de tiempo son las Redes Neuronales Artificiales (RNA) que han tenido gran aceptación debido a que proporcionan mejores resultados que los basados en extrapolación, en la mayoría de los casos [Rao 1994].

(21)

utilizadas para realizar pronósticos de una sola variable (monovariable) así como también pronósticos de varias variables (multivariable).

El tipo de RNA más utilizado es el modelo perceptrón multi-capa (MLP) optimizado con el algoritmo de retro propagación (backpropagation). Y es también el tipo de RNA que más se ha utilizado para el pronóstico de avenidas [Wen 2006].

Estas metodologías han sido estudiadas y comparadas para llevar al cabo el pronóstico de avenidas, los modelos ARMA y las redes neuronales en varios ríos de distintos países, sin embargo, en México solo se han reportado estudios orientados al proceso [Domínguez 1994], [Domínguez 2004].

En el desarrollo de la tesis se desea llevar al cabo un análisis comparativo entre dos tipos de metodologías para pronosticar avenidas como son: los modelos ARMA y los métodos de inteligencia artificial como las RNA con el objetivo de determinar cuál es la metodología qué proporciona un pronóstico de avenidas con mayor efectividad y más ventajas para el pronóstico de avenidas en la cuenca en estudio, así como también comprobar si el conjunto de datos actual es suficiente para proporcionar un pronóstico confiable.

1.3 Objetivo y alcance de la tesis

Objetivo general

Analizar y comparar dos métodos de pronóstico que puedan ser aplicables para pronosticar avenidas en línea con horizonte de tiempo a mediano plazo.

Alcances

ƒ Analizar modelos orientados a datos para el pronóstico de avenidas; en particular los modelos de series de tiempo como los de tipo ARMA

ƒ Investigar un modelo de red neuronal que permita resolver el problema del pronóstico de avenidas basado en series de tiempo.

ƒ Determinar cuáles son los criterios principales para desarrollar un modelo de pronóstico con series de tiempo con una metodología clásica como es el modelo ARMA y un modelo de red neuronal.

ƒ Comparar las metodologías seleccionadas para determinar con cuál se obtienen mejores resultados.

(22)

Introducción 6

1.4 Organización de la tesis

(23)

Capítulo 2

Pronóstico de avenidas: Revisión

En esta sección se describe la variedad de métodos para llevar al cabo el pronóstico de avenidas, los cuales pueden clasificarse en dos clases generales: métodos orientados al análisis del proceso físico (modelos tipo hidráulico) y métodos orientados al análisis de los datos. Los métodos orientados al proceso conciben el proceso de avenidas como la salida de un sistema geográfico denominado cuenca, analizan la extensión geográfica, el tipo de suelo, la vegetación, entre otros y matemáticamente aproxima los procesos físicos internos del sistema de cuencas que rigen los procesos de avenidas sobre la base de una cierta comprensión de los procesos y elementos físicos que la integran.

(24)

Pronóstico de avenidas: Revisión 8

2.1 Modelos orientados al análisis del proceso físico

Generalmente hay dos tipos de modelos orientados al análisis del proceso para el pronóstico de avenidas: los modelos de precipitación-escorrentía (acumulados, semidistribuidos, o distribuidos), y modelos de bajo caudal. Los modelos de precipitación-escorrentía son aplicables a los procesos de avenidas en los que dominan diferentes fuentes de escorrentía, especialmente los casos donde los procesos de avenidas están dominados por los procesos de precipitación. Mientras que los modelos de bajo caudal describen los procesos de avenidas resultantes de los drenajes de las aguas subterráneas de almacenamiento o de otras fuentes de retraso, y en consecuencia, por lo general sólo son aplicables al período de estiaje posterior a la temporada de inundaciones. Antes de iniciar con la descripción de los modelos explicaremos en forma breve en qué consiste el proceso de escorrentía.

2.1.1 Descripción del proceso de escorrentía

[image:24.612.137.504.458.705.2]

La hidrología se define como la ciencia que estudia la disponibilidad y la distribución del agua sobre la tierra. El fenómeno hidrológico tiene un comportamiento que responde a un complejo conjunto de interacciones entre diversos procesos físicos que dan origen a lo que se conoce como ciclo hidrológico. El ciclo hidrológico es un término descriptivo aplicable a la circulación general del agua en la tierra. Con mayor precisión se puede decir que es una sucesión de etapas que atraviesa el agua al pasar de la atmósfera a la tierra y volver a la atmósfera: evaporación desde el suelo, mar o aguas continentales, condensación de nubes, precipitación, acumulación en el suelo, deshielos, escorrentía y nuevamente evaporación. Un esquema resumido de las distintas etapas y su interacción se muestra en la Figura 2.1 [USGS 2008].

(25)

Cada una de las etapas del ciclo hidrológico tiene implícita una fuerte componente estocástica. Así por ejemplo las infiltraciones dependen de la porosidad del suelo, la que a su vez depende, en un rango amplio de valores, de la temperatura del suelo. A su vez la evaporación y los deshielos dependen directamente de la temperatura ambiente, la que puede se modelada como un proceso estocástico. Por su parte, las precipitaciones también están vinculadas a complejos procesos atmosféricos. [Davis 1966]

Dentro del ciclo hidrológico encontramos el estudio de avenidas de los ríos. El término de avenida es generalmente considerado como un sinónimo de aportación de un río; en este sentido representa la suma de la escorrentía superficial y del flujo subterráneo captado por los cauces de los ríos. El estudio de la escorrentía, como parte del ciclo hidrológico, incluye el de la distribución del agua y el de su trayectoria desde que ésta se precipita sobre la tierra hasta que alcanza la red hidrogeográfica o vuelve directamente a la atmósfera a través de la vaporización. La proporción correspondiente a cada una de las partes entre las que puede distribuirse el volumen total de agua caída durante una precipitación dada depende tanto de las características y condiciones físicas (naturales o artificiales) de las cuencas como de las características de la propia precipitación.

2.1.1.1 Descripción del proceso de escorrentía y su importancia en el pronóstico de avenidas

Al comienzo de una fuerte precipitación, una gran cantidad de agua es interceptada por la vegetación; el agua así almacenada sobre la superficie de la capa vegetal se encuentra muy expuesta al viento y ofrece una enorme área de evaporación, de tal forma que las precipitaciones de corta duración y poca intensidad pueden no aportar escurrimientos hacia el caudal de los ríos [Meted 2007].

En un segundo proceso, el suelo a través de sus capas de depósitos de restos vegetales y sobre todo en sus depresiones, almacena una cierta cantidad de agua. Es decir, se inicia el proceso de percolación del agua a las capas inferiores (infiltración). Cuando la capacidad de almacenamiento del suelo, ya descontada la infiltración, está en el límite, se inicia el proceso de circulación superficial del agua.

Existe además una porción de lluvia que desde el primer momento cae directamente sobre los cauces de los ríos y circula por ellos sin haber corrido sobre la superficie del suelo; esta porción puede a veces aparecer claramente individualizada en el hidrograma general de la crecida.

(26)
[image:26.612.174.468.139.390.2]

Pronóstico de avenidas: Revisión 10

Figura 2.2 muestra la evolución de la escorrentía hasta llegar al proceso de avenidas, además muestra algunas de las herramientas que utilizan los métodos orientados al proceso físico y que pudieran ser útiles en el análisis de cada etapa del proceso.

Figura 2.2. Proceso de avenidas. University Corporation of Atmospheric Research

2.1.1.2 Características de la cuenca

Las cuencas son definidas como extensiones geográficas delimitadas por un parteaguas en donde las precipitaciones son captadas por los ríos dentro de su territorio y escurren directamente a un captador como por ejemplo una presa.

Analizando la escorrentía superficial y estudiando el hidrograma de una cuenca se plantea el análisis de las características físicas de la cuenca que condicionan el hidrograma producido en ellas. Estas características superficiales son la forma, el relieve y distribución hidrográfica.

ƒ Área. Es la magnitud más importante que define la cuenca. Delimita el

volumen total de agua que la cuenca recibe en cada precipitación. No parecerá sorprendente que la comparación de una lluvia uniforme sobre una cuenca más grande y otra más pequeña revela que la más grande produce un mayor volumen de escorrentía.

(27)
[image:27.612.192.453.461.674.2]

tarda más en alcanzar la salida de la cuenca que la escorrentía que proviene del punto más lejos aguas arriba de la cuenca más pequeña. Además, es probable que una tormenta sólo afecte a una parte de la cuenca más grande en un momento dado, mientras que puede cubrir toda la cuenca más pequeña.

Figura 2.3 Área de una cuenca

ƒ Forma de la cuenca. La forma de la cuenca también influye en la magnitud y

el desarrollo temporal del caudal máximo en la salida de la cuenca. En la Figura 2.4 se muestran dos cuencas de área igual, pero una de forma larga y estrecha, y la otra más ancha. Considere ahora el recorrido de la escorrentía a medida que se desplaza desde el punto más lejano de la cuenca hasta la salida correspondiente. La escorrentía de la cuenca más ancha llegará más rápidamente a la salida de la cuenca.

(28)

Pronóstico de avenidas: Revisión 12

Además, es más probable que el agua proveniente de varios lugares de la cuenca más ancha alcance la salida al mismo tiempo, lo cual produce un caudal máximo mayor. En contraste, es menos probable que el agua proveniente de distintos lugares de la cuenca larga y estrecha llegue al mismo tiempo.

ƒ Pendiente de la cuenca. La pendiente de una cuenca influye en la cantidad y

el desarrollo temporal de la escorrentía.

En la Figura 2.5 se muestra el efecto de la pendiente, a medida que aumenta la pendiente de la topografía, entran en juego varios factores. En primer lugar, el contacto del agua con la superficie y no es perpendicular. En las pendientes, la fuerza de gravedad ya no atrae el agua directamente hacia el suelo, de forma que una mayor parte se convierte en escorrentía superficial. Otro factor es el movimiento del agua sobre la superficie terrestre. A medida que aumenta la pendiente del suelo, el agua se desplaza con mayor rapidez y queda menos tiempo en contacto con la superficie, lo cual reduce el tiempo que puede infiltrarse.

Figura 2.5 Efecto de la pendiente de la cuenca en la escorrentía

ƒ Rugosidad. La “rugosidad” de un cauce fluvial aumenta con la presencia de

(29)

Otro factor influyente en el proceso de avenidas son las propiedades de la superficie del suelo qué pueden ser el factor más importante y que determinan la escorrentía en algunas áreas. Si el agua no puede penetrar la superficie del suelo, las características del perfil del suelo subyacente carecen de importancia. Los materiales de superficie impermeables, la compactación del suelo, la deforestación y los incendios son algunos de los factores que influyen en la infiltración en el perfil del suelo.

Las características de la cuenca descritas anteriormente tienen un gran impacto al momento de construir el hidrograma que determina el escurrimiento y el momento de la crecida o avenida.

2.1.1.3 Composición del hidrograma de una cuenca

El hidrograma unitario (Figura 2.7) muestra el cambio en el caudal, o flujo, por unidad de escorrentía a lo largo del tiempo; en otras palabras, muestra cómo la adición de una unidad de escorrentía influirá en el caudal de un río con el tiempo. El hidrograma unitario es una herramienta útil en el proceso de predecir el impacto de la precipitación sobre el caudal.

Figura 2.6 Características de un hidrograma Figura 2.7 Ejemplo de una serie de tiempo

formada por un hidrograma

En el hidrograma se distinguen las siguientes partes:

ƒ Caudal de base. Corresponde al caudal circulante por el río antes de iniciarse

la lluvia y después de que los efectos de la lluvia han desaparecido.

ƒ Curva ascendente. Es la rama ascendente del hidrograma, función de la

intensidad y distribución de la lluvia así como de las características de la cuenca. Las condiciones iniciales de la cuenca (humedad del suelo, vegetación, etc.) influyen decisivamente en la curva de concentración.

ƒ Punta del hidrograma. Es el punto de caudal máximo.

ƒ Curva descendente. Es la primera parte de la rama descendente del

(30)

Pronóstico de avenidas: Revisión 14

ƒ Curva de agotamiento. Corresponde a la parte final de la curva de bajada del

hidrograma y contiene los caudales subterráneos que corresponden a menores velocidades de circulación del agua. Los caudales hipodérmicos o subsuperficiales son intermedios a los anteriores y sus valores mayores corresponden al entorno del punto de inflexión de la curva de bajada del hidrograma.

ƒ Tiempo de punta. Es el tiempo transcurrido desde que se inicia la curva de

concentración hasta el momento de producirse la punta del hidrograma.

ƒ Tiempo de Base. Es el tiempo transcurrido entre el inicio de la curva de

concentración y el punto de inflexión que identifica el final de la curva de bajada.

ƒ Tiempo de concentración. Es el tiempo transcurrido desde el final de la lluvia

neta hasta el momento en que acaba la curva de bajada, es decir, el final de la escorrentía superficial.

En la actualidad la hidrología tiene un papel muy importante en la planeación del uso de los recursos hidráulicos y ha llegado a convertirse en parte fundamental de los proyectos de ingeniería que tienen que ver con suministro de agua, disposición de aguas almacenadas, drenaje, protección contra la acción de ríos y recreación. Por otro lado, la integración de la hidrología con métodos computacionales es ahora imprescindible para el pro de información existente y en la simulación de ocurrencia de eventos futuros.

2.1.2 Modelo de bajo caudal

El análisis de bajo caudal es una técnica muy útil de pronóstico para describir los procesos de recesión de escurrimiento de río durante el período de estiaje. El bajo flujo o caudal en un río natural puede ser definido como el flujo resultante de la corriente de drenaje de las aguas subterráneas de almacenamiento u otras fuentes retardadas [Davis 1966]. La recesión de las descargas de avenidas se pueden observar en una curva de recesión. La expresión cuantitativa de la curva de recesión puede ser obtenida de varias formas. En [Mishra 2003] se desarrolló un modelo de pronóstico de bajo caudal para el Río Nilo Azul utilizando un algoritmo de salida- captación-almacenamiento no lineal. Sin embargo, hay una falta de consistencia en la obtención de las características de recesión debido a la alta variabilidad del tiempo que se encuentra en las recesiones, lo que ha limitado una mayor utilización de este algoritmo [Tallaksen 1995].

2.1.3 Modelo de precipitación-escorrentía

(31)

agregada considerando un hidrograma unitario. Los modelos de

precipitación-escorrentía describen el proceso basados en la combinación de algunas ecuaciones que aproximan al fenómeno físico y ecuaciones empíricas. Para el modelado físico de los procesos de avenidas se deben tener en cuanta dos subprocesos esenciales: la transformación de la precipitación-escorrentía y el canal de enrutamiento. De la misma manera, un modelo típico conceptual de precipitación-escorrentía se compone de un módulo que simula el proceso de transformación de la precipitación a la escorrentía y otro módulo que simula el proceso que sigue el flujo del canal o río. Si bien los modelos conceptuales de precipitación-escorrentía se utilizan ampliamente para pronóstico en tiempo real e inundaciones de corto plazo, hay también muchos casos para la aplicación de modelos conceptuales para el modelado de mediano y largo plazo en los procesos de precipitación-escorrentía. Por ejemplo, el primer modelo desarrollado en 1973, llamado modelo Pitman [Pitman 1973], se ha convertido en uno de los más utilizados mensualmente en los modelos de precipitación-escorrentía en el sur de África [Hughes 2004].

Cuando es aplicado a tiempo real y al pronóstico de inundaciones a corto plazo, las unidades de tiempo básicas de entrada y salida de datos de modelos conceptuales generalmente van de 1 hora a 1 día. Cuando se aplican a pronóstico de avenidas en escalas grandes de tiempo (semanalmente o mensualmente), se debería agregar el pronóstico en tiempo de escala corto para hacer el pronóstico en tiempo de escala más grande, o más comúnmente, cambiar la escala de tiempo de las variables de entrada. Por ejemplo, cuando se aplica al pronóstico de avenidas a 10 días o mensualmente, las unidades de tiempo y las entradas usualmente son 10 días o un mes.

A pesar del cambio de entrada de la escala de tiempo, a veces, la estructura del modelo debe ser modificado también. Por ejemplo, en el modelo convencional de Xinanjiang [Zhao 1995], la escorrentía es separada en tres componentes: la escorrentía inmediata, la escorrentía superficial y la escorrentía subterránea. Cuando se usa el modelo Xinanjiang para pronosticar escurrimientos mensuales, sólo dos componentes deben ser considerados, la rápida respuesta de escorrentía (la superficie del terreno y la corriente del suelo) y la lentitud de la respuesta de la escorrentía (escorrentía subterránea) [Liu 1997].

(32)

Pronóstico de avenidas: Revisión 16

La Autoridad de Energía y Agua en Columbia Británica en Canadá utiliza un modelo hidrológico parcialmente distribuido para pronosticar el escurrimiento estacional a partir de Enero a Agosto del proyecto Mica sobre el Río Columbia [Druce, 2001]. El modelo hidrológico se ejecuta junto con el pronóstico con entradas meteorológicas observadas hasta obtener el estatus actual de la cuenca, entonces los datos de precipitación histórica son utilizados como entradas para pronosticar futuros flujos estacionales. Con la mejora en la exactitud de los pronósticos meteorológicos, los datos meteorológicos pronosticados a mediano y largo plazo son cada vez más utilizados en el pronóstico de los escurrimientos.

Por ejemplo, el Sistema Europeo de Pronóstico de Inundaciones (EFFS, por sus siglas en inglés) que se desarrolla en colaboración con varios países de Europa, utiliza las predicciones de precipitación de mediano plazo del Centro Europeo para el Pronóstico del Clima a mediano plazo (ECMWF, por sus siglas en inglés) como entradas a los modelos de balance de agua y a los modelos de precipitación-escorrentía para hacer el pronóstico del clima de 1 a 10 días de antelación [De Roo 2003], [Wood 2002]. Los pronósticos del clima mensualmente englobados producidos por el modelo espectral global (GSM, por sus siglas en inglés) para pronóstico con plazo de un día, son utilizados para pronóstico como entrada a un modelo hidrológico de capacidad de infiltración de variable (VIC, por sus siglas en inglés) semidistribuído para producir pronóstico de escurrimientos a largo plazo. Existen dos cuestiones importantes para llevar al cabo el pronóstico de mediano y largo plazo, una, es cómo reducir la escala de tiempo de pronóstico (downscale) de las variables atmosféricas que se pronostican (especialmente la precipitación) y dos, cómo satisfacer los requerimientos de los modelos de precipitación-escorrentía. En [Werner 2005] se compararon dos conjuntos de datos de pronóstico con el ESP: una corrida de control basada sobre la temperatura y precipitación observados históricamente y una corrida experimental basada sobre un rango medio (1 a 14 días) de pronósticos de temperatura y precipitación (MRF). Su estudio mostró que el uso de los datos meteorológicos pronosticados fue generalmente superior a la utilización de datos meteorológicos históricos, pero hubo situaciones en las que el pronóstico se volvió impreciso con la disminución de la escala de pronóstico del MRF.

2.2 Métodos orientados al análisis de datos

(33)

todavía no es posible lograr un conocimiento preciso acerca de los mecanismos físicos subyacentes en las avenidas, por lo cual, las técnicas de modelado orientado al uso de datos se ha hecho más popular el campo de la hidrología en la última década [Solomatine 2002].

2.2.1 Modelo de regresión

Se denominan modelos de regresión a los modelos estadísticos que explican la dependencia de una variable dependiente “Y” respecto de una o varias variables cuantitativas “X”. El análisis de regresión, tanto, el de regresión simple como el de regresión múltiple, es uno de los métodos más antiguos y con mayor frecuencia utilizado en el pronóstico de avenidas. Éste tiene la ventaja de que es comparativamente simple y puede ser fácilmente implementado. Muchos métodos de regresión iniciales utilizaron técnicas gráficas. Algunas variaciones del modelo de regresión se encuentran disponibles en el campo del pronóstico de avenidas, como el modelo de perturbación lineal (LPM) [Nash 1983]. También son esencialmente métodos de regresión los siguientes: el método de variable-índice y el método de almacenamiento-contable [Lattenmaier 1993].

Muchas de las aplicaciones de los métodos de regresión pueden ser encontradas en la literatura. En [Tangborn 1976] se sugiere que el almacenamiento de la cuenca, St podría ser estimada como una función lineal de la precipitación de la cuenca desde el comienzo de un período de acumulación (generalmente, cerca del inicio de las lluvias del año) hasta el dato de pronóstico, menos la escorrentía. El pronóstico de la escorrentía para el período T es entonces una función lineal de St. En los 80´s, el Proyecto Plan Maestro de Agua en cooperación con la Universidad de El Cairo y el Massachusetts Institute of Technology desarrollaron el modelo de regresión lineal gradual multivariado para hacer los pronósticos de escurrimiento mensual de la reserva de Aswan [Curry 1980]. La Compañía British Columbia Hydro utiliza un programa de regresión lineal múltiple que incluye nevadas, precipitaciones y temperatura para hacer pronóstico de volumen de afluencia estacional [Fast 1990]. El método de regresión aún se utiliza operativamente hoy en día en muchos casos. El pronóstico de la posible escorrentía por la nieve derretida de las dos cuencas ubicadas en el sureste de Alberta, Canadá se basa en los métodos de regresión actuales [Mahabir 2003].

En [Hu 2001] se desarrolló un modelo de pronóstico para la afluencia del embalse Sanmen Gorge del Río Amarillo durante los períodos de no-inundación con modelos de regresión utilizando antecedentes de precipitaciones y avenidas.

(34)

Pronóstico de avenidas: Revisión 18

del mar y el índice de circulación atmosférica). Los temas más importantes que deberían ser determinados para la aplicación de métodos de regresión son:

(1) ¿Qué factores tienen una correlación significativa con el proceso de avenidas que está bajo estudio?

(2) ¿En cuáles escalas de tiempo los factores seleccionados tienen una mayor correlación significativa con el proceso de avenidas?

(3) ¿Cuál es el tiempo de retraso de la respuesta de escurrimiento a los predictores?

Si bien las descargas en tiempo real y a corto y mediano plazo están relacionadas con los factores locales y las condiciones iniciales de las cuencas, los escurrimientos a largo plazo son comúnmente relacionados con algunas cantidades geofísicas remotas. En la mayoría de las aplicaciones de pronóstico de escurrimientos se utilizan los modelos de regresión lineal. Para hacer regresiones más flexibles se pueden aplicar los modelos de regresión no lineal. Un modelo de regresión no lineal ampliamente utilizado es el modelo de regresión umbral (TR), en el cual una regresión separada es ajustada a un grupo específico de datos de acuerdo con algunos valores de umbral. Un derivado del modelo TR es el llamado modelo de árbol, con el cual un número de modelos de regresión son ajustados de manera jerárquica. Recientemente TR se ha utilizado para los problemas de pronóstico precipitación-escorrentía, por ejemplo, [Solomatine 2003], [Solomatine 2004].

2.2.2 Modelo de series de tiempo

El análisis de series de tiempo desempeña un papel importante en la investigación hidrológica. Se utiliza para la construcción de modelos matemáticos para generar registros hidrológicos sintéticos, para pronosticar eventos hidrológicos, detectar tendencias y marcarlos en los registros hidrológicos, y para suplir la falta de datos y extender los registros [Salas 1993]. Los modelos de series de tiempo utilizados para el pronóstico de avenidas se pueden dividir en dos categorías según el número de variables involucradas en los modelos, de esta manera encontramos a los modelos monovariable y modelos que incorporan variables exógenas. Los modelos de series de tiempo monovariable más populares son:

(35)

• ARIMA (por sus siglas en inglés, AutoRegressive Integrated Moving Average). Este modelo combina también los modelos AR y MA pero la serie no es estacionaria.

• SARIMA (por sus siglas en inglés, Seasonal AutoRegressive Integrated Moving Average). Es un modelo ARIMA que expresa la relación de los valores que toma la variable entre estaciones similares en períodos diferentes. • PARMA (por sus siglas en inglés, Periodic AutoRegressive Moving Average).

Un modelo PARMA es básicamente una extensión del ARMA cuyos parámetros dependen de cada período utilizando días, semanas o meses.

• TAR (por sus siglas en inglés Threshold AutoRegressive). Este modelo emplea grupos definidos a partir de umbrales, permitiendo así el análisis de series de tiempo complejas, a partir de subsistemas simples.

• ARFIMA (por sus siglas en inglés AutoRegressive Fractionally Integrated Moving Average). Este modelo es una generalización del modelo ARMA que busca una mejor caracterización de las series en donde las autocorrelaciones decrecen a un ritmo muy lento pero finalmente convergen hacia cero.

Se hace notar que el modelo ARMA se basa en la suposición de que la serie de tiempo es estacionaria; sin embargo las series de tiempo hidrológicas por lo general tienen una fuerte estacionalidad. En consecuencia ARMA no es directamente aplicable a series de tiempo hidrológicas. Por esa razón se emplean dos modelos para dichas series [Hipel l994]:

o Modelo ARIMA combinado el modelo SARIMA,

o Modelo ARMA desestacionalizado (ARMA convertido en estacionario)

La Figura 2.8 muestra el modelo ARMA y sus diferentes variantes para el análisis y pronóstico de series de tiempo hidrológicas. Estos modelos y sus parámetros (p,d,q, etc.) se explican con más detalle en el capitulo 3.

Los dos tipos de modelos anteriores se han utilizado para el pronóstico mensual o semanal-mensual de avenidas [McKerchar 1974], [Thompstone 1985], [Noakes 1985], [Yurekli 2005]. También se han empleado dichos modelos en el pronóstico diario, [Kang 1993] y [Abrahart 2000].

(36)

Pronóstico de avenidas: Revisión 20

de precipitación. En los últimos años, la propiedad de memoria larga de los procesos de avenidas atrajo mucho la atención.

Figura 2.8 Clasificación de los principales tipos de modelos para series de tiempo

El modelo ARMA y un derivado (el modelo SARIMA) son estudiados en capítulos posteriores para llevar al cabo el pronóstico mensual de avenidas en el río Balsas ubicado en la cuenca de “El Caracol” en México.

2.2.3 Modelo de red neuronal artificial

El modelo ANN (por sus siglas en inglés, Artificial Neural Networks) o red neuronal artificial (RNA) es un método orientado al análisis de datos con una estructura matemática flexible que es capaz de identificar las relaciones no lineales complejas entre los conjuntos de datos de entrada y salida sin la necesidad de entender la naturaleza del fenómeno. Las ANN se han utilizado cada vez más para el pronóstico hidrológico en la última década, como se muestra en los trabajos realizados por [Maier 2000] y [Dawson 2001].

En una de las primeras aplicaciones que involucran aplicaciones hidrológicas se utilizaron modelos tipo ARMA para predecir flujos diarios y horarios [Kang 1993]. Este estudio preliminar llegó a la conclusión que las ANN son útiles para pronóstico de flujos. Muchos estudios han confirmado posteriormente la superioridad de los modelos de ANN sobre las técnicas tradicionales estadísticas y conceptuales en el modelado de los procesos hidrológicos, como son los trabajos desarrollados por [Raman 1995], [Dibike 2001], [Tokar 2000] y [Birikundavyi 2002].

ARMA(p,q)

SARMA(p,d,q) ARIMA(p,d,q)

ARIMA (p, d, q) x SARIMA (P, D, Q)

ARIMA (p, d, q) (P, D, Q)S AR(p)

(37)

En trabajos posteriores las ANN han sido comparadas con modelos tipo ARMA monovariable [Pita 2008] y también con aquellos que incorporan variables exógenas [Bordignon 2000]. En ambos casos las ANN obtuvieron un desempeño similar a los obtenidos con modelos tipo ARMA. Sin embargo, se requiere investigación adicional para evaluar la eficiencia de ambos modelos.

El tipo más popular de ANN es el modelo de perceptrón multicapa (MLP) optimizado con el algoritmo de retro-propagación. También es el tipo de ANN más utilizado en el pronóstico de avenidas. En [Hsu 1995] se aplicó un modelo ANN para hacer pronósticos de avenidas diario. En [Markus 1997] se realizaron pronósticos de avenidas mensuales con los modelos MLP ANN de varios ríos, y se comparó el desempeño de los modelos de ANN con otros modelos. En [Jain 1999] se utilizó el modelo de MLP ANN para hacer pronóstico de flujo mensualmente. En [Zealand 1999] se utilizaron modelos MLP ANN para hacer pronóstico de flujo con cuatro semanas de antelación. En [Sajikumar 1999] se diseñó un tipo especial de modelo ANN MLP, llamado, red neuronal de retropropagación temporal, para hacer modelos de precipitación-escorrentía mensuales. En [Birikundavyi 2002] se investigó el desempeño de los modelos de ANN para pronóstico de flujo diario con 7 días de anticipación y se demostró que las ANN tuvieron un rendimiento superior a un modelo de precipitación-escorrentía para pronósticos de hasta 5 días de antelación. En [Atiya 1998] se compararon varios modelos de ANN para predecir las avenidas del río Nilo en el embalse Aswan. En [Kisi 2004] se utilizaron modelos MLP ANN para hacer pronósticos de avenidas mensuales. En [Srivastava 2004] se utilizó un modelo ANN para compararlo con un modelo orientado a proceso, dicho resultado muestra que en la escala mensual, en que se comparan, ambos obtienen resultados similares.

Algunos otros tipos de ANN se han aplicado también a los problemas de pronósticos de avenidas, pero con menor frecuencia. El modelo de función de base radial (RBF) ha sido utilizado por muchos investigadores para el pronóstico de avenidas [Fernando 1998],[Dibike 2001] y [Dawson 2002].

En [Chang 2001] se aplicó una red neuro difusa de retro-propagación, la cual es una fusión de una red neuronal y lógica difusa para pronosticar con una hora de antelación. En [Ballini 2001] se aplicó una red neuro-difusa para el problema del pronóstico de avenida estacional. En [Moradkhani 2004] se exploró la aplicabilidad de una función de base radial auto-organizada para pronosticar con un día de anticipación la avenida de flujo diario.

(38)

Pronóstico de avenidas: Revisión 22

2.2.4 Otros métodos orientados al análisis de datos

En esta sección se muestran dos metodologías que han sido utilizadas para el pronóstico de avenidas en menor grado, sin embargo, no se han obtenido resultados tan exitosos como el caso de los modelos ARMA y ANN.

2.2.4.1 Lógica difusa

Desde que Zadeh publicó en 1965 [Zadeh 1965] la teoría de conjuntos difusos como una extensión de la clásica teoría de conjuntos, la lógica difusa ha sido aplicada con éxito en muchos campos de aplicación donde la relación entre causa y efecto (variable y resultado) es imprecisa. Con las técnicas de lógica difusa, las variables difusas son usadas para organizar el conocimiento que se expresa 'lingüísticamente', en un análisis formal.

Por ejemplo, “flujo alto”, “flujo medio” y " flujo bajo” se llegan a convertir en variables. Las técnicas de lógica difusa se han aplicado a la vez en pronóstico de inundaciones en tiempo real [Han 2002], [Nayak 2005] y pronóstico de flujos de mediano a largo plazo [Zhu 1994]. Mediante la aplicación de la lógica difusa, se han desarrollado modelos expertos difusos para pronóstico de escorrentía en primavera [Mahabir 2003].

Los resultados muestran que los pronósticos de escorrentía de primavera de los sistemas expertos difusos son mucho más confiables que los modelos de regresión en pronosticar la correspondiente zona de escorrentía, especialmente en términos de identificar los años de escorrentía promedio o baja. Las técnicas de lógica difusa pueden ser combinadas con modelos conceptuales u otros modelos conducidos por datos, como por ejemplo ANN). [Mizumura 1995] mostró que el enfoque combinado usando el modelo conceptual Tank y un modelo de lógica difusa cubre satisfactoriamente con los resultados de predicción de la escorrentía-nieve derretida. Cuando las técnicas de lógica difusa se combina con el modelo ANN, se puede construir una regla difusa basada en un modelo ANN [See 2001], o un modelo de sistema neuro difuso integrado más estrechamente (ANFIS) [Chang 2001] [Nayak 2004].

2.2.4.2 Método del vecino más cercano

(39)

Debido a su buena aproximación y capacidad para la dinámica no lineal, con el desarrollo de la teoría de la dinámica no lineal, el método NNM es adoptado por muchos investigadores en el campo de la dinámica no lineal como un método estándar para predecir series de tiempo caóticas [Farmer 1987], [Sugihara 1990]. Se aplicó por primera vez al pronóstico de precipitación-escorrentía por [Karlsson 1985] y luego por [Yakowitz 1987].

A raíz de su investigación, muchos investigadores han aplicado el NNM al pronóstico de avenidas para casos de una sola variable (monovariable), como es el caso de [Kember 1993], [Liu 1998], [Bordignon 2000] y [Sivakumar 2001], así como a casos multivariados [Porporato 2001].

En [Yakowitz 1987] se comparó el desempeño de NNM con un modelo ARMA que incorpora variables exógenas (ARMAX) y el modelo orientado a proceso Sacramento para hacer pronóstico de flujos de un día de antelación. Se concluyó que mientras los desempeños del NNM y ARMAX son considerablemente mejores que el rendimiento del modelo Sacramento, el rendimiento de los modelos NNM y ARMAX son comparables. Sin embargo, algunos estudios recientes demostraron que el modelo NNM supera a los modelos tipo ARMA, como son los trabajos realizados por [Bordignon 2000], [Porporato 2001].

2.3 Discusión

En este capítulo se han detallado los principales componentes físicos del proceso de avenidas o escurrimiento, aunque en esta tesis no se contempla su estudio es de interés conocerlo para entender el proceso y visualizar de que manera los modelos orientados a datos pueden simplificar el análisis de este complejo fenómeno físico y obtener buenos resultados cuando se lleva al cabo su pronóstico.

(40)

Capítulo 3

Análisis de series de tiempo para el pronóstico

de avenidas

La importancia del análisis y el pronóstico de series de tiempo ha sido desde siempre de gran interés debido a que es de gran utilidad en diversas áreas de la ciencia y de la ingeniería como en los procesos de producción y monitoreo, optimización, la economía, la hidrología, etc., donde, basado sobre los datos colectados en el pasado, se puede realizar pronósticos que son de gran utilidad para la toma de decisiones. También podemos constatar su importancia y gran utilidad por la gran cantidad de trabajos que se presentan en la actualidad por parte de científicos e ingenieros interesados en proporcionar nuevas soluciones.

(41)

3.1 Introducción al análisis de series de tiempo

Una serie de tiempo es una secuencia ordenada de valores observados de variables físicas o financieras realizadas en espacios de tiempo regulares Δt, estos valores se representan como un conjunto de n valores discretos x1, x2, x3,…, xn [Bowerman 1993].

La figura 3.1 muestra las ventas por mes del vino rojo australiano desde enero de 1980 hasta octubre de 1991. En este caso el conjunto de datos consiste de 142 observaciones, estas observaciones fueron hechas en intervalos uniformes de tiempo.

En otro ejemplo de una serie de tiempo, la figura 3.2 muestra el gasto (m3/s) diario del río Amarillo en China desde el año 1956 hasta el año 2000.

[image:41.612.130.499.268.522.2]

Año

Figura 3.1. Serie de tiempo con las ventas de vino australiano

En lo que a la ingeniería se refiere y como es el caso de las variables hidrológicas, los valores de nivel (que es donde se obtiene el gasto, mediante las tablas de nivel-gasto) se obtienen de sensores que proporcionan los datos en períodos de tiempo uniformes que pueden ser por hora, diarios, mensuales, etc.

El análisis de una determinada serie de tiempo es primeramente encaminado al estudio de su estructura interna (autocorrelación, tendencia, estacionalidad, etc.) para obtener un mejor entendimiento de la dinámica del proceso mediante el cual los datos de esta serie de tiempo fueron generados.

M

ile

(42)

Capítulo 3 Análisis de series de tiempo para el pronóstico de avenidas 26

[image:42.612.115.510.90.357.2]

Año

Figura 3.2 Gastos diarios del río Amarillo en China

El alcance del análisis de las series de tiempo abarca actividades como:

• Definición, clasificación y descripción de las series de tiempo.

• Construcción del modelo usando datos registrados en series de tiempo. • Pronóstico o predicción de los valores futuros.

Para pronosticar los valores futuros de una serie de tiempo se dispone de un amplio espectro de métodos. Desde el punto de vista del sistema teórico éstos pueden ser:

• Modelo libre (model-free), usado en análisis de regresión y suavización exponencial.

• Basado en modelos, particularmente usado en el modelado de datos de series de tiempo para capturar la característica del comportamiento a largo plazo del sistema dinámico subyacente.

El estudio de los enfoques tradicionales para la clasificación de series de tiempo, modelado y pronóstico son de gran utilidad para comparar y analizar los resultados con respecto a enfoques más modernos. Un método de inteligencia artificial expuesto en un capítulo siguiente ayudará a un mejor entendimiento de los enfoques modernos para el análisis de las series de tiempo y el pronóstico.

Gas

(43)

3.2 Definición del problema tradicional

Tradicionalmente, el análisis de las series de tiempo es definido como una rama de la estadística que generalmente trata con dependencias de estructuras entre la observación de datos de un fenómeno aleatorio y los parámetros relacionados. El fenómeno observado es indexado por el tiempo como el único parámetro, por lo tanto, se usa un nombre para la serie de tiempo [Palit 2005].

Básicamente, hay dos enfoques para el análisis de las series de tiempo:

• Enfoque en el dominio del tiempo, principalmente basado sobre el uso de la función de covarianza de las series de tiempo.

• Enfoque en el dominio de la frecuencia, basado sobre el análisis de la función de densidad espectral y análisis de Fourier.

Ambos enfoques son apropiados para aplicaciones de un amplio rango de disciplinas, pero el enfoque que se utilizará en el análisis de series de tiempo del presente trabajo es en el dominio del tiempo. Esto, porque existe la disponibilidad del enfoque de Box & Jenkins al análisis de series de tiempo, lo cual está relacionado con el modelo lineal de fenómenos estacionarios. Sin embargo, Box & Jenkins también se puede aplicar al análisis de las series de tiempo no-estacionarias, después de diferenciarlas (remoción de tendencias).

3.2.1 Elementos característicos

Los principales elementos característicos de las series de tiempo son la estacionariedad, linealidad, tendencia y estacionalidad. A pesar de que una serie de tiempo puede exhibir uno o más de estos elementos, cada uno de ellos es tratado separadamente para presentación, análisis y predicción de las series de tiempo. La Figura 3.3 muestra gráficamente las características de las series de tiempo.

3.2.1.1 Estacionariedad

Esta propiedad de un proceso aleatorio está relacionada con el valor medio y varianza de los datos de observación, los cuales deben ser constantes sobre el tiempo y la covarianza entre las observaciones xt y xt-d debe únicamente depender de la distancia

entre las dos observaciones y no cambiar con el tiempo, esto es, las siguientes relaciones deben mantenerse:

{ }

xt =μ,

E t=1, 2, 3, … (3.1)

( )

x E

{

(

x

)

2

}

k0,

Var t = t −μ = t=1, 2, 3, … (3.2)

(

xt,xt d

)

E

{

(

xt d

)

}

kd,

(44)

Capítulo 3 Análisis de series de tiempo para el pronóstico de avenidas 28

con t=1, 2, 3, …, d = …,-2,-1,0,1,2,…y donde μ, k0 y kd son algunos valores constantes finitos.

Es difícil verificar si una serie de tiempo dada cumple las tres condiciones de estacionariedad formuladas arriba simultáneamente. Al principio, la estacionariedad de una serie de tiempo era burdamente verificada mediante la inspección de un patrón de la serie de tiempo. Una determinada serie de tiempo se reconocía como estacionaria cuando a simple vista se observaba sin tendencia o sin estacionalidad y con varianza constante. Cuando en un modelo de series de tiempo se conocen los procesos que generan la estacionariedad en los valores observados de la serie, esta, puede ser analizada fácilmente.

t t

t x

x1+ε (3.4) La condición de estacionariedad requiere que la condición

( )

xt =Var

( )

xt+1

Var (3.5)

o la igualdad

[

]

{

}

{

[

2 ( )1

]

2

}

2

1 − −

− + t = t + t

t E x

x

E θ ε θ ε (3.6)

se mantenga; por lo tanto, debido a la independencia mutua de εt y xt, la igualdad

( )

xt Var

( )

xt Var

( )

t

Var =θ2 1 + ε

(3.7)

sigue y finalmente la igualdad

1 ,

2 0 2

0 =θ k +σ θ <<

k (3.8)

t tiempo del

depende no

0

k

(45)

(a) Tendencia (b) Estacionariedad

[image:45.612.108.536.61.359.2]

(c) Estacionalidad y estacionariedad (d) Tendencia

Figura 3.3 Elementos característicos de las series de tiempo

3.2.1.2 Tendencia

El componente de tendencia de una serie de tiempo es su elemento de largo plazo que se manifiesta a través del incremento o decremento local o global de los valores de datos como una secuencia de superposición de valores de series de tiempo verdaderos y un disturbio con tendencia ascendente o descendente. La presencia de un componente de disturbio es detectable mediante el seguimiento de los cambios en los valores medios en determinados intervalos sucesivos de tiempo a través del patrón de la serie de tiempo.

El análisis de tendencia es importante en el pronóstico de las series de tiempo. En la práctica éste se realiza usando técnicas de regresión lineal o no lineal que auxilian en la identificación de los componentes de tendencia no-monótonos en las series de tiempo. Una serie de tiempo tiene tendencia cuando por largos períodos sus valores crecen o decrecen. También puede definirse como cambios en la media.

3.2.1.3 Estacionalidad

Figure

Figura 2.1 Esquema simplificado del ciclo hidrológico
Figura 2.2 muestra la evolución de la escorrentía hasta llegar al proceso de avenidas, además muestra algunas de las herramientas que utilizan los métodos orientados al proceso físico y que pudieran ser útiles en el análisis de cada etapa del proceso
Figura 2.3 Área de una cuenca
Figura 3.1. Serie de tiempo con las ventas de vino australiano Año
+7

Referencias

Documento similar

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

entorno algoritmo.

por unidad de tiempo (throughput) en estado estacionario de las transiciones.. de una red de Petri

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

Figura 94 Pluma de pronósticos de modelos estadísticos globales más representativos de ENOS y el modelo ConvLSTM con respecto a los datos observados en la región Niño 3.4, iniciando

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

El recurso hídrico en la subcuenca del río Shullcas es escaso en cantidad, calidad y oportuni- dad; el abastecimiento de agua potable para los pobladores de la ciudad de Huancayo

La moral especial (o institucional, la M de G ARZÓN ) parece ofrecer de- masiados pretextos; terminaría por justificar cualquier tipo de acción requerida por ra- zones