CARACTERIZACIÓN DE SEÑALES DE PRECIPITACIÓN
MEDIANTE LA TRANSFORMADA DE FOURIER Y
TRANSFORMADA WAVELET
ANA MARÍA MOROS VIVAS
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA CIVIL
MAESTRÍA EN HIDROSISTEMAS
Ana María Moros Vivas 2
PONTIFICIA UNIVERSIDAD JAVERIANA
FACULTAD DE INGENIERÍA
Trabajo de grado presentado como requisito para optar al
título de Magíster en Hidrosistemas
Asesor
JORGE ALBERTO VALERO FANDIÑO.
Ingeniero Civil
Ana María Moros Vivas 3 REGLAMENTO DE LA
PONTIFICIA UNIVERSIDAD JAVERIANA.
Artículo 23. "La Universidad no se hace responsable por los conceptos emitidos por sus alumnos en sus trabajos de tesis. Sólo velará porque no se publique nada contrario al dogma y a la moral católica y por que las tesis no contengan ataques personales contra persona alguna, antes bien se vea en ellas el anhelo de buscar la verdad y la justicia".
Ana María Moros Vivas 4 El proyecto de grado titulado:
“CARACTERIZACIÓN DE SEÑALES DE PRECIPITACIÓN MEDIANTE LA
TRANSFORMADA DE FOURIER
Y TRANSFORMADA WAVELET”
presentado por Ana María Moros Vivas, en cumplimiento parcial de los requisitos exigidos para optar al título de Magister en Hidrosistemas, fue aprobado el día ____2____ del mes de __Julio__ de __2.010_ _.
_______________ __
MSc. Ing. Jorge Alberto Valero Fandiño DIRECTOR
_______________________ PhD. MSc. Ing. Mario Díaz-Granados JURADO
_______________________
PhD. MSc. Ing. Nelson Obregón Neira JURADO
Ana María Moros Vivas 5 "Vivimos bajo una cadena de pensamientos que selecciona y aísla un único aspecto de la
realidad".
Ana María Moros Vivas 6
Agradecimientos
A Dios, pues es a quién todo lo debo.
A mi madre, Martha Vivas y mi mami, Rosalis Mosquera por haber creído en mí, por tener siempre las palabas de cariño, compresión y amor para darme aliento.
Al Ingeniero Jorge Valero, por la colaboración prestada como director y por las grandes dosis de inspiración inyectadas durante la realización del Trabajo de Grado.
Al Ingeniero Nelson Obregón, por cada palabra de apoyo, confianza y amistad durante todos mis estudios de maestría.
Liliana, Hillary, Martha, Franghy y compañeros del Instituto Geofísico, que siempre me apoyaron y favorecieron para cumplir esta meta en mi vida.
Ana María Moros Vivas 7
CONTENIDO
1. INTRODUCCIÓN ... 15
2. OBJETIVOS ... 18
2.1 OBJETIVO GENERAL ... 18
2.2 OBJETIVO ESPECIFICO ... 18
3. ANTECEDENTES ... 19
4. CARACTERIZACIÓN ESTADÍSTICA DE UNA SERIE DE TIEMPO ... 22
4.1 DESCRIPCIÓN GRÁFICA DE LOS DATOS ... 22
4.1.1 HISTOGRAMA ... 22
4.1.2 DIAGRAMA DE CAJA Y BIGOTES ... 23
4.2 DESCRIPCIÓN NUMÉRICA DE LOS DATOS1 ... 24
4.2.1 MEDIDAS DE TENDENCIA CENTRAL ... 25
4.2.1.1 MEDIA ... 25
4.2.1.2 MEDIANA ... 25
4.2.1.3 MODA ... 25
4.2.2 MEDIDAS DE DISPERSIÓN ... 26
4.2.2.1 RANGO ... 26
4.2.2.2 VARIANZA Y DESVIACIÓN ESTÁNDAR ... 26
4.2.2.3 COEFICIENTE DE VARIACIÓN MUESTRAL ... 26
4.2.2.4 COEFICIENTE DE ASIMETRÍA... 27
4.2.2.5 COEFICIENTE DE APUNTAMIENTO ... 27
4.2.3 DESCRIPCIÓN DE LA MEMORIA DE PROCESO ... 28
4.2.3.1 FUNCIÓN DE AUTO-CORRELACIÓN LINEAL ... 28
4.2.3.2 EXPONENTE DE HURST ... 31
4.3 INFORMACIÓN A ANALIZAR ... 37
4.3.1 ANÁLISIS DE LA SEÑAL “SUMA DE COSENOS” ... 38
4.3.2 ANÁLISIS DE LA SEÑAL REGISTRADA POR LA ESTACIÓN CAMAVIEJA ... 40
4.3.3 ANÁLISIS DE LA SEÑAL REGISTRADA EN LA TORMENTA DE BOSTON ... 46
5. ANÁLISIS DE FOURIER ... 53
5.1 “TRANSFORMADA:LA OTRA REALIDAD” ... 53
5.1.1 REPRESENTACIÓN DE UNA SERIE DE TIEMPO MEDIANTE LA SUMA DE ARMÓNICOS ... 54
5.1.1.1 CARACTERIZACIÓN MATEMÁTICA DE UN ARMÓNICO (F) ... 55
CALCULO Y ... 56
CÁLCULO DE Y A PARTIR DE LA SERIE DE TIEMPO ... 57
5.1.1.2 PERIODOGRAMA ... 58
5.1.1.3 TRANSFORMADA DE FOURIER DIRECTA DISCRETA ... 58
5.1.1.4 TRANSFORMADA DE FOURIER INVERSA DISCRETA ... 59
5.1.2 REPRESENTACIÓN DE UNA IMAGEN MEDIANTE ARMÓNICOS... 60
5.1.2.1 “IMAGEN:SEÑAL BIDIMENSIONAL” ... 61
Ana María Moros Vivas 8
5.1.2.3 FILTRADO DE IMÁGENES ... 67
5.2 IMPLEMENTACIÓN DEL ANÁLISIS DE FOURIER ... 70
5.2.1 SEÑALES UNIDIMENSIONALES ... 70
5.2.1.1 “SUMA DE COSENOS” ... 70
5.2.1.2 SEÑAL DE LA ESTACIÓN CAMAVIEJA ... 71
5.2.1.3 SEÑAL DE LA TORMENTA DE BOSTON ... 73
5.2.2 SEÑALES BIDIMENSIONALES ... 75
5.2.2.1 IMAGEN DE CONTROL:“CARTÓN DE HUEVOS” ... 75
5.2.2.2 IMAGEN DE TORMENTA CAPITALINA ... 77
6. TRANSFORMADA DE FOURIER DE TIEMPO CORTO ... 82
6.1 TRANSFORMADA DE FOURIER A TRAVÉS DE UNA VENTANA FINITA ... 82
6.1.1 FUNCIÓN “VENTANA MÓVIL” ... 84
6.2 IMPLEMENTACIÓN DE LA TRANSFORMADA DE FOURIER DE TIEMPO CORTO ... 87
6.2.1 ANÁLISIS DE LA SEÑAL “SUMA DE COSENOS” ... 87
6.2.2 ANÁLISIS DE LA SEÑAL REGISTRADA POR LA ESTACIÓN CAMAVIEJA ... 89
6.2.3 ANÁLISIS DE LA SEÑAL REGISTRADA EN LA TORMENTA DE BOSTON ... 92
7. ANÁLISIS DE WAVELET ... 97
7.1 LA FORMA Y LOS DETALLES ... 97
7.1.1 ¿QUÉ ES UNA “WAVELET”? ... 98
7.1.1.1 HISTORIA Y CRONOLOGÍA DE LA TRANSFORMADA WAVELET ... 98
7.1.1.2 APLICACIONES15, ... 100
7.1.1.3 VENTAJAS DE LAS “WAVELET” SOBRE LA TRANSFORMADA DE FOURIER Y LA TRANSFORMADA DE TIEMPO CORTO ... 101
7.1.1.4 PROPIEDADES DE LAS FUNCIONES WAVELET ... 101
7.1.2 PROBLEMA DIRECTO E INVERSO EN 1D ... 102
7.1.2.1 MARCO CONTINUO19 ... 102
7.1.2.2 MARCO DISCRETO ... 106
7.1.2.3 METODOLOGÍA DE CÁLCULO DEL ESCALOGRAMA ... 110
7.1.2.4 TIPOS DE FUNCIONES WAVELET Y FUNCIONES DE ESCALAMIENTO ... 113
7.1.3 PROBLEMA DIRECTO E INVERSO EN 2D ... 118
7.1.3.1 MARCO DISCRETO, ... 118
7.1.3.2 METODOLOGÍA DE CÁLCULO ... 119
7.2 IMPLEMENTACIÓN DE LA TRANSFORMADA WAVELET ... 122
7.2.1 SEÑALES UNIDIMENSIONALES ... 123
7.2.1.1 ANÁLISIS DE LA SEÑAL “SUMA DE COSENOS” ... 123
7.2.1.2 ANÁLISIS DE LA SEÑAL REGISTRADA POR LA ESTACIÓN CAMAVIEJA ... 124
7.2.1.3 ANÁLISIS DE LA SEÑAL REGISTRADA DURANTE LA TORMENTA DE BOSTON ... 127
7.2.2 SEÑALES BIDIMENSIONALES ... 130
7.2.2.1 ANÁLISIS DE LA IMAGEN DE CONTROL “CARTÓN DE HUEVOS” ... 130
7.2.2.2 ANÁLISIS DE LA IMAGEN DE “LENNA” ... 131
7.2.2.3 ANÁLISIS DE IMÁGENES DE TORMENTA CAPITALINA ... 133
8. CONCLUSIONES Y RECOMENDACIONES ... 141
8.1 DEL PROBLEMA CENTRAL: ... 141
Ana María Moros Vivas 9
8.3 DEL CASO ESTUDIO: ... 142
8.4 USUARIOS FINALES DE LA INVESTIGACIÓN: ... 142
9. BIBLIOGRAFÍA ... 144
10. ANEXOS ... 149
1 ANEXO. FUNCIONES ORTOGONALES Y ORTONORMALES ... 150
1.1 CONJUNTOS ORTOGONALES ... 151
1.2 SERIES ORTOGONALES ... 156
1.3 SERIES DE FOURIER PARA FUNCIONES PARES E IMPARES ... 165
2 ANEXO. RUTINAS DE CÁLCULO SOPORTADAS POR MATLAB® ... 169
2.1 ANÁLISIS EXPLORATORIO ... 169
2.2 CÁLCULO DEL EXPONENTE DE HURST ... 170
2.3 CÁLCULO DE LA TRANSFORMADA DE FOURIER DISCRETA DE SEÑALES UNIDIMENSIONALES MEDIANTE OPERACIONES MATRICIALES ... 172
2.4 CÁLCULO ANÁLISIS DE SEÑALES BIDIMENSIONALES CON TRANSFORMADA DE FOURIER EN TIEMPO DISCRETO MEDIANTE OPERACIONES MATRICIALES ... 173
2.4.1 CÁLCULO TFDD:"TRANSFORMADA DE FOURIER DISCRETA DIRECTA" ... 176
2.4.2 CÁLCULO TFDI:"TRANSFORMADA DE FOURIER DISCRETA INVERSA" ... 176
2.5 CÁLCULO DE LA TRANSFORMADA DE FOURIER DE TIEMPO CORTO DISCRETA MEDIANTE OPERACIONES MATRICIALES ... 177
2.6 CÁLCULO DE LOS COEFICIENTES DE APROXIMACIÓN CON EL ANÁLISIS DE WAVELET EN UNA SEÑAL BIDIMENSIONAL ... 179
11. APÉNDICES ... 181
1. APÉNDICE. SEÑALES BÁSICAS... 182
2.7 FUNCIÓN UNITARIA ... 182
2.8 IMPULSO ... 182
2.9 FUNCIÓN SHAH ... 183
2.10 FUNCIONES HORQUILLA Y ANTIHORQUILLA ... 184
2.11 FUNCIÓN ESCALÓN ... 185
2.12 FUNCIÓN SIGNO ... 185
2.13 FUNCIÓN RECTANGULAR O FUNCIÓN “RECT” ... 186
2.14 FUNCIÓN TRIANGULO ... 187
2.15 CAMPANA DE GAUSS O DISTRIBUCIÓN NORMAL ... 188
2.16 FUNCIONES SINUSOIDALES ... 190
2.17 FUNCIÓN SINUSOIDAL AMORTIGUADA, FUNCIÓN SENO CARDINAL O FUNCIÓN “SINC” ... 191
2.18 FUNCIÓN “ASINC” ... 192
2.19 EXPONENCIAL COMPLEJA... 192
Ana María Moros Vivas 10
LISTA DE TABLAS
Tabla 4-1. Serie Original Vs Serie rezagada una y dos unidades de tiempo ... 30
Tabla 4-2. Análisis Exploratorio numérico de la señal “Suma de Cosenos” ... 39
Tabla 4-3. Análisis Exploratorio numérico de la señal registrada por la Estación Camavieja, para diferentes escalas de agregación temporal... 43
Tabla 4-4. Análisis Exploratorio numérico de la señal registrada durante la tormenta de Boston para diferentes escalas de agregación temporal de 15 segundos,1 minuto, 10 minutos y 30 minutos ... 49
Tabla 5-1. Valores por pixel para la Figura 5-7-d. ... 64
Tabla 6-1. Relación entre el tamaño de la función ventana con la frecuencia y el tiempo de la señal de análisis ... 87
Tabla 7-1. Cronología de la Transformada Wavelet15 ... 99
Tabla 7-2. Tamaño de las series unidimensionales analizadas con Transformada Wavelet ... 123
Ana María Moros Vivas 11
LISTA DE FIGURAS
Figura 4-1. Diagrama de Caja y Bigotes ... 24
Figura 4-2. Gráficas de dispersión para algunos valores de rk. (a) y (b) rk = 0, correlación lineal nula, (c) rk = -1, Correlación lineal negativa y (d) rk = 0,9877, Correlación lineal positiva. ... 29
Figura 4-3. Relación Potencial ... 33
Figura 4-4. Relación Potencial, bajo la apariencia de una línea recta ... 35
Figura 4-5. División del conjunto de datos para realizar los cálculos de [log(n)] Vs .... 36
Figura 4-6. Apariencia de la señal “Suma de Cosenos” junto con el histograma de frecuencia y el diagrama de Caja y Bigotes. ... 38
Figura 4-7. Función de Autocorrelación para la señal "Suma de Cosenos" ... 39
Figura 4-8. Representación del exponente de Hurst para la señal "Suma de Cosenos". (a) 10 puntos y (b) 20 puntos ... 40
Figura 4-9 Serie de tiempo registrada por la estación Camavieja para diferentes escalas de agregación temporal. (a) Diaria, (b) Semanal, (c) Mensual y (d) Anual ... 42
Figura 4-10. Función de Autocorrelación de la serie de tiempo registrada por la estación Camavieja con diferentes niveles de agregación temporal: (a) Diaria, (b) Semanal, (c) Mensual y (d) Anual. ... 44
Figura 4-11. Valor de exponente de Hurst para la estación Camavieja escala: (a) diaria con 10 puntos, (b) escala con 20 puntos, (c) semanal con 10 puntos, (d) semanal con 20 puntos, (e) mensual con 10 puntos, (f) mensual con 20 puntos y (g) anual con 10 puntos ... 45
Figura 4-12. Serie de tiempo registrada para la tormenta de Boston para diferentes escalas de agrupación temporal. Cada, (a) 15 segundos, (b) 1 minuto, (c) 10 minutos y (d) 30 minutos. .... 48
Figura 4-13. Función de Autocorrelación de la serie de tiempo registrada en la tormenta de Boston, con diferentes escalas de agregación temporal: (a) 15 segundos, (b) 1 minuto, (c) 10 minutos y (d) 30 minutos. ... 50
Figura 4-14. Valor de exponente de Hurst para la tormenta de Boston cada (a) 15 segundos con 10 puntos, (b) 15 segundos con 20 puntos, (c) cada minuto con 10 puntos, (d) cada minuto con 20 puntos, (e) cada 10 minutos con 10 puntos y (f) cada 10 minutos con 20 puntos ... 51
Figura 5-1. (a) Señal de suma de cosenos presenta4.3.1 y (b) Transformada de dicha señal bajo el lente del análisis de Fourier (Periodograma) ... 54
Figura 5-2. Representación de una serie de tiempo mediante armónicos ... 54
Figura 5-3. Representación gráfica de la relación existente entre , , y ... 57
Figura 5-4. Reconstrucción de una señal con 10 armónicos ... 60
Figura 5-5. Escalas comparativas de frecuencia y longitud de onda del espectro visible ... 62
Figura 5-6. Cubo de colores ... 62
Figura 5-7. Fotografía de la modelo “Lenna”. (a) Imagen original 256*256(31), (b) 1er Acercamiento 55*60, (c) 2do Acercamiento 28*30 y (d) 3er Acercamiento 17*19. ... 63
Figura 5-8. Función sinusoidal vertical bidimensional y su respectiva Transformada de Fourier. 66 Figura 5-9. Filtros. (a) Filtro Pasa alta y (b) Filtro pasa baja ... 68
Figura 5-10. Reconstrucción de la imagen de “Lenna” con diferente cantidad de armónicos. (a) Imagen de entrada de “Lenna”, (b) Imagen reconstruida con 3.290 armónicos, (c) Imagen reconstruida con 3.200 armónicos y (d) Imagen reconstruida con 2.300 armónicos ... 69
Ana María Moros Vivas 12 Agregación mensual, (d) Acercamiento de agregación mensual, (e) Agregación Anual y (f)
Acercamiento de Agregación Anual. ... 72
Figura 5-13. Periodograma de la serie de tiempo registrada por la tormenta presentada en Boston a diferente resolución temporal, cada: (a) 15 segundos, (b) Acercamiento de 15 segundos, (c) 1 minuto, (d) Acercamiento de 1 minuto, (e) 10 minutos, (f) Acercamiento de 10 minutos, (g) 15 minutos y (h) Acercamiento de 15 minutos... 74
Figura 5-14. Imagen de control: “Cartón de Huevos” ... 75
Figura 5-15. Implementación de la Transformada de Fourier en la imagen de control “Cartón de Huevos”. (a) Imagen de control en planta con el Periodograma, (b) Imagen reconstruida con 1 armónico y el Periodograma, (c) Imagen reconstruida con 3 armónicos y el Periodograma y (d) Imagen reconstruida con 100 armónicos y el Periodograma. ... 77
Figura 5-16. Localización de la zona de estudio7710 ... 78
Figura 5-17. Zona de estudio y localización de estaciones pluviométricas ... 79
Figura 5-18. Implementación de la Transformada de Fourier en una imagen de la “Tormenta Capitalina”. (a) Imagen original y su Periodograma, (b) Reconstrucción de la señal con 1 armónico y el Periodograma, (c) Reconstrucción de la señal con 20 armónicos y (d) Reconstrucción de la señal con 800 armónicos más importantes. ... 81
Figura 6-1. Desplazamiento de la función ventana en el dominio del tiempo de una señal... 85
Figura 6-2. Diferentes comportamientos de la función Ventana Gaussiana según el parámetro . (a) , (b) y (c) ... 86
Figura 6-3. Periodograma de la Transformada de Fourier de Tiempo Corto para la señal “Suma de Cosenos” con la función ventana Gaussiana para el diferentes valores del parámetro “a”. (a) Serie original, (b) a =1 e-2, ... 88
Figura 6-4. Periodograma de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el valor del parámetro “a”, para la señal registrada en la Estación Camavieja a escala temporal semanal. ... 90
Figura 6-5. Periodograma de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el valor del parámetro “a”, para la señal registrada en la Estación Camavieja a escala mensual. (a) Serie original, (b) a =1 e-2, (c) a =1 e-3 y (d) a =1 e-4. ... 91
Figura 6-6. Periodograma de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el valor del parámetro “a”, para la señal registrada en la Estación Camavieja a escala anual. (a) Serie original, (b) a =1 e-2, (c) a =1 e-3 y (d) a =1 e-4. ... 92
Figura 6-7. Periodograma de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el parámetro “a”, para la señal registrada en la tormenta de Boston cada 15 segundos. (a) Serie original, (b) a =1 e-2, (c) a =1 e-3 y (d) a = 1 e-4. ... 93
Figura 6-8. Periodograma de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el parámetro “a”, para la señal registrada en la tormenta de Boston agregada cada minuto. (a) Serie original, (b) a =1 e-2, (c) a =1 e-3 y (d) a =1 e-4. ... 94
Figura 6-9. Espectro de Potencia de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el parámetro “a”, para la señal registrada en la tormenta de Boston agregada cada 10 minutos. (a) Serie original, (b) a =1 e-2, (c) a =1 e-3 y (d) a =1 e-4. ... 95
Figura 6-10. Espectro de Potencia de la Transformada de Fourier de Tiempo Corto con la función ventana Gaussiana variando el parámetro “a”, para la señal registrada en la tormenta de Boston agregada cada 30 minutos. (a) Serie original, (b) a = 1e-2, (c) a =1 e-3 y (d) a =1 e-4. ... 96
Figura 7-1. Onda tipo “wavelet” ... 98
Figura 7-2. Escalograma ... 105
Figura 7-3. Descomposición de escalas de una señal ... 108
Ana María Moros Vivas 14 Figura 1-3. Representación de la función del ejemplo 4 mediante una serie de Fourier. Función desarrollada a partir de una sumatoria con: a) Un término, b) cinco términos, c) cincuenta
términos y d) cien términos. ... 168
Figura 1-1. Función Uno en el intervalo de ... 182
Figura 1-2. El impulso ... 183
Figura 1-3. Función Shah ... 184
Figura 1-4. La función Horquilla ... 184
Figura 1-5. Función Anti-Horquilla ... 185
Figura 1-6. La función Escalón ... 185
Figura 1-7. La función signo ... 186
Figura 1-8. La función rect ... 187
Figura 1-9. La función Triángulo ... 188
Figura 1-10. La función Gauss ... 189
Figura 1-11. Funciones Sinusoidales ... 190
Figura 1-12. La función de interpolación sinc ... 191
Figura 2-1. Secuencia de impulsos ... 194
Figura 2-2. La respuesta de un sistema de tiempo discreto a una secuencia de impulsos ... 195
Figura 2-3. Suma ponderada de secuencias de impulsos unitarios desplazados ... 196
Ana María Moros Vivas 15
1.
INTRODUCCIÓN
Los hombres en su afán por comprender el mundo tratan de interpretar los signos que algunos sistemas de la naturaleza emiten en su continuo trascurrir, y que son registrados a lo largo del tiempo en lo que se conoce como “serie de tiempo” o “señal”.
El contexto del proceso de entender el comportamiento de estas señales, es lo que ha llevado a científicos, matemáticos e Ingenieros a desarrollar herramientas para tal fin. La información que definen las señales son valores definidos paramétricamente que no permiten visualizar toda la información que contienen, la cual puede ser utilizada y aprovechada con beneficios prácticos. Por lo anterior, es necesario procesar la señal con herramientas matemáticas para llegar a una representación más efectiva que permite encontrar información oculta, que puede ser incluso la más importante o representativa de la señal. Estas herramientas matemáticas se denominan Transformadas.
En los últimos treinta años las transformadas se han convertido en una herramienta indispensable en las diferentes áreas de Ingeniería. Es importante destacar que la cantidad de conceptos desarrollados durante casi dos siglos, son aportes por de diferentes científicos que perseguían resolver problemas técnicos de diversas disciplinas, se establecen actualmente como la Transformada Wavelet.
Con respecto a lo antes mencionado, la Transformada Wavelet nace del análisis de Fourier en . Un siglo después matemáticos, físicos e ingenieros como Alfred Haar en 1909, John Littlewood y R.E.A.C. Paley en , Dennis Gabor en , Jean Morlet y Alex Grossmann en , en Yves Meyer, Mallat en y Ingrid Daubechies fueron presentando sus aportes para superar las limitaciones que se tenía en el análisis de señales con la Transformada de Fourier y así llegar a lo que hoy en día se conoce como la teoría de “Wavelet”
Uno de las principales ventajas de utilizar las “wavelets” es la compresión de datos. Esta herramienta fue utilizada en por el FBI para comprimir la información que tienen de huellas dactilares. En la Organización Internacional de Estándares acepto el uso un nuevo estándar de compresión de imágenes digitales denominado JPEG-2000. El nuevo estándar utiliza “wavelets” para comprimir archivos de imágenes sin pérdidas apreciables en la calidad de la imagen.
En la actualidad existe un sin número de aplicaciones de la transformada “wavelet” en diferentes disciplinas a nivel internacional, que ha ido reemplazando en el transcurrir del tiempo a la transformada de Fourier. Disciplinas conocidas como dinámica molecular, astrofísica, sísmica, óptica, mecánica de turbulencia, mecánica cuántica, procesamiento de imágenes, análisis de señales medicas, como electrocardiogramas, análisis de proteínas y ADN, climatología, topografía y geográfica, reconocimiento de voz y análisis multifractal.
Ana María Moros Vivas 16 durante la ocurrencia de una tormenta el 27 de mayo de para la identificación de auto - similitud en el marco de variación de las escalas. Luego el artículo titulado “Wavelet and Neuro – Fuzzy conjunction model for precipitation forecasting” publicado en el en la revista Journal of Hydrology y presentado por Turgay y Özgür, donde se muestra la implementación de un modelo basado en la conjunción de dos herramientas para el pronóstico de la precipitación.
A nivel nacional se destaca de los autores Arbeláez, Bacchi, Ranzi y Arango en el el artículo titulado “Aplicación de la Técnica “Wavelet” a un campo de precipitación. Identificación de Autosemejanza”, donde utilizando el análisis de múltiple escalamiento propuesto por Mallat, se verificó para dos eventos de tormentas localizados en el norte de Italia , que el campo de precipitación presenta características de auto - similaridad simple en un rango de escalas de a .
Sin embargo los resultados obtenidos a la fecha pueden considerase satisfactorios en el contexto internacional. Se recalca la necesidad de hacer la implementación de las Transformadas a señales registradas de los diferentes sistemas de la naturaleza, en especial a las señales de Precipitación en Colombia.
Esta razón, en adición de las características propias de la maestría en Hidrosistemas, maestría de investigación de la Pontificia Universidad Javeriana, y la limitada existencia de un documento en un lenguaje amigable para diferentes profesionales de las Geociencias ha impulsado el desarrollo de un trabajo didáctico de los conceptos de la Transformada de Fourier, Transformada de Fourier de tiempo Corto y Transformada Wavelet.
Esta investigación busca ofrecer a ingenieros e investigares de las ciencias de la tierra, herramientas conceptuales y computacionales que faciliten la interpretación de señales bajo los lentes de las Transformadas.
Por consiguiente el objetivo fundamental de este texto se da en desarrollar una herramienta útil y practica que facilite el análisis de series de tiempo y campo de precipitación para profesionales de la Geociencia que realizan procesamiento de series de datos, con dominio en el tiempo o el espacio, buscando así, un desarrollo más fácil y comprensible.
Para lograr lo anterior, el presente documento está estructurado con 11 capítulos, incluyendo la introducción actual y los objetivos del presente documento. En los apartes siguientes se anticipa brevemente el contenido registrado en cada uno de ellos donde se halla estructurado con la exposición de las consideraciones teóricas necesarias para comprender la filosofía de cada técnica y continúan con la implementación de dichos conceptos en dos tipos de señales: señales de control y señales de datos observables.
El capítulo cuatro (4) contiene una caracterización de la serie de tiempo desde el punto de vista estadístico.
Ana María Moros Vivas 17 Posteriormente, se introduce al lector aplicación de los procedimientos del análisis de Fourier a intervalos cortos de tiempo sentando las bases del Análisis de Fourier de Tiempo Corto, con el fin de poder localizar en el tiempo las frecuencias de una señal (capítulo 6). Seguidamente se extienden las características del Análisis de Fourier de Tiempo Corto al utilizar ventanas de tamaño variable que permiten analizar series no estacionarias a diversas escalas de análisis, ofreciendo un panorama más amplio y profundo en el campo del procesamiento y análisis de series de datos (capítulo 7).
El capitulo 8 contiene la principales conclusiones la cual se llego al final del desarrollo de presente documento y además se plantean algunas recomendaciones a seguir en el desarrollo de futuras investigaciones a partir del presente estudio.
Ana María Moros Vivas 18
2.
OBJETIVOS
2.1
Objetivo General
Desarrollar herramientas que faciliten el análisis de series de tiempo y campos de precipitación.
2.2
Objetivo Especifico
Proveer un documento didáctico para el estudio de la fundamentación matemática de la transformada de Fourier y la transformada Wavelet, de modo que se facilite su entendimiento a ingenieros y profesionales de las ciencias de la tierra.
Desarrollar rutinas computacionales que faciliten la implementación y el análisis de la transformada de Fourier y la transformada Wavelet en series de tiempo y campos de precipitación.Ana María Moros Vivas 19
3.
ANTECEDENTES
Fourier como objeto de investigación organizada tienen más que los “Wavelets” que tiene menos de dos décadas. Los “wavelet” se derivan de una cantidad de conceptos desarrollados durante un período de casi dos siglos, siendo repetidamente redescubiertas por científicos que perseguían resolver problemas técnicos de diversas disciplinas.
En tal sentido el análisis de Fourier. Jean Baptiste Joseph Fourier en , plantea que “cualquier forma de onda repetitiva, se puede expresar como una suma infinita de ondas sinusoidales y cosinusoidales de diversas frecuencias”. La transformada de Fourier fue un éxito durante el siglo XIX resolviendo muchos problemas de la física y de la ingeniería. Esa importancia llevó a científicos e ingenieros a pensar que esta transformada era la “única” capaz analizar fenómenos de todo tipo. Por lo tanto, esta universalidad obligó a una exploración más detallada de la metodología. Como resultado, durante el siglo XX, matemáticos, físicos e ingenieros encontraron un inconveniente de dicha transformación: se tenía problemas para ubicar en el tiempo las frecuencias predominantes cuando la señal de análisis es no estacionaria.
El principio profundo a este problema se puede ilustrar mediante lo que se conoce como el principio de la indeterminación de Heisenberg. En , el físico Werner Heisenberg afirmó que la posición y la velocidad de un objeto no se pueden medir exactamente al mismo tiempo, ni siquiera en teoría. En términos de procesamiento de señales, esto significa que es imposible conocer de forma simultánea la frecuencia exacta y el momento exacto en que ocurre esta frecuencia en una señal. Para poder conocer la frecuencia, la señal se debe dilatar en el tiempo, y viceversa.
La consecuencia del problema se puede ilustrar mediante lo que se conoce como el principio de la indeterminación de Heisenberg. En , el físico Werner Heisenberg afirmó que la posición y la velocidad de un objeto no se pueden medir exactamente al mismo tiempo, ni siquiera en teoría. En términos de procesamiento de señales, esto significa que es imposible conocer de forma simultánea la frecuencia exacta y el momento exacto en que ocurre esta frecuencia en una señal. Para poder conocer la frecuencia, la señal se debe dilatar en el tiempo, y viceversa.
Por consiguiente en el transcurso del siglo XX, científicos de distintos campos intentaron superar estas limitaciones, para permitir que las representaciones de los datos se adaptaran a la naturaleza de la información. Aunque cada científico intentaba resolver los problemas específicos de su respectivo campo, todos comenzaron a llegar a la misma conclusión que las culpables eran las transformaciones de Fourier. También llegaron en esencia a la misma solución, quizás al dividir una señal en componentes que no fueran ondas sinusoidales puras sería posible condensar la información tanto en el dominio del tiempo como en el de la frecuencia. Esta es la idea que finalmente se denominaría “wavelet”.
Ana María Moros Vivas 20 Seguidamente en 1946, Dennis Gabor, un físico británico-húngaro, presentó la transformación de Gabor, presentada en este documento como la Transformada de Fourier de Tiempo Corto, la cual introduce el concepto de ventana donde se considera la señal estacionaria para hacer Transformada de Fourier.
Más adelante en las décadas de y , las comunidades de procesamiento de señales y procesamiento de imágenes presentaron sus propias versiones del análisis de “wavelets” con nombres tales como "codificación de subbandas", "filtros de duplicación de cuadratura" y "algoritmo piramidal".
Unos años después, Jean Morlet no pensaba iniciar una revolución científica. Solo intentaba ofrecer a los geólogos una forma mejor de buscar petróleo. Normalmente los geólogos localizan los depósitos subterráneos de petróleo mediante ruidos intensos. Las señales viajan a través de distintos materiales con velocidades distintas, los geólogos podían deducir el tipo de material que se encontraba bajo la superficie enviando señales sísmicas a la tierra y midiendo la rapidez con la que rebotaban. Si las señales se propagaban especialmente rápido a través de una capa, podía tratarse de una bóveda salina que podía retener una capa de petróleo bajo ella.
Morlet, un ingeniero de Elf-Aquitanie, desarrolló su propia forma de analizar las señales sísmicas para crear componentes que estuvieran localizados en el espacio, a los que denominó "wavelets de forma constante". Posteriormente, se conocieron como "wavelets de Morlet". Independientemente de que los componentes se dilaten, compriman o desplacen en el tiempo, mantienen la misma forma. Morlet consiguió separar una señal en las wavelets que la componían y también volver a unirlas para formar la señal original. Él, comenzó a preguntar a otros científicos si el método era matemáticamente coherente.
Morlet obtuvo respuesta de Alex Grossmann, un físico del Centre de Physique Théorique de Marsella. Grossmann trabajó con Morlet durante un año para confirmar que las señales se podían reconstruir a partir de la descomposición de las wavelets. Lo cual, las transformaciones de wavelets resultaron funcionar mucho mejor que las transformaciones de Fourier, porque eran mucho menos susceptibles a pequeños errores de cómputo. Un error o un truncamiento indeseados de los coeficientes de Fourier pueden transformar una señal suave en una saltarina o viceversa; las wavelets evitan tales consecuencias no deseables. Seguidamente en 1984 publicaron conjuntamente el artículo donde se introduce por primera vez el término "wavelet" en el lenguaje matemático, consiguiendo que la teoría de los wavelet adoptara finalmente su carácter propio.
Posteriormente en 1985 Yves Meyer, descubre las primeras “wavelets” ortogonales suaves. Después en 1986 Mallat demuestra que todo lo que se había presentado antes de 1982 estaba relacionado con algoritmos basados de “wavelet”.
Seguidamente en 1987 Ingrid Daubechies construye las primeras “wavelets” ortogonales suaves con una base sólida, lo cual convierten la teoría en una herramienta práctica. David Donoho e Iain Johnstone en 1990 utilizan las “wavelets” para "eliminar el ruido" de las imágenes, haciéndolas aún más nítidas que los originales.
Ana María Moros Vivas 21 Por otra parte en 1995, Pixar Studios presenta la película Toy Story, la primera película de dibujos animados realizadas completamente por computadora. En la secuencia de Toy Story 2, algunas formas se realizan mediante superficies de subdivisión, una técnica relacionada matemáticamente con las “wavelets” y posteriormente en 1999 la Organización Internacional de Estándares acepto el uso un nuevo estándar de compresión de imágenes digitales denominado JPEG-2000. El nuevo estándar utiliza “wavelets” para comprimir archivos de imágenes en una proporción de 1:200, sin pérdidas apreciables en la calidad de la imagen.
En la actualidad la transformada “wavelet” ha sido adoptada como herramienta para un número de aplicaciones de la naturaleza diversa, reemplazando a menudo a la transformada de Fourier. Aéreas como dinámica molecular, astrofísica, sísmica, óptica, mecánica de turbulencia, mecánica cuántica, procesamiento de imágenes, análisis de señales medicas, como electrocardiogramas, análisis de proteínas y ADN, climatología, topografía y geográfica, reconocimiento de voz y análisis multifractal.
A nivel internacional y nacional se han publicado gran cantidad de documentos entre los que se destacaron por su interés en temas atmosféricos:
Kumar, P.; and Foufoula, E. . A new look at rainfall fluctuations and Scaling Properties of Spatial Rainfall Using Orthogonal Wavelets.
Hoyos, C.; y Mesa, O. . Algunas aplicaciones de la transformada de Fourier y la descomposición de onditas a señales Hidrológicas y Sísmicas.
Arbeláez, C.; Bacchi, B., Ranzi R. y Arango H. . Aplicación de la Técnica “Wavelet” a un campo de precipitación. Identificación de Autosemejanza.
Estupiñan, J.; Flórez, C.; y Obregón, N. . Manual conceptual y aplicativo de la transformada wavelet para ingenieros.
Domínguez, M.; Mendez, Jr.; y Mendez, A. . On wavelet techiques in atmospheric sciences.
Massei, N.; Dupont, J.; Mahler, B.; Laignel, B.; Fournier, M.; Valdes, D.; y Ogier, S. . Investigating transport properties and turbidity dynamics of a karst aquifer using correlation, spectral, and wavelet analyses.
Ana María Moros Vivas 22
4.
CARACTERIZACIÓN ESTADÍSTICA DE UNA SERIE
DE TIEMPO
Una etapa necesaria en toda investigación es el análisis exploratorio de la información. Los resultados de este análisis permiten visualizar los datos originales de otra manera, gracias a procesos de organización y reducción. En este capítulo se presenta al lector una breve explicación del conjunto de datos utilizados en el desarrollo de este proyecto, así como sus representaciones gráficas y numéricas empleadas.
Los métodos que se exponen a continuación son formas convenientes de reducir paquetes de datos a formas más compresibles.
4.1
Descripción Gráfica de los datos
1El ver la información de manera gráfica ofrece al investigador numerosas ventajas, como ver tendencias, dispersión, asimetría de los datos, etc., tal como lo dice el refrán popular: “una imagen vale más que mil palabras”.
A continuación se describe dos tipos de representaciones graficas el Histograma y el diagrama de caja y bigotes.
4.1.1 Histograma
Representación gráfica de conjuntos de datos, elaborada con el fin de contemplar la distribución de la información, donde le permite al investigador tener una visión inmediata de la amplitud de los datos, los valores que más se repiten o de mayor frecuencia absoluta y el grado de dispersión alrededor de valores centrales o típicos. Dicha gráfica se construye subdividiendo el conjunto de datos en intervalos de igual extensión llamados clases, para los cuales se determina el número de elementos integrantes (frecuencias). En el eje de las ordenacias se ubica las frecuencias y en el eje de las abscisas se colocan las clases. Se traza un rectángulo sobre cada intervalo o subconjunto, de manera que la altura del rectángulo sea proporcional a la fracción de observaciones que caen en el intervalo.
Puede resultar útil adoptar ciertos criterios para elegir los intervalos, aún cuando estos criterios sean un tanto arbitrarios. Un primer criterio tiene que ver con que los puntos de división del eje de las abscisas no coincidan con ningún elemento del conjunto original, con el fin de evitar ambigüedades, es decir que un dato no pertenece a las clases. Un segundo criterio se relaciona con la amplitud de los intervalos y en consecuencia con el mínimo número de intervalos necesarios para describir los datos. Para fijar de manera aproximada la amplitud del intervalo se puede hacer uso de las siguientes consideraciones matemáticas:
1 WACKERLY, D., MENDENHALL, W. y SCHEAFFER, R. Estadística matemática con aplicaciones. Sexta edición. THOMSOM. 2.002
Ana María Moros Vivas 23
Ecuación 4-1
Ecuación 4-2
Ecuación 4-3
Tomar entre y intervalos, empleando un mayor número de intervalos para cantidades grandes de datos.
Donde:
Cantidad de intervalos
El número datos
En todo caso es el investigador quien define en cuantos intervalos fragmentara el conjunto de datos de modo que las fórmulas antes presentadas se constituyen únicamente como guías.
4.1.2 Diagrama de caja y bigotes2
Este diagrama, también conocido como box – whister, caja y punto o caja con patillas, ofrece una representación creada a partir de siete números , con el objeto de que los datos del conjunto analizado no pierdan su distribución espacial.
Esta herramienta de análisis exploratorio permite estudiar la simetría de los datos y detectar los valores atípicos en la información que se está analizando. El diagrama de cajas y bigotes divide los datos en cuatro áreas de igual frecuencia, con los siguientes intervalos:
El diagrama de caja y bigotes consta de una caja central y dos segmentos horizontales (bigotes) que parten del centro de cada lado de la caja como se puede visualizar en la Figura 4-1. La caja central encierra el 50% de los datos. La línea vertical al interior de la caja representa la mediana o 50 percentil . Si esta línea está en el centro de la caja, no hay asimetría en los datos. Los lados verticales de la caja están situados en los cuartiles inferior (25 percentil ) y superior (75
Ana María Moros Vivas 24 percentil ) de los datos. Partiendo del centro de cada lado vertical de la caja se dibujan los bigotes, uno hacia la izquierda y el otro hacia la derecha, teniendo en cuenta lo siguiente:
Figura 4-1. Diagrama de Caja y Bigotes
El bigote de la izquierda tiene un extremo en el primer cuartil y el otro extremo en el correspondiente valor de en la Figura 4-1 y calculado mediante Ecuación 4-4.
El bigote de la derecha tiene un extremo en el tercer cuartil y el extremo superior correspondiente al valor de en la Figura 4-1, calculado por la Ecuación 4-5.
Ecuación 4-4
Ecuación 4-5
Donde el valor : Rango Intercuartilico, está definido por la siguiente expresión:
Ecuación 4-6
A los datos que se encuentran a la izquierda del bigote izquierdo y a la derecha del bigote derecho, se les denomina valores atípicos moderados siempre cuando se halle entre y , ver la Figura 4-1. Donde y se calculan mediante las siguientes ecuaciones:
Ecuación 4-7
Ecuación 4-8
Los datos ubicados a la izquierda del valor y a la derecha después del valor se le llaman valores atípicos extremos.
4.2
Descripción Numérica de los datos
1A menudo es necesario resumir el conjunto de datos de análisis en indicadores con significado conocido, tales como las medidas de tendencia central, la medida de dispersión de los datos y la memoria del proceso. El lector interesado puede remitirse a libros básicos de de estadística para ampliar la información que se expone a continuación.
Q1 Q2 Q3
b c
a d
Ana María Moros Vivas 25
4.2.1 Medidas de tendencia central
En esta sección se definen algunas de las medidas numéricas más comunes para describir el “centro” de los datos o los valores más “esperados”.
4.2.1.1 Media
Es la medida más popular de la tendencia central, también conocida como “promedio” o “valor esperado”. La media de conjunto de datos sólo indica el centro de la distribución de los datos.
La media de una muestra de tamaño se determina mediante la ecuación:
Ecuación 4-9
Donde:
Media muestral Tamaño de la muestra
I-ésimo valor del conjunto de datos.
La media es solo un “indicador” de lo que pasa en el centro de los datos y de manera formal es el primer momento alrededor del valor cero.
4.2.1.2 Mediana
Es el valor ubicado en la mitad de los datos una vez estos han sido ordenados. Adopta el valor del elemento central si el número de elementos es impar o el promedio de los dos elementos centrales cuando el número de datos es par.
4.2.1.3 Moda
Ana María Moros Vivas 26
4.2.2 Medidas de dispersión
Debido a que cada fenómeno tiene variaciones alrededor de su valor medio, el cálculo de las medidas de dispersión, proporciona una serie de parámetros importantes para describir la dispersión del conjunto de datos o el grado de separación entre los datos.
4.2.2.1 Rango
Extensión del conjunto de datos. Se calcula como la diferencia entre el mayor y menor valor de los datos.
4.2.2.2 Varianza y Desviación Estándar
Concepto análogo al momento de inercia, puesto que se relaciona con la suma de los cuadrados de las distancias existentes entre los datos y la media o centro de gravedad de los mismos.
La varianza de una muestra se calcula como la suma de los cuadrados de las diferencias entre los valores y su media, dividida entre para eliminar la dependencia del tamaño de la muestra. Matemáticamente se puede calcular como:
Ecuación 4-10
Cuanto mayor sea la varianza del conjunto de mediciones, mayor será el grado de separación entre los datos.
A la raíz cuadrada positiva de la varianza se denomina desviación estándar. Como se puede observar en la Ecuación 4-11. Este valor tiene las mismas unidades de los datos originales. Entre más pequeña sea la desviación estándar, los datos se concentrarán mas alrededor de la media muestral y menos frecuentes serán los valores lejanos del centro de los datos.
Ecuación 4-11
4.2.2.3 Coeficiente de variación muestral
Ana María Moros Vivas 27
Ecuación 4-12
Tal medida tiene un parecido con la definición del Exponente de Hurst explicado más adelante.
4.2.2.4 Coeficiente de asimetría
Otro rasgo que es importante analizar en un conjunto de datos es su simetría respecto a la media. Al cuantificar la simetría, es necesario conservar información tanto del signo, como de la distancia de cada dato a la media (centro de simetría). Este razonamiento implica que la diferencia entre cada valor y la media debe estar afectada por una potencia impar, que para el caso toma el valor de tres.
Si la varianza es el segundo momento respecto de la media, el tercer momento respecto a la media se define como el coeficiente de asimetría de la muestra o , definido mediante la Ecuación 4-13.
Ecuación 4-13
Coeficientes positivos indicarán distribuciones con sesgo a la derecha (es decir, con colas más largas a la derecha) y valores negativos indicarán un sesgo a la izquierda. En el caso en que el coeficiente valga cero la distribución es simétrica alrededor de la media.
4.2.2.5 Coeficiente de apuntamiento
El cuarto momento central es una medida de que tan puntiaguda es la distribución de los datos. Recibe el nombre de coeficiente de apuntamiento o kurtosis . Indica si los datos se concentran demasiado o no, comparados con un modelo de distribución llamado curva normal.
Ecuación 4-14
Si:
la distribución se denomina platicúrtica y es decir más achata que la distribución normal.
Ana María Moros Vivas 28
la distribución se denomina leptocúrtica, es decir más puntiaguda que la distribución normal.
4.2.3 Descripción de la memoria de proceso
Estudiar la memoria del proceso es buscar la relación que tiene el dato medido en el presente en una estación determinada, con el dato del pasado registrado por la misma estación. Dos herramientas matemáticas utilizadas con gran frecuencia en el análisis de la memoria de un proceso son la función de Auto-correlación Lineal y el Exponente de Hurst, para las cuales se presentara en los próximos renglones una breve explicación.
4.2.3.1 Función de Auto-correlación Lineal
El objetivo de los próximos renglones es entender una de la medida para el análisis de la memoria de un proceso como lo es la función de Autocorrelación Lineal, pero antes se presenta la Correlación lineal, de donde nace dicha función y permitirá entender más facial la aplicación.
Coeficiente de Correlación Lineal3
El coeficiente de correlación , es una medida del grado de relación lineal que existe entre dos variables y . La siguiente expresión matemática define el coeficiente de correlación entre dos variables:
Ecuación 4-15
Donde:
Valor de la variable
Valor de la variable
Media muestral de la variable
Media muestral de la variable
Ana María Moros Vivas 29 Se encuentra definido en el intervalo . El valor de indica una correlación inversamente proporcional entre las dos variables de análisis, mientras que un valor de señala una correlación directamente proporcional. Si es igual a , entonces no existe ninguna relación lineal entre y . En la Figura 4-2 se las graficas de dispersión para algunos valores de
(a) (b)
(c) (d)
Figura 4-2. Gráficas de dispersión para algunos valores de rk. (a) y (b) rk = 0, correlación lineal nula, (c) rk = -1, Correlación lineal negativa y (d) rk = 0,9877, Correlación lineal positiva.
En la Figura 4-2 (b), puede verse que aunque existe una relación parabólica perfecta el coeficiente de correlación lineal es cercano a cero, por cuando este mide el parecido con una línea recta y no con una parábola u otra gráfica.
Es importante aclarar tanto el concepto de Coeficientes de Correlación Lineal y Función de Autocorrelación, son similares.
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7
Y
X
Y = -X2+ 30*X + 25
0 50 100 150 200 250 300
0 5 10 15 20 25 30 35
Y
X
Y = -X + 11
0 2 4 6 8 10 12
0 2 4 6 8 10 12
Y
X
Y = 0,9851*X + 0,1765
0 2 4 6 8 10 12
0 2 4 6 8 10 12
Y
Ana María Moros Vivas 30 Función de Auto-correlación Lineal
La función de auto-correlación mide la relación existente entre los valores de la serie temporal discreta de un proceso y los correspondientes a la misma serie rezagada o desfasada unidades de tiempo, como se presenta en la Tabla 4-1.
Tabla 4-1. Serie Original Vs Serie rezagada una y dos unidades de tiempo
Serie Original
a1 - -
a2 a1 -
a3 a2 a1
a4 a3 a2
a5 a4 a3
ai ai-1 ai-2
an an-1 an-2
Esta función es de gran utilidad para encontrar patrones repetitivos dentro de una señal. Para estimar el coeficiente de auto-correlación entre la serie original y la misma serie rezagadas unidades de tiempo, debe hacerse el uso de la siguiente expresión:
Ecuación 4-16
Donde:
Coeficiente de auto-correlación Lineal
Dato de la serie original
La media de la serie de datos
Dato rezagado unidades de tiempo
Ana María Moros Vivas 31
4.2.3.2 Exponente de Hurst
El hidrólogo ingles Harold Edwing Hurst (1.880 – 1.978), en su afán por responder ¿Cuál es el tamaño optimo del embalse?, pregunta para la cual respondió,
Aquel embalse nunca este vacío, es decir el embalse siempre debe almacenar algo de agua para contrarrestar sequias.
Aquel embalse nunca se rebose, es decir que tenga un espacio vacío para almacenar crecientes.
Hurst solucionó este problema mediante el cálculo de o rango de volúmenes, o rango en que se debe mover del embalse. Matemáticamente puede expresarse como:
Ecuación 4-17
Donde:
Es la mayor diferencia positiva entre el consumo acumulado y el caudal aportado por el río acumulado desde el inicio de la operación del embalse hasta el tiempo . Lo anterior con el fin de tener un tamaño óptimo del embalse para que nunca este vacío, con el fin de aliviar sequias.
Es la menor diferencia negativa entre el consumo acumulado y el caudal del río acumulado desde el inicio de la operación del embalse hasta el tiempo , en busca de tener el tamaño recomendable para que el embalse nunca se rebose.
La diferencia entre el aporte del río acumulado y consumo acumulado en el tiempo esta dada por:
Ecuación 4-18
Donde:
Es el volumen suministrado por el río
Es el volumen promedio demandado
Ana María Moros Vivas 32
Como el contenido de la sumatoria interna del segundo término es una constante:
Ecuación 4-19
Asumiendo que la probabilidad de cada término es la misma: , se llega a:
Ecuación 4-20
Donde:
Cantidad total de agua entregada por el río en años
Cantidad total de agua demandad en años
Tamaño de la muestra
Hurst quería comparar rangos de volúmenes de diferentes embalses, de modo para poder hacer esto, normalizó dividiéndolo entre la desviación estándar de los datos, , obteniendo de esta manera lo que llamó “Análisis de Rango Reescalado”4.
Ecuación 4-21
Ana María Moros Vivas 33 Adicionalmente, Hurst y sus colegas estudiaron el comportamiento del Rango Reescalado, y notaron que al graficar en papel logarítmico los valores de Vs
, se obtenía una relación potencial como la mostrada en la Ecuación 4-22, relación que se hablará en el siguiente ítem (Ley de Potencia).
Ecuación 4-22
Donde:
Es una constante
Tamaño de la muestra
Medida de la intensidad de la dependencia de largo plazo, nombrada Hurst” en honor al hidrólogo inglés Harold Edwin Hurst. “Exponente de
Ley de Potencia
La Ecuación 4-22, posee la forma funcional de una ley de potencia. De manera general una ley de potencia posee la forma de la Ecuación 4-23, en la cual la variable independiente esta afectada por un coeficiente y un exponente . Por ejemplo, cuando toma una valor de 2 y de -0.9, se genera la gráfica que se muestra en la Figura 4-3 la cual es una representación clásica de eventos tales como: terremotos, tormentas, avalanchas, etc., eventos para los cuales la frecuencia de ocurrencia, , disminuye a medida que aumenta el tamaño del evento .
Figura 4-3. Relación Potencial
f(x) = 2x-0,9
0 1 2 3 4 5 6 7 8 9
0 1 2 3 4 5 6 7
F re cu en ci a d el E ve n to f( x)
Ana María Moros Vivas 34 Sea:
Despejando se tiene:
Al aplicar logaritmos, a cada uno de los lados:
Ecuación 4-23
Ecuación 4-24
Haciendo:
Se llega a:
Con
Ecuación 4-25
Donde la Ecuación 4-25, posee la forma funcional de una línea recta. La Figura 4-3 bajo la apariencia de una línea recta toma la forma:
Ecuación 4-26
Ana María Moros Vivas 35 Figura 4-4. Relación Potencial, bajo la apariencia de una línea recta
Invarianza de escalas
A partir de la Ecuación 4-23, puede apreciar el concepto de Invariancia de Escala. Al ampliar la variable , multiplicándola por un escalar , se obtiene:
Ecuación 4-27
De modo que si es escalado por una magnitud constante , se ve escalado en una magnitud . Por lo tanto, “si se conoce el comportamiento de un fenómeno a una escala , es posible conocer o inferir el comportamiento de dicho fenómeno a otras escalas más finas o gruesas según el valor que adopte la constante ”.
Calculo e Interpretación del Exponente Hurst
Para obtener cada uno de los puntos que hacen parte de la gráfica logarítmica se debe dividir la serie en conjuntos de datos, para los cuales se calculan los correspondientes valores de y . A modo de ejemplo se tiene, para un conjunto de datos se desea obtener el exponente de Hurst con 8 divisiones. Es importante recordar como son 8 divisiones para hacer el grafico se va contar con 8 puntos, los cuales se van a obtener a partir de: una primera división es con todos los datos de la serie, , lo cual se calcula el rango, la desviación estándar y los logaritmos de y , lo cual es el primer punto de la gráfica. Para un segundo punto de la gráfica, se divide la serie de tiempo en dos partes, a cada parte se le calcula el rango y la desviación estándar, de los
y = -0,9x + 0,301
-4 -2 0 2 4 6
-6 -4 -2 0 2 4 6
Lo
g
[f
(x
)]
Ana María Moros Vivas 36 cuales se calcula el prometido y aplica el logaritmo a y a la relación del promedio de los rangos y las desviaciones estándar de ; así sucesivamente para cada una de las divisiones como se muestra en la Figura 4-5.
Datos R/S Logaritmos
n log(n)
n/2 log(n/2)
n/3 log(n/3)
n/4 log(n/4)
n/5 log(n/5)
: : : :
n/8 log(n/8)
: : : :
: : : :
Figura 4-5. División del conjunto de datos para realizar los cálculos de [log(n)] Vs
Al graficar en el eje de las abscisas el y en el de las ordenadas el
se tiene una cantidad de puntos según la cantidad de divisiones que se desean hacer de la serie, los cuales se aproximan a una línea recta que al obtener la ecuación de dicha línea recta el valor de la pendiente (el que acompaña a la variable ) es el coeficiente de Hurst.
Ana María Moros Vivas 37 El coeficiente de Hurst puede tomar valores entre cero y uno, de modo que:
El caso especial de , da evidencia de un comportamiento aleatorio puro, es decir, evidencia independencia estadística de largo plazo. El futuro no se ve influenciado por lo que ocurre en el presente y pasado.
Un proceso con un valor de tal que es llamado un Proceso Antipersistente, es decir si la serie está creciendo no se sabe si seguirá creciendo o decreciendo, su comportamiento es incierto pero el proceso presenta memoria.
Un proceso con un valor de tal que es llamado un Proceso Persistente, en el que los valores que toma el proceso tienden a reforzar la tendencia actual, esto es, si la tendencia de la serie de tiempo ha sido positiva en el último período observado, es más fácil que esta tendencia continúe siendo positiva en el siguiente período. La intensidad del comportamiento persistente se incrementa cuando H se aproxima a uno, y es este efecto de memoria de largo plazo el que causa la apariencia de tendencias y ciclos en el proceso. Mandelbrot llamó a éste comportamiento el “Efecto José” por la historia bíblica de los siete años de abundancia seguidos de los siete años de escasez.
En conclusión cuando una serie de tiempo tiene un valor de H diferente de 0.5, las observaciones NO son independientes. Cada observación es producto del recuerdo de todos los eventos predecesores, es decir, existe un efecto de sesgo o de memoria. Sin embargo, esta no es una memoria de corto plazo, comúnmente llamada Markoviana, esta memoria es distinta, es de largo plazo. Es evidente que eventos más recientes tengan un impacto mayor que eventos distantes, pero estos últimos siguen influenciando al proceso.
4.3
Información a analizar
Para ilustrar cada uno de los conceptos presentados en este capítulo, se analizaron tres series de tiempo de las cuales: una está compuesta una por la suma de funciones cosenos y las otras dos por series de precipitación registradas por estaciones pluviométricas.
Función “Suma de Cosenos”: serie construida para actuar como experimento controlado. Consiste en la suma de cuatro funciones cosenoidales y está definida en el intervalo .
Ecuación 4-28
Estación Camavieja – EAAB5: serie de datos de precipitación diaria registradas por la estación Camavieja desde el 3 de marzo de 1.975 hasta 15 de diciembre de 2.009, cuenta con datos.
Ana María Moros Vivas 38
Earl Williams of the Department of Meteorology of MIT: serie de datos registrados cada
segundos durante la ocurrencia de una tormenta en Boston el día 25 de Octubre de desde las hasta , cuenta con datos.
4.3.1 Análisis de la señal “Suma de Cosenos”
Supóngase que en cierta estación se registraron valores de lluvia que pueden ser descritos por la Ecuación 4-28. Dichos datos son presentados de tres maneras distintas (Figura 4-6): Serie de tiempo, Histograma y diagrama de Caja y Bigotes.
Figura 4-6. Apariencia de la señal “Suma de Cosenos” junto con el histograma de frecuencia y el diagrama de Caja y Bigotes.
En el histograma de la Figura 4-6 se puede apreciar que lo datos siguen la forma de una distribución Normal, con una cola o sesgo hacia los valores altos de la función debido a que el intervalo de tiempo comprendido entre y la función no alcanza a completar ciclos exactos. La misma asimetría también se aprecia en diagrama de caja y bigotes. Nótese que en la grafica del histograma no se ve un pico excesivo ni disminuido.
Ana María Moros Vivas 39 Tabla 4-2. Análisis Exploratorio numérico de la señal “Suma de Cosenos”
ANÁLISIS EXPLORATORIO DE LA SEÑAL “SUMA DE
COSENOS”
Parámetros Unidades Valor
Numero de datos und 400
Mínimo mm -2,67
Moda mm -2,67
Mediana mm -0,24
Media mm 1,90E-03
Desviación Estándar mm 1,43
Coeficiente de variación muestral Adimensional 750,00 Coeficiente de Asimetría Adimensional 0,54 Coeficiente de Apuntamiento Adimensional 2,99
Máximo mm 4,00
En la Tabla 4-2 se hallan inscritas las medidas de descripción numérica del conjunto de datos. Se aprecia la existencia de una asimetría positiva lo cual indica sesgo hacia valores altos y un apuntamiento muy cercano a lo que evidencia el parecido de dicha serie con la distribución normal en cuanto curtosis se refiere.
Con este experimento controlado se aprecia que las rutinas de cálculo utilizadas funcionan correctamente, de modo que pueden ser utilizados para caracterizar series de datos reales.
En la Figura 4-7 y Figura 4-8, se presenta la función de Autocorrelación y la gráfica necesaria para obtener el exponente de Hurst de la señal en estudio, con el objetivo de observar la memoria del proceso de la serie.
Figura 4-7. Función de Autocorrelación para la señal "Suma de Cosenos"
Ana María Moros Vivas 40 El exponente de Hurst (pendientes de las rectas) fue calculado con (a) 10 puntos y (b) 20 puntos, ver Figura 4-8. Se puede observar que dicho coeficiente es muy sensible a la cantidad de puntos utilizados. Para el primer caso “H” toma un valor de característico de un Proceso Anti-persistente. En el segundo caso “H” toma un valor de característico de un Proceso Persistente. En ambos casos la calidad del ajuste fue evaluado mediante el parámetro y tal como se observa, la calidad del ajuste es buena por cuanto tiende a . Respecto al coeficiente de Hurst puede concluirse que existe memoria, concordando con los resultados obtenidos con la gráfica de Auto-correlación Lineal.
(a) (b)
Figura 4-8. Representación del exponente de Hurst para la señal "Suma de Cosenos". (a) 10 puntos y (b) 20 puntos
4.3.2 Análisis de la señal registrada por la Estación Camavieja
Ana María Moros Vivas 41
(a)
Ana María Moros Vivas 42
(c)
(d)
Figura 4-9 Serie de tiempo registrada por la estación Camavieja para diferentes escalas de agregación temporal. (a) Diaria, (b) Semanal, (c) Mensual y (d) Anual
Ana María Moros Vivas 43 Tabla 4-3. Análisis Exploratorio numérico de la señal registrada por la Estación Camavieja, para diferentes escalas
de agregación temporal.
ANÁLISIS EXPLORATORIO DE LA SEÑAL REGISTRADA POR LA ESTACIÓN CAMAVIEJA
Parámetros Unidades Diaria Agregación Temporal
Semanal Mensual Anual
Numero de datos Und 12.397 1.771 415 35
Mínimo mm 0,00 0,00 0,40 405,30
Moda mm 0,00 0,00 11,70 405,30
Mediana mm 0,10 10,30 60,90 853,50
Media mm 2,41 16,88 72,03 854,09
Desviación Estándar mm 5,64 19,20 50,05 177,82
Coeficiente de Variación Muestral Adimensional 2,34 1,14 0,69 0,21
Coeficiente de Asimetría Adimensional 4,17 1,89 1,24 -0,02
Coeficiente de Apuntamiento Adimensional 26,71 7,40 4,41 2,71
Máximo mm 75,10 152,90 276,00 1.189,20
En la Tabla 4-3 se observa que a medida que cambia la escala temporal cambian los parámetros estadísticos como era de esperarse, sin embargo existen algunas características comunes en estas cuatro escalas:
Existe un sesgo hacia los valores altos, excepto en la escala anual donde el sesgo es casi nulo.
Los coeficiente de variación muestral varían de mayor a menor a medida que la agregación temporal va aumentando.
Existe un comportamiento Leptocúrtica, es decir alta concentración de valores alrededor de la media, excepto en el caso anual como lo constata la Figura 4-9 (d).
En la Figura 4-10 se muestra la función de Auto-correlación para las escalas temporales antes mencionadas.
Ana María Moros Vivas 44
(c) (d)
Figura 4-10. Función de Autocorrelación de la serie de tiempo registrada por la estación Camavieja con diferentes niveles de agregación temporal: (a) Diaria, (b) Semanal, (c) Mensual y (d) Anual.
En la Figura 4-10 se observa que la memoria para la escala diaria decae rápidamente hasta estabilizarse en un valor cercano a , valor bajo comparado con el de las escalas semanales, mensuales y anuales el cual oscila alrededor de . Sin embargo, para todas las escalas se aprecia como la memoria disminuye con el tiempo.
En la Figura 4-11, se presentan los resultados de las gráficas generadas para el Análisis de Rango Reescalado con su respectiva ecuación lineal y nivel de ajuste para cada una de las escalas de agregación. Nuevamente el exponente de Hurst fue calculado con y puntos.
Ana María Moros Vivas 45
(c) (d)
(e) (f)
(g)
Figura 4-11. Valor de exponente de Hurst para la estación Camavieja escala: (a) diaria con 10 puntos, (b) escala con 20 puntos, (c) semanal con 10 puntos, (d) semanal con 20 puntos, (e) mensual con 10 puntos, (f) mensual con 20