INDICE
DEDICATORIA 1
AGRADECIMIENTO 2
ÍNDICE DE TABLAS 3
ÍNDICE DE FIGURAS 4
INDICE DE ANEXOS 5
RESUMEN 6
I. INTRODUCCION 8
1.1 Generalidades 8
1.2 Objetivo General 9
1.2.1 Objetivo general 9
1.2.2 Objetivos específicos 9
II. REVISION BIBLIOGRAFICA 10
2.1 Antecedentes 10
2.1.1 Antecedentes bibliográficos internacionales 10
2.1.2 Antecedentes bibliográficos nacionales 11
2.2 Marco Teórico 12
2.2.1 Precipitación 12
2.2.2 Caudal 13
2.2.3 Análisis de consistencia 13
A. Análisis de saltos 13
B. Análisis de tendencias 17
2.2.4 Red neuronal 20
2.2.4.1 Estructura de una red neuronal 21
A. Niveles o capas de neuronas 22
B. Estado de activación y función de activación 23
D. Regla de aprendizaje 25
2.2.4.2 La red backpropagation 26
A. Ejecución del modelo backpropagation 27
2.2.5 Tipos de redes neuronales a probarse 30
A. Cascade forward – backpropagation 30
B. Elman backpropagation 32
C. Feed forward backpropagation 35
2.2.6 Modelos estadísticos para la validación de la simulación 36
A. Raíz del error cuadrático medio (RMSE) 37
B. Eficiencia de Nash-Sutcliffe (NSE) 37
C. Error cuadrático medio normalizado (ECMN) 38
D. Coeficiente de determinación (R2) 39
E. Coeficientes de análisis provenientes del Excel 2016 39
III. MATERIALES Y METODOS 41
3.1 Tipo de investigación 41
3.2 Descripción de la zona de estudio 41
3.2.1 Información cartográfica 41
3.2.2 Información hidrológica 42
3.2.3 Parámetros morfométricos de la cuenca 42
3.3 Materiales 43
3.4 Métodos 43
3.4.1 Trabajo en campo 43
3.4.1.1 Recopilación de información 43
3.4.2 Trabajo en gabinete 43
3.4.2.1 Completación de datos y análisis de consistencia. 44
3.4.2.2 Selección del tipo de red. 45
A. Agrupación 45
B. Proceso I. Iteración, verificación y selección de red. 47 3.4.2.3 Aplicación de una estructura funcional para el tipo de red elegida. 49
A. Proceso II. Generación de caudales. 50
3.4.2.4 Verificación de la relación que existe entre caudales mensuales generado y los caudales mensuales reales analizando la validez de la generación 50
4.1 Selección del tipo de red que se adecue a los datos generados 52 4.2 Aplicar una estructura funcional para el tipo de red elegida. 52
4.2.1 Elman backpropagation, Precipitaciones mensuales 53
A. Precipitaciones mensuales grupo A. 53
B. Precipitaciones mensuales grupo B. 55
4.2.2 Elman backpropagation, Caudales mensuales 57
A. Caudales mensuales grupo A. 57
B. Generación de caudales mensuales Grupo B 59
C. Generación de caudales mensuales grupo C. 62
4.3 Análisis de la validez de las generaciones 63
4.3.1 Elman backpropagation, Precipitaciones mensuales. 64
A. Verificación de Precipitaciones mensuales Grupo A 64
B. Verificación de precipitaciones mensuales Grupo B 64
4.3.2 Elman backpropagation, Caudales mensuales. 65
A. Verificación de Caudales mensuales Grupo A 65
B. Validación de caudales mensuales Grupo B 66
C. Validación de caudales mensuales Grupo C 67
V. DISCUSIONES 68
VI. CONCLUSIONES 69
VII. RECOMENDACIONES 70
VIII. BIBLIOGRAFIA 71
1
DEDICATORIA
2
AGRADECIMIENTO
Quiero agradecer a Dios por bendecirme con el regalo de la vida, por guiarme a lo largo de mi existencia, ser el apoyo y fortaleza en aquellos momentos de dificultad y de debilidad.
Gracias a mi madre Clarita Luisa Pariamachi García y mi padre Alex Feliz Pineda Pariamachi, por ser los principales promotores de mis sueños, por confiar y creer en mis expectativas, por los consejos, valores y principios que me han inculcado.
3
ÍNDICE DE TABLAS
Tabla 1. Características geomorfométricas de la cuenca 42
Tabla 2. Registro de datos de acuerdo a los años 45
Tabla 3. Matrices de agrupación de datos de acuerdo al tipo de red 46
Tabla 4. Distribución de datos respecto a los años. 46
Tabla 5. Distribución de datos para la selección del tipo de función de entrenamiento. 47 Tabla 6. Estructura inicial para cada entrenamiento. Grupo A 48
Tabla 7. Periodo de años para la fase de validación 51
Tabla 8. Datos generados por la RNA N°02. Precipitaciones mensuales 54 Tabla 9. Estructura de las redes neuronales, Elman backpropagation generación de
precipitaciones Grupo B. 55
Tabla 10. Datos generados por la RNA N°02_4. Precipitaciones mensuales 56 Tabla 11. Datos generados por la RNA N°Q7. Caudales mensuales 58 Tabla 12. Estructura de las redes neuronales, Elman backpropagation generación de caudales
Grupo B. 60
Tabla 13. Datos generados por la RNA N°Q7_1. Caudales mensuales 61 Tabla 14. Estructura de generación de precipitación mensual, Elman backpropagation 62 Tabla 15. Estructura de generación de precipitación mensual, Elman backpropagation 62 Tabla 16. Resumen de los coeficientes de validación. Elman backpropagation precipitaciones
mensuales Grupo A. 64
Tabla 17. Resumen de los coeficientes de validación. Elman backpropagation precipitaciones
mensuales Grupo B. 65
Tabla 18. Resumen de los coeficientes de validación. Elman backpropagation, caudales
mensuales Grupo A 66
4
Tabla 20. Resumen de los coeficientes de validación. Grupo C 67
ÍNDICE DE FIGURAS
Figura 1. Ejemplo de una red Neuronal totalmente conectada 22 Figura 2. Funcionamiento general backpropagation. 28
Figura 3. Red Cascade forward backpropagation. 31
Figura 4. Red básica de Elman. 34
Figura 5. Diagrama de flujo de la metodología aplicada 44 Figura 6. Iteración de las estructuras para el Grupo B. 49
Figura 7. Diagrama de flujo para el proceso II 51
Figura 8. Distribución de grupos para cada tipo de red 52 Figura 9. Generación de datos de precipitaciones mensuales modelo Elman backpropagation,
Grupo A. 53
Figura 10. Generación de precipitaciones Red Neuronal Artificial N° 02. 54 Figura 11. Generación de datos de precipitaciones mensuales modelo Elman
backpropagation, Grupo B. 56
Figura 12. Generación de precipitaciones Red Neuronal Artificial N° 02_4. 57 Figura 13. Generación de datos de caudales mensuales con el modelo Elman
backpropagation, Grupo A. 58
Figura 14. Generación de caudales mensuales Red Neuronal Artificial N° Q7. 59 Figura 15. Generación de datos de caudales mensuales con el modelo Elman
backpropagation, Grupo B. 60
5
Figura 17. Generación de datos de caudales mensuales con el modelo Elman
backpropagation, Grupo C 63
INDICE DE ANEXOS
Anexo 1. Carta Nacional Recuay 20-i 74
Anexo 2. Delimitación de la sub cuenca Querococha. 74
Anexo 3. Precipitaciones mensuales estación Querococha. 75
Anexo 4. Caudales mensuales estación Querococha. 76
Anexo 5. Precipitaciones mensuales estación Querococha datos para generación. 77 Anexo 6. Caudales mensuales estación Querococha datos para generación. 77
Anexo 7. Diagrama de flujo del proceso I 78
Anexo 8. Mejor validación para generación de datos de precipitación mensual por el modelo
Elman backpropagation. 79
Anexo 9. Mejor validación para la generación de datos de caudales mensuales por el modelo
6
RESUMEN
El objetivo principal de la investigación fue generar caudales mensuales a partir de precipitaciones mensuales en la sub cuenca Querococha ubicada en la provincia de Recuay. La tipificación del estudio es aplicada de nivel predictivo, según el diseño de la investigación es no experimental y según la naturaleza de los datos manejados es cuantitativo. El método consistió en la aplicación de redes neuronales artificiales, específicamente, del modelo backpropagation, de este se probaron tres tipos de red neuronal artificial: Cascade forward backpropagation, Elman backpropagation y Feed forward backpropagation. Para definir la estructura más eficiente, se realizaron iteraciones en las funciones fundamentales basados en tres procesos principales: entrenamiento, validación y generación para cada tipo de red, se priorizo la generación de caudales mensuales, analizando previamente estos procesos en las precipitaciones mensuales; estos procesos se especifican en el contenido de la investigación. Se obtuvo un resultado satisfactorio en el uso de los tres tipos de red, resaltando de los tres el tipo Elman backpropagation, el cual presenta un coeficiente de correlación de 0.90 y un error máximo de 0.60 m3/seg. Desde esta perspectiva una de las conclusiones más importantes es la viabilidad de la generación de caudales mensuales mediante la aplicación de las redes neuronales artificiales solo con una variable de apoyo en este caso las precipitaciones mensuales.
7
SUMMARY
The main objective of the research was to generate monthly flows from monthly rainfall in the Querococha sub-basin located in the province of Recuay. The typification of the study is applied at the predictive level, according to the design of the research it is non-experimental and according to the nature of the data handled, it is quantitative. The method consisted of the application of artificial neural networks, specifically, of the backpropagation model, of which three types of artificial neural network were tested: Cascade forward backpropagation, Elman backpropagation and Feed forward backpropagation. To define the most efficient structure, iterations were made in the fundamental functions based on three main processes: training, validation and generation for each type of network, the generation of monthly flows was prioritized, previously analyzing these processes in the monthly rainfall; these processes are specified in the content of the investigation.
A satisfactory result was obtained in the use of the three types of network, highlighting of the three the Elman backpropagation type, which has a correlation coefficient of 0.90 and a maximum error of 0.60 m3 / sec. From this perspective, one of the most important conclusions is the feasibility of generating monthly flows through the application of artificial neural networks with only one supporting variable in this case, monthly rainfall.
8
I.
INTRODUCCION
1.1 Generalidades
A diferencia de la Cordillera Negra, la Cordillera Blanca tradicionalmente ha tenido agua suficiente en sus lagos, lagunas, bojedales y manantiales gracias a los glaciares, sin embargo, parece que la abundancia de agua tendrá un fin cercano al ritmo de retroceso de los glaciares.
Desde el pueblo vecino de Cátac han ido surgiendo historias de escasez de agua por varios años durante la temporada seca. Son noticias que incluso han llegado a la prensa limeña (Borg, 2011, p. 6).
Los reportes de una crisis de agua venidera también han llegado a la puna, y aquí tenemos una interacción interesante entre las experiencias propias de los pobladores y la información que llega desde afuera. Entre otras cosas, ha significado una mayor politización del agua. A medida que se incrementa la presión sobre el abastecimiento de agua irán surgiendo conexiones parciales entre los usuarios individuales y la organización mayor del agua. Estas conexiones son las que influyen en el hecho de que “menos agua” lleva una experiencia de escasez de agua. El agua en el río viene de la laguna Querococha. Aparte del Canal Querococha 3 Bases, el río también es inicio de tres canales más que van para los comuneros de Catac, el caserío Buenos Aires y la Mina Toma la Mano. Significa que es necesario coordinar a mayor escala entre quienes tienen derecho a cuál agua.
Puntualizando tenemos un problema de escases de recurso hídrico, el cual es necesario para abastecer cuatro sectores principales, agricultura, ganadería, consumo humano y minería. La tendencia de escasez es notoria y cíclica cada año, y muestra un aumento debido al incremento en su uso por el crecimiento poblacional
9
una justificación académica por el uso de un modelo novedoso, una implicancia social ya que se tiene un uso humano y principalmente, económica al dotar de agua a medios productivos como la agricultura ganadería y minería.
“El análisis y la predicción de series de tiempo permiten obtener información básica para la planeación, diseño, y evaluación de hidrosistemas, con base en la optimización del manejo de los recursos hídricos para el bienestar social” (Alvarez, Gomez, & Obregon, 2012).
Entonces podemos mencionar que la creciente escasez de agua conjuntamente con un sistema de distribución con poco control, la necesidad de un manejo más estable y basado en estudios de caudales que favorezcan el planeamiento y repartición de los mismos, son los problemas principales en mi sector de estudio.
1.2 Objetivo General
1.2.1 Objetivo general
Generar caudales mensuales aplicando redes neuronales artificiales mediante precipitaciones mensuales en la sub cuenca Querococha, Recuay.
1.2.2 Objetivos específicos
a. Encontrar el tipo de red que se adecue a los datos generados. b. Aplicar una estructura funcional para el tipo de red elegida.
10
II.
REVISION BIBLIOGRAFICA
2.1 Antecedentes
2.1.1 Antecedentes bibliográficos internacionales
Pujol (2009) Presenta en su tesis doctoral una comparación entre un modelo autorregresivo de media móvil con variable exógena ARMAX, una red neuronal artificial tipo perceptrón multicapa y un modelo modular con una red neuronal auto-organizada para la predicción de caudales horarios en diferentes secciones del rio Paraná, cambiando las estructuras de las redes neuronales, midiendo su asertividad y analizando el desfase, finalmente concluye considerando la capa de entrada y la cantidad de datos como fundamental en el proceso de predicción, menciona también que las redes utilizadas presentan un menor desfase respecto al modelo autor regresivo, dándoles una mayor proximidad de predicción. (p.280)
Campozano (2011). Estudia en su tesis de maestría la implementación de tres tipos de redes MLP con diferentes estructuras variando principalmente en el número de capas ocultas y tipo de salida esto para la predicción de caudales y el análisis posterior de la robustez de sus modelos. Concluye con resultados satisfactorios para los tres modelos de las redes neuronales considerando el mejor a la red tipo MLP con 25 neuronas, función de activación sigmoidal, una capa de salida con activación lineal y entrenada mediante algoritmo Levenberg-Marquardt.(p. 20)
11
métodos siendo superior por mayor flexibilidad en este caso el modelo ANFIS, además recomienda utilizar estructuras y topologías sencillas al implementar la red. (p.112)
Talento (2011). Realiza en su tesis para maestría una comparación de predicción de caudales de aporte utilizando métodos estadísticos, una red neuronal simple backpropagation y un clustering, llegando a concluir la red neuronal como un modelo de predicción eficiente en los meses que se presentan mayor cantidad de datos y a los modelos estadísticos tanto como el clustering cuando existen pocos datos esto solo referido a la relación de caudales de aporte.
2.1.2 Antecedentes bibliográficos nacionales
Herrera , Luque , Tupac, & Yari, (2013). Basan su artículo científico en la generación de caudales mensuales utilizando una red neuronal feedforward backpropagation con funciones de salida sigmoidales esto en dos estructuras similares utilizando el programa Network Neural 4.0, ello llegan a una conclusión satisfactoria respecto a la semejanza de los caudales en la serie temporal histórica esto en el sentido estadístico dejando claro que no se puede definir las características que deben ser reproducidas por el modelo o la interpretación de las mismas ya que sus muestras son anuales y no poseen otro indicador. (p. 47)
12
Laqui & Sanchez (2009). Prueban en su artículo científico la predicción de caudales medios mensuales a través de 10 modelos de redes neuronales del tipo Perceptrón multicapa tomando un periodo de tiempo de 1964 a 1996 para realizar el entrenamiento y datos de 1997 al 2002 para su validación, se compara el modelo optimo con un modelo autorregresivo de primer orden PAR(1), el grupo concluye como positiva la predicción de caudales medios mensuales utilizando precipitación y evaporación al evaluar los errores de predicción en comparación con el modelo autorregresivo. (p. 205)
Lujano, Lujano, Lujano, & Quispe (2010). Manifiestan en su artículo científico el uso de 06 modelos de redes neuronales artificiales del tipo perceptrón multicapa los caudales son evaluados estadísticamente en su error llegando a la conclusión de que las redes muestran un buen desempeño en la estimación de fenómenos de comportamiento no lineal como los caudales. (p. 99)
2.2 Marco Teórico
2.2.1 Precipitación
Es toda forma de humedad que se origina en las nubes para llegar a la superficie terrestre en forma de lluvia, granizo, nieve y otros.
Desde el punto de vista de la ingeniería hidrológica la precipitación es la fuente primaria de agua en la superficie terrestre y su medición es el punto de partida para estudios relacionados al uso y control del agua. (Ledesma,2006, p.26)
13 2.2.2 Caudal
También conocido como gasto o escurrimiento, el cual es otro elemento del ciclo hidrológico, básicamente es el agua que proveniente de la precipitación que avanza sobre la superficie terrestre y que es transportada por una corriente hasta un determinado punto de aforo.
El exceso de precipitación o precipitación efectiva es la precipitación que no ser retiene en la superficie terrestre y tampoco se infiltra en el suelo. Después de fluir a traces de la superficie de la cuenca, el exceso de precipitación se convierte en escorrentía directa a la salida de la cuenca bajo la suposición de flujo superficial hortoniano. (Chow, Maidment, & Mays, 1994, p. 138).
2.2.3 Análisis de consistencia
Las referencias a continuación se han tomado del libro del Hidrología Estadística del Ingeniero Máximo Villón Béjar.
A. Análisis de saltos
A.1 Análisis de consistencia de la media
Consiste en probar mediante la prueba t (prueba de hipótesis) si los valores medios de las submuestras son estadísticamente iguales o diferentes con una probabilidad del 95 % o con 5% de nivel de significancia, de la siguiente manera:
Calcula de la media y de la desviación estándar para las submuestras, según:
Donde:
= 1= 1 ; = 1− 1 − ( 1)
14
= valores de la serie del periodo 1
= valores de la serie del periodo 2
, = media de los periodos 1 y 2 respectivamente
, = desviación estándar de los periodos 1 y 2 respectivamente.
= tamaño de la muestra
, = tamaño de las submuestras
= +
Calculo del t calculado ( ) según:
Donde: − = 0 (por hipótesis, la hipótesis es que las medias son iguales)
Quedando:
Además:
Siendo:
= desviación de las diferencias de los promedios
= desviación estándar de la ponderada
= − − − ( 3)
= − ( 4)
= 1 + 1 ( 5)
15 Calculo del t tabular $:
El valor critico de t se obtiene de la tabla t de Student, con una probabilidad del 95% o con un nivel de significación del 5%, es decir con α/2 = 0.025 y con grados de libertad v= + − 2.
Comparación del con el $:
Si | | ≤ $ (95%) → = (estadísticamente)
En este caso, siendo las medias = estadísticamente, no se debe realizar proceso de corrección.
Si | | > $ (95%) → ≠ (estadísticamente)
En este caso, siendo las medias ≠ estadísticamente, se debe realizar proceso de corrección.
A.2 Análisis de consistencia de la desviación estándar
El análisis estadístico consiste en probar, mediante la prueba F, si los valores de las desviaciones estándar de las submuestras son estadísticamente iguales o diferentes, con un 95% de probabilidad o con un 5% de nivel de significación, de la siguiente forma:
Calculo de las varianzas de ambos periodos:
= 1− 1 − ( 7)
16 Calculo del F calculado (- , según:
Calculo del F tabular (valor critico de F o -$ , se obtiene de las tablas F para una probabilidad del 95%, es decir, con un nivel de significancia α=0.05 y grados de libertad:
.. 0. 1 = − 1
.. 0. 2 = − 1} , 45 >
.. 0. 1 = − 1
.. 0. 2 = − 1} , 45 >
Donde:
G.L.N = grados de libertad del numerador
G.L.D = grados de libertad del denominador
Comparación del Fc con el Ft:
Si -6 ≤ Ft (95%) → = (estadísticamente)
Si -6 > Ft (95%) → = (estadísticamente), por lo que se debe corregir.
A.3 Corrección de los datos
En los casos en que los parámetros media y desviación estándar de las submuestras de las series de tiempo, resultan estadísticamente iguales, la información original no se corrige, por ser consistente con un 95 % de probabilidad, aun cuando en la doble masa
- = , 45 > ( 9)
17
se observe quiebres. En caso contrario, se corrigen los valores de las submuestras mediante las ecuaciones (11) y (12):
Donde:
7′$ = valor corregido de saltos
$ = valor a ser corregido
La ecuación (11), se utiliza cuando se deben corregir los valores de la submuestra de tamaño , y la ecuación (12), si se debe corregir la submuestra de tamaño .
B. Análisis de tendencias
Antes de realizar el análisis de tendencias, se realiza el análisis de saltos y con la serie libre de saltos, se procede a analizar las tendencias en la media y en la y en la desviación estándar.
B.1 Tendencia en la media
La tendencia en la media Tm, puede ser expresada en forma general por la ecuación polinómica:
Y en forma particular por la ecuación de regresión lineal simple:
Donde:
7′$ = $− . + ( 11)
7′ $ = $− . + ( 12)
9: = ;<+ =< + >< + 2< ?+ ⋯ ( 13)
18
t= tiempo en años, tomado como la variable independiente de la tendencia.
T=1,2,3, …, n
Tm= tendencia en la media, para este caso:
Tm= 7′ $ valor corregido de saltos, es decir, datos a usarse para el cálculo de los parámetros.
;< , =<, ><, 2<, = coeficientes del polinomio de regresión, que deben ser estimados
con los datos.
Los parámetros de regresión de estas ecuaciones, pueden ser estimados por el método de mínimos cuadrados, o por el método de regresión lineal múltiple.
Evaluación de la tendencia Tm
Para averigua si la tendencia es significativa, se analiza el coeficiente de regresión Bm o también el coeficiente de correlación R.
El análisis de R según el estadístico t, es como sigue:
Calculo estadístico tc según:
Donde:
= valor estadístico t calculado.
N= número total de datos
R= coeficiente de correlación.
Calculo de $:
= A√ − 2 √1 − A
19
El valor critico de t, se obtiene de la tabla t de Student, con 95% de probabilidad o con un nivel de significación del 5%, es decir:
α/2 = 0.025
G.L = n-2
3. Comparación del con el $:
Si | | ≤ $ (95%) →A = no es significativo
En este caso, la tendencia no es significativa y no hay que corregir.
Si | | > $ (95%) →A = si es significativo
En este caso, la tendencia es significativa y hay necesidad de corregir la información de tendencia en la media.
B.2 Corrección de la información:
La tendencia es la media se elimina haciendo uso de la ecuación:
Donde:
7′ $ = Serie corregida de saltos
9<= tendencias en la media, obtenida de la ecuación (14)
C$= serie sin tendencia en la media.
Para que el proceso 7$ preserve la media constante, se devuelve el promedio de las 7′ $ o 9< , luego las ecuaciones (16) y (17) toman la forma :
C$= 7′$ − 9< ( 16)
20
Donde 9< es el promedio de la tendencia en la media o promedio de los valores corregidos de saltos.
2.2.4 Red neuronal
Se puede definir de muchas formas lo que son las redes neuronales, desde las formas generales y abreviadas hasta las que se basan en explicar al detalle lo que significa red neural. Podemos mencionar algunos ejemplos de ambos casos:
Las redes neuronales son más que otra forma de emular ciertas características propias de los humanos, como la capacidad de memorizar y de asociar hechos. Si se examinan con atención aquellos problemas que no pueden expresarse a través de un algoritmo, se observará que todos ellos tienen una característica en común: la experiencia. (Matich, 2011, p.4)
Las Redes Neuronales Artificiales (RNA) son sistemas de procesamiento de la información cuya estructura y funcionamiento están inspirados en las redes neuronales biológicas. (Mercado, Pedraza, & Martinez, 2015, p. 89)
Una red neuronal artificial es un proceso sólido y paralelamente distribuido con la propensión natural a acumular procedimientos experimentales y hacerlos disponibles para su uso. Se parece al cerebro en dos aspectos, por una parte, la red adquiere conocimientos a través de un proceso de aprendizaje, y por otra las conexiones interneuronales, conocidas como cargas sinápticas presentan una gran solidez de se encargan de almacenar los conocimientos. (Castellano, 2009, p.3)
C$ = 7′$ − 9<+ 9< ( 18)
21
Podemos definir utilizando estas perspectivas a una red neuronal como un sistema de computación inspirada en modelos biológicos compuesto por un gran número de elementos procesales organizados en niveles siguiendo un modelo matemático de procesos interconectados que procesan información mediante estados dinámicos como respuesta a entradas externas.
2.2.4.1Estructura de una red neuronal
Las redes neuronales artificiales son modelos que tratan de emular el comportamiento humano del cerebro, en tal caso realiza una simplificación, averiguando cuáles son los elementos de los que se pude prescindir en el sistema ya sea porque la cantidad de datos disponibles es demasiada o porque es redundante. La elección optima de sus características, sumado a una estructura eficiente es el proceso convencional para construir una red capaz de realizar una tarea en particular.
En todos los modelos de redes existe una parte elemental la cual es generadora de los procesos, en este caso las neuronas, por lo que ya vimos lleva ese nombre debido a que trata de emular el funcionamiento de las mismas
Entonces, se puede considerar que una neurona artificial, es un procesador elemental que recibe una serie de entradas con ponderaciones diferentes que al agregarse producen el nivel de excitación S. La activación de la neurona artificial se produce mediante la aplicación de una función de activación F, generalmente no lineal, a cada nivel de excitación, proporcionando una salida (Correa, 2009, p10).
En general podemos encontrar tres tipos de neuronas:
22
Luego está el procesamiento de estos elementos la cual se da por trasmisión. Emulando la forma biológica del cerebro y en comparación con la sinapsis y neuronas es donde se genera la representación interna de la información inicial, a pesar de ello no se da una relación directa con la información de entrada ni de salida, estos elementos se denominan capas ocultas.
La empresa IBM menciona que “Las capas ocultas de una red neuronal contienen unidades no observables. El valor de cada unidad oculta es alguna función de los predictores; la forma exacta de la función depende en parte del tipo de red.”
Finalizando el proceso se encuentras las unidades de salida las cuales dan la respuesta del sistema.
A. Niveles o capas de neuronas
Matich (2001) Las neuronas dentro de la red se distribuyen formando niveles o capas de un número determinado de neuronas cada una. A partir de su situación dentro de la red, se puede distinguir tres tipos de capas:
• De entrada: La que recibe la información de la parte externa de la red.
• Ocultas: Son internas a la red y no tienen contacto directo con el entorno exterior, pueden estar entre cero y un número elevado.
• De salida: Transfieren información de la red hacia el exterior. (p.2)
Figura 1. Ejemplo de una red Neuronal totalmente conectada
23
B. Estado de activación y función de activación
Adicionalmente al conjunto de unidades, la representación necesita los estados del sistema en un tiempo t, (Bojorquez, 2011), menciona que proporciona el estado de activación actual, F de la neurona i en función de su estado anterior, F − 1 y de su potencial pos sináptico actual. Es decir:
F = G +F − 1 , , ( 20)
Donde:
F = H4 FIJ F6 KFL IH LF HMKJ F
F − 1 = H4 FIJ F HM5JM IH LF HKMJ F
= NJ H 65FL 45 FN 56J F6 KFL
En muchos modelos de Redes neuronales artificiales se considera que el estado actual de la neurona no depende de su estado anterior, sino únicamente del actual, es decir:
F = G + , ( 21)
Donde:
F = H4 FIJ F6 KFL IH LF HMKJ F
= NJ H 65FL 45 FN 56J F6 KFL
24
En ocasiones los algoritmos de aprendizaje requieren que la función de activación cumpla con la condición de ser derivable.
Podemos mencionar las funciones de activación utilizadas con mayor frecuencia, entre estas tenemos
Función de activación escalón.
Función de activación lineal o identidad.
Función de activación lineal-mixta.
Función de activación sigmoidal. (p.6)
C. Función de Salida o transferencia
El componente final que una neurona necesita es la función de salida. El valor total de esta función es la salida de la neurona i (JK ); por lo tanto, la función de salida determina qué valor se transfiere a las neuronas vinculadas. Entonces si la función de activación está por debajo de un umbral determinado, ninguna salida se pasa a la neurona subsiguiente. Se debe considerar que de acuerdo al modelo esta puede ser binaria, el cual es el caso más sencillo, para nuestros modelos utilizaremos redes de una función identidad diferente.
Tenemos que recordar que las neuronas que forman una red neural artificial se da un grupo de conexiones que unen unas con otras. Cada unidad transmite señales a aquellas que están conectadas con su salida. Desde una perspectiva matemática, asociada con cada unidad O hay una función de salida G F , que trasforma el estado que tenga la neurona en una señal de salida, podemos describir esto así:
25 Donde:
P = H4 FIJ F6 KFL IH LF HMKJ F
G +F , = GK 65J IH 4FL5IF H MHLF65J FL H4 FIJ IH LF HKMJ F
Existen cuatro funciones de transferencia que son de uso común las cuales determinan diversos tipos de neuronas:
• Función Escalón
• Función Lineal y Mixta
• Sigmoidal
• Función Gaussiana
De estas podemos decir que la función escalón se utiliza cuando las salidas son binarias, es decir cuando son dos posibles valores. La función lineal equivale a no aplicar una función, esto para comandos que se necesiten puros en la trasmisión de datos, en nuestro caso no será utilizado. Las funciones mixtas y sigmoidales son las más adecuadas cuando se requiere una salida de información una serie analógica. (Hilera & Victor, 2000, p.15)
D. Regla de aprendizaje
26
estas conexiones. En realidad, puede decirse que se aprende modificando los valores de los pesos de la red.
Al igual que el funcionamiento de una red depende del número de neuronas de las que disponga y de cómo estén conectadas entre sí, cada modelo dispone de su o sus propias técnicas de aprendizaje. (Hilera y Victor, 2000, p.24)
2.2.4.2La red backpropagation
Es un método muy utilizado para la formación de redes neuronales artificiales complementado con un método de optimización, tales como descenso de gradiente. El algoritmo se repite en un ciclo de actualización de dos fases, propagación y consideración de los pesos. Cuando un vector de entrada es presentado se propaga hacia adelante a través de la red, capa por capa, hasta que llega a la capa de salida. Los datos de salida se comparan entonces con la salida deseada, esto se da usando una función de pérdida, el valor de error se calcula para cada una de las neuronas en la capa de salida. Los valores de error se propagan entonces hacia atrás, a partir de la salida, EL método de retropropagación utiliza estos valores de error para calcular el gradiente de la función de pérdida con respecto a los pesos de la red.
En la segunda fase, este gradiente alimenta a la red a través de un método de optimización, que a su vez lo utiliza para actualizar los pesos, en un intento de minimizar la función de pérdida.
Se desarrolla el algoritmo Backpropagation como un mecanismo de aprendizaje para perceptrónes multicapas. De alta popularidad para la solución de problemas de clasificación y pronóstico.
27
La importancia de este proceso se basa en que las neuronas de las capas intermedias se organizan de tal manera que las diferentes neuronas aprenden a reconocer diferentes características del espacio de entrada total. Después del entrenamiento, cuando un patrón de entrada arbitraria está presente, que contenga ruido o sea incompleta, las neuronas en la capa oculta de la red responderán con una salida activa, esto claro si la nueva entrada contiene un patrón que se asemeja a una característica que las neuronas individuales han aprendido a reconocer durante su formación.
Este modelo requiere una salida conocida deseado para cada valor de entrada con el fin de calcular el gradiente de la función de pérdida - por lo tanto, generalmente se considera que es un aprendizaje supervisado; Sin embargo, también se utiliza en algunos sin supervisión de redes tales como el modelo de Autoencoders; este es una generalización de la regla delta de capas múltiples redes de alimentación hacia adelante , hecha posible mediante el uso de la regla de la cadena para calcular iterativamente gradientes para cada capa.
A. Ejecución del modelo backpropagation
Hay que recalcar que a diferencia del Perceptrón, la técnica Backpropagation o generalización de la regla delta requiere el uso de neuronas cuya función de activación sea continua, y por tanto diferenciable, esta función en general es del tipo sigmoidal, el recorrido se basa íntegramente en el error y su adecuación a los datos de salida, como ya se mencionó antes la red corre de atrás hacia adelante.
28 Inicialización de los pesos
Se debe iniciar con un patrón de entrada de pesos aleatorios pequeños preferentemente; Q = Q , Q , … Q <, luego se requiere una especificación de la salida deseada: R , R , R< esto de acuerdo al patrón de
salida requerida, en nuestro caso no será binario serán caudales por lo que la nomenclatura será Q.
Calcular la salida actual de la red
Para esto se presentan las entradas a la red que serán SN , SN , SN< y se van calculando las salidas que presenta cada capa hasta llegar a la capa de salida esta será la salida de la red RT , RT , … RT<.
Retropropagación hasta la capa de entrada.
Se genera un error de salida, considerando la Figura 2 el error se encuentra en las flechas amarillas de la capa de salida (output) este sería:
UV = R − RT W -< ( 23)
Figura 2. Funcionamiento general backpropagation.
29 Donde:
UV = UMMJM H LF 6FNF IH 4FL5IF X
R = >FKIFL MHFL
RY = >FKIFL ZH HMFIJ
-< = GK 65J IHL :JIHLJ
Ahora el peso para ese error el cual no brinda la importancia del dato generado, este sería:
QV = QV+ 0 W UV W R ( 24)
Donde:
QV = SH4J IH HMMJMH4 IH 6FNF J6KL F F 4FL5IF
0 = >JHG565H H IH FNMH I5[F\H
UV = UMMJM IH LF 6FNF IH 4FL5IF X1
R = >FKIFL ZH HMFIJ IH LF 6FNF J6KL F
Es en la capa oculta J donde se hace la variación de Precipitaciones mensuales a caudales mensuales, para esta capa tenemos
U = -<W ∑ UV W QV ( 25)
Donde:
U = UMMJM IH LF 6FNF J6KL F
30 UV = UMMJMH4 IH LF4 6FNF4 X
QV = SH4J4 IH LF 6FNF J6KL F F LF 6FNF IH 4FL5IF
Y para finalizar los pesos para los errores de la capa oculta
Q = Q + 0 W U W SN ( 26)
Donde:
Q = SH4J IH LF 6FNF IH 5 ZMH4J F LF 6FNF J6KL F
-< = -K 65J IHL :JIHLJ
SN = SMH65N5 F65J IH 5 ZMH4J
Este proceso se realiza para cada entrada para todas las capas ocultas para cada caudal de salida en una relación matricial.
2.2.5 Tipos de redes neuronales a probarse
Se han considerado aquellos que se probarán en la generación de caudales, tanto en su uso para proyecciones como en su eficiencia para la relación de variables para generar datos.
A. Cascade forward – backpropagation
31
relaciones complejas más rápidamente, a esto se le llama propagación trasera en cascada. (Dheeraj, Anil, & Vinayak, 2013, p. 2)
Podemos también mencionar que la alimentación de esta red es similar a la red neural de propagación posterior, Backpropagation, la actualización de los pesos se puede hacer utilizando un algoritmo de este, recalcando que la principal característica de este método es la relación de cada capa con las anteriores capas de neuronas.
Las redes de conexión en cascada son similares a las redes de feed-forward, pero incluyen una conexión desde la entrada y cada capa anterior a las capas siguientes.
“Al igual que con las redes feed-forward, una red en cascada de dos o más capas puede aprender cualquier relación de entrada-salida finita arbitrariamente bien dada con suficientes neuronas ocultas” (MathWorks, 1994-2018).
Figura 3. Red Cascade forward backpropagation.
32
Podemos describir para el modelo usado que cumple con las características principales del backpropagation considerando la proyección en cascada basada en la siguiente ecuación para la función modelo
-< = ∑_ Q W R − ^ ( 27)
… 16
-< = Q$W 2
T− ^ ( 28)
Donde:
Q = SH4J IH LF 6FNF IH 5 ZMH4J F LF 6FNF J6KL F
-< = -K 65J IHL :JIHLJ
R = >FKIFL ZH HMFIJ H LF 6FNF J6KL F
Q$ = SH4J4 J FLH4
2T = 2F F ZH HMFIF
^ = 6JHG565H H IH 4H4ZJ
Para el coeficiente de sesgo este se alterna en la capa oculta considerando el algoritmo de cascada en el que se trabaja la matriz como un conjunto con intromisión directa a la capa oculta, este coeficiente depende de la función en si por esta relación, por comparación podemos mencionar que si la función se vuelve cero o negativo la activación vuelve al sesgo superior o positivo.
B. Elman backpropagation
33
conexión de realimentación adicional desde la salida de la capa oculta a su entrada.
La ventaja de esta vía de retroalimentación es que permite a la ENN reconocer y generar patrones temporales y patrones espaciales. Esto significa que después del entrenamiento, las interrelaciones entre la entrada actual y los estados internos se procesan para producir la salida y representan la información pasada relevante en los estados internos. Como resultado, la ENN ha sido ampliamente utilizado en diversos campos que incluye la clasificación, predicción e identificación del sistema, etc. Sin embargo, dado que el ENN usualmente utiliza los algoritmos basados en la propagación las diversas señales, se ha demostrado que sufre frecuentemente de una solución problema al mismo tiempo, la eficiencia de la ENN es limitada a un sistema de orden inferior debido a la insuficiente capacidad de memoria cuando la propagación trasera al algoritmo se emplea. Así, han sugerido varios enfoques en la literatura para mejorar el desempeño de la ENN entrenada por BP con simples modificaciones en la estructura de la red, pero no en los algoritmos. Estas modificaciones mejoradas intentan agregar conexiones de retroalimentación al modelo que aumenten la capacidad de la memoria y así acelerar la convergencia y escapar de los mínimos locales. Sin embargo, en la ENN es difícil superar la debilidad o características inherentes de los algoritmos basados en BP la cual sufre de la lentitud de convergencia y se queda fácilmente pegado en resultados locales. (Zhiqiang, Shangce, Gang, Fangjia, & Zheng, 2009, p. 2997).
34
completos de derivativos dinámicos; La red Elman ya no se recomienda excepto con fines históricos y de investigación.
Se debe mencionar que el servidor no considera la inclusión del modelo Backpropagation, esto con la suposición de no librarse de la memoria corta. O las alteraciones de similitudes grandes respecto a los resultados de entrada y salida. (MathWorks, 1994-2018)
Para este modelo podemos considerar la función modelo como:
-< = Q W R W 1 − R W ^ ( 29)
Donde:
Q = SH4J IH LF 6FNF IH 5 ZMH4J F LF 6FNF J6KL F
-< = -K 65J IHL :JIHLJ
R = >FKIFL ZH HMFIJ H LF 6FNF J6KL F Figura 4. Red básica de Elman.
35 ^ = 6JHG565H H IH 4H4ZJ
A diferencia del modelo de cascada la salida tiene relación individual con cada entrada priorizando el orden de ingreso para su análisis, es por tal fin que la proyección es ideal para series históricas, en este caso el valor de sesgo se relaciona con filas anteriores que mejoren el resultado ajustando el peso desde la capa oculta con el coeficiente de aprendizaje, este sesgo es ajustable y se presenta como una constante igual a 1.
C. Feed forward backpropagation
Es un tipo de arquitectura de Red Neural donde las conexiones son "alimentadas hacia delante", es decir, no forman ciclos (como en redes periódicas). El término "forward" también se utiliza cuando se introduce algo en la capa de entrada y se desplaza de la entrada a la ocultada y de la capa oculta a la salida. Los valores son "avanzados".
Ambos usos de la frase "feed forward" se encuentran en un contexto que no tiene nada que ver con la formación en sí de la red.
Backpropagation es un algoritmo de entrenamiento que consta de dos pasos básicamente: Avanzar, los valores, corriéndolos en la red y calcular el error y propagarlo de nuevo a las capas anteriores. Así que, para ser exactos, forward-propagation es parte del algoritmo backforward-propagation, pero viene antes de propagarse de nuevo.
36
asociación de datos entrada/salida. Los pesos sinápticos de las neuronas se ajustan de tal manera que ante cada entrada la red responda de una manera preestablecida.
Esta red posee también funciones de asociación con el problema de aproximación de funciones, referido a datos de entrada y salida que se asimilan con vectores multidimensionales; Pretende que el valor real de la salida generada por la red cuando se estimule con un cierto dato de entrada, se parezca lo más posible al correspondiente dato de salida. La ventaja de usar redes neuronales para este problema de aproximación de funciones es las aproximaciones que nos ofrecen esta serie de modelos, en este caso ligado a otro.
Para este modelo tenemos que la función modelo para una salida seria la siguiente:
-< = Q W 1
1 + Ha ∑cdfgbcdWed _
( 30)
Donde:
Q = SH4J IH LF 6FNF IH 5 ZMH4J F LF 6FNF J6KL F
-< = -K 65J IHL :JIHLJ
7 = 2F J4 IH 5 ZMH4J NJM HKMJ F
2.2.6 Modelos estadísticos para la validación de la simulación
37
A. Raíz del error cuadrático medio (RMSE)
En este modelo se presentan los valores observados frente a los calculados ilustrando así el grado con el que los puntos se distribuyen sobre la recta 1:1 o de ajuste perfecto, para este caso se trabajaron generando datos de verificación en periodos que se muestran en la Tabla 05. El error en las predicciones del modelo se cuantifico de acuerdo a las unidades de la variable calculada es decir en milímetros o metros cúbicos por segundo. Para este se utilizó la ecuación (14).
Ah U = i∑k P − Pj1 ( 31)
Donde:
N= Número de observaciones
P= Valor observado
Pj= Valor generado
B. Eficiencia de Nash-Sutcliffe (NSE)
Es un indicador adimensional de la bondad de ajuste, que relaciones las variables de verificación con las variables generadas por la red neuronal artificial, este es usado comúnmente para la evaluación de modelos hidrológicos.
Caracterizado por su flexibilidad para ser aplicado a diversos tipos de modelos matemáticos. Lujano, et al.(2010).
38
observaciones con el valor promedio entonces NSE = 0. Para este criterio numérico se utilizó la ecuación (15)
1 U = ∑∑kk P − PjP − P ( 32)
Donde:
N= Número de observaciones
P= Valor observado
Pj= Valor generado
P= Promedio de los datos observados
C. Error cuadrático medio normalizado (ECMN)
Este es el error cuadrático medio pero normalizado por la varianza de los datos. Si el resultado es cercano a 0, el ajuste a los valores reales es mayor y en consecuencia el modelo de generación es mejor, contrario a esto mientras el valor se aleje a 0 menos representativo es de los datos analizados.
La ecuación que define este método está dada por:
1 U = − 1 ∑∑kk P − PjP − P ( 33)
Donde:
N, n = Número de observaciones
P= Valor observado
Pj= Valor generado
39 D. Coeficiente de determinación (R2)
Este índice de desempeño, representa la fracción de variación de la variable dependiente explicada por el modelo.
A = 1 − U>h1 ( 34)
En el caso de un predictor perfecto el coeficiente debiera ser 1. Si se obtiene valores cercanos a la unidad se tiene un modelo adecuado. Lujano, et al. (2010)
E. Coeficientes de análisis provenientes del Excel 2016
Se utilizaron dos fórmulas propias del Excel en su versión 2016, las explicaciones a continuación han sido extraídas de la página soporte de Microsoft.
E.1 COEF.DE.CORREL (función COEF.DE.CORREL)
Devuelve el coeficiente de correlación entre dos rangos de celdas definidos por los argumentos matriz1 y matriz2. Use el coeficiente de correlación para determinar la relación entre dos propiedades. Por ejemplo, para examinar la relación entre la temperatura promedio de una localidad y el uso de aire acondicionado.
Se deben mencionar algunas observaciones respecto a esta formula
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Si los argumentos matriz1 y matriz2 tienen un número diferente de puntos de datos, COEF.DE.CORREL devuelve el valor de error #N/A.
40
La ecuación para el coeficiente de correlación es:
>JMMHL 7, C = ∑ − ̅ P − P
m∑ − ̅ ∑ P − P ( 35)
Donde
41
III.
MATERIALES Y METODOS
3.1 Tipo de investigación
La tipificación del estudio de investigación de acuerdo al objetivo es aplicada, así lo menciona Tamayo-Tamayo (2000) señalando que la misma depende de los descubrimientos y aportes de la investigación básica. Se dirige a su aplicación inmediata y no desarrolla teorías.
El diseño de investigación del presente estudio es no experimental de series de tiempo, puesto que no se van a ver afectadas las variables de la investigación, se utilizan los instrumentos o técnicas utilizadas para la realización del mismo, como las Redes Neuronales Artificiales. Así lo menciona Hernández R, et al, 2010. Es aquella investigación en la cual no se manipulan intencionalmente las variables, observando fenómenos tal como se dan en su contexto Población y muestra
3.2 Descripción de la zona de estudio
La investigación se realizó entre las localidades Querococha, pertenecientes al Distrito de Ticapampa, Provincia Recuay, Departamento de Ancash; hidrográficamente es el Río Querococha en la salida de la laguna que posteriormente toma el nombre de Yanayacu, perteneciente a la Sub cuenca Querococha y a la vez a la cuenca del Río Santa.
El área de estudio está localizada entre las longitudes de Greenwich 77°20'45.9" - 77°20'44.3" O y latitudes 9°38'46.53" - 9°38'48.89"
Información básica
3.2.1 Información cartográfica
42 3.2.2 Información hidrológica
Los datos precipitaciones y caudales mensuales de los años del 1953 a 1996 se tomaron de los registros del SENAMHI.
De la base de datos de la Autoridad Nacional del Agua se obtuvo información de las precipitaciones y caudales mensuales, esto referido a la estación Querococha, desde el 2006 a 2015.
En el Anexo 03, 04, 05 y 06, se muestran los datos hidrológicos obtenidos y aplicados en la tesis.
3.2.3 Parámetros morfométricos de la cuenca
Se han enunciado parámetros morfométricos básicos ya que estos en general influyen en la precipitación escorrentía, pero para los fines de la tesis no representan un factor influyente en la variación al solo considerarse la relación precipitación – caudal.
Tabla 1. Características geomorfométricas de la cuenca
DESCRIPCION UNIDAD VALOR
Superficie
Área km2 68.21
Perímetro km 39.11
Ancho promedio km 7.81
Longitud promedio
km 12.95
Cotas
Cota Mínima msnm 3950
Cota Máxima msnm 5300
Centroide
X centroide m 2480008.036
Y centroide m 8927374.282
Z centroide msnm 4723
Índices representativos
Factor de forma 0.603088803
43 3.3 Materiales
• Hojas Bond A4
• Datos hidrológicos de la estación Querococha
• Útiles de escritorio.
• Cámara fotográfica
• Computadora e impresora
• Software (Word, Excel, Matlab, entre otros)
• Plotter. 3.4 Métodos
3.4.1 Trabajo en campo
El trabajo en campo consistió en la visita a la localidad y la inspección de los sectores afectados con la generación de los caudales.
3.4.1.1Recopilación de información
Consistió en recopilar información básica y necesaria relacionada con los parámetros necesarios para la generación de caudales mensuales esta información se obtuvo de libros de hidrología e hidráulica, tesis, tanto nacionales, como internacionales siendo de estas últimas las más influyentes para el proyecto, asi también se aplicao el uso de manuales relacionadas al tema e información proveniente del internet, considerando del mismo rubro el apoyo de profesionales extranjeros.
3.4.2 Trabajo en gabinete
44
Figura 5. Diagrama de flujo de la metodología aplicada
Fuente: Elaboración Propia
3.4.2.1Completación de datos y análisis de consistencia.
45
consistencia y tendencia utilizando el análisis estadístico que se menciona en el inciso 2.2.3; se aplicó el mismo proceso para el segundo grupo de datos de la Unidad de Glaciología.
Con los datos completos y corregidos tanto de precipitación mensual como de caudales mensuales se realizó la agrupación considerando el vacío temporal entre los datos del Senamhi y los datos brindados por la Unidad de Glaciología.
Tabla 2. Registro de datos de acuerdo a los años
Este vacío se completó por correlación con la estación de Recuay para las precipitaciones mensuales y para los caudales mensuales. Los datos se pueden ver en el Anexo 05 y Anexo 06.
3.4.2.2Selección del tipo de red.
A. Agrupación
Para la agrupación de datos se tomó distribuciones de manera aleatoria para precipitación mensual y caudal mensual, esto considerando el espacio completado por correlación, es decir se tomó este vacío de generación real como un parámetro delimitante entre periodos.
Para incluir los valores en el programa de acuerdo al tipo de red, se consideraron matrices con igual número de filas, ya que son 12 meses, pero diferentes en el número de columnas y número de años, la distribución se ve en la Tabla 2.
ENCARGADO
Precipitación
mensual
Caudal
mensual
Senamhi 1953-1996 1953-1996
46
Tabla 3. Matrices de agrupación de datos de acuerdo al tipo de red
Se utilizó el modelo backpropagation tomando tres tipos de red: Cascade-forward backpropagation, Elman backpropagation y Feed-forward backpropagation.
Tabla 4. Distribución de datos respecto a los años.
Tipo de Red Cascade forward Elman Feed forward Grupos
de análisis
Data Precipitación mensual Caudal mensual Precipitación mensual Caudal mensual Precipitación mensual Caudal mensual Grupo A
Imput 12x15 12x33 12x15 12x33 12x15 12x33
Tarjet 12x15 12x33 12x15 12x33 12x15 12x33
Sample 12x7 12x11 12x7 12x11 12x7 12x11
Grupo B
Imput 12x15 12x33 12x15 12x33 12x15 12x33
Tarjet 12x15 12x33 12x15 12x33 12x15 12x33
Sample 12x7 12x11 12x7 12x11 12x7 12x11
Grupo C
Imput 12x54 12x54 12x54
Tarjet 12x54 12x54 12x54
Sample 12x10 12x10 12x10
Grupo
general Proceso Tipo de datos Años Variable
Precipitación
I
Precipitación 1953-1967 Imput Precipitación 1968-1982 Tarjet Precipitación 1983-1989 Sample Precipitación 1990-1996 Verificación
Caudal
Caudal
I
Precipitación 1953-1985 Imput Caudal 1953-1985 Tarjet Precipitación 1986-1996 Sample
Caudal 1986-1996 Verificación
II
47
B. Proceso I. Iteración, verificación y selección de red.
En este proceso se usaron la distribución de datos del Grupo A y el Grupo B mostrados en la Tabla 3 siguiendo la secuencia mostrada en el Anexo 7 en correlación con los años y tipo de variable de ingreso mencionados en la Tabla 4.
Considerando el tipo de datos las estructuras de iteración se armaron en dos grupos principales, precipitaciones mensuales y caudales mensuales, estos a su vez en dos grupos más, A y B, el primero para probar el tipo de entrenamiento más eficiente y el segundo para hacer variaciones en la función de adaptación de aprendizaje, la función de rendimiento y la función de trasferencia, de los 2 tipos de entrenamiento que presentaban una mayor calidad en los coeficientes del análisis estadístico. La estructura base para el grupo A se puede ver en la Tabla 6 así como las estructuras de prueba para la selección de la función de entrenamiento se muestran en la Tabla 5, las iteraciones respecto a la estructura para el grupo B se pueden ver en la Figura 5, considerando que se optó la estructura que se ajustó más en el periodo de validación respecto a los coeficientes de los modelos de validación que se mencionaron el inciso 2.2.6.
Tabla 5. Distribución de datos para la selección del tipo de función de entrenamiento.
Nominación de la red
Función de entrenamiento
Función de adaptación
de aprendizaje
Función de rendimiento
Función de Transferencia
RNA01 TRAINBFG LEARNGD MSE LOGSIG
RNA02 TRAINBR LEARNGD MSE LOGSIG
RNA03 TRAINCGB LEARNGD MSE LOGSIG
48
Tabla 6. Estructura inicial para cada entrenamiento. Grupo A
Para la fase de iteración del Grupo B se partió de las dos funciones de entrenamiento que pasaron con coeficientes aceptables los modelos estadísticos mencionados en el inciso 2.2.6, de estos se formaron siete estructuras individuales por cada función de entrenamiento siguiendo el diagrama de flujo del Anexo 7 así como las iteraciones de la Figura 5 optando siempre por la combinación que afine la salida de datos.
RNA05 TRAINCGP LEARNGD MSE LOGSIG
RNA06 TRAINGD LEARNGD MSE LOGSIG
RNA07 TRAINGDM LEARNGD MSE LOGSIG
RNA08 TRAINGDA LEARNGD MSE LOGSIG
RNA09 TRAINGDX LEARNGD MSE LOGSIG
RNA10 TRAINLM LEARNGD MSE LOGSIG
RNA11 TRAINOSS LEARNGD MSE LOGSIG
RNA12 TRAINR LEARNGD MSE LOGSIG
RNA13 TRAINRP LEARNGD MSE LOGSIG
RNA14 TRAINSCG LEARNGD MSE LOGSIG
Funciones Descripción
Función de adaptación de aprendizaje LEARNGD
Función de rendimiento MSE
Numero de Capas 2
Numero de Neuronas 12
49
Finalmente, se escogió la estructura de red neuronal que presentó coeficientes adecuados respecto a los modelos de estadísticos de validación.
3.4.2.3Aplicación de una estructura funcional para el tipo de red elegida.
La estructura de la red neuronal artificial para los tres tipos de red a probar, consta básicamente por una función de entrenamiento (FE), una función de adaptación de aprendizaje (FA) una función de rendimiento (FR) un numero de capas las cuales para todos los modelos serán 2 un numero de neuronas (NN) y una función de transferencia. Con respecto a la cantidad de neuronas se usó una variación entre 12 y 24 analizando el progreso de acuerdo al periodo de evaluación.
Para que la estructura de una red neuronal sea funcional se debe saber cuál es la organización de estos componentes para genera datos con mayor cercanía a los reales, esta organización ya la tenemos así que pasamos al proceso de aplicación.
Figura 6. Iteración de las estructuras para el Grupo B.
50
A. Proceso II. Generación de caudales.
En este proceso ya se tiene la estructura de red que se adecua a los datos brindados para la generación de caudales primero se cambió la agrupación de ingreso de datos al Grupo C como se muestra en la Tabla 3, y se asoció a la secuencia mostrada en la Figura 6 en correlación con los años y tipo de variable de ingreso mencionados en la Tabla 4.
3.4.2.4Verificación de la relación que existe entre caudales mensuales generado
y los caudales mensuales reales analizando la validez de la generación
Se verificaron los datos generados utilizado una evaluación estadística de los modelos, en los métodos para tal fin tenemos la raíz del error cuadrático medio (RMSE), la Eficiencia de Nash – Sutcliffe (NSE), el error cuadrático medio normalizado (ECMN), el coeficiente de determinación, así como el coeficiente de relación y el R² provenientes del Excel, el programa nos brinda también un coeficiente de relación respecto a la función de rendimiento.
51
Para la fase de verificación en el proceso II, los periodos de verificación fueron desde los años de 2006 a 2016 para la generación de caudales mensuales.
Tabla 7. Periodo de años para la fase de validación
Procesos Tipo de datos Años Variable
Proceso I
Precipitación 1990-1996 Verificación Caudal 1986-1996 Verificación
Proceso II Caudales 2006-2016 Verificación
Figura 7. Diagrama de flujo para el proceso II
52
IV.
RESULTADOS
4.1 Selección del tipo de red que se adecue a los datos generados
La selección del tipo de red se dio luego de haber optado por la mejor estructura y haber obtenido coeficientes altos en la verificación de la validez de la generación de caudales mensuales totales.
4.2 Aplicar una estructura funcional para el tipo de red elegida.
Para este fin se realizó una agrupación de los datos referida en la Tabla 03, en la cual se pueden ver 3 grupos de análisis, el grupo A que se presenta en la etapa inicial para evaluar el tipo de entrenamiento más eficiente, el grupo B para evaluar la función de adaptación de aprendizaje, la función de rendimiento, el número de neuronas y la función de trasferencia. Por ultimo está el grupo C, en el cual se generó los datos de caudales mensuales.
Se realizó este proceso para las precipitaciones y así ver el efecto de la generación y el tipo de estructura.
Se considera la generación del modelo más importante siguiendo el esquema de la Figura 8, para la presentación de los resultados.
Figura 8. Distribución de grupos para cada tipo de red
53
4.2.1 Elman backpropagation, Precipitaciones mensuales
A.Precipitaciones mensuales grupo A.
Los procesos de iteración se encuentran explicados en el inciso 3.5.2.2 Los entrenamientos utilizados están en el orden mostrado en la Tabla 5. La estructura inicial utilizada se muestra en la Tabla 6, y la generación se dio siguiendo el Diagrama de flujo adjuntado en el Anexo 7. Los datos generados para cada red están representados en la Figura 9, los datos específicos de la red más eficiente se presentan en la Tabla 8 y se grafican en la Figura 10.
0.00 50.00 100.00 150.00 200.00 250.00 300.00 350.00 1 9 9 0 :0 1 1 9 9 0 :0 5 1 9 9 0 :0 9 1 9 9 1 :0 1 1 9 9 1 :0 5 1 9 9 1 :0 9 1 9 9 2 :0 1 1 9 9 2 :0 5 1 9 9 2 :0 9 1 9 9 3 :0 1 1 9 9 3 :0 5 1 9 9 3 :0 9 1 9 9 4 :0 1 1 9 9 4 :0 5 1 9 9 4 :0 9 1 9 9 5 :0 1 1 9 9 5 :0 5 1 9 9 5 :0 9 1 9 9 6 :0 1 1 9 9 6 :0 5 1 9 9 6 :0 9 P re ci p it a ci o n e s ( m 3 /s e g ) Periodo (años) REAL RNA01 RNA02 RNA03 RNA04 RNA05 RNA06 RNA07 RNA08 RNA09 RNA10 RNA11 RNA12 RNA13 RNA14
Figura 9. Generación de datos de precipitaciones mensuales modelo Elman backpropagation, Grupo A.
54
Tabla 8. Datos generados por la RNA N°02. Precipitaciones mensuales
1990 1991 1992 1993 1994 1995 1996
167.9287 167.9292 167.9227 167.9267 167.9332 167.9281 167.9329 186.7906 186.7907 186.7896 186.7903 186.7914 186.7905 186.7913 175.2679 175.2681 175.2655 175.2671 175.2697 175.2677 175.2695 84.6121 84.6121 84.6123 84.6122 84.6120 84.6122 84.6120 43.5363 43.5364 43.5353 43.5360 43.5371 43.5362 43.5370 14.4877 14.4877 14.4876 14.4877 14.4878 14.4877 14.4878 11.0715 11.0715 11.0714 11.0715 11.0715 11.0715 11.0715 25.2155 25.2155 25.2150 25.2153 25.2158 25.2154 25.2158 53.4423 53.4426 53.4392 53.4413 53.4448 53.4421 53.4446 88.5864 88.5868 88.5821 88.5850 88.5897 88.5860 88.5895 125.6705 125.6712 125.6630 125.6681 125.6763 125.6698 125.6759 145.4658 145.4662 145.4608 145.4642 145.4695 145.4653 145.4692
0.00 50.00 100.00 150.00 200.00 250.00 300.00 350.00 1 9 9 0 :0 1 1 9 9 0 :0 4 1 9 9 0 :0 7 1 9 9 0 :1 0 1 9 9 1 :0 1 1 9 9 1 :0 4 1 9 9 1 :0 7 1 9 9 1 :1 0 1 9 9 2 :0 1 1 9 9 2 :0 4 1 9 9 2 :0 7 1 9 9 2 :1 0 1 9 9 3 :0 1 1 9 9 3 :0 4 1 9 9 3 :0 7 1 9 9 3 :1 0 1 9 9 4 :0 1 1 9 9 4 :0 4 1 9 9 4 :0 7 1 9 9 4 :1 0 1 9 9 5 :0 1 1 9 9 5 :0 4 1 9 9 5 :0 7 1 9 9 5 :1 0 1 9 9 6 :0 1 1 9 9 6 :0 4 1 9 9 6 :0 7 1 9 9 6 :1 0 P re ci p it a ci o n e s (m m ) Años:meses REAL RNA02
Figura 10. Generación de precipitaciones Red Neuronal Artificial N° 02.
55 B.Precipitaciones mensuales grupo B.
Los procesos de iteración se encuentran explicados en el inciso 3.5.2.2 Los entrenamientos utilizados están en el orden mostrado en la Tabla 5. La estructura inicial utilizada para cada red se muestra en la Tabla 9, y la generación se dio siguiendo el Diagrama de flujo adjuntado en el Anexo 7. Los datos generados para cada red están representados en la Figura 11, los datos específicos de la red más eficiente se presentan en la Tabla 10 y se grafican en la Figura 12.
Tabla 9. Estructura de las redes neuronales, Elman backpropagation generación de precipitaciones Grupo B.
Nominación de la red
Función de entrenamiento
Función de adaptación de aprendizaje
Función de rendimiento
Numero de Neuronas
Función de Transferencia
RNA02_1
T
R
A
IN
B
R
LEARNGDM MSE 12 LOGSIG
RNA02_2 LEARNGDM MSEREG 12 LOGSIG
RNA02_3 LEARNGDM MSEREG 24 LOGSIG
RNA02_4 LEARNGDM MSEREG 24 PURELIN
RNA02_5 LEARNGDM MSEREG 24 TANSIG
RNA02_6 LEARNGDM SSE 24 PURELIN
RNA02_7 LEARNGDM SSE 24 LOGSIG
RNA14_1
T
R
A
IN
S
C
G
LEARNGDM MSE 12 LOGSIG
RNA14_2 LEARNGDM MSEREG 12 LOGSIG
RNA14_3 LEARNGDM MSE 24 LOGSIG
RNA14_4 LEARNGDM MSE 12 PURELIN
RNA14_5 LEARNGDM MSE 12 TANSIG
RNA14_6 LEARNGDM SSE 12 PURELIN