DETECCION DE DEFECTOS MEDIANTE EL USO DE REDES NEURONALES ARTIFICIALES Y OPTIMIZACION DE RESULTADOS CON LOGICA NEURO DIFUSA

(1)

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA

SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN

“DETECCIÓN DE DEFECTOS MEDIANTE EL

USO DE REDES NEURONALES

ARTIFICIALES Y OPTIMIZACIÓN DE

RESULTADOS CON LÓGICA NEURO

DIFUSA”

T E S I S

QUE PARA OBTENER EL GRADO DE

:

DOCTOR EN CIENCIAS

CON LA ESPECIALIDAD EN

INGENIERÍA MECÁNICA

P R E S E N T A

ALEJANDRO LUNA AVILÉS

DIRECTOR:

DR. LUIS HÉCTOR HERNÁNDEZ GÓMEZ

(2)

INSTITUTO

POLITECNICO

NACIONA

L

SECRETARiA DE INVESTIGACION Y POSGRADO

E n la Ciu d a d d e M e x ic o, D. F. s ie n d o la s 12 : 0 0 h o r a s d e l d ia 2 4 de l m e s de N ov ie m b r e del 2 00 9 se r e u n ie r o n lo s m ie m b r o s d e la C o m is i6n R e vis o r a d e T e s is d e s ignada

p o r el Cole gio de P r o f e s o r e s d e E s t u d io s d e P o s g r a d o e In v e s t ig a c i6 n d e E. S. I. M. E.

p a ra e xa m in a r la t e s is d e t it u la d a:

"DETECCION DE DEFECTOS MEDIANTE EL

usa

DE REDES NEURONALES

ARTIFICIALES Y OPTIMIZACION DE RESULTADOS CON LOGICA NEURO DIFUSA". Pre s en t ad a p o r e l a lu m n o :

LUNA Ap ellido p aterno

AVILES

Apellido m a t erno

C on r e g ist r o:

DOCTOR EN CIENCIAS

D e s p u es d e in terca m b ia r o p in io n e s lo s m ie m bro s d e laC o m is i6 n m a n if e s t aro n SU APROBACION DE LA TESIS_, _{e n v}_i_{r t u d} _{d e q u e} _{s a t}_i_{s f a c e} _{lo s r e q u is it o s} _{s e r ia la d o s} _{p o r la s d is p o s}_i_{c io n e s} _{r e g la m e n t a r}_i_a_s

(3)

(4)

_{Agradecimientos.}

AGRADECIMIENTOS.

Al Instituto Politécnico Nacional – Sección de Estudios de Posgrado e Investigación – Escuela Superior de Ingeniería Mecánica y Eléctrica.

Por abrirme sus puertas y confiar en mi trabajo como alumno de esta honorable institución.

Al Doctor Luis Héctor Hernández Gómez.

Por su apoyo, ayuda, amistad y confianza durante la realización de mis estudios y la elaboración del presente trabajo.

Al Consejo Nacional de Ciencia y Tecnología.

Por el apoyo brindado durante la realización de mis estudios.

A Ramiro Luna Martínez.

Mi Padre, por estar siempre conmigo, brindarme su apoyo incondicional, ayuda y consejo.

A Natividad Avilés Cerón.

Mi Madre, por sus cuidados, cariño y consejos.

A María del Rocío García Gómez.

Mi Esposa, por su ayuda, cariño, amor y paciencia en todo momento.

A mi familia.

Por ser un soporte fundamental.

(5)

DETECCIÓN DE DEFECTOS MEDIANTE EL USO DE REDES NEURONALES ARTIFICIALES Y OPTIMIZACIÓN DE RESULTADOS CON LÓGICA NEURO DIFUSA

i

RESUMEN.

Se plantea una metodología para la localización y clasificación de defectos a través de frecuencias naturales y análisis inversos con ayuda de las redes neuronales artificiales (RNA) y un programa de simulación numérica (ANSYS). Posteriormente, se desarrolla la optimización de los resultados obtenidos. Además, se establece la semejanza entre las redes neuronales biológicas y las artificiales, procurando resaltar los términos que son compartidos y sus significados. Se muestran algunas aplicaciones de las RNA en diferentes campos de la ciencia, aplicaciones industriales, detección de defectos a través de técnicas experimentales (no destructivas) y numéricas. Se establecen las bases matemáticas de las redes neuronales, con particular énfasis en las de retropropagación. Además, se muestran los teoremas y axiomas matemáticos de los sistemas difusos y posteriormente los neuro difusos. Se establece la importancia y características de los análisis a través de las frecuencias naturales. Por último se muestran los casos de estudio planteados y los resultados obtenidos.

Los casos de estudio están desarrollados en el dominio de la frecuencia. Una parte innovadora del presente trabajo es el uso de sistemas neuro difusos que permiten optimizar los resultados obtenidos a partir de la simulación numérica con las redes neuronales artificiales de retropropagación.

El primer caso de estudio (únicamente localización) se desarrolla con el siguiente procedimiento: Se simula el modelo físico con el programa ANSYS de elementos finitos, obteniéndose un pseudo código y posteriormente, con una instrucción preprogramada, se estudian doscientos casos. En cada uno de ellos se evalúan las cinco primeras frecuencias naturales de la placa con un solo defecto postulado a la vez. La información sintética obtenida integra una base de datos y se divide en dos partes. La primera consta de ciento cincuenta casos, que se emplea como patrón de referencia para entrenar una red neuronal de varias capas con el algoritmo de retropropagación, cuyas principales características son: red robusta poco sensible al ruido, se utiliza un arreglo con la siguiente estructura 5-25-2 de neuronas por capa. La información de entrada son las cinco primeras frecuencias, los datos de salida son las coordenadas de los defectos. La segunda parte consta de cincuenta casos que se sirven para verificar la precisión de la red neuronal propuesta, con la que se estima la localización de los defectos. Los resultados obtenidos se analizan estadísticamente. En general no muestran una dispersión grande. El procedimiento descrito con anterioridad es sencillo de implementar y permite una localización rápida de defectos. En forma general y en términos estadísticos, hay un buen grado de precisión en la localización de los defectos.

(6)

(7)

iii

ABSTRACT.

(8)

vi

ÍNDICE.

SIP 14. i

Derechos. ii

Resumen. iv

Abstract. v

Índice. vi

Índice de figuras. viii

Índice de tablas. xi

Justificación. xiv

Hipótesis. xvi

Objetivo general. xvii

Objetivos particulares. xviii

Introducción. xix

Capítulo I. Antecedentes Generales sobre las Redes Neuronales Artificiales.

1.1. Semejanza Biológico – Numérica. 4

1.2. Redes Neuronales Artificiales, Lógica Difusa y Lógica

Neuro Difusa. 8

1.3. Aplicación de las Redes Neuronales Artificiales en

problemas de ingeniería. 11

1.4. Antecedentes en la Localización y Clasificación de

Defectos Utilizando Redes Neuronales Artificiales. 15 1.4.1. Localización y Clasificación de Defectos: Redes

Neuronales Artificiales – Frecuencias Naturales. 17 1.5 Descripción de los Sistemas de Digitalización de Datos. 18

1.6. Planteamiento del Caso de Estudio. 21

1.7. Sumario. 23

1.8. Referencias. 23

Capítulo II. Fundamentos Teóricos sobre Redes Neuronales Artificiales de Retropropagación.

2.1. Formulación matemática. 29

2.2. Métodos de aprendizaje de las Redes Neuronales

Artificiales. 32

2.3. Características de las Redes Neuronales Artificiales. 33 2.4. Paradigmas de las Redes Neuronales Artificiales. 34

2.5. Algoritmo de retropropagación. 36

2.5.1. Cálculo del gradiente para una red neuronal con una capa oculta.

39

2.5.2. Funciones de transferencia. 41

2.6. Sumario. 43

(9)

vii

Capítulo III. Fundamentos Teóricos sobre Lógica Neuro - Difusa.

3.1. Introducción a la lógica difusa y neuro difusa. 45 3.2. Análisis bibliográfico sobre el uso de la lógica Neuro –

Difusa. 46

3.3. Fundamentos teóricos de la lógica difusa. 47 3.4. Fundamentos teóricos de lógica neuro difusa. 52

3.5. Sumario. 55

Capítulo IV. Análisis Dinámicos.

4.1. Consideraciones de modelos de sistemas dinámicos. 58

4.2. Importancia del análisis modal. 60

4.3. Ecuación del movimiento. 61

4.4. Formulación matemática para el cálculo de frecuencias

naturales en una viga en cantiléver. 64

4.5. Sumario. 66

Capítulo V. Consideraciones para el Modelo Experimental.

5.1. Consideraciones. 68

5.2. Comparación de valores. 76

5.3. Sumario. 79

Capítulo VI. Aplicación de las Redes Neuronales Artificiales a la Detección y Clasificación de Defectos.

6.1. Resumen de la Metodología y Casos de Estudio. 81

6.2. Localización Caso A. 83

6.3. Localización y Clasificación Caso B. 85

6.4. Localización, Clasificación y Análisis de Ruido Caso C. 87

6.5. Localización y Clasificación Caso D. 90

6.6. Sumario 93

6.7. Referencias 93

Capítulo VII. Evaluación de Resultados.

7.1. Resumen de Resultados. 96

7.2. Breve Descripción de la Técnica Estadística. 97

7.3. Resultados Obtenidos del Caso A. 98

7.3.1. Placa sin muesca. 99

7.3.2. Placa con muesca. 102

7.4. Resultados Obtenidos del Caso B. 104

7.4.1. Barra plana. 104

7.4.2. Barra con muesca. 112

(10)

viii

7.5.1. Ruido artificial. 129

7.6. Comparación de casos de estudio A, B y C. 132

7.7. Resultados Obtenidos del Caso D. 133

7.7.1. Barra plana. 133

7.7.2. Barra con muesca. 140

7.8 Sumario. 147

7.9 Referencias. 147

Conclusiones. 148

Recomendaciones. 151

Artículo aceptado. 153

Anexos. 160

ÍNDICE DE FIGURAS.

Figura 1.1. Neurona biológica con sus componentes. 4 Figura 1.2. Esquema de una Red Neuronal Artificial (RNA). 7

Figura 2.1. Modelo de una neurona básica. 30

Figura 2.2. Trabajo desarrollado por una neurona. 30

Figura 2.3. Funciones no lineales típicas. 31

Figura 2.4. Esquema del funcionamiento del algoritmo de retropropagación.

37

Figura 2.5. Funciones de transferencia. 42

Figura 3.1. Transición gradual entre conjuntos. 48

Figura 3.2. Gráfica de la función GBELLMF. 52

Figura 3.3. Arquitectura de un sistema neuro difuso. 53 Figura 4.1. Modelo dinámico de un grado de libertad. 58 Figura 4.2. Modelo típico de un sistema con un grado de libertad. 61 Figura 4.3. Descripción física de los conceptos de vibración. 64 Figura 5.1. Frecuencia típica de algunos tipos de sujeción (a) tipo

de sujeción, (b) frecuencia 73

Figura 5.2 Diagrama del espécimen experimental. 76

Figura 5.3 Modelo de elementos finitos. 77

Figura 5.4 Montaje experimental. 79

Figura 6.1. Resumen de la metodología propuesta. 81

Figura 6.2. Resumen de los casos propuestos. 82

Figura 6.3. Resumen de casos y defectos considerados. 82 Figura 6.4. Esquema de las barras analizadas: (A) barra plana

sencilla, (B) barra plana con muesca. 83

Figura 6.5. Modelo de simulación numérica, con detalle del defecto

postulado y condiciones de frontera. 84

Figura 6.6. Dimensiones de la barra analizada (A) Barra plana; (B)

Barra con muesca. 86

(11)

ix Barra plana; (B) Barra con muesca.

Figura 6.8. Dimensiones y características del modelo utilizado. 88 Figura 6.9. Red de elementos finitos del modelo de simulación

numérica. 88

Figura 6.10. Dimensiones de la barra analizada (A) Barra plana;

(B) Barra con muesca. 91

Figura 6.11. Malla de elementos finitos de las barras analizadas

(A) Barra plana; (B) Barra con muesca. 92

Figura 7.1. Histograma de residuos: placa sin muesca coordenada

X. 100

Figura 7.2. Errores absolutos: placa sin muesca coordenada X. 100 Figura 7.3. Histograma de residuos: placa sin muesca coordenada

Y. 101

Figura 7.4. Errores absolutos: placa sin muesca coordenada Y. 101 Figura 7.5. Histograma de residuos: placa con muesca coordenada

X. 102

Figura 7.6. Errores absolutos: placa con muesca coordenada X. 103 Figura 7.7. Histograma de residuos: placa con muesca coordenada

Y. 104

Figura 7.8. Errores absolutos: placa con muesca coordenada Y. 104 Figura 7.9. Comparación de 10 puntos tomados al azar del

conjunto de datos resultantes (barra plana). 105

Figura 7.10. Clasificación de los defectos (barra plana). 106 Figura 7.11. Error absoluto de diez puntos tomados al azar (barra

plana). 107

Figura 7.12. Comparación de 10 puntos tomados al azar del

conjunto de datos resultantes (barra con muesca). 108 Figura 7.13. Clasificación de los defectos (barra con muesca). 108 Figura 7.14. Error absoluto de diez puntos tomados al azar (barra

con muesca). 109

Figura 7.15. Histograma de residuos: localización con análisis

neuro difuso barra plana coordenada Y. 110

Figura 7.16. Histograma de residuos: clasificación con RNA barra

plana. 111

Figura 7.17. Histograma de residuos: clasificación con análisis

neuro difuso barra plana. 111

con muesca). 114

Figura 7.21. Histograma de residuos: localización con RNA barra

con muesca coordenada X. 115

neuro difuso barra con muesca coordenada X. 115

(12)

x con muesca coordenada Y.

neuro difuso barra con muesca coordenada Y. 117

con muesca. 118

neuro difuso barra con muesca. 118

Figura 7.27. Comparación de diez puntos tomados al azar para las

coordenadas X, Y. 120

Figura 7.28. Clasificación de defectos. 120

Figura 7.29. Error absoluto de diez puntos tomados al azar. 121 Figura 7.30. Histograma de residuos: localización con RNA placa

con dos muescas coordenada X. 122

neuro difuso placa con dos muescas coordenada X. 123 Figura 7.32. Histograma de residuos: localización con RNA placa

con dos muescas coordenada Y. 124

Figura 7.32A. Histograma de residuos: localización con análisis

neuro difuso placa con dos muescas coordenada Y. 124 Figura 7.33. Histograma de residuos: clasificación con RNA placa

con dos muescas. 125

neuro difuso placa sin muesca. 126

Figura 7.35. Histograma de residuos: localización con RNA placa

con dos muescas coordenada X. 127

neuro difuso placa con dos muescas coordenada X. 128 Figura 7.37. Histograma de residuos: localización con RNA placa

con dos muescas coordenada Y. 129

neuro difuso placa con dos muescas coordenada Y. 130 Figura 7.39. Histograma de residuos: clasificación con RNA placa

con dos muescas. 131

neuro difuso placa sin muesca. 131

conjunto de datos resultantes (barra plana). 134

Figura 7.42. Clasificación de los defectos (barra plana). 134 Figura 7.43. Error absoluto de diez puntos tomados al azar (barra

plana). 135

plana coordenada X. 136

neuro difuso barra plana coordenada X. 137

(13)

xi Figura 7.47. Histograma de residuos: localización con análisis

neuro difuso barra plana coordenada Y. 138

plana. 139

neuro difuso barra plana. 140

con muesca). 142

con muesca coordenada X. 143

neuro difuso barra con muesca coordenada X. 144

con muesca coordenada Y. 145

neuro difuso barra con muesca coordenada Y. 145

con muesca. 146

neuro difuso barra con muesca. 147

ÍNDICE DE TABLAS.

Tabla 1.1. Elementos constituyentes de la computación blanda. 9 Tabla 1.2. Desarrollo histórico de la computación blanda. 10 Tabla 3.1. Identidades básicas en operaciones de conjuntos. 49

Tabla 5.1 Valores de la constante C 78

Tabla 7.1. ANOVA unidireccional placa sin muesca: Coordenada

simulada en el eje X contra la real. 99

Tabla 7.2. ANOVA unidireccional placa sin muesca: Coordenada

simulada en el eje Y contra la real. 100

Tabla 7.3. ANOVA unidireccional placa con muesca: Coordenada

simulada en el eje X contra la real. 102

Tabla 7.4. ANOVA unidireccional placa con muesca: Coordenada

simulada en el eje Y contra la real. 103

Tabla 7.5. ANOVA unidireccional barra plana: Coordenada

simulada, con la RNA, en el eje X contra la real. 107 Tabla 7.6. ANOVA unidireccional barra plana: Coordenada

simulada, con el análisis neuro difuso, en el eje X contra la real. 108 Tabla 7.7. ANOVA unidireccional barra plana: Coordenada

simulada, con la RNA, en el eje Y contra la real. 109 Tabla 7.8. ANOVA unidireccional barra plana: Coordenada

(14)

xii Tabla 7.9. ANOVA unidireccional barra plana: Coordenada

simulada, con la RNA, para la clasificación. 110

simulada, con el análisis neuro difuso, para la clasificación. 111 Tabla 7.11. ANOVA unidireccional barra con muesca: Coordenada

simulada, con la RNA, en el eje X contra la real. 114 Tabla 7.12. ANOVA unidireccional barra con muesca: Coordenada

simulada, con el análisis neuro difuso, en el eje X contra la real. 115 Tabla 7.13. ANOVA unidireccional barra con muesca: Coordenada

simulada, con la RNA, en el eje Y contra la real. 116 Tabla 7.14. ANOVA unidireccional barra con muesca: Coordenada

simulada, con el análisis neuro difuso, en el eje Y contra la real. 116 Tabla 7.15. ANOVA unidireccional barra con muesca: Coordenada

Tabla 7.16. ANOVA unidireccional barra con muesca: Coordenada

simulada, con el análisis neuro difuso, para la clasificación. 118 Tabla 7.17. Análisis de errores absolutos coordenada X, Y. 120 Tabla 7.18. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con la RNA, en el eje X contra la real. 121 Tabla 7.19. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con el análisis neuro difuso, en el eje X contra la real.

122

Tabla 7.20. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con la RNA, en el eje Y contra la real. 123 Tabla 7.21. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con el análisis neuro difuso, en el eje Y contra la real.

124

Coordenada simulada, con la RNA, para la clasificación. 125 Tabla 7.23. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con el análisis neuro difuso, para la clasificación.

126

Coordenada simulada, con la RNA, en el eje X contra la real. 127 Tabla 7.25. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con el análisis neuro difuso, en el eje X contra la real.

128

Coordenada simulada, con la RNA, en el eje Y contra la real. 128 Tabla 7.27. ANOVA unidireccional placa con dos muescas:

Coordenada simulada, con el análisis neuro difuso, en el eje Y contra la real.

129

Coordenada simulada, con la RNA, para la clasificación. 130 Tabla 7.29. ANOVA unidireccional placa con dos muescas:

(15)

xiii clasificación.

Tabla 7.30. Comparativo de datos localizados y clasificados (±5%

de error). 132

Tabla 7.31. Comparativo de datos localizados y clasificados con

perturbación entre 0 y 2% (Rango de precisión ±10%). 133 Tabla 7.32. ANOVA unidireccional barra plana: Coordenada

simulada, con la RNA, en el eje X contra la real. 136 Tabla 7.33. ANOVA unidireccional barra plana: Coordenada

simulada, con el análisis neuro difuso, en el eje X contra la real. 136 Tabla 7.34. ANOVA unidireccional barra plana: Coordenada

simulada, con la RNA, en el eje Y contra la real. 137 Tabla 7.35. ANOVA unidireccional barra plana: Coordenada

simulada, con el análisis neuro difuso, en el eje Y contra la real. 138 Tabla 7.36. ANOVA unidireccional barra plana: Coordenada

simulada, con el análisis neuro difuso, para la clasificación. 139 Tabla 7.38. ANOVA unidireccional barra con muesca: Coordenada

simulada, con la RNA, en el eje X contra la real. 143 Tabla 7.39. ANOVA unidireccional barra con muesca: Coordenada

simulada, con el análisis neuro difuso, en el eje X contra la real. 143 Tabla 7.40. ANOVA unidireccional barra con muesca: Coordenada

simulada, con la RNA, en el eje Y contra la real. 144 Tabla 7.41. ANOVA unidireccional barra con muesca: Coordenada

simulada, con el análisis neuro difuso, en el eje Y contra la real. 145 Tabla 7.42. ANOVA unidireccional barra con muesca: Coordenada

Tabla 7.43. ANOVA unidireccional barra con muesca: Coordenada

(16)

xi

JUSTIFICACIÓN.

Los avances en las ciencias computacionales, han permitido a la humanidad desarrollarse en áreas del conocimiento que antes se pensaban inalcanzables, nuevas técnicas y herramientas numéricas permiten desarrollos rápidos, precisos y confiables.

Bajo este esquema se pueden enunciar técnicas como el Método del Elemento Finito, Método de las Diferencias Finitas, Método del Elemento Frontera, Método del Elemento Banda, entre otros; permitiendo desarrollar distintas aplicaciones en diversos campos de la física a través de la solución de ecuaciones diferenciales en derivadas parciales, con condiciones iniciales y finales definidas.

Es así que de manera importante, los programas centralizados como ANSYS, CATIA, NASTRAM, UNIGRAPHICS, etc. han ayudado en la labor antes mencionada. Sin embargo, tienen restricciones debido a que siguen reglas estrictas que no se pueden omitir, además en ocasiones los propios analistas no entienden la relación que existe entre un fenómeno físico y un conjunto de variables asociadas a él. Los métodos mencionados con anterioridad siguen una estructura lógica, ordenada y secuencial (dada por el programador) para alcanzar sus fines. Sin embargo, la información que proviene del mundo real es masiva, redundante e imprecisa. El cerebro, es capaz de percibir y recibir toda esa información a través de los órganos sensoriales, analizarla, procesarla y emitir una respuesta o solución a partir de ella. Tomando en consideración esa capacidad los investigadores se han dado a la tarea de desarrollar programas de cálculo que emulen ese proceso descentralizado, paralelo, no lineal, auto-organizado, etc. para resolver problemas.

Unas décadas atrás, se comenzó el desarrollo de las Redes Neuronales Artificiales (RNA) y su aplicación en diferentes áreas del conocimiento se ha incrementado con el paso de los años, como ejemplo se puede citar la detección de defectos, predicción de características geológicas, control de autómatas, diseño de sistemas expertos, por mencionar algunos de ellos. Las RNA, como los perceptrones, al contrario de otros métodos numéricos, no utilizan algoritmos de cálculo secuenciales. Sino que aprenden o se auto-organizan a través de los datos que se le suministran y son capaces de emitir una respuesta o establecer un patrón de análisis, con o sin ayuda de un

algoritmo supervisor llamado “maestro”.

(17)

xii por entender la forma en que están relacionados los defectos, fallas o fracturas con el medio ambiente y todos los factores que en un momento dado pueden estar involucrados.

Una de las técnicas que se ha desarrollado para lograr la comprensión antes mencionada son los análisis inversos que de manera general plantean el uso de la respuesta mecánica de un cuerpo para llegar a las características físicas que ocasionaron ese comportamiento.

(18)

xiii

HIPÓTESIS.

(19)

xiv

OBJETIVO GENERAL.

(20)

xv

OBJETIVOS PARTICULARES.

Generar bases de datos sintéticas, que contienen los datos de las cinco primeras frecuencias naturales, con ayuda de ANSYS.

Crear bases de datos hibridas con ayuda de sistemas de adquisición de datos y ANSYS.

Observar los elementos que constituyen el diseño de una RNA de retropropagación, dentro de MATLAB, para seleccionar los que mejor se adecuen a los problemas planteados.

Analizar la cantidad de datos necesaria para lograr la correcta localización de defectos en barras con y sin muesca.

Definir los parámetros de los análisis estadísticos de varianza para establecer el nivel de error obtenido en la localización de defectos a través de RNA de retropropagación.

Localizar y clasificar defectos en barras con y sin muesca a través de RNA de retropropagación y establecer el nivel de error a través del contraste directo de valores.

Optimizar los datos de localización y clasificación obtenidos de la simulación con RNA de retropropagación a través de un análisis neuro difuso (ANFIS).

(21)

xvi

INTRODUCCIÓN.

Los análisis directos, entre los que se pueden mencionar métodos numéricos como el método del elemento finito, el método del elemento frontera, el método del elemento banda, el método de las diferencias finitas, etc. en la solución de problemas de ingeniería juegan un papel protagónico, ya que ofrecen una alternativa viable en aquellos casos que son complejos o requieren para su solución una cantidad de ecuaciones que no es posible manejar con métodos analíticos convencionales.

Por otra parte se tienen los análisis inversos, que implementan el uso de técnicas como las redes neuronales artificiales, los algoritmos genéticos, la lógica difusa, la lógica neuro difusa, etc. Su propósito final es el mismo que los directos, es decir nos permiten encontrar soluciones a problemas complejos.

En la actualidad dichos análisis se pueden clasificar en: (1) estructurados, como el método del elemento finito, y (2) los que asemejan a los procesos biológicos observados en la naturaleza, como las redes neuronales artificiales, en ambos casos se utilizan secuencias denominadas algoritmos de solución.

En el primer caso, los programas contienen una serie de instrucciones secuenciales, es decir, siempre se sigue el mismo proceso para obtener la solución del problema. En este caso, los programas utilizados son rígidos y no permiten variaciones en el proceso de cálculo. Las fórmulas utilizadas están perfectamente definidas y siempre se resuelven una a consecución de la otra sin crear un vínculo o interactuar entre ellas. Si falta algún dato o es inexistente, no se puede obtener la solución. En este contexto se encuentran, entre otros, el método de las diferencias finitas, el método del elemento finito, el método del elemento frontera, etc.

En el segundo caso, los programas son más flexibles y pueden asimilar diversas variantes. Se retroalimentan y generan un “auto aprendizaje” con los datos que se les suministran. Las secuencias de ecuaciones se desarrollan en forma paralela y permiten ajustes durante el proceso, no necesitan todos los datos del problema o que estén perfectamente acotados para llegar a una solución. En este enfoque se encuentran las redes neuronales artificiales, los algoritmos genéticos, los sistemas difusos, sistemas neuro difusos, entre otros. Otras ventajas son que no requieren un elevado número de recursos de cómputo, obteniéndose resultados rápidamente.

(22)

xvii se puede encontrar inmerso, la interrelación con los operarios u otras maquinas, herramientas o dispositivos, etc. Por lo que depende de la experiencia del analista seleccionar las variables más representativas o de interés para un estudio en particular.

Tomando en consideración lo anterior, es claro que un algoritmo rígido, como sucede con el método del elemento finito no puede por sí solo, desarrollar un análisis inverso, por el simple hecho de que las variables inmersas en el proceso no están totalmente definidas. Sin embargo, se encuentra involucrado en el proceso. Debido a que a través de él se puede construir la base de datos sintética y con ayuda de los programas flexibles por ejemplo las redes neuronales artificiales permite encontrar la solución completa al problema planteado.

El presente desarrollo se centra en el uso de redes neuronales artificiales, en específico el paradigma de retropropagación, y el empleo de la técnica de análisis inversos para proponer una metodología en la localización y clasificación de defectos a través del uso de frecuencias naturales, que se evalúan a través del método del elemento finito. Una vez obtenidos los resultados, se implementa la optimización de los mismos a través de la aplicación de análisis neuro difusos y se evalúa el nivel de error empleando dos técnicas.

A continuación se describe brevemente el contenido de cada capítulo.

Capítulo 1. Se establece la semejanza biológica numérica de los modelos de redes neuronales. Se enuncian diversas aplicaciones, a través de la revisión bibliográfica, para la solución de problemas de ingeniería. Se desarrolla la misma revisión, en lo referente a la localización y clasificación de defectos. Además, se muestra el uso de los análisis neuro difusos en diferentes campos de la ciencia. Al final se plantean los casos de estudio a resolver.

Capítulo 2. Se muestran los fundamentos teóricos y matemáticos referentes a las redes neuronales artificiales. Se definen algunas técnicas de aprendizaje, paradigmas y características. A demás, se hace particular énfasis en la técnica de retropropagación.

Capítulo 3. Se definen los fundamentos teóricos y matemáticos sobre la lógica difusa y posteriormente la neuro difusa. Se muestran algunas funciones de membrecía relacionadas con el problema planteado.

(23)

xviii Capítulo 5. Se aplican las redes neuronales artificiales para localizar y clasificar defectos utilizando la respuesta mecánica de un cuerpo en el dominio de la frecuencia. Además, se emplea la lógica neuro difusa para optimizar los resultados obtenidos.

Capítulo 6. Se evalúan los resultados a través de dos técnicas 1. Análisis de varianza y 2. Por comparación directa de los valores reales contra los simulados de la red neuronal y los optimizados de la lógica neuro difusa. A demás, se postula la aplicación de la técnica desarrollada hacia diferentes campos de la ciencia.

Los aspectos más importantes que se deben mencionar en el desarrollo del presente documento son:

1. Las redes neuronales artificiales de retropropagación logarítmica sigmoidal, son utilizadas para localizar y clasificar defectos utilizando únicamente una arquitectura multicapa.

2. Los sistemas de inferencia neuro difuso, se implementan como instrumento de optimización logrando una mejora sustantiva en los resultados obtenidos.

3. Las bases de datos empleadas son sintéticas y se utilizan de tal forma que se da solución al problema inverso que se plantea. En términos muy generales es: determinar el tipo y posición de defectos a través de la respuesta mecánica de un cuerpo en el dominio de la frecuencia.

De los puntos enunciados con anterioridad el elemento innovador y de aporte científico se ubica en la posición dos, debido a que durante la revisión bibliográfica (de ese periodo de tiempo) no se encontró un desarrollo similar al planteado. Esto permitió la publicación de un artículo a nivel internacional en la revista Applied Mechanics and Materials Vols. 13-14 durante el 2008 (ver anexo)

Otros trabajos que se pueden mencionar, desarrollados en el Instituto Politécnico Nacional, y que están vinculados al presente trabajo son:

 Proyecto: Análisis de Esfuerzos Numéricos y Experimental en Sistemas Prótesis – Vértebra. Registro: 20060497.

 Proyecto: Análisis de Esfuerzos Numéricos y Experimental en Sistemas Prótesis – Vértebra. Registro: 20070479.

 Proyecto: Aplicación de Redes Neuronales en la Solución de Problemas de Biomecánica. Registro: 20080663.

(24)

Capítulo I: Antecedentes generales sobre las Redes Neuronales Artificiales.

Alejandro Luna Avilés 3

Capítulo I: Antecedentes

Generales sobre las

Redes Neuronales

Artificiales.

(25)

1.1. Semejanza Biológico – Numérica.

Antes de iniciar el estudio de las redes neuronales artificiales es conveniente exponer algunos conceptos básicos de los sistemas neuronales biológicos, para establecer más fácilmente el paralelismo que existe entre ellos.

En 1852 nace en Navarra, España, el científico Santiago Ramón y Cajal, es conocido por descubrir los mecanismos que gobiernan la morfología y los procesos conectivos de las células nerviosas. Por dicho descubrimiento recibe el Premio Nobel en 1906, muere en Madrid en 1934. En su obra “TEXTURA” realiza un monumental estudio y descripción en detalle del sistema nervioso de los vertebrados.

[image:25.595.100.496.430.733.2]

Una neurona (del griego: célula nerviosa), figura 1.1, es por definición fisiológica, la unidad anatómico-funcional del sistema nervioso. Está constituida por un cuerpo celular que presenta varias prolongaciones; a la más larga se le llama cilindroeje, y a las otras más cortas se les da el nombre de dendritas. El primero se encuentra cubierto por una vaina aislante que tiene en su interior una sustancia llamada mielina, ésta recibe el nombre de vaina de Schwann. El cuerpo neuronal es el lugar donde ocurre la información funcional que genera un estímulo o lo registra, el cilindro-eje sirve de guía de conducción a los estímulos. En la transmisión de los impulsos regulares toman parte varias neuronas.

(26)

La neurona es una unidad de procesamiento simple y se comunica con otras neuronas a través de formas filamentarias llamadas dendritas (del griego: ramificaciones). Estas abarcan zonas extensas en formas ramificadas y están conectadas al soma (del griego: cuerpo) de la célula nerviosa, que tiene una forma piramidal o cilíndrica. La superficie exterior de la neurona está cubierta por la membrana. Así como el interior y exterior de la célula por fluido intra y extra celular respectivamente. Cuando la neurona es excitada, a un nivel determinado, se activa y transmite una señal eléctrica a lo largo del axón. Este último termina en ramificaciones filamentarias llamadas final del axón que están conectadas con dendritas de otras neuronas, a esta conexión se le denomina sinapsis (del griego: contacto). Una sola neurona puede tener entre 1000 y 10000 contactos, que a su vez estimulan alrededor de 1000 neuronas. Cuando el estímulo llega al final del axón se liberan mensajeros químicos conocidos como neurotransmisores, estos últimos, son transportados en pequeñas formas esféricas llamadas versículos, los anteriores, son los responsables de la comunicación efectiva entre las neuronas.

Los neurotransmisores pueden ser excitadores, si la carga eléctrica es más positiva, o inhibidores si ocurre lo opuesto. La decodificación de las señales se puede llevar a cabo de dos maneras: suma temporal, ocurre a través de funciones de impulso como los dientes de sierra o la forma escalón unitario, y la suma espacio temporal, es la integración de todos los estímulos recibidos por las neuronas. Ejemplo de la primera es la reacción del cuerpo a un estímulo doloroso y la segunda se puede especificar como un proceso de toma de decisión. La transmisión de las señales es a través del axón, esté último está cubierto por una sustancia llamada mielina que está segmentada. Tiene el propósito de reducir la capacitancia de la membrana para incrementar la velocidad de propagación y los espacios libres, conocidos como nodos de Ranvier, funcionan como amplificadores de la señal. Este proceso es efectivo y puede transmitir un estímulo a más de 1m de distancia.

No todas las neuronas hacen las mismas funciones, algunas son sensoriales, otras motoras y otras mucho más complejas. Estás últimas realizan la interpretación de las situaciones (tangibles o no) que se perciben como reales. Sin embargo, todas las redes neuronales muestran algunas propiedades en común:

1. Existen muchas conexiones en paralelo entre muchas neuronas. 2. Muchas conexiones en paralelo proporcionan retroalimentación a otras neuronas y a ellas mismas.

3. Algunas neuronas pueden excitar a otras mientras inhiben el estímulo a algunas más.

4. Algunas zonas de la red neuronal se pueden inhibir completamente y otras encontrarse en desarrollo.

(27)

7. Las redes neuronales ejecutan programas que están completamente distribuidos y no secuencialmente definidos.

8. Las redes neuronales no poseen una unidad de procesamiento central, su modo de ejecutar alguna secuencia es distribuida.

Las redes neuronales poseen una arquitectura jerárquica, es así que pueden aprender, adaptarse, clasificar, almacenar, recordar, cruzar, interpolar y extrapolar la información.

Como se mencionó con anterioridad, al contacto de las neuronas entre sí se llama sinapsis, esto último permite el paso de los estímulos de una neurona a otra y es la responsable del desarrollo del biocomputo. En la naturaleza, la sinapsis compara patrones a través de un simple contraste, este proceso es comparable al armado de un rompecabezas. Por otro lado los computadores binarios, deben comparar bit por bit para establecer un patrón, de esta manera, se utilizan muchos recursos de cómputo y tiempo. Un hecho importante es que la señal transmitida por la sinapsis es digital, en el sentido de que existe o no, y todas ellas son de diferente magnitud.

Durante el desarrollo de un ser vivo, el cerebro se modela, de forma que existen muchas cualidades del individuo que no son innatas, sino que se adquieren por la influencia de la información que del medio externo proporcionan sus sensores (sentidos). Existen diferentes formas de modelar el sistema nervioso: por el establecimiento de nuevas conexiones, ruptura de otras, modelado de las intensidades sinápticas o incluso mediante la muerte y creación neuronal. Este tipo de acciones en especial, la modificación de las intensidades sinápticas serán las que utilicen los sistemas neuronales artificiales para llevar a cabo el aprendizaje.

El cerebro y el computador convencional son muy diferentes, el primero es un sistema complejo de procesamiento, no lineal, masivamente paralelo y adaptativo, muy eficiente desde el punto de vista energético, mientras que el segundo realiza operaciones en forma secuencial pudiendo manejar grandes masas de datos realizando operaciones en forma centralizada. Curiosamente, las neuronas son mucho más simples, lentas y menos fiables que un computador y a pesar de ello existen problemas difícilmente abordables por una computadora convencional, que el cerebro resuelve eficazmente.

Los actuales ordenadores son máquinas de Von Neumann, en esencia una máquina de procesamiento que actúa ejecutando en serie una secuencia de instrucciones (programa) que almacena en su memoria, el verdadero corazón del computador es el microprocesador.

(28)

con eficiencia, puede resultar conveniente construir sistemas que copien en cierto modo, la estructura de las redes neuronales biológicas, con el fin de alcanzar una funcionalidad similar.

Los tres conceptos clave de los sistemas nerviosos, que se pretende simular en los artificiales son:

 Paralelismo de cálculo.  Memoria distribuida.  Adaptabilidad.

Los elementos básicos de un sistema neuronal biológico son las neuronas, que se agrupan en conjuntos compuestos por millones de ellas, organizadas en capas (jerarquías), constituyendo un sistema con funcionalidad propia. En la realización de un sistema neuronal artificial puede establecerse una estructura jerárquica similar. El elemento esencial de partida será la neurona artificial, que se organizará en capas; varias de estas constituirán una red neuronal, junto con las interfaces de entrada y salida (sinapsis), más los módulos convencionales adicionales necesarios (funciones de transferencia, pesos, funciones de ajuste) constituirán el sistema global del proceso.

Una definición interesante de red neuronal hace uso del concepto matemático de GRAFO, objeto consistente en un conjunto de nodos, más un conjunto de conexiones establecidas entre ellos. En este caso, el grafo describe la arquitectura del sistema y proporciona los canales por los que puede ejecutarse su dinámica.

Figura 1.2. Esquema de una Red Neuronal Artificial.

(29)

salientes. Las que no son, ni de entrada, ni de salida, se denominan neuronas ocultas. Una red es unidireccional cuando no presenta regresos cerrados de conexiones. Alternativamente, una red es recurrente cuando el flujo de información puede encontrar un regreso de adelante hacia atrás, es decir una retroalimentación.

1.2. Redes Neuronales Artificiales, Lógica Difusa y Lógica Neuro Difusa.

Recientemente, algunos investigadores han creando modelos, tanto en circuitos como en programas, que interpretan la actividad cerebral en un esfuerzo por producir una forma de inteligencia artificial (interpretación, comparación de patrones y toma de decisiones). Las redes neuronales artificiales (RNA) son utilizadas por primera vez en el año 1943, cuando McCulloch y Pitts [1.2] proponen el primer modelo simple de este tipo, muchas formas de RNA y tipos se han desarrollado desde entonces. Sin embargo, las investigaciones sobre este tema fueron retrasadas debido a la aparición de un libro que lleva por nombre “Perceptrones” publicado por Minsky y Papert [1.3]. En este, se describe la imposibilidad de una RNA para generalizar los resultados buscados y uno de los principales argumentos utilizados son las compuertas lógicas. Posteriormente, Kolmogorov [1.4] probó que una RNA de 3 capas era capaz de aprender y generalizar resultados previendo que esta tenga las suficientes neuronas por capa, de esta manera los trabajos de investigación se reactivaron.

Las RNA, están compuestas de muchos elementos sencillos que operan en paralelo, el diseño de la red está determinado mayormente por las conexiones entre sus elementos. Al igual que las sinapsis de las neuronas cerebrales. La idea de las redes neuronales fue concebida originalmente como un intento de modelar la biofisiología del cerebro humano, esto es, entender y explicar cómo funciona y opera el cerebro. La meta era crear un modelo capaz de emular el proceso humano de razonamiento. La mayor parte de los trabajos iniciales en redes neuronales fue realizada por fisiólogos y no por ingenieros.

(30)

“La computación evolutiva es una aproximación que surge para calcular en forma paralela la habilidad de la mente humana de razonar y aprender en un ambiente de incertidumbre e imprecisión” [1.5]

La computación evolutiva incluye varios paradigmas, entre los que se encuentran: las redes neuronales artificiales, la teoría de conjuntos difusos, la inteligencia artificial, los algoritmos genéticos y la inteligencia artificial convencional. Cada uno de los mencionados con anterioridad posee fortalezas que son resumidas en la tabla 1.1.

Tabla 1.1. Elementos constituyentes de la computación evolutiva.

Metodología Fortalezas

Red Neuronal Artificial Aprendizaje y adaptabilidad Teoría de los Conjuntos

Difusos

Representación de los conocimientos a través de las reglas difusas SI-ENTONCES

Algoritmos Genéticos Búsqueda sistemática aleatoria Inteligencia Artificial

Convencional

Manipulación simbólica

La sinergia entre las áreas mencionadas con anterioridad permite a la computación evolutiva incorporar el conocimiento humano en forma efectiva, a pesar de la incertidumbre e imprecisión, los algoritmos aprenden, se adaptan o modifican el ambiente hacia un mejor desempeño. En términos generales, la computación evolutiva no utiliza mucha manipulación simbólica, así que se puede establecer que es una nueva disciplina que complementa las aproximaciones de la inteligencia artificial convencional y viceversa.

Los humanos utilizamos variables lingüísticas para razonar y tomar decisiones. La inteligencia artificial convencional trata de imitar este proceso a través de reglas simbólicas, que son estructuradas en bases de conocimiento. Las anteriores son llamadas sistema hipotético de símbolos físicos, este sistema da las bases para el modelado de sistemas expertos, toda vez que el conocimiento esté disponible en forma explícita.

La combinación de inteligencia artificial convencional y la computación evolutiva se están integrando de tal manera que se ha empezado a utilizar el término inteligencia artificial moderna. Con el desarrollo de algoritmos inspirados en procesos biológicos y la tendencia descrita con anterioridad, la computación evolutiva tiende más hacia la cibernética (estudio de la información y control en máquinas y humanos).

(31)

Tabla 1.2. Desarrollo histórico de la computación evolutiva [1.6]. Año Inteligencia

Artificial

Redes Neuronales Artificiales

Lógica Difusa Algoritmos Genéticos 1940 1947

Cibernética

1943 Modelo de

Neurona de

McCulloch-Pitts 1950 1956

Inteligencia Artificial

1957 Perceptrón

1960 1960 Lenguaje silbante

1960 Adaline

Madaline

1965 Conjuntos difusos 1970 Mediados de

1970, sistemas expertos

1974 Algoritmo de retropropagación 1975 Cognitron Neocognitron

1974 Control difuso

1970 Algoritmos genéticos

1980 1980 Mapas de auto

organización

1982 Red de

Hopfield

1983 Máquina de Boltzmann

1986 Auge del

algoritmo de

retropropagación

1985 Modelado difuso

(modelo TSK)

Mediados de

1980 vida

artificial

1990 1990

Modelado Neuro Difuso 1991 ANFIS 1994 CANFIS 1990 Programación Genética

En una forma de interpretación simple, se puede decir que una red neuronal artificial es una aproximación no algorítmica que intenta simular un sistema dinámico no lineal en el espació tiempo continuo. Por otro lado, la lógica difusa provee un cálculo sistemático a través de variables lingüísticas y desarrolla procesos computacionales numéricos con el uso de etiquetas llamadas funciones de membrecía. Las reglas SI-ENTONCES son el componente básico y soporte de los sistemas de inferencia difusa, que en forma efectiva pueden modelar a un humano experto en un área específica. De esta manera, si se incorpora el concepto de aprendizaje de una red neuronal artificial en un sistema de inferencia difusa, resulta en un modelo neuro difuso. Esta última es una técnica fundamental en la computación evolutiva.

(32)

1.3. Aplicación de las Redes Neuronales Artificiales en problemas de ingeniería.

Hasta hace algunos años, se pensaba que muchos problemas en ingeniería no poseían solución. La aparición de la computadora combinada con métodos numéricos, inteligencia artificial convencional, lógica difusa, redes neuronales artificiales, algoritmos genéticos, lógica neuro difusa, etc. permiten entender y analizar planteamientos complejos.

Yagawa y Okuda [1.8] desarrollan una revisión del estado del arte de aplicaciones de mecánica computacional en diferentes campos de la ciencia: evaluación cuantitativa no destructiva para la identificación estructural de daños, modelado de materiales visco-plásticos, análisis del crecimiento de grietas en especímenes soldados, diseño estructural, estimación de parámetros involucrados en el análisis no lineal a través del método de elementos finitos y solución de ecuaciones. En este documento se muestra claramente como la mecánica computacional se ha convertido en una herramienta indispensable en áreas experimentales y de aplicación práctica en campo. A continuación, se plantea una reflexión sobre la técnica de evaluación cuantitativa no destructiva por ser está la de mayor interés para el desarrollo del presente trabajo.

A través del uso de la evaluación no destructiva (ondas ultrasónicas, rayos X, polvos magnéticos, corrientes de Eddy, etc.) se puede saber si un dispositivo (herramienta, maquinaria, estructura, etc.) posee grietas o defectos. Esta información es crucial para la seguridad y consecución de los procesos productivos. Sin embargo, no identifican la localización, forma, posición y tamaño. Es en esta área donde la evaluación cuantitativa no destructiva, también llamada QNDE (del inglés Quantitative Nondestructive Evaluation) y las redes neuronales artificiales se unen para caracterizar un problema inverso.

Se puede decir que: los problemas inversos son tópicos matemáticos relacionados a diferentes áreas del conocimiento. Se pueden describir como problemas en los cuales se conoce la respuesta pero no la pregunta o bien donde se conocen los resultados y/o consecuencias, pero no las causas. Si se consideran, por ejemplo, los problemas de identificación de defectos a través de ondas ultrasónicas. Se pueden definir parámetros como el tamaño y la localización, considerando la respuesta dinámica del sólido. Este es un problema inverso. Por otro lado, si los parámetros del defecto son conocidos, la respuesta dinámica del sólido puede ser calculada a través de mecánica computacional (por ejemplo simulación con Método de Elementos Finitos). Este es un problema directo.

(33)

1. Simulación de la respuesta dinámica de un sólido, que contiene defectos que pueden ser manipulados en parámetros como localización, forma, tamaño, profundidad, etc. A través del método de elementos finitos para obtener conjuntos de pares de datos (respuesta dinámica - parámetros).

2. La red neuronal artificial es entrenada con los datos colectados en la primera etapa. La respuesta dinámica son los datos de entrada y los parámetros del defecto son los datos objetivo.

3. La RNA entrenada es utilizada para identificar los parámetros del defecto a partir de la respuesta dinámica medida en un sólido a través de procesos de aplicación (ultrasonido, rayos X, martillo de impactos, etc.).

Un análisis inverso puede ser aplicado a cualquier problema inverso a través del uso de la simulación con mecánica computacional. Esta técnica es aplicable a varios campos de la ciencia.

Muchos problemas en ingeniería son medidos con la ayuda de sensores, sin embargo, los datos así obtenidos en ocasiones son excesivos y complicados de analizar. Corcoran [1.9] realiza una revisión de la interrelación que se puede dar entre los dispositivos antes mencionados y las redes neuronales artificiales. Mellit y Kalogirou [1.10] presentan una disertación sobre los sistemas fotovoltaicos y el uso de las RNA en tres principales áreas: (1) pronóstico y modelado de sistemas meteorológicos, (2) determinar el tamaño y forma de un sistema fotovoltaico y (3) simulación y control de sistemas fotovoltaicos. La información presentada muestra el gran potencial de aplicación de las RNA en este campo.

En la búsqueda de aplicaciones para la industria. Se puede citar, la investigación desarrollada por Casalino et. al. [1.11] donde se utiliza el modelado numérico (Método del Elemento Finito), las redes neuronales artificiales y los conjuntos difusos para determinar el mejor método de unión a través de soldadura por arco eléctrico y su posterior evaluación.

Li et. al. [1.12] presentan un método para identificar los defectos que produce un porta herramientas conforme se va descalibrando. Utilizando digitalización por laser, lógica difusa y redes neuronales para lograr este propósito.

Dini [1.13] establece una metodología para la predicción de la delaminación en el proceso de taladrado de fibras de vidrio reforzadas, para lograrlo utiliza dos RNA de retropropagación, una establece el nivel de daño y la otra indica el tamaño del defecto producido.

(34)

artificiales. En éste estudio se interrelacionan dos variables, el material utilizado y los trabajadores involucrados en la producción. En este contexto se puede citar a Yarlagadda [1.15] que hace un estudio de los parámetros que pudieran afectar el moldeo por inyección, utiliza la velocidad y la presión involucradas en el proceso para entrenar dos tipos de redes neuronales artificiales. Los datos de entrenamiento se obtienen a partir de simulación numérica. Lázaro [1.16] propone una técnica con base en redes neuronales para clasificar las piezas producidas por fundición, en maquinables y no maquinables, considerando los datos obtenidos de una señal ultrasónica.

Muchas son las áreas donde las redes neuronales pueden ser de utilidad y ayudar a mejorar resultados en los procesos, no solo de producción también en la parte experimental y tener un buen nivel de confianza en los resultados obtenidos, como lo demuestra el análisis de las superficies de rodamientos sometidos a presión en flechas utilizando redes neuronales por Osman-Kurban [1.17]. En este desarrollo se muestra en forma experimental como se obtienen los datos de la distribución de las presiones sobre el rodamiento, a diferentes velocidades de trabajo y rugosidad en la superficie. Posteriormente, utilizando las redes neuronales, se optimizan los resultados para obtener la distribución real de la presión durante el proceso de lubricación.

En un documento presentado por Huber et. al. [1.18,1.19], se muestra una técnica para determinar la relación de Poisson, considerando la rigidez que se produce de la carga y descarga de un cuerpo. La ecuación que define la relación de Poisson puede ser invertida a través de dos RNA para identificar dicho parámetro con un alto nivel de precisión.

Artymiak et. al. [1.20] utilizan las redes neuronales para determinar las curvas de resistencia a la fatiga y limite de fatiga en especímenes que simulan componentes estructurales. Se muestra que este método es superior a los utilizados convencionalmente.

Seibi y Al-Alawi [1.21] emplean una RNA para predecir la resistencia promedio a la fractura de una aleación de aluminio. Involucran datos con base en la evaluación de valores críticos de la integral J, obtenidos en forma experimental. Además, exploran los efectos de la geometría de la grieta, temperatura y biaxialidad en la resistencia a la fractura.

Sablani [1.22] utilizan redes neuronales para calcular el coeficiente de fricción en tuberías, que transportan fluidos plásticos de Bingham, a través del número de Reynolds y la potencia efectiva de la bomba.

(35)

evaluar la integridad estructural de marcos de carga, utilizados en infraestructuras civiles, a través de vibraciones libres inducidas por medidas de deformación. Utiliza una red neuronal para tal efecto y determina que el rango de precisión, de los resultados obtenidos, se encuentra dentro de 5%.

Kim et. al. [1.25] utilizó medidas de emisiones acústicas, en frecuencia cíclicas de carga de 1, 2 y 4 Hz, en una barra de acero estructural para determinar el factor de intensidad esfuerzos a través de una RNA con un arreglo 5-14-1, el desarrollo del modelo se usó para varios tipos de especímenes y condiciones cíclicas de carga.

El uso de la computadora e internet, permiten nuevos desarrollos como el propuesto por Chinnam y Mohan [1.26] que exponen un método en línea para estimar la confiabilidad (tiempo de vida útil) de los sistemas físicos, utilizan wavelets para facilitar examinar las señales degradadas en los dominios del tiempo y frecuencia (eliminar el ruido en la señal), mientras que la RNA se usa para reacomodar la señal recibida y estimar la vida útil del dispositivo. Guo [1.27] propone un método en línea para monitorear en tiempo real la deformación que produce una roladora. Utilizando una red neuronal, eliminan el ruido que recibe el sensor hecho de fibra óptica.

Si bien es cierto que las RNA ayudan a modelar, optimizar, reconocer patrones y en forma general a resolver problemas, también se debe mencionar que su diseño es un proceso heurístico. Algunos trabajos se han desarrollado para establecer un proceso metodológico concreto, entre ellos se puede mencionar el presentado por Staszewski [1.28] donde se muestra técnicas para el pre-procesamiento de datos que se utilizan en la detección de daño estructural en el dominio del tiempo. Siraj et. al. [1.29] muestran una técnica para mejorar la capacidad de generalización de una RNA a través de dos perceptrones discriminantes multicapa, estos últimos son construidos a partir de los patrones de prueba y entrenamiento. Kallassy [1.30] propone un método para diseñar una RNA a partir de un análisis de regresión y determinar el número óptimo de neuronas para un nivel de error deseado. Magoulas et. al. [1.31] mejora el algoritmo de retropropagación, enfocándose principalmente en el rango y características de convergencia. Yang et. al. [1.32] postula un nuevo algoritmo para el entrenamiento de perceptrones multicapa, la propuesta se fundamenta en la no inversión explicita de la información contenida en la matriz de Fisher.

(36)

cada capa de sustrato. Otra aplicación geológica es presentada por Singh [1.34] al realizar un estudio de la vibración que se produce en el suelo debido a los procesos de excavación. Con ayuda de una red neuronal artificial plantea la posibilidad de predecir la magnitud (impacto adverso) de dicho fenómeno. Basheer [1.35] utiliza redes neuronales para caracterizar las propiedades mecánicas de muestras de suelo a través de procesos de histéresis, compara la efectividad de las teorías existentes y propuestas, además establece la posibilidad de generalizar los resultados obtenidos con la inserción de nuevos datos.

1.4. Antecedentes en la Localización y Clasificación de Defectos Utilizando Redes Neuronales Artificiales.

Una de las preocupaciones de la ingeniería se centra en la evaluación cuantitativa no destructiva de las fracturas y defectos en las estructuras y materiales utilizados en los procesos productivos. Achenbach [1.36] hace una revisión de las técnicas más importantes en este rubro y plantea el posible uso de la inteligencia artificial moderna, entre otros métodos, para la detección de fallas y análisis de fatiga. Como se mencionó con anterioridad, la QNDE es un conjunto de técnicas y metodologías utilizadas para evaluar la integridad estructural de un dispositivo. Para lograrlo emplea herramientas como ultrasonido, rayo laser, microscopios, etc. Una de las consideraciones más importantes en este tipo de desarrollos se fundamenta en el uso y construcción de modelos de simulación numérica (problema directo). Estos se utilizan principalmente como patrones de referencia, para la interpretación de datos experimentales y para reconocer características especificas (como propiedades mecánicas).

En ocasiones los datos obtenidos en forma experimental, por ejemplo los datos generados a través de las ondas de señales ultrasónicas colectadas con sensores, son difíciles de interpretar (discriminar entre datos útiles y ruido) en consecuencia se conocen los resultados finales pero no así las causas que dieron origen a estos (problema inverso). Es entonces cuando se debe aplicar un análisis inverso combinando las QNDE y las RNA.

A continuación se mencionan algunos documentos donde se mezclan técnicas numéricas, inteligencia artificial moderna y datos experimentales para la localización y detección de defectos.