INSTITUTO POLITECNICO NACIONAL
ESCUELA SUPERIOR DE INGENIERÍA MECANICA Y ELÉCTRICA SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN
UNIDAD CULHUACAN
ESTRUCTURA DE LÓGICA DIFUSA PARA FILTRADO ADAPTIVO
TESIS
QUE PARA OBTENER EL GRADO DE:
MAESTRO EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
PRESENTA:
ING. FLAVIO MANCERA OLIVARES
ASESOR:
DR. JUAN CARLOS SÁNCHEZ GARCÍA DR. HÉCTOR M. PÉREZ MEANA
MÉXICO D.F. 2005
AGRADECIMIENTOS
A los directores de Tesis Dr. Juan Carlos Sánchez García y Dr. Héctor M. Pérez Meana, por la valiosa conducción para el desarrollo del presente trabajo de investigación. Así mismo la colaboración del M. en C. Henry Martínez Conde.
A los miembros del jurado por sus comentarios y atinadas sugerencias para lograr una correcta distribución y presentación de los resultados obtenidos.
A las autoridades, profesores ,compañeros de la ESIME CULHUACAN y de la Sección de Estudios de Posgrado e Investigación, de los que no menciono nombres por temor a omitir alguno, pero de los que siempre recibí el apoyo incondicional.
A mi padre † y a mi madre, mis hermanos, mi hijo Alberto, a la persona que me dió la certeza de que se pueden alcanzar los objetivos y en especial al ser supremo que nos da la energía para lograrlo.
Índice
Capitulo 1. Introducción
1.1 Antecedentes . . . 1
1.2 Objetivos . . . 4
1.3 Organización de la tesis . . . 5
1.4 Referencias . . . 6
Capitulo 2. Sistemas adaptivos 2.1 Introducción . . . 7
2.2 Áreas de desarrollo . . . 8
2.3 Sistema adaptivo . . . 8
2.3.1 Adaptación de lazo abierto . . . 10
2.3.2 Adaptación de lazo cerrado . . . 10
2.4 Combinador aditivo . . . 12
2.5 Adaptación . . . 16
2.5.1 Método de gradiente . . . 16
2.5.2 Método de mínimos cuadrados . . . 17
2.8 Referencias . . . 17
Capitulo 3. Lógica difusa y razonamiento difuso 3.1 Lógica y conjunto clásico. . . 18
3.2 Lógica y conjunto difuso . . . 19
3.2.1 Parámetros de los conjuntos difusos . . . 21
3.2.2 Operaciones teóricas de conjuntos difusos . . . 22
3.2.3 Intersección difusa. T-norma . . . 24
3.2.4 Unión difusa. T-conorma ó S-norma . . . 25
3.2.5 Leyes de D'Morgan generalizadas 25 3.3 Parámetros de diseño . . . 26
3.3.1 Partición difusa . . . 26
3.3.2 Tipos de funciones . . . 26
3.4 Sistemas difusos . . . 28
3.4.1 Principio de extensión . . . .. . . 28
3.4.2 Relación difusa . . . 29
3.4.2.1 Relaciones binarias . . . 29
3.4.2.2. Composición de relaciones difusas . . . 30
3.4.3 Variables lingüisticas . . . 30
3.4.3.1 Función de implicación . . . 31
3.5 Razonamiento difuso . . . 31
3.5.1 Mecanismo de inferencia difuso . . . 32
Índice
3.5.1.1 Inferencia tipo Tsukamoto . . . 33
3.5.1.2 Inferencia tipo Mandami . . . 34
3.5.1.3 Inferencia tipo Sugeno . . . 35
3.6 Defusificación . . . 36
3.7 Referencias . . . 38
Capitulo 4. Filtro difuso para predicción de señales audibles 4.1 Modelado de Lógica difusa . . . 39
4.2 Arquitectura de un sistema difuso . . . 40
4.3 Diseño del procesador con estructura difusa . . . 43
4.4 Implementación del algoritmo FAD . . . 46
4.5 El FAD como predictor . . . 53
4.6 El FAD como identificador de sistemas . . . 55
4.7 Referencias . . . 62
Capitulo 5. Conclusiones . . . 63
Apéndice A. Programas del FAD A1 Programa para llevar a cabo simulación en un canal no lineal con funciones Gaussianas . . . .. . . 66
A2 Programa para llevar a cabo simulación en un canal no lineal con funciones triangulares . . . 69
A3 Algoritmo para simulación con filtro FIR . . . 71
A4 Algoritmo para aproximación de señal FAD. . . 73
A5 Algoritmo para aproximación de señal filtro FIR. . . 76
A6 Programa para gráficar la función no lineal . . . 78
A7 Funciones para los programas . . . 79
Apéndice B. Artículos publicados Cast Tour / ICED Estructura de Lógica Difusa para Filtrado Adaptivo . . . 82
1er. Congreso Mexicano de Ing. En Coms. y Electrónica Aplicación de la Lógica Difusa en el Filtrado Adaptivo . . . 87
Lista de acrónimos . . . 94
Índice de figuras
Capitulo 2
Figura 2.1 Adaptación de lazo abierto . . . 10
Figura 2.2 Adaptación de lazo carrado . . . . . . 11
Figura 2.3 Señales en adaptación de lazo cerrado . . . 11
Figura 2.4 Ejemplos de aplicación de lazo cerrado: a)Predicción b) Identificación de sistema (modelado), c)Ecualización (deconvolución, filtrado inverso, modelado inverso), d) Cancelación de eco ó ruido. . . 12
Figura 2.5 Combinador lineal aditivo . . . 12
Figura 2.6 Filtro transversal adaptivo . . . 13
Figura 2.7 Obtención del error en un combinador lineal aditivo . . . 14
Capitulo 3 Figura 3.1 Conjuntos: a) Clásico b) Difuso . . . .. . . 19
Figura 3.2 Partes importantes de una función de membresía . . . 21
Figura 3.3 Conjuntos difusos . . . 22
Figura 3.4 Subconjunto. A está contenido en B . . . 23
Figura 3.5 A unión B . . . 23
Figura 3.6 A intersección B . . . 23
Figura 3.7 Conjunto A negado . . . 24
Figura 3.8 Partición difusa . . . 26
Figura 3.9 F.M. a) triangular b) trapezoidal c) gaussiana d) campana e) sigmoidal . . . . . . 27
Figura 3.10 Diagrama a bloques de un sistema de inferencia b) A implica B . . . 31
Figura 3.11 Modelo difuso tipo Tsukamoto . . . 33
Figura 3.12 Modelo difuso tipo Mandami . . . 34
Figura 3.13 Modelo difuso tipo Sugeno . . . 35
Figura 3.14 Métodos de defusificación . . . 37
Capitulo 4 Figura 4.1 Estructura de un sistema difuso . . . 40
Figura 4.2 Sistema adaptivo difuso . . . 41
Figura 4.3 Modelo difuso propuesto . . . 46
Figura 4.4 Filtro adaptivo difuso (FAD) . . . 46
Figura 4.5 Fusificación: a) Secuencia de datos y su intersección con conjuntos difusos b) y c) Cálculo del grado de membresía función triangular y gaussiana respectivamente . . . 48
Figura 4.6 FAM del sistema difuso . . . 50
Figura 4.7 Controlador difuso . . . . .. . . .. . . 52
Figura 4.8 Neurona difusa . . . 52
Índice de figuras
Figura 4.9 Aplicación del FAD como predictor . . . 53
Figura 4.10 Señal aproximada: a) y b) 5 funciones triangulares, c) y d) 5 funciones gaussianas . . . 54
Figura 4.11 Aproximación a) Barrido de frecuencias b) Una señal audible 54 Figura 4.12 Aplicación como identificador de sistema . . . 55
Figura 4.13 Filtro adaptivo FIR de prueba para comparación . . . 56
Figura 4.14 Función no lineal de prueba en el bloque H(S) planta .. . . 56
Figura 4.15 Resultados señal cuadrada con bloque no lineal. FAD . . . 57
Figura 4.16 Resultados señal cuadrada con bloque no lineal. FIR . . . 57
Figura 4.17 Resultados para señal de voz: 5 funciones de membresía gaussianas y ruido . . . 58
Figura 4.18 Resultados para señal de voz: 5 funciones de membresía triangulares . . . 59
Figura 4.19 Resultados para señal de voz: filtro FIR . . . 59
Figura 4.20 Error entre la señal deseada y estimada . . . .. . . 60
Figura 4.21 Gráfica MSE del FAD con diferentes valores de alfa . . . 60
Figura 4.22 Gráfica MSE del filtro FIR con diferentes valores de alfa . . . 61
RESUMEN
Recientemente la lógica difusa ha atraído la atención debido a su capacidad de representar fenómenos complejos. La habilidad de la lógica difusa para describir sistemas complejos por medio de un simple e intuitivo conjunto de reglas de comportamiento ha motivado un interés por aplicarlo a varias tareas, por ejemplo: reconocimiento de patrones, filtrado adaptivo y otros.
Es de interés particular desarrollar un filtro adaptivo difuso para aplicarlo a señales audibles, debido a que la transmisión de información eléctrica por cualquier medio se ve afectada por problemas de diversa índole, como puede ser la distorsión y el ruido aditivo, por lo que es necesario regenerar las señales a su versión original.
La ventaja más importante de la lógica difusa es que se puede utilizar en el mismo sistema, información numérica proveniente de un sensor ó dispositivo procesador de señal, así como información en lenguaje natural provista por un experto humano asociada a algún proceso o problema en forma de reglas del tipo si – entonces.
Un filtro adaptivo difuso (FAD) puede llevar a cabo adaptación no lineal a diferencia de las técnicas de filtrado clásico, es decir con filtros FIR o IIR.
Los resultados muestran que el filtro tiene buen comportamiento comparado con un filtro transversal tipo FIR.
v
ABSTRACT
Recently fuzzy logic has attracted considerable attention because of its capability for representing complex phenomena. The ability of fuzzy logic to describe a complex system by means of a simple and intuitive set of behavioral rules has motivated an increasing interest for applying to several tasks, for instance: pattern recognition, adaptive filters, prediction, etc.
A particular interest is to develop a fuzzy adaptive filter and use it in audible signals, due to the electrical signals are affected by several problems during its transmission and is necessary to convert to the original version.
The most important advantage of the fuzzy logic is that in the same system, can be used numerical information coming from sensor or process signal device and linguistic descriptions whose are provided by human experts in natural language about the problem in form of fuzzy if-then rules.
A fuzzy adaptive filter (FAD) can develop non lineal adaptation unlike with those existent as classical technical of filtering, namely with FIR or IIR filters.
The results show that fuzzy filter can provide a better performance that cannot be achieved by conventional transversal type FIR filter.
vi
C C A A P P Í Í T T U U L L O O 1 1
INTRODUCCIÓN
1.1. Antecedentes
En la década de los años veinte del siglo pasado, J. Lukasiewicz desarrolló los principios de la lógica multivaluada, cuyos enunciados pueden tener valores de verdad comprendidos entre el 0 (falso) y el 1 (verdadero) de la lógica binaria clásica [1].
En 1965, L. Zadeh aplicó la lógica multivaluada a la teoría de conjuntos, estableciendo la posibilidad de que los elementos pudieran tener diferentes grados de pertenencia a un conjunto. Zadeh introdujo el término fuzzy (difuso) y desarrolló un álgebra completa para los conjuntos difusos o borrosos. Pero se tuvieron resultados reales hasta mediados de los años setenta, cuando E.H. Mamdani diseñó un controlador difuso para un sistema de control de vapor[1].
Fue en los años 80 cuando se consiguió implementar aplicaciones realmente significativas, alcanzando el máximo auge a partir de 1994.
Dicho lo anterior, podemos decir que la teoría difusa está totalmente inmersa en la vida cotidiana, pero en cambio hemos de aceptar que es una teoría que abarca un extenso campo en el mundo tecnológico, y todo ese campo no esta aún explotado, por consiguiente se puede afirmar que se encuentra actualmente en vías de expansión.
Sin duda, donde más éxito tuvieron los sistemas difusos fue en Japón, y una de las aplicaciones más importantes de la teoría difusa se aplicó en Sendai (Japón) donde se puso en servicio un transporte metropolitano (metro) controlado mediante lógica difusa, este tenía la peculiaridad de poseer controladores que hacían la frenada y la aceleración mucho más suaves facilitando así la conducción [1],[2]. Así, a medida que los sistemas difusos operaban correctamente estos comenzaron a utilizarse en numerosas aplicaciones y a partir de la década de los 90 se incluyó también en los ascensores consiguiendo así reducir el
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
1
Introducción Capítulo1 1
tiempo de espera y la seguridad de los mismos. También se ha comenzado a implementar en los controles de inyección electrónica del carburante y en los sistemas de guiado automático de automóviles[2], haciendo los controles complejos más eficientes y fáciles de utilizar. Las lavadoras difusas [2] tienen mas de 400 ciclos preprogramados y a pesar de su complejidad tecnológica resultan más fáciles de operar que las lavadoras tradicionales; el usuario solo pone en marcha la lavadora y el resto queda en manos del control difuso; el sistema evalúa automáticamente el material, el volumen, la suciedad de la ropa, elige el ciclo óptimo de lavado, así como el caudal de agua que emplea. En las actividades domésticas cotidianas se inventó un sistema de ventilación [2] que usa el control difuso para conmutar un ventilador según la detección de cantidad de polvo, olores, temperatura y humedad ambiente. El baño difuso [2], por ejemplo tiene un controlador que mantiene el agua a la temperatura ideal del usuario, ni muy fría ni muy caliente, etc.
En Estados Unidos de Norteamérica y Europa solamente se empezó a dar importancia a la lógica difusa cuando desde Japón empezó a llegar información sobre numerosas aplicaciones prácticas. A partir de entonces empresas como NASA, Boeing, Ford, Rochwell o Bell comenzaron a aplicar la lógica difusa [3].
Con esta serie de ejemplos de sistemas difusos se puede concluir que se trata de una aplicación con un presente confiable y un futuro inmediato sin límites.
En los últimos años los sistemas difusos se han venido consolidando como una herramienta para modelar sistemas complejos y no lineales en áreas como el control, procesamiento de señales, filtrado de señales, robótica, electrónica de consumo, control de tráfico, control en centrales térmicas, predicción de terremotos, reconocimiento de escritura manuscrita, reconocimiento de objetos, etc.[2].
El filtrado de señales en los sistemas de comunicación es de las áreas de mayor importancia y de interés especial en el campo de la ingeniería, pues es común que exista distorsión de tipo no lineal en los canales que se utilizan para envío de señales, ya sea analógica ó digital.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
2
Introducción Capítulo1 1
Uno de los problemas que presenta un canal de comunicación es, que se modifica de un instante a otro por diversas circunstancias y por lo tanto se considera variante en el tiempo, esto hace necesario contar con un sistema que evite la distorsión y mantenga un canal con mínimos cambios, por lo que se requiere de un filtro que sea modificable en tiempo, es decir, que se adapte de acuerdo a los cambios que se generen. Este tipo de filtros adaptivos se pueden diseñar con estructuras no convencionales (filtros transversales FIR ó IRR) y es un campo en el cual también se ha dado la aplicación de los sistemas difusos. En la revisión de estos sistemas propuestos sobresalen algunos por su importancia y se relacionan a continuación:
Investigadores como Wang/Mendel [4] proponen aplicaciones para filtrado adaptivo, específicamente aplicado como ecualizador a un canal de comunicación no lineal, para resolver problemas de interferencia intersímbolos en una transmisión con alta velocidad de datos que incluye en su simulación ruido blanco aditivo de tipo Gaussiano. Los datos de entrada toman valores [-1,1] con igual probabilidad. La propuesta difusa que presentan es equivalente a un modelo de base radial aplicada en redes neuronales con una capa oculta, cuya función de activación es una neurona Gaussiana. Para actualizar los parámetros que son considerados y minimizar el error obtenido entre la salida del canal y la respuesta estimada a la salida del filtro se utiliza un algoritmo de adaptación tipo RLS ó LMS, de acuerdo a los resultados publicados se obtiene un filtro ecualizador que se aproxima a un filtro ideal.
Existe una propuesta para eliminar ruido blanco en aplicaciones de audio, de Magdalena Di Giura, et.al.[5]. Ellos proponen una aplicación para eliminación de ruido usando un modelo neurodifuso. La técnica consiste en aplicar un preproceso con un algoritmo basado en una estructura multiperceptrón para caracterizar el ruido blanco y hacer una correcta selección de las funciones de membresía, mismas que describen las variables involucradas en el proceso de filtrado. Los resultados obtenidos al filtrar una melodía corrompida con ruido y comparados con una técnica de filtrado clásico FIR son alentadores, estos muestran una
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
3
Introducción Capítulo1 1
atenuación del ruido de manera considerable, a diferencia del resultado obtenido con el filtro FIR.
Hao Ying[6] describe los sistemas difusos como aproximadores universales. El autor muestra como un sistema difuso de una entrada y una salida SISO (por sus siglas en el idioma inglés), puede aproximar cualquier función continua con buena precisión. También propone una forma de determinar, el mínimo de conjuntos y reglas difusas de un sistema para llevar a cabo esta aproximación.
En el campo de reductores de ruido para procesamiento de imágenes existen trabajos como el de Muneyasu, et.al.[7]. La estructura del filtro es expresada como un filtro adaptivo que usa proceso difuso para preservar la imagen de la corrupción de ruido blanco Gaussiano e impulsivo. La clasificación de la señal o ruido se obtiene mediante la diferencia entre píxeles como la característica para determinar los pesos.
También hay aplicaciones en modelos analógicos cuya autoría de Díaz-Mendez, et. al.[8]
desarrollan un sistema mediante el diseño de filtros adaptivos difusos que son modelados usando la herramienta MDS-CAD (Fuzzy System Modeling) con apreciables resultados.
Una investigación realizada por A. Bastián [9] también arroja resultados alentadores, al aplicar un algoritmo neurodifuso basado en el modelo aditivo estándar (SAM), para ecualización de canales, simulando su propuesta en el ambiente de programación Matlab®.
1.2. Objetivos
El objetivo del presente trabajo es desarrollar un filtro adaptivo de baja complejidad y que pueda adaptar cambios no lineales aplicando las técnicas de lógica difusa, en el procesamiento de señales audibles. Para tal fin se considera el modelo propuesto por Wang/Mendel [4], pero se modifican parámetros como son: las funciones de membresía que caracterizan los conceptos difusos en reglas difusas del tipo si-entonces, el mecanismo de inferencia difuso, el método de defusificación y el algoritmo de adaptación.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
4
Introducción Capítulo1 1
El filtro adaptivo difuso (FAD) se compara con un filtro transversal de respuesta finita al impulso (FIR) que utiliza la técnica de filtrado clásico con orden similar al propuesto, esto con la finalidad de observar las diferencias entre uno y otro al aplicarlo con señales audibles de sonidos diversos a través de un bloque no lineal y ruido gaussiano aditivo. Los resultados de esta aproximación no lineal pueden resultar atractivos como una alternativa al filtrado adaptivo.
1.3. Organización de la tesis
La tesis esta conformada por 5 capítulos de la siguiente manera:
El Capítulo 1 es una descripción breve de la evolución de los sistemas difusos, las investigaciones recientes que sirven de plataforma para el trabajo desarrollado, y la estructuración del reporte de la investigación. El capítulo 2 presenta conocimiento de los sistemas adaptivos en forma general y sus configuraciones de mayor aplicación, de tal manera que el lector aun no familiarizado con el tema, comprenda la teoría elemental de las estructuras utilizadas para la adaptación de sistemas, las cuales son aplicables en el análisis de la presente tesis. Posteriormente el capítulo 3 permite involucrarnos con las bases de la lógica difusa, la descripción de los sistemas difusos, el razonamiento difuso, creación de reglas, los mecanismos de inferencia (Mamdani, TSK, Tsukamoto) y toda la información necesaria que combinada con el capítulo anterior permiten comprender el modelo presentado para aplicarlo a señales audibles en medios de tipo no lineal. El capítulo 4 presenta la propuesta del algoritmo desarrollado para realizar filtrado por medio de una estructura de lógica difusa que nos permite aproximar funciones no lineales, se presentan los resultados obtenidos, aplicando el procesamiento de predicción e identificación de señales audibles cuando son aplicadas a un canal de transmisión con una función de transferencia no lineal. La evaluación y simulaciones se llevan a cabo por medio de Matlab®. El capítulo 5 especifica las conclusiones obtenidas a raíz de los resultados y que permite dar una idea de los alcances sobresalientes de éste trabajo de investigación y el trabajo a futuro que puede seguir el procesamiento de señales utilizando lógica difusa.
Los apéndices contienen la información adicional para el completo entendimiento de la investigación realizada.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
5
Introducción Capítulo1 1
1.4. Referencias
[1]. José R. Hilera/Víctor J.Martínez. “Redes Neuronales Artificiales” Ed. Alfomega.2000.
[2].Página web de P.R. Perles. www.alu.ua.es/p/prpr/lógica/lógica_difusa.htm. Tutorial de Lógica Difusa.
[3]. Bonifacio Martín del Brío, Alfredo Sanz Molina.”Redes Neuronales y Sistemas Difusos” 2ª. Edición. Ed. Alfaomega. 2002.
[4]Li-Xin Wang and Jerry M. Mendel. “Fuzzy Adaptive Filters, with application to Nonlinear Channel Equalization”.IEEE Transactions on Fuzzy Systems, Vol.1, No.3, 1993.
[5]Maddalena Di Giura, Nadia Serina, Gianguido Rizzotto “Adaptive Fuzzy Filtering for Audio Applications Using a Neuro-Fuzzy Modelization”. IEEE. 1997.
[6]Hao Ying. “General SISO Takagi-Sugeno Fuzzy Systems with Linear Rule Consequent are Universal Approximators”. IEEE Transactions on Fuzzy Systems, vol 6. no. 4 . 1998.
[7]Mitsuji Muneyasu, Kouichiro Asou, Yuji Wada, Akira Taguchi Takao Hinamoto “An Implementation of Tunable Fuzzy Filters for Mixed Noise Reduction”. IEICE Trans, Fundamentals, Vol.E84-A, No.2 February 2001.
[8]A. Díaz-Méndez, G. Espinoza F-V, H. Pérez-Meana, J.C. Sánchez-García y G. Duchén- Sánchez. “A CMOS Current-Mode Analog Fuzzy Adaptive filter”. Journal of Signal Processing, vol. 5, no. 4, 2001.
[9]J. A. Bastián. “Algoritmo difuso para ecualización de canales”. Tesis para obtener el grado de Maestro en ciencias. SEPI ESIME UC.2001.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
6
C C A A P P Í Í T T U U L L O O 2 2
SISTEMAS ADAPTIVOS
2.1. Introducción
En los años recientes, un crecimiento en el campo de la investigación de los sistemas
“adaptivos” ha dado como resultado una variedad de autómatas adaptivos cuyas características en forma limitada se parecen a los procesos biológicos de adaptación de los seres vivos [1].
Estos sistemas se han desarrollado para llevar a cabo tareas de control adaptivo o procesamiento de señal adaptivo y generalmente tienen alguna de las siguientes características.
1.- Pueden adaptarse automáticamente (auto-optimizarse) frente a los cambios de su ambiente.
2.- Pueden ser entrenados para realizar filtrado específico y tareas de decisión, es decir, son
“programados” por medio de un proceso de entrenamiento.
3.- Pueden extrapolar un modelo de comportamiento con nuevas situaciones después de haber sido entrenado en un finito número de señales o patrones de entrenamiento.
4.- En un limitado alcance pueden actuar y adaptar correctamente el sistema sobre ciertas clases de defectos internos del propio sistema.
5.- Usualmente describen sistemas lineales y no lineales con parámetros variantes en el tiempo.
6.- Son más complejos y difíciles de analizar que los sistemas no adaptivos, pero ofrecen la posibilidad y tienen la “capacidad de adaptación” cuando las características de la señal de entrada son desconocidas y variantes en el tiempo.
El adjetivo “adaptivo” puede ser entendido como un sistema que trata de ajustar sus parámetros con un objetivo bien definido que depende no sólo del estado del sistema, sino también de su ambiente [2].
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
7
Sistemas Adaptivos Capitulo 2
2.2. Áreas de desarrollo
Los progresos en el diseño de microcircuitos ha resultado en la miniaturización, economía y realización de procesadores de señal que rivalizan con los sistemas nerviosos biológicos en tamaño y velocidad en el traslado de información, más no así en un proceso complejo como podría ser el reconocimiento de una persona en forma visual ó por su voz. Esto ha producido un rápido crecimiento en el campo de aplicaciones para todos los tipos de procesamiento digital de señal, incluyendo por supuesto el procesamiento adaptivo. Dichas aplicaciones son comunes en el campo de las comunicaciones, radar, sonar, sismología, diseño mecánico, sistemas de navegación y electrónica biomédica, cancelación de ruido en señales de voz, cancelación de ecos en canales telefónicos, modelado e identificación de sistemas, control de ruido activo y más [1],[3].
2.3. Sistema adaptivo
Los sistemas de procesamiento en general, pueden ser “lineales o no lineales” y a su vez estos pueden ser analógicos ó digitales. Un sistema analógico opera con señales continuas en el tiempo. En cambio un sistema digital contiene señales en tiempo discreto, por lo que, todas las señales son representadas por secuencias tales como x(n) [2].
La característica básica de un sistema lineal es que su comportamiento está gobernado por el principio de superposición. Esto significa que si la respuesta de un sistema discreto lineal con secuencias de entrada x1(n), x2(n), es: y1(n), y2(n), entonces, la respuesta del mismo sistema con una entrada x(n)= ax1(n) + bx2(n) , será y(n) = ay1(n)+by2(n), donde a y b son constantes arbitrarias [2].
Por otro lado, el comportamiento de un sistema adaptivo es lineal si los valores de a y b son constantes, en cambio, si los valores están cambiando rápidamente con el tiempo, el comportamiento del sistema ya no es lineal.
Ciertos sistemas adaptivos llegan a ser sistemas lineales con sus ajustes y mantener constante la adaptación, a este tipo se le llama sistema adaptivo lineal y tiende a ser matemáticamente tratable, por lo que resulta más simple diseñarlo en forma tradicional que en forma adaptiva [2].
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
8
Sistemas Adaptivos Capitulo 2
A un sistema que lleva a cabo un proceso de filtrado es común aplicarle el adjetivo de “filtro”. Los filtros adaptivos digitales son aquellos en los que la entrada, la salida y los pesos del filtro están cuantificados y codificados en forma binaria. Los coeficientes variables del filtro son necesarios cuando no se conocen de antemano las características estadísticas de la señal a filtrar, ó cuando se conocen y se sabe que son cambiantes con el tiempo, y es donde se precisa este tipo de filtrado adaptivo.
La ecuación de entrada-salida [3] de un filtro adaptivo digital es :
∑ ∑
= =
≥
−
−
−
= N
i
M
j j
i n x n i b n y n j n señales causales a
n y
0 1
) (
0 )
( ) ( )
( ) ( )
( (2.1)
Donde x(n) e y(n) son las muestras de entrada y salida, respectivamente, en el instante n, ai(n) y bj(n) son los pesos del filtro i-ésimo y j-ésimo en el instante n, y N+M+1 es el número total de coeficientes del filtro, también conocido como filtro tipo IIR. Si bj(n)=0 para 1 j≤M, en la ecuación (2.1) entonces el filtro adaptivo es de respuesta impulsional finita (FIR), esto es:
≤
(2.2)
∑
=≥
−
= N
i ai n x n i n
n y
0
0 )
( ) ( )
(
Un filtro digital adaptivo [3] podría perfectamente implementarse mediante un filtro IIR (respuesta impulsional infinita), pero los filtros FIR son mucho menos susceptibles de ser inestables que los IIR. Hay que recordar que los filtros IIR tienen tanto polos como ceros, y, si por alguna circunstancia los polos quedan fuera de la circunferencia de radio unidad, el filtro es inestable. Además, aunque supiésemos teóricamente los coeficientes a utilizar para tener los polos y ceros donde se necesitan, y consiguiendo siempre la estabilidad del filtro, dado que estamos trabajando con filtros digitales, también los coeficientes (pesos) del filtro están cuantificados y codificados en forma binaria, con lo que es posible que por problemas de cuantificación los polos queden desplazados respecto del lugar teórico donde debieran estar, haciendo el filtro inestable. Ello no quiere decir que los filtros FIR sean siempre estables, de hecho, su estabilidad depende del algoritmo que se use para ajustar sus coeficientes. Sin embargo, se utilizan generalmente filtros FIR porque su estabilidad es más controlable que en los IIR[3].
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
9
Sistemas Adaptivos Capitulo 2
Actualmente existen varios criterios que pueden adoptarse para llevar a cabo la adaptación de los pesos del filtro respecto a las variaciones de la señal de entrada, de los cuales se mencionan algunos en los siguientes puntos.
2.3.1. Adaptación de lazo abierto
Este proceso de adaptación de lazo abierto [1],[4] involucra realizar mediciones de la entrada o características del entorno para aplicarlas a una fórmula o a un algoritmo computacional, y utilizar esta información para ajustar el sistema adaptivo. En la figura 2.1 se observa la configuración de este proceso. La entrada “otro dato” mostrado en la figura incluye información acerca del ambiente en el cual se encuentra el sistema, señal deseada ó la señal de entrenamiento.
Señal de
entrada Procesador
Algoritmo de adaptación
Señal de salida
Otro dato
Figura 2.1. Adaptación de lazo abierto.
2.3.2. Adaptación de lazo cerrado
Este proceso de adaptación de lazo cerrado [1],[4] que se muestra en la figura 2.2, involucra una experimentación automática con los ajustes y conocimiento de sus salidas para optimizar un desarrollado sistema de medición. La señal de salida se utiliza como comparación de la señal de entrada ó con la señal etiquetada “otro dato”, y mediante un proceso de decisión en el bloque de adaptación lleva a cabo las variaciones pertinentes al procesador. Nuevamente la señal “otro dato” puede ser la señal deseada, información del entorno, ó señal de entrenamiento.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
10
Sistemas Adaptivos Capitulo 2
Algoritmo de adaptación
Criterio de cálculos Señal de
entrada Procesador Señal de
salida
Otro dato
Figura 2.2 Adaptación de lazo cerrado.
Si la configuración de adaptación de lazo cerrado se adecua a una forma particular de adaptación, el proceso de retroalimentación de lazo cerrado [1],[4]queda como la figura 2.3.
Figura 2.3. Señales en adaptación de lazo cerrado
Donde: “x” es la señal de entrada y definimos como respuesta deseada a la señal “d”. El error “e” es la diferencia entre la señal de salida deseada y la señal de salida actual “y” del sistema adaptivo[1],[5].
Utilizando la señal de error, un sistema adaptivo ajusta la estructura del sistema, alterando las características de su respuesta mediante la minimización del error.
La figura 2.4 muestra ejemplos de aplicaciones en configuración de lazo cerrado[1][5].
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
11
Sistemas Adaptivos Capitulo 2
a) (b)
(d)
c) d)
Figura 2.4. Ejemplos de aplicación en configuración de lazo cerrado. a) Predicción; b) Identificación de sistema (modelado); c) Ecualización (deconvolución, filtrado inverso, modelado inverso); d) Cancelación de eco ó ruido.
2.4. Combinador aditivo
El combinador lineal aditivo[1],[4] ó filtro adaptivo no recursivo, es fundamental en el procesamiento de señales. Este aparece en las aplicaciones de los filtros ó sistemas adaptivos y es el elemento más importante en sistemas de aprendizaje y procesamiento adaptivo en general, como es el caso de los filtros transversales y la regla de propagación de las redes neuronales[1],[4]. La estructura del combinador se muestra en la figura 2.5.
e Retardo Procesador
Adaptivo
s d
x y
-+
∑
e Procesador
Adaptivo
s d
x y
-+∑
H
e Retardo
x +
+ Ruido
∑ H s
Procesador Adaptivo
d
y +
_ ∑ Procesador e
Adaptivo
s+n d
x y
-+∑ n'
Señal de salida
vector de pesos x0
x1
xL
w0
w1
wL
Σ y
Procesador Adaptivo
Vector de la señal de entrada
Figura 2.5. Combinador lineal aditivo
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
12
Sistemas Adaptivos Capitulo 2
El combinador es llamado lineal porque para un número fijo de pesos, su salida es una combinación lineal de sus componentes de entrada. Sin embargo, cuando sus pesos están en un proceso de adaptación, estos son función de las componentes de la entrada, y la salida no es precisamente una función lineal de la entrada [1],[4].
El vector de entrada del combinador aditivo puede ser de señales simultáneas de diferentes fuentes ó pueden ser muestreos secuenciales de la misma fuente (señal a través de un bloque de retardo) y este se interpreta como de entrada múltiple o de entrada simple respectivamente.
En el caso de entrada simple, el procesador adaptivo puede ser implementado con un combinador lineal y elementos de retardo como se muestra en la figura 2.6, y es llamado filtro transversal adaptivo [1],[4].
∑
Z-1 Z-1 Z-1
xk Xk-1 Xk-2 Xk-L
w0k w1k w2k wLk
yk Figura 2.6. Filtro transversal adaptivo.
Para el caso de un filtro con entrada simple, el vector de entrada es:
Xk = [ xok x1k x2k …… xLk ]T (2.3) La relación de la salida con la entrada es la siguiente:
(2.4)
∑= −
= L l wlkxk yk
0 1
El vector de pesos está dado por el siguiente vector:
Wk = [w0k w1k ... wLk] T ( 2.5)
La relación entre (ec. 2.1) y (ec. 2.2) se expresa como:
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
13
Sistemas Adaptivos Capitulo 2
T T
yk = Xk Wk = Wk Xk (2.6)
on esta descripción de la operación del combinador aditivo lineal podemos entender la
lida yk, lo C
adaptación, como el efecto de cambio del vector Wk conforme cambia el índice k.
En el proceso de adaptación, el vector de los pesos es ajustado para producir la sa
más parecida a la señal deseada dk. La comparación de la salida yk con la respuesta deseada dk da como resultado una señal de error, esta señal de error debe minimizarse con el ajuste u optimización del vector de los pesos. La figura 2.7 muestra el método de la derivación del error.
Figura 2.7. Obtención del error en un combinador lineal aditivo.
De la figura (2.7 ) se observa que la señal de error ek es la diferencia de la señal deseada y
yk (2.7)
stituyendo (2.4) en (2.5)
εk = dk - XkT
W = dk - WTXk (2.8)
levamos (2.6) al cuadrado para obtener el error cuadrático instantáneo
εk = dk + W Xk Xk W - 2dk Xk W (2.9) la señal de salida del combinador, esto es:
εk = dk -
su
E
2 2 T T T
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
14
Sistemas Adaptivos Capitulo 2
Suponemos que εk , dk , y Xk son estadísticamente estacionarios y tomamos el valor esperado de (2.7) sobre k:
E[εk2
] = E[dk2
] +WT E[Xk XkT
] W – 2E [dkXkT
] W (2.10)
Note que el valor esperado de cualquier suma es la suma de valores esperados, pero que el valor esperado de un producto, es el producto de valores esperados si las variables son estadísticamente independientes. Las señales xk y dk no son generalmente independientes.
La función del error cuadrático medio puede ser convenientemente expresado como sigue.
Sea R definido como la matriz cuadrada.
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
=
=
2 2
1 0
1 2
1 2 1 0
1
0 2
0 1 0 2
0
] [
Lk k
Lk k Lk k Lk
Lk k k
k k k
k
Lk k k
k k k k
T k k
x x
x x x x x
x x x
x x x
x
x x x
x x x x
E X X E R
K M M
M M
K K
( 2.11)
Esta matriz se llama matriz de correlación de entrada [1],[4]. Los términos de la diagonal principal son los cuadrados principales de los componentes de entrada, y los términos cruzados son las correlaciones cruzadas de los componentes de la entrada.
Sea P similarmente definido como el vector columna
P = E [dk Xk] = E [ dk x0k dk x1k …. DkxLk ] T (2.12 ) Este vector es el conjunto de las correlaciones cruzadas entre la respuesta deseada y los componentes de entrada. Los elementos de ambos, R y P, son todos constantes estadísticas de segundo orden cuando Xk y dk son estacionarias.
El error cuadrático medio en términos de (2.11) y (2.12)
(2. 13)
W P W R W d E E
MSE≡ξ= [εk2]= [ k2]+ T −2 T
El proceso de selección de los parámetros del filtro (coeficientes) se lleva a cabo para obtener la mejor relación entre la señal deseada y la salida del filtro. Esta acción puede ser definida mediante un funcionamiento estadístico ó determinístico. En la aproximación
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
15
Sistemas Adaptivos Capitulo 2
estadística, la acción más común es aplicar como función el valor cuadrático medio del error, esto es, la diferencia entre la señal deseada y la señal de salida del filtro. Y para señales estacionarias, es conveniente aplicar el proceso de minimización del error cuadrático medio, mejor conocido como filtro de Wiener. En la aproximación determinística , la selección usual es una función de la suma pesada del error cuadrático de la señal.[1],[2],[5] .
2.5. Adaptación
Como se menciona en la sección anterior, normalmente hay dos tipos de aproximación que han sido ampliamente usadas para adaptar los algoritmos; estadísticas y deterministas.
Ambos tienen muchas variaciones en sus implementaciones y cada cual ofrece características apropiadas, conduciendo a una gran variedad de algoritmos.
2.5.1 Método de gradiente
De acuerdo con la teoría del filtro de Wiener, el cual se origina de una estructura estadística, los coeficientes óptimos de un filtro lineal son obtenidos por la minimización de su error cuadrático medio (MSE). Como ya se ha mencionado, la minimización del MSE requiere ciertas estadísticas obtenidas a través de un conjunto promedio, el cual no puede ser posible en aplicaciones prácticas. El problema es resuelto usando ergodicidad, esto quiere decir, el uso de tiempos promedio en lugar de conjuntos promedio[1],[4]. El ampliamente usado algoritmo del mínimo valor cuadrático medio (LMS) usa el valor instantáneo del error cuadrático como una estimación del MSE y cuando se usan pequeños pasos en la búsqueda de los coeficientes óptimos del filtro se obtiene un algoritmo simple y confiable.
La principal desventaja del algoritmo LMS es que la convergencia depende altamente de la densidad espectral de potencia de la entrada del filtro. Es decir para que la convergencia sea rápida, se requiere igual excitación sobre el rango de frecuencias. En algunas aplicaciones son necesarios filtros adaptivos con una gran cantidad de bloques de retardo y estos filtros son muy difíciles de implementar[1],[3].
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
16
Sistemas Adaptivos Capitulo 2
2.5.2. Método de mínimos cuadrados
Los algoritmos derivados de la teoría del filtro de Wiener han tenido su origen en formulaciones estadísticas del problema. En contraste a esto, el método de mínimos cuadrados se aproxima a una optimización desde el punto de vista determinístico, esto es, la suma pesada de los errores cuadráticos. Una consecuencia de esta determinística aproximación es que en general, el algoritmo converge más rápido y no es sensible a la densidad espectral de potencia. El precio que hay que pagar para alcanzar esta ventaja es la mayor complejidad y la pobre estabilidad numérica. A este algoritmo se le denomina filtro adaptivo recursivo de mínimos cuadrados, de los cuales existen versiones mejoradas como Fast RLS ó RLS(QRD-RLS) [1],[3].
2.6. Referencias
[1]. Bernard Widrow, Samuel D. Stearns. “Adaptive Signal Processing”.
[2]. B Farhang-Boroujeny. “Adaptive Filters. Theory and Applications”. Ed. John Wiley &
Sons. Capítulo 1 . Octubre 2000.
[3]. Página web. Filtrado adaptativo. Benemérita Universidad Autónoma de Puebla.
[4]. J. Rubén Azor Montoya . Página web. www.um.edu.ar/match/comple.htm. Matemática Superior . Universidad de Mendoza. Argentina
[5]. Meter M. Grant, Colin F.N. Cowan. “Adaptive Filters”. Ed. Prentice Hall. 1985.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
17
C C A A P P Í Í T T U U L L O O 3 3
LÓGICA Y RAZONAMIENTO DIFUSO
3.1. Lógica y conjunto clásico
Lógica: del griego, logos, 'palabra', 'proposición', 'razón', disciplina y rama de la filosofía que estudia los principios formales del conocimiento humano. Su principal análisis se centra en la validez de los razonamientos y argumentos, para que a partir de proposiciones dadas, llamadas premisas, alcance una conclusión derivada de ellas.
Los principios y terminología de la teoría de conjuntos es fundamental en los razonamientos lógicos, pues se utilizan para construir proposiciones matemáticas y explicar conceptos.
Un conjunto es una agrupación, clase o colección de objetos denominados elementos del conjunto.
Un conjunto clásico es un conjunto con límites rígidos, es decir, se sabe con certeza que un elemento pertenece o no pertenece al conjunto A.
Por consiguiente el conjunto clásico A de los números reales mayores que 25 puede ser expresado como :
A= { x | x > 25 } , (3.1)
Es claro que el límite 25 no tiene ambigüedad, por lo que si x es mayor que el número 25, entonces x pertenece al conjunto A; de otra manera x no pertenece al conjunto. Aunque los conjuntos clásicos son utilizados para varias aplicaciones y han probado ser una herramienta importante para las matemáticas y la ciencia, no reflejan los conceptos y pensamientos de la naturaleza humana, los cuales tienden a ser abstractos e imprecisos[1].
Como ejemplo, matemáticamente podemos expresar el conjunto de las temperaturas altas como una colección de valores que miden más de 25 grados centígrados, lo cual queda denotado por la ecuación (3.1), donde A=”temperatura alta” y x=”temperatura en grados”.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
18
Lógica Difusa Capítulo 3
Como podemos observar, lo anterior es una forma inadecuada de representar el concepto de
“temperatura alta”. De acuerdo con el enunciado, podríamos clasificar una temperatura de 25.01 grados como una temperatura alta, pero una temperatura de 24.99 grados como una temperatura no alta. Esta distinción es intuitivamente irrazonable. El defecto está en la transición rígida entre inclusión y exclusión.
3.2. Lógica y Conjunto difuso
La lógica difusa proporciona un medio para enfrentar situaciones del mundo real, situaciones complejas y dinámicas que son más fácilmente caracterizadas por palabras que por ecuaciones matemáticas. La lógica difusa trabaja con conjuntos a los cuales llamamos conjuntos difusos, estos conjuntos están definidos por funciones que expresan la distribución de verdad de una variable. En contraste a un conjunto clásico, un conjunto difuso como su nombre lo indica es un conjunto sin límites rígidos. Esto significa que: la transición de “pertenece al conjunto” a “no pertenece al conjunto” es gradual, y esta transición suave es caracterizada por su función de pertenencia que le dan a los conjuntos difusos flexibilidad en el modelado usando expresiones lingüísticas tal como “el agua está caliente” ó “la temperatura es alta” [1]. La figura 3.1 muestra estas importantes diferencias entre los conjuntos.
(a) (b)
Figura 3.1 Conjuntos: a)Clásico b)Difuso
Lofti A. Zadeh, propuso los conjuntos difusos pensando en la necesidad de implementar una teoría que permitiera implementar ideas subjetivas, es decir, ideas desde el punto de vista humano.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
19
Lógica Difusa Capítulo 3
Un conjunto difuso A se define como una función de pertenencia que enlaza los elementos de un dominio o universo X con elementos del intervalo [0,1]. [2]
A = X → [ 1, 0] (3.2)
Esto es, un conjunto difuso A en el universo X esta expresado como un conjunto de pares ordenados:
A = {(x, µA (x)) | x ∈ X} (3.3) donde A es el conjunto difuso, µA(x) es el grado de pertenencia ó membresía del elemento x con respecto al conjunto difuso A, que puede tomar valores entre 0 y 1, y X es el universo donde está definido A [1].
Obviamente la definición de un conjunto difuso es una simple extensión de la definición de un conjunto clásico en la cual la función característica le permite tener valores continuos entre 0 y 1, pero si la función de membresía µA(x) está restringida sólo a valores 0 ó 1, entonces A es reducido a un conjunto clásico.
Usualmente X es referido como el “universo de discurso”, “universo de discusión” o simplemente el “universo”, y puede contener tanto valores discretos como valores continuos.
Un conjunto difuso se define también como una función de membresía (µ) en la cual para cada elemento del universo le asocia su grado de pertenencia. Por lo tanto un conjunto difuso A puede representarse como un conjunto de pares de valores para cada elemento x en X con su respectivo grado de pertenencia a A. Es decir, la función mapea elementos de un conjunto difuso a un valor en el intervalo [0 1] y se representa de la siguiente forma:
Para el caso de un universo de discurso discreto A = ΣµA(x) / x (3.4)
Para el caso de un universo de discurso continuo A =∫x µA(x) / x (3.5) Cabe aclarar que el símbolo de la sumatoria (Σ) y el de la integral ( ∫ ) indican únicamente la unión de los grados de membresía en cada caso, ya sea discreto o continuo; de manera
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
20
Lógica Difusa Capítulo 3
similar, el símbolo “/” indica únicamente una marca de separación y no implica la división algebraica.
Así, una función de membresía describe el grado de pertenencia al conjunto difuso para los diferentes elementos en el universo de discurso.
3.2.1. Parámetros de los conjuntos difusos
Un conjunto difuso puede representarse gráficamente como una función (función de membresía), tal como se observa en la figura 3.2 donde las abscisas (eje x), es el universo y las ordenadas (eje y) son los grados de pertenencia en el intervalo [0, 1], la misma figura muestra las partes importantes en la caracterización de una función de membresía [1][8].
Figura 3.2. Partes importantes de una función de membresía
Soporte.- El soporte de un conjunto difuso A es el conjunto de todos los puntos x en X tales que µA (x) > 0:
Soporte (A) = {x | µA (x) > 0}
Núcleo.- El núcleo de un conjunto difuso A es el conjunto de todos los puntos x en X tales que µA (x) = 1:
Núcleo (A) = {x | µA (x) = 1}
Normalidad.- Un conjunto difuso A es normal si el núcleo no se encuentra vacío. En otras palabras, se puede encontrar al menos un punto x ∈ X tal que µA (x) = 1.
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
21
Lógica Difusa Capítulo 3
Singleton Difuso.- Es un conjunto difuso cuyo soporte es únicamente un solo punto en X con µA (x) = 1 .
Corte-α, Corte-α fuerte.- El corte-α o conjunto nivel-α de un conjunto difuso A es un conjunto certero definido por:
Aα = {x | µA (x) ≥ α}
El corte-α fuerte o conjunto nivel-α fuerte es definido de manera similar:
A’α = {x | µA (x) >α} donde α ∈ [0, 1].
Un corte α sirve como medio para establecer una interfaz entre un conjunto difuso y un rango certero.
Un conjunto difuso A está abierto hacía la izquierda si
limx → -∞ µA (x) = 1 y limx →+∞ µA (x) = 0;
Un conjunto difuso A esta abierto a la derecha si
limx → -∞ µA (x) = 0 y limx → +∞ µA (x) =1;
Y esta cerrado si
limx → -∞ µA (x) = limx→ +∞ µA (x) = 0.
3.2.2. Operaciones teóricas de conjuntos difusos
En lógica difusa los valores no están definidos rígidamente, por tanto sus operaciones exhiben una distribución descrita por su función de membresía[1][7]. Sean los conjuntos difusos A y B de la figura 3.3
Figura 3.3. Conjuntos difusos
Un subconjunto esta determinado por la siguiente ecuación y se muestra en la figura 3.4
• Subconjunto A ⊆ B ⇔ µA ≤ µB
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
22
Lógica Difusa Capítulo 3
Figura 3.4 Subconjunto. A está contenido en B
En lógica difusa también se cuenta con operaciones de complemento, unión e intersección.
Cuando a dos variables difusas se les aplica una operación de "unión" (que en lógica binaria es equivalente a una operación “O”), el resultado se obtiene tomando el valor más grande de entre las variables de entrada, max(x1, x2, …, xn) , como se observa en la figura 3.5
• Unión: C= A ∪ B ⇔ µC (x) = max (µA (x), µB (x)) = µA (x) ∨ µB (x)
Figura 3.5 A union B
Para el caso de la "intersección" (que equivale a la operación “Y”) el valor resultante de la operación corresponde al mínimo valor de alguna de las entradas: min(x1, x2, …, xn).
• Intersección: C = A ∩ B ⇔ µC (x) = min (µA (x), µB (x)) = µA (x) ∧ µB (x)
Figura 3.6 A intersección B
En la operación "complemento" (equivale a una operación NO), se toma el valor que complemente a 1, de esta forma:
• Complemento: A = X − ⇔A µA( )x = −1 µA( )x
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
23
Lógica Difusa Capítulo 3
Figura 3.7 Conjunto A negado
3.2.3. Intersección difusa: T-Norma
La norma T o norma triangular establece modelos genéricos para las operaciones de intersección, las cuales deben cumplir ciertas propiedades básicas (conmutativa, asociativa, monotonicidad y condiciones frontera). [1],[7],[8]
La intersección de dos conjuntos difusos A y B están especificados en general por una función T: [0, 1] x [0, 1] → [0, 1], que contiene dos grados de membresía como se muestra.
De forma simbolica:
µA∩B( )x =T(µA( ),x µB( ))x =µA( )x ~ B x
*µ ( ) (3.6) donde es un operador para la función T norma. ~∗
Cuatro de los operadores T-norma más frecuentemente utilizados son:
• Mínimum: Tmin (a, b) = min (a, b) = a ∧ b
• Producto algebraico: Tap (a, b) = ab
• Producto acotado: Tbp (a,b) = 0 ∨ (a + b – 1)
• Producto Drástico: Tdp (a, b) =
a si b b si a si a b ,
,
, ,
=
=
<
⎧
⎨⎪
⎩⎪
1 1
0 1
De lo anterior se puede comprobar que:
Tdp (a, b) ≤ Tbp (a, b) ≤ Tap (a, b) ≤ Tmin (a, b).
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
24
Lógica Difusa Capítulo 3
3.2.4. Unión difusa: T-Conorma o S-Norma
Al igual que la intersección difusa, el operador de unión difusa, conorma triangular ó norma triangular S esta especificada en general por una función S : [0, 1] x [0, 1] → [0, 1].
De forma simbólica,
µA B∪ ( )x = S(µA( ),x µB( ))x =µA( ) ~x +µB( ) (3.7) x donde es un operador para la función S [1][7][8]. Operador de unión difusa, que esta referida regularmente como operador T-conorma (o S-norma),
~+
Cuatro de los operadores T-conorma
• Máximum: S (a, b) = max (a, b) = a ∨ b
• Suma algebraica: S (a, b) = a + b – ab
• Suma acotada: S (a, b) = 1 ∧ (a + b)
• Suma Drástica:
. a si b b si a si a b ,
,
, ,
=
=
>
⎧
⎨⎪
⎩⎪
0 0
1 0
También se puede verificar que: Smax (a, b) ≤ Sap (a, b) ≤ Sbp (a, b) ≤ Sdp (a, b).
3.2.5. Leyes de D’ Morgan generalizadas
La T-norma y T-conorma son operadores duales que soportan la generalización de las leyes de De Morgan[1]:
T (a, b) = N (S (N (a), N (b))),
S (a, b) = N (T (N (a), N (b))), donde N (⋅) es el operador de complemento difuso. Si utilizamos y para los operadores T-norma y T-conorma respectivamente, entonces las ecuaciones anteriores pueden ser re-escritas como:
~∗ ~+
a ~∗ b = N (N (a) ~+ N (b)),
a ~+ b = N (N (a) ~∗ N (b)).
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
25
Lógica Difusa Capítulo 3
Para un operador T-norma dado, se puede encontrar siempre un operador T-conorma correspondiente, a través de las leyes generalizadas de De Morgan y viceversa.
3.3. Parámetros de diseño
Para la realización de sistemas basados en lógica difusa se han de definir particiones de las variables. Se recomienda que estas particiones sean completas, con un solapamiento del 20% al 50%, y en un número impar. Normalmente se emplean particiones de 3 ó 7 conjuntos, pues la complejidad no es excesiva y permiten una aproximación suficiente en la descripción de los valores de la variable, también se recomienda definir conjuntos de tipo T (triangulares) en torno a puntos singulares, como el cero, pero depende de la aplicación.
[3],[7],[9]
3.3.1. Partición difusa.
La partición difusa es una división del espacio difuso o el universo de discurso por medio de un número determinado de conjuntos difusos representando variables lingüísticas. Por ejemplo la figura 3.8, muestra como el universo de discurso "Edad" se divide en lo que se conoce como sub-espacio difuso, en este caso tres secciones. La partición difusa esta formada por los valores lingüísticos “Joven”, “Adulto”, y “Viejo”.[1]
Figura 3.8.Partición difusa.
3.3.2. Tipos de funciones
Es precisamente a través de las funciones de membresía (FM) que los conjuntos difusos pueden ser definidos, es decir, una función de membresía es un conjunto difuso, y una vez
MAESTRÍA EN CIENCIAS DE INGENIERÍA EN MICROELECTRÓNICA
26