Identificación por clustering usando modelos difusos Takagisugeno para sistemas con parámetros variantes con el tiempo
67
0
0
Texto completo
(2) IDENTIFICACIÓN POR CLUSTERING USANDO MODELOS DIFUSOS TAKAGISUGENO PARA SISTEMAS CON PARÁMETROS VARIANTES CON EL TIEMPO. JOHN JAIRO SOTO SÁNCHEZ. Proyecto de Grado para optar al título de Magíster en Ingeniería Electrónica y de Computadores. ASESOR: ALAIN GAUTHIER, Phd.. CO-ASESOR: VICTOR HUGO GRISALES, Msc. BOGOTA, DC UNIVERSIDAD DE LOS ANDES MAESTRIA EN INGENIERÍA ELECTRICA Y ELECTRÓNICA FACULTAD DE INGENIERIA Febrero 2004.
(3) CONTENIDO Pág. RESUMEN. 1. OBJETIVOS. 2. INTRODUCCIÓN. 3. 1. IDENTIFICACIÓN DE SISTEMAS. 7. 1.1 PROCESO DE IDENTIFICACIÓN. 8. 1.1.1 Obtención de datos entrada – salida. 8. 1.1.2 Tratamiento previo de los datos registrados. 8. 1.1.3 Elección de la estructura del modelo. 8. 1.1.4 Obtención de los parámetros del modelo. 8. 1.1.5 Validación del modelo. 8. 1.2 MÉTODOS DE IDENTIFICACIÓN. 9. 1.2.1 Dependiendo del tipo de modelo obtenido. 9. 1.2.1.1 Métodos no paramétricos. 9. 1.2.1.2 Métodos Paramétricos. 9. 1.2.2 Dependiendo de la aplicación. 10. 1.2.2.1 Métodos de identificación off-line. 10. 1.2.2.2 Métodos de identificación on-line. 10. 1.2.3 Dependiendo del criterio de ajuste de los parámetros. 10. 1.3 TÉCNICAS DE IDENTIFICACIÓN PARAMÉTRICA. 10. 1.3.1 Estructura Modelos Paramétricos. 11. 1.3.2 Métodos para el ajuste de parámetros. 11. 1.4 ESTIMACIÓN POR MÍNIMOS CUADRADOS. 12. 2. MODELO DIFUSO TAKAGI-SUGENO. 17. 2.1 MODELO AFFINE TAKAGI-SUGENO. 17.
(4) 3. TÉCNICA DE IDENTIFICACIÓN BASADO EN CLUSTERING DIFUSO. 20. 3.1 MODELAMIENTO DIFUSO DE SISTEMAS. 20. 3.2 CLUSTERING DIFUSO. 20. 3.2.1 Algoritmo Fuzzy C-Means. 21. 3.2.2 Algoritmo Gustafson Kessel. 23. 3.2.3 Estimación de parámetros del consecuente. 25. 3.2.3.1 Obtención de los consecuentes de las reglas a partir de los prototipos de cluster. 26. 3.2.3.2 Estimación de los parámetros del consecuente por mínimos cuadrados ordinarios . Enfoque Local. 27. 3.2.3.3 Estimación de los parámetros del consecuente por mínimos cuadrados ordinarios . Enfoque Global. 29. 3.2.4 Generación de funciones de pertenencia del antecedente. 30. 3.3 FUZZY MODELING AND IDENTIFICATION TOOLBOX (FMID). 31. 4. MODELACIÓN DE SISTEMAS NO LINEALES QUE PRESENTAN PEQUEÑAS VARIACIONES CON EL TIEMPO. 33. 4.1 TÉCNICA 1. ACTUALIZACIÓN MODELO GLOBAL A PARTIR DEL MODELO LOCAL. 33. 4.2 TÉCNICA 2. RE-EJECUCIÓN DE CLUSTERING. 36. 4.3 RESULTADOS SIMULACIÓN. 37. 4.3.1 Técnica 1. Actualización modelo global a partir del modelo local. 38. 4.3.1.1 Obtención de datos entrada – salida. 38. 4.3.1.2 Espacio entrada – salida. 40. 4.3.1.3 Reglas modelo difuso. 40. 4.3.1.4 Ejecución algoritmo variante con el tiempo. 41. 4.3.2 Técnica 2. Re-ejecución de clustering. 44. 5. RESULTADOS PRÁCTICOS DE CLUSTERING DIFUSO APLICADO A UNA PLANTA REAL NO LINEAL 5.1 CARACTERÍSITCAS FÍSICAS. 47 47.
(5) 5.1.1 Entrada del Sistema. 47. 5.1.2 Salida del Sistema. 48. 5.1.3 Señales de entrada y salida. 50. 5.1.4 Sistema Completo. 50. 5.2 MODELAMIENTO TEÓRICO. 51. 5.3 IDENTIFICACIÓN POR CLUSTERING AL MODELO TEÓRICO DE LA PLANTA REAL. 52. 5.4 APLICACIÓN CLUSTERING DIFUSO A LA PLANTA REAL. 54. 6. CONCLUSIONES Y RECOMENDACIONES. 57. 7. REFERENCIAS. 59.
(6) LISTA DE FIGURAS. pág. Figura No. 1. Proceso de Identificación. Figura No. 2. Diagrama en Bloques de una estimación de Parámetros por mínimos cuadrados. Figura No. 3. 7. 13. Gráfica de un modelo affine difuso Takagi – Sugeno. 18. Figura No. 4. Matriz de Covarianza Difusa. 25. Figura No. 5. Posición y orientación de un modelo local Lineal obtenido por clustering. Figura No. 6. 26. Aproximación de los datos proyectados por una Función de pertenencia paramétrica. 31. Figura No. 7. Obtención datos entrada – salida. 33. Figura No. 8. Técnica 1. Actualización modelo global a partir Del modelo local. 34. Figura No. 9. Técnica 2. Re-ejecución de clustering. 37. Figura No. 10. Planta utilizada. 37. Figura No. 11. Señal de excitación al sistema. 39. Figura No. 12. Diagrama bloques simulink. Obtención de datos entrada – salida. 39. Figura No. 13. Señal de salida del sistema. 39. Figura No. 14. Espacio entrada –salida. 40. Figura No. 15. Función de pertenencia. 41. Figura No. 16. Simulación Técnica 1.. 42. Figura No. 17. SBPA de entrada sobre un punto de operación. 42. Figura No. 18. Salida modelo difuso – salida planta. 43.
(7) Figura No. 19. Simulación Técnica 2.. 44. Figura No. 20. Nuevo espacio entrada – salida. 45. Figura No. 21. Nuevas funciones de pertenencia. 45. Figura No. 22. Salida modelo difuso – salida planta. 46. Figura No. 23. Planta real. 47. Figura No. 24. Bomba de alimentación. 48. Figura No. 25. Curva Flujo – Corriente de la bomba. 48. Figura No. 26. Sensor de presión. 49. Figura No. 27. Curva Altura – Voltaje sensor de presión. 49. Figura No. 28. Fieldpoint. 50. Figura No. 29. Sistema completo vista 1. 50. Figura No. 30. Sistema completo vista 2. 51. Figura No. 31. Toma de datos del modelo teórico. 53. Figura No. 32. Simulación modelo difuso. 53. Figura No. 33. Salida planta – salida modelo difuso. 53. Figura No. 34. Espacio entrada – salida planta real. 54. Figura No. 35. Funciones de pertenencia planta real. 55. Figura No. 36. Salida Modelo Difuso. 56. Figura No. 37. Salida planta real. 56.
(8) RESUMEN. Este documento explica un método específico en la identificación de sistemas no lineales usando modelos difusos de tipo Takagi-Sugeno, basados en técnicas de clustering y orientados a sistemas que presenten variaciones lentas con el tiempo.. En primer lugar se hace una descripción de la técnica de clustering enfatizando en el Algoritmo Fuzzy C-means y Gustafson Kessel. Posteriormente se explican dos técnicas para la modelación de sistemas variantes con el tiempo.. La técnica de identificación por clustering se aplicó a una planta real no lineal. Esta planta consistió de dos tanques acoplados (uno de ellos completamente alineal) a la que se le modeló la altura del tanque no lineal en función del flujo o caudal de entrada del primer tanque..
(9) OBJETIVOS. Profundizar en la técnica de identificación de sistemas no lineales usando modelos difusos tipo Takagi-Sugeno, basados en clustering y aplicarla a un proceso real.. Estudiar la viabilidad de la aplicación de la técnica de identificación por clustering a sistemas no lineales que presentan variaciones lentas con el tiempo..
(10) INTRODUCCIÓN. Cuando se hace necesario conocer el comportamiento de un sistema en unas determinadas condiciones y ante unas determinadas entradas, se puede recurrir a la experimentación sobre dicho sistema y a la observación de sus salidas. Sin embargo, en muchos casos la experimentación puede resultar compleja o incluso imposible de llevar a cabo, lo que hace necesario trabajar con algún tipo de representación que se aproxime a la realidad, y a la que se conoce como modelo.. Básicamente,. un. modelo es una herramienta. que permite. predecir. el. comportamiento de un sistema sin necesidad de experimentar sobre él.. Existen dos métodos principales para obtener el modelo de un sistema: •. Modelado teórico. Se trata de un método analítico, en el que se recurre a leyes básicas de la física para describir el comportamiento dinámico de un fenómeno o proceso.. •. Identificación del sistema. Se trata de un método experimental que permite obtener el modelo de un sistema a partir de datos reales recogidos de la planta bajo estudio.. El modelado teórico tiene un campo de aplicación restringido a procesos muy sencillos de modelar, o a aplicaciones en que no se requiera gran exactitud en el modelo obtenido. En muchos casos, además, la estructura del modelo obtenido a partir del conocimiento físico de la planta posee un conjunto de parámetros.
(11) 4. desconocidos y que sólo se pueden determinar experimentando sobre el sistema real. De ahí la necesidad de recurrir a los métodos de identificación de sistemas.. Los modelos obtenidos mediante técnicas de identificación tienen, sin embargo, las siguientes desventajas:. •. Su rango de validez suele ser limitado (sólo son aplicables a un determinado punto de trabajo, un determinado tipo de entrada o un proceso concreto).. •. En muchos casos es difícil dar significado físico al modelo obtenido, puesto que los parámetros identificados no tienen relación directa con ninguna magnitud física. Estos parámetros se utilizan sólo para dar una descripción aceptable del comportamiento conjunto del sistema.. En la práctica, lo ideal es recurrir a una mezcla de ambos métodos de modelado para obtener el modelo final. El uso de datos reales para identificar los parámetros del modelo provee a éste de una gran exactitud, pero el proceso de identificación se ve tanto más facilitado cuanto mayor sea el conocimiento sobre las leyes físicas que rigen el proceso.. La identificación difusa es una herramienta efectiva para la aproximación de sistemas dinámicos no lineales basada en la medida de los datos de entrada – salida. El Modelo Difuso Takagi-Sugeno también es usado para la representación de sitemas dinámicos no lineales mediante la interpolación de modelos locales lineales. Este modelo (TS) consiste de reglas if-then con antecedentes difusos y funciones matemáticas en el consecuente. Los antecedentes difusos particionan el espacio de entrada en un número de regiones difusas mientras que las.
(12) 5. funciones del consecuente describen el comportamiento del sistema en esas regiones.. La construcción de un modelo TS generalmente se hace en dos pasos. En primer lugar se deben determinar los conjuntos difusos (funciones de pertenencia). Esto puede hacerse de una forma manual, a partir del conocimiento que se tenga del sistema o proceso, o mediante algunas técnicas de manejo de datos. En segundo lugar, los parámetros de las funciones del consecuente son estimados. Como esas funciones generalmente son lineales, métodos estandar de mínimos cuadrados pueden ser aplicados.. El Clustering difuso es otra herramienta que se usa para obtener las funciones de pertenencia del antecedente. Y una de sus características más importantes es la identificación simultanea de las funciones de pertenencia del antecedente con los modelos lineales locales del consecuente.. Este documento está organizado en 5 capítulo de la siguiente manera.. En el primer capítulo IDENTIFICACIÓN DE SISTEMAS, se hace una breve descripción sobre lo que significa identificar un sistema, como también las diferentes clases que existen. Se explica el método de ajuste de parámetros por mínimos cuadrados (LS) para plantas invariantes.. En el segundo capítulo MODELO DIFUSO TAKAGI-SUGENO, se describe la aplicación de este modelo a sistemas dinámicos mediante el modelo affine.. En el tercer capítulo TÉCNICA DE IDENTIFICACIÓN BASADO EN CLUSTERING DIFUSO, se define el término clustering y se hace una explicación del algoritmo de Fuzzy c-means y posteriormente Gustafson Kessel.. Se describe la forma de. obtener los parámetros del consecuente como también las funciones de.
(13) 6. pertenencia del antecedente.. También se hace una introducción al Fuzzy. Modeling and Identification Toolbox (FMID) de matlab.. En el cuarto capítulo, MODELACIÓN DE SISTEMAS NO LINEALES QUE PRESENTAN PEQUEÑAS VARIACIONES CON EL TIEMPO, se introducen dos técnicas diferentes para modelar plantas no lineales que presentan pequeñas variaciones con el tiempo a partir de la técnica de identificación por clustering difuso. Adicionalmente estas técnicas son aplicadas en simulación, a la obtención de un modelo.. El quinto capítulo, RESULTADOS PRÁCTICOS DE CLUSTERING DIFUSO APLICADO A UNA PLANTA REAL NO LINEAL, comprende en primer lugar la obtención de un modelo teórico de la planta utilizada, al que se le hizo, bajo simulación, una identificación por clustering difuso. Posteriormente a la planta real se le hizo la identificación completa y se compararon los diferentes resultados.. Por último,. el sexto capítulo presenta las conclusiones y recomendaciones.
(14) 1. IDENTIFICACIÓN DE SISTEMAS. Se entiende por identificación de sistemas a la obtención de forma experimental de un modelo que reproduzca con suficiente exactitud, para los fines deseados, las características dinámicas del proceso objeto de estudio1.. Figura No. 1 Proceso de Identificación. 1. L. Ljung. “System Identification. Theory for the user”. Prentice Hall. 1987.
(15) 8. 1.1 PROCESO DE IDENTIFICACIÓN2. En términos generales, el proceso de identificación comprende los siguientes pasos:. 1.1.1 Obtención de datos de entrada - salida. Para ello se debe excitar el sistema mediante la aplicación de una señal de entrada y registrar la evolución de sus entradas y salidas durante un intervalo de tiempo.. 1.1.2 Tratamiento previo de los datos registrados. Los datos registrados están generalmente acompañados de ruidos indeseados u otro tipo de imperfecciones que puede ser necesario corregir antes de iniciar la identificación del modelo. Se trata, por tanto, de ‘preparar’ los datos para facilitar y mejorar el proceso de identificación.. 1.1.3 Elección de la estructura del modelo. Si el modelo que se desea obtener es un modelo paramétrico, el primer paso es determinar la estructura deseada para dicho modelo. Este punto se facilita en gran medida si se tiene un cierto conocimiento sobre las leyes físicas que rigen el proceso.. 1.1.4 Obtención de los parámetros del modelo. A continuación se procede a la estimación de los parámetros de la estructura que mejor ajustan la respuesta del modelo a los datos de entrada-salida obtenidos experimentalmente.. 1.1.5 Validación del modelo. El último paso consiste en determinar si el modelo obtenido satisface el grado de exactitud requerido para la aplicación en cuestión. Si se llega a la conclusión de que el modelo no es válido, se deben revisar los siguientes aspectos como posibles causas:. 2. LOPEZ GUILEN, Elena. Identificación de Sistemas. Aplicación al modelado de un motor de continua..
(16) 9. •. El conjunto de datos de entrada-salida no proporciona suficiente información sobre la dinámica del sistema.. •. La estructura escogida no es capaz de proporcionar una buena descripción del modelo.. •. El criterio de ajuste de parámetros seleccionado no es el más adecuado.. Dependiendo de la causa estimada, deberá repetirse el proceso de identificación desde el punto correspondiente. Por tanto, el proceso de identificación es un proceso iterativo. Ver Figura No. 1. 1.2 MÉTODOS DE IDENTIFICACIÓN3 Existen diversos métodos de identificación, que pueden clasificarse según distintos criterios:. 1.2.1 Dependiendo del tipo de modelo obtenido. 1.2.1.1. Métodos. no. paramétricos,. que. permiten obtener modelos. no. paramétricos del sistema bajo estudio. Algunos de estos métodos son: análisis de la respuesta transitoria, análisis de la respuesta en frecuencia, análisis de la correlación, análisis espectral, análisis de Fourier, etc.. 1.2.1.2 Métodos paramétricos, que permiten obtener modelos paramétricos. Estos métodos requieren la elección de una posible estructura del modelo, de un criterio de ajuste de parámetros, y por último de la estimación de los parámetros que mejor ajustan el modelo a los datos experimentales.. 3. ISERMANN, R. LACHMANN, K. MATKO, D. Adaptive Control Systems. Prentice Hall. 1992..
(17) 10. 1.2.2 Dependiendo de la aplicación:. 1.2.2.1 Métodos de identificación off-line (a posteriori), utilizados en aquellas aplicaciones en que no se requiera un ajuste continuado del modelo. En estos casos, se realiza la identificación previa de la planta, considerándose que la validez de los parámetros obtenidos no se verá alterada con el paso del tiempo.. 1.2.2.2 Métodos de identificación on-line (identificación recursiva), en los que los parámetros se van actualizando continuamente a partir de los nuevos datos de entrada-salida obtenidos durante la evolución del proceso. Estos métodos son muy utilizados en sistemas de control adaptativo. 1.2.3 Dependiendo del criterio de ajuste de los parámetros. Existen diversos métodos matemáticos para ajustar los parámetros de una estructura a un conjunto de datos de entrada-salida. Algunos de los más utilizados en el campo de la identificación son el método de mínimos cuadrados y el método de las variables instrumentales.. 1.3 TÉCNICAS DE IDENTIFICACIÓN PARAMÉTRICA. Los modelos paramétricos quedan descritos mediante una estructura y un número finito de parámetros que relacionan las señales de interés del sistema (entradas, salida y perturbaciones). En muchas ocasiones es necesario realizar la identificación de un sistema del cual no se tiene ningún tipo de conocimiento previo. En estos casos, se suele recurrir a modelos estándar, cuya validez para un amplio rango de sistemas dinámicos ha sido comprobada experimentalmente. Generalmente estos modelos permiten describir el comportamiento de cualquier sistema lineal. La dificultad radica en la elección del tipo de modelo (orden del mismo, número de parámetros, etc.) que se ajuste satisfactoriamente a los datos de entrada - salida obtenidos experimentalmente..
(18) 11. 1.3.1. Estructuras Modelos Paramétricos 4 .. Generalmente los modelos. paramétricos se describen en el dominio discreto, puesto que los datos que sirven de base para la identificación se obtienen por muestreo. En el caso de que se requiera un modelo continuo, siempre es posible realizar una transformación del dominio discreto al continuo.. Tipo de modelo Modelo ARX Modelo Output Error (OE). Estructura Resultante A(q −1 ) y (t ) = B(q −1 ) ⋅ u (t ) + e(t ) y (t ) =. B ( q −1 ) ⋅ u (t ) + e(t ) F (q −1 ). Modelo ARMAX. A ( q −1 ) y (t ) = B ( q − 1 ) ⋅ u (t ) + C ( q − 1 ) e (t ). Modelo Box Jenkins (BJ). B ( q −1 ) C (q −1) y (t ) = ⋅ u (t ) + ⋅ e (t ) F (q −1 ) D(q −1 ). 1.3.2. Métodos para el ajuste de parámetros. Una vez elegida la estructura del modelo (tanto el tipo - ARX, ARMAX, BJ, OE...- como los órdenes de cada polinomio), es necesario determinar el valor de los parámetros del mismo que ajustan la respuesta del modelo a los datos de entrada - salida experimentales.. Entre estos se encuentra el método de mínimos cuadrados.. 4. Opcit LOPEZ GUILLEN..
(19) 12. 1.4 ESTIMACIÓN POR MÍNIMOS CUADRADOS5. Las dinámicas de procesos de un sistema de control digital son representados usando un modelo discreto donde la salida de la planta en la muestra k está definida en términos de las entradas pasadas u (k − 1), u (k − 2),... y salidas pasadas. y (k − 1), y (k − 2)... . En forma general:. n. m. i =1. j =1. y ( k ) + ∑ a i y ( k − i ) = ∑ b j u (k − d − j ) + e ( k ). (1.1). Esta ecuación de diferencias relaciona la salida actual del proceso con las n salidas previas, las m entradas previas, el tiempo muerto d y el efecto de los disturbios e(k).. La estimación de parámetros hace referencia a la aproximación numérica de los pesos a1, a2, …. , an, b1, b2,……, bm que represente adecuadamente la dinámica de un proceso particular.. Se mostrará un método que genera. estimaciones de los parámetros de un. proceso minimizando la suma de los cuadrados del error de estimación.. La figura No. 2 ilustra un diagrama en bloques de una estimación de parámetros, donde la entrada del proceso u(k) es llevada a un modelo que intenta emular la dinámica del proceso. Basado en la entrada dada, el modelo predice la salida del proceso. La salida predecida es comparada con la salida actual del proceso. El error de predicción es usado para actualizar el modelo para que represente más cercanamente el proceso.. 5. HANG, Chang. LEE, Tong. Adaptive Control. 1993.
(20) 13. Figura No. 2. Diagrama en bloques de una estimación de parámetros por mínimos cuadrados. Una característica importante de todos los esquemas de estimación de parámetros por mínimos cuadrados es que la cantidad de datos de entrada y de salida almacenados debe ser finita.. Este método es uno de los más comúnmente usados para la estimación de parámetros.. El método intenta minimizar la suma de los cuadrados de las. diferencias entre la salida del proceso y la salida del modelo de tal forma que los parámetros estimados en el modelo sean los más cercanos a sus valores actuales.. Considere el proceso de la figura No. 2. La dinámica del proceso puede ser descrito usando una función de transferencia discreta, G p ( z −1 ) , donde:. −1. G p (z ) = z. −d. B p ( z −1 ) A p ( z −1 ). (1.2). con. A p ( z −1 ) = 1 + a1 z −1 + ... + a n z − n B p ( z −1 ) = b1 z −1 + b2 z − 2 + ... + bm z − m. (1.3).
(21) 14. Re-escribiendo la función de transferencia en ecuación de diferencia resulta la expresión: n. m. i =1. j =1. y ( k ) + ∑ a i y ( k − i ) = ∑ b j u (k − d − j ) + e ( k ). (1.4). Escrita de forma matricial queda:. y ( k ) = θ T x ( k ) + e( k ). (1.5). donde θ es el vector de parámetros: ⎡ a1 ⎤ ⎢a ⎥ ⎢ 2⎥ ⎢M⎥ ⎢ ⎥ a θ = ⎢ n⎥ ⎢ b1 ⎥ ⎢ ⎥ ⎢ b2 ⎥ ⎢M⎥ ⎢ ⎥ ⎢⎣bm ⎥⎦. (1.6). y x(k ) es el vector de datos:. ⎡ − y (k − 1) ⎤ ⎢ − y (k − 2) ⎥ ⎥ ⎢ ⎥ ⎢ M ⎥ ⎢ − y ( k − n) ⎥ ⎢ x( k ) = ⎢ u (k − d − 1) ⎥ ⎥ ⎢ ⎢ u (k − d − 2) ⎥ ⎥ ⎢ M ⎥ ⎢ ⎢⎣u (k − d − m)⎥⎦. (1.7).
(22) 15. En la figura No. 2 también existe un modelo discreto Gm ( z −1 ) , que es usado como un modelo de estimación del proceso. −1. Gm ( z ) = z. −d. B m ( z −1 ) Am ( z −1 ). (1.8). con. Am ( z −1 ) = 1 + aˆ1 z −1 + ... + aˆ n z − n Bm ( z −1 ) = bˆ1 z −1 + bˆ2 z −2 + ... + bˆm z − m. (1.9). El símbolo ^ representa el valor estimado.. Re-escribiendo la función de transferencia del modelo en una ecuación de diferencia, la salida predecida en el tiempo t = k está dada por: n. m. i =1. j =1. y (k ) = − ∑ aˆ i y (k − i ) + ∑ bˆ j u (k − d − j ). (1.10). Escrita de forma matricial queda: y (k ) = θˆ T (k ) x (k ). (1.11). donde θˆ(k ) es el vector de estimación de parámetros en el tiempo t = k:. ⎡ aˆ1 (k ) ⎤ ⎢ aˆ (k ) ⎥ ⎢ 2 ⎥ ⎢ M ⎥ ⎥ ⎢ aˆ n (k ) ⎥ ⎢ ˆ θ (k ) = ˆ ⎢ b1 (k ) ⎥ ⎥ ⎢ˆ ⎢ b2 (k ) ⎥ ⎢ M ⎥ ⎥ ⎢ ˆ ⎣⎢bm (k )⎦⎥. (1.12).
(23) 16. Dada la salida del proceso actual y la salida predicha, en cualquier instante k, el error de predicción del modelo, ε (k ) es:. ε (k ) = y (k ) − yˆ (k ). (1.13). Si se toman todas las muestras desde 0 hasta k se puede construir un vector de errores de la forma: ⎡ε (k )⎤ E K = ⎢⎢ M ⎥⎥ = YK − φkθˆ ⎢⎣ ε (1) ⎥⎦. (1.14). ⎡ aˆ1 ⎤ ⎢M⎥ ⎢ ⎥ ⎡ x T (k ) ⎤ ⎢ aˆ ⎥ ⎢ ⎥ θˆ = ⎢ ˆn ⎥, φk = ⎢ M ⎥ ⎢ b0 ⎥ ⎢ x T ( 0) ⎥ ⎣ ⎦ ⎢M⎥ ⎢ˆ ⎥ ⎣⎢bm ⎦⎥. (1.15). Con. ⎡ y (k )⎤ YK = ⎢⎢ M ⎥⎥, ⎢⎣ y (1) ⎥⎦. Ahora el objetivo es buscar el vector θˆ(k ) tal que el error entre modelo y planta sea el menor posible. Una forma de lograrlo es construyendo un funcional J de la forma. J=. 1 k ε ( j)2 ∑ 2 j =1. (1.16). Y minimizarlo, es decir se calcula el mínimo error cuadrático en el modelo. Esto se logra cuando6:. θˆk = [φ kT φ k ] φ kT Yk −1. 6. HABER, Rober y KEYVICZKY, Laszlo. Nonlinear System Identification – Input – Output Modeling Approach. Kluwer Academic Publishers. London. 1999.
(24) 2. MODELO DIFUSO TAKAGI-SUGENO. En el modelo difuso propuesto por Takagi y Sugeno, la estructura del antecedente describe regiones difusas en el espacio de entrada, y la del consecuente presenta funciones lineales (no difusas) de las entradas del modelo. Las reglas son de la forma:. Ri : If x is Ai then yi = f i ( x), i = 1,2,..., K. (2.1). 2.1 MODELO AFFINE TAKAGI-SUGENO7. El Modelo Affine Difuso Takagi-Sugeno consiste de reglas Ri que presenta la siguiente estructura: Ri : If x is Ai then yi = aiT x + bi , i = 1,2,..., K. (2.2). Donde x en un vector de entrada, Ai es un conjunto difuso multidimensional:. µ A ( x) → [0,1] , yi es la salida escalar de la i-esima regla, ai es el véctor de i. parámetros y bi es un offset escalar. El modelo anterior puede representar múltiples entradas, múltiples salidas, sistemas dinámicos o estáticos.. Dadas las salidas de los consecuentes individual yi, la salida global y de un modelo TS es calculada usando la siguiente ponderación:. 7. HELLENDROM, H and DRIANKOV, D. Fuzzy Model identification. Springer. 1997.
(25) 18. ∑ y= ∑ K. i =1 K. β i ( x) y i. β ( x) i =1 i. (2.3). Donde βi(x) representa el grado de cumplimiento de la i-esima regla del antecedente, calculada simplemente como el grado de pertenencia de x dentro del conjunto difuso Ai: βi(x)=µAi(x). Por ejemplo, las siguientes 3 reglas difusas describe un modelo affine difuso Takagi-Sugeno:. R1 : If x is A1 then y = a1 x + b1 R2 : If x is A2 then y = a2 x + b2. (2.4). R3 : If x is A3 then y = a3 x + b3. La representación gráfica de esas 3 reglas difusas es la que se muestra en la siguiente figura. Figura No. 3 Gráfica de un modelo affine difuso Takagi-Sugeno. En el contexto de identificación de sistemas dinámicos, el antecedente de un modelo difuso TS define una región difusa sobre los regresores mientras que el.
(26) 19. consecuente es (en la mayoría de los casos) un modelo autoregresivo.. Por. ejemplo:. R1 : If. y ( k ) is A1 and u ( k ) is B1 then y ( k + 1) = a1 y ( k ) + b1u ( k ) + c1. R2 : If. y ( k ) is A2 and u ( k ) is B2 then y ( k + 1) = a2 y ( k ) + b2u ( k ) + c2. (2.5). A las variables del antecedente ( y(k) y u(k) )se les denomina vector de regresión, o simplemente regresando y a la variable de salida del consecuente y(k+1) se le denomina regresor..
(27) 3. TÉCNICA DE IDENTIFICACIÓN BASADO EN CLUSTERING DIFUSO. Cluster es un grupo de objetos que presentan una similitud matemática entre ellos más fuerte que con otros objetos.. Se le denomina clustering a la detección de. supespacios (clusters) en el espacio de datos8 3.1 MODELAMIENTO DIFUSO DE SISTEMAS9. La utilización de conjuntos difusos para efectos de modelamiento fue formulada inicialmente por L. Zadeh como un nuevo enfoque que provee un medio aproximado y efectivo para describir el comportamiento de sistemas lo suficientemente complejos como para no permitir el uso de análisis matemáticos precisos.. A nivel del mundo real, es aquí en donde el uso de la lógica y control difusos permiten en la práctica un adecuado tratamiento de la información, en donde la imprecisión es admisible, imitando los mecanismos de razonamiento aproximado aplicados exitosamente por la mente humana. 3.2 CLUSTERING DIFUSO10. Los datos son observaciones de algún proceso físico y son organizados en una matriz Z por concatenación de una matriz que contiene en sus columnas los. 8. ZHANG, Liyan. Comparison of Fuzzy c-means Algorithm and New Fuzzy Clustering and Fuzzy Merging Algorithm. Computer Science Department University of Nevada, Reno Mayo 2001. 9 GRISALES, Victor Hugo, ISAZA, Claudia Victoria y VILLAMARIN, Gustavo. Modelamiento de Sistemas Dinámicos Difusos Tipo Takagi - Sugeno. 2002 10 Opcit HELLENDROM, H and DRIANKOV, D.
(28) 21. regresores y un vector que contiene la información de los regresandos.. Por. ejemplo un sistema SISO de segundo orden de la forma. y (k ) = F ( y (k − 1), y (k − 2), u (k − 1), u (k − 2)). (3.1). al que se le hicieron N medidas, es organizados en la matriz Z, de la siguiente forma:. ⎡ y (2) y (3) ⎢ y (1) y (2) ⎢ Z = ⎢u (2) u (3) ⎢ ⎢ u (1) u (2) ⎢⎣ y (3) y (4). L y ( N − 1) ⎤ L y ( N − 2)⎥⎥ L u ( N − 1) ⎥ ⎥ L u ( N − 2) ⎥ y ( N ) ⎥⎦ L. (3.2). Donde las primeras 4 filas contienen los regresores (y(k-1), y(k-2), u(k-1) y u(k-2)) y la última fila el regresando y(k).. El vector en la k-esima columna de la matriz Z será denotado por zk. Este vector contiene la completa información acerca del sistema en el instante de tiempo k, es decir el estado del sistema.. La determinación de los clusters se hace a partir de esta matriz Z, y se puede realizar de varias formas dependiendo de la forma como se quieren generar los clusters:. •. El Algoritmo Fuzzy C-Means. •. El Algoritmo Gustafson-Kessel. 3.2.1 Algoritmo Fuzzy C-Means. La mayoría de algoritmos de clustering difuso están basados en la optimización de la función objetivo básica fuzzy c-means:.
(29) 22. c. N. J ( Z ;V ,U ) = ∑∑ (µ i , k ) m d 2 ( z k , vi ). (3.3). i =1 k =1. Sujeto a las siguientes restricciones: c. ∑µ i =1. i, k. N. = 1,. k = 1,..., N ,. 0 < ∑ µi , k < N ,. (3.4). i = 1,..., c. (3.5). k =1. Los vectores zk de la matriz Z son particionados en c clusters, representados por el vector prototipo vi = [vi ,1 ,..., vi ,n ] . V ∈ R nxc , representa la matriz prototipo que T. contiene los vectores prototipo vi en su i-esima columna.. El particionamiento. difuso de lo datos a lo largo de los c clusters es representado mediante la matriz de partición difusa U ∈ R cxN donde sus elementos denotados µ i ,k ∈ [0,1] son los grados de pertenencia del vector de datos zk en el i-esimo cluster. En (3.3), m>1 es un parámetro que controla la fuzividad (fuzzines) de los clusters. Con valores altos de m los clusters van a estar más sobrelapados, y si m se aproxima a 1, se llega a una partición entera (crisp). Un valor usual para este parámetro es 2. La función d ( z k , vi ) es la distancia del vector de datos zk desde los prototipos de cluster vi. La expresión (3.4) es una condición en donde se requiere que la suma de funciones de pertenencia para cada punto sea igual a uno y rechaza la solución trivial U=0 y la expresión (3.5) garantiza que los clusters nunca van a estar vacíos ni que tampoco un cluster va a contener todos los datos..
(30) 23. El problema de optimización definido por el funcional (3.3) y sujeto a las restricciones (3.4) y (3.5) se resuelve por diferentes técnicas de optimización no lineal y se llega al siguiente algoritmo:. •. Paso 1. Calcular los prototipos de cluster: N. (l ) i. v. =. ∑ (µ k =1 N. ∑ (µ k =1. •. ( l −1) m ik k. ) z. ,. 1≤ i ≤ c. ). Paso 2. Calcular las distancias: Dik2 = ( z k − vi( l ) )T A( zk − vi(l ) ), 1 ≤ i ≤ c, 1 ≤ k ≤ N. •. (3.6). ( l −1) m ik. (3.7). Paso 3. Actualizar la matriz de partición difusa. µik(l ) =. 1 c. ∑ (D j =1. ik. / D jk ). (3.8) 2 /( m −1). hasta que:. U (l ) − U (l −1) <∈. (3.9). La forma de los clusters obtenidos mediante este algoritmo tienen forma circular debido a que la matriz de forma inducida A es la identidad.. 3.2.2 Algoritmo Gustaffson Kessel. Es una extension del algoritmo estándar fuzzy c-means, donde se emplea una norma de distancia adaptativa para efectos de detección de clusters de diferentes formas geométricas en el conjunto de datos. Cada cluster tiene su propia matriz de norma inducida Ai, la cual genera la siguiente norma de producto interno:.
(31) 24. 2 DikAi = ( z k − vi )T Ai ( z k − vi ). (3.10). Donde Ai = [det( Fi )] F −1 1/ n. (3.11). El algoritmo Gustafson-Kessel queda de la siguiente forma:. •. Paso 1. Calcular los prototipos de cluster N. (l ) i. v. =. ∑ (µ k =1 N. ( l −1) m ik k. ∑ (µ k =1. •. ) z. ,. 1≤ i ≤ c. (3.12). ( l −1) m ik. ). Paso 2. Calcular las matrices de covarianza de cluster N. Fi =. ∑ (µ k =1. ( l −1) m ik. ) ( zk − vi(l ) )( zk − vi(l ) )T N. ∑ (µ. ,. 1≤ i ≤ c. (3.13). ( l −1) m ik. ). k =1. •. Paso 3. Calcular las distancias: Dik2 = ( z k − vi(l ) )T [det( Fi )]. 1/ n. •. F −1 ( z k − vi(l ) ), 1 ≤ i ≤ c, 1 ≤ k ≤ N. Paso 4. Actualizar la matriz de partición.. 3.14).
(32) 25. µik(l ) =. 1 c. ∑ (D j =1. ik. / D jk ). (3.15) 2 /( m −1). hasta que. U (l ) − U (l −1) <∈. (3.16). La estructura propia (valores propios λi y vectores propios asociados φi) de la matriz de covarianza de cluster provee información acerca de la forma y la orientación del cluster:. Figura No. 4 Matriz de Covarianza Difusa 3.2.3 Estimación de Parámetros del Consecuente11. Existen diversos métodos para obtener los parámetros del consecuente. Basándose en la interpretación geométrica del modelo TS pueden calcularse directamente los parámetros del consecuente a partir de los puntos prototipos de cluster (centros) y los vectores propios (eigenvectors) más pequeños de las matrices de covarianza de clusters.. Puede estimarse también un juego óptimo de parámetros con respecto a la salida del modelo a partir de los datos de identificación mediante mínimos cuadrados 11. Opcit GRISALES, Victor Hugo, ISAZA, Claudia Victoria y VILLAMARIN, Gustavo.
(33) 26. ordinario (Ordinary Least. Squares). Si el modelo debe servir como predictor. numérico, normalmente se prefiere el enfoque de mínimos cuadrados globales, debido a su menor error de predicción. Por otra parte, pueden obtenerse modelos locales más precisos mediante mínimos cuadrados ponderados o total.. 3.2.3.1. Obtención de los Consecuentes de las Reglas a partir de los. Prototipos de Cluster. Los parámetros ai y bi de los consecuentes del modelo affine TS pueden ser obtenidos de la estructura geométrica de los clusters. Para el algoritmo GK, la medida de distancia define cada cluster como una hiperelipsoide cuya forma está descrita por la estructura propia (eigenstructure) de la matriz de covarianza de cluster Fi. Los clusters, que aproximan la superficie de regresión, yacen en subespacios lineales p-dimensionales del espacio de regresión. El vector propio Φi,n correspondiente al valor propio mas pequeño de Fi determina el vector normal al plano extendido sobre los vectores propios restantes de ese cluster, según se observa en la Figura 5. para el caso 3D:. Figura No. 5 Posición y orientación de un modelo local lineal obtenida por clustering De la gráfica se aprecia que la posición y orientación de un modelo local lineal obtenido por clustering está determinado por el centro de cluster vi y por los vectores propios Φi,j .. Por simplicidad el vector propio mas pequeño del i-ésimo cluster será denotado como Φ i, omitiendo el subíndice n. Retomando que z=[xT;y]T es el vector de datos y.
(34) 27. vi es el punto prototipo del cluster, se puede escribir directamente la forma normal implícita para el hiperplano del consecuente, dada por:. φiT ( z − v i ). =. (3.17). 0. Es conveniente dividir el prototipo vi en un vector vix correspondiente al regresor x y un escalar viy correspondiente al regresando y: viT = [(vix)T , viy]. El vector propio mas pequeño es particionado de la misma forma: φiT = [(φix)T , φiy]. Así, llevando a cabo el producto interno se obtiene la siguiente igualdad: (φix ) T ( x − v ix ) + (φi y ) ( y − viy ). =. 0. (3.18). Por lo cual se obtiene mediante una manipulación algebraica simple la ecuación explícita para el hiperplano: y =. −1. φi. y. 1. ( φ ix ) T x +. φi. 14 4244 3 a. y. φiT v i. (3.19). 142 43 bi. i. De donde resultan los valores de ai y bi: ai =. −1. φi. y. φ ix. =. −1. φ ipy + 1. [ φ i1 , φ i 2 , L , φ ip ] T. bi =. 1. φ iy. φ iT v i. ,. (3.20). ,. 3.2.3.2 Estimación de los Parámetros del Consecuente por Mínimos Cuadrados Ordinario –Enfoque Local. Esta sección describe la estimación de los parámetros del consecuente coni, bi formulando un conjunto de problemas independientes de mínimos cuadrados ordinarios (OLS, Ordinary Squares). Denote X la matriz en RNxp que tiene xk en su k-ésima fila,. Least y denota. el vector en RN que tiene yk como su k-ésimo componente, y Wi denota una matriz diagonal en RNxN que tiene µi,k como su k-ésimo elemento diagonal. Los.
(35) 28. parámetros ai y bi del consecuente de la regla que corresponde i-ésimo cluster son concatenados en un solo vector parámetro θ. i. = [aiT:bi]T. Para estimar el. desplazamiento (offset) bi se añade una columna unitaria a X produciendo la matriz del regresor extendida Xe = [X; 1]. Asumiendo que cada cluster representa un modelo lineal local del sistema, los vectores. parámetro. del. consecuente. θi. pueden. ser. estimados. independientemente por ponderación de los mínimos cuadrados, donde los grados de pertenencia de la partición difusa expresan la relevancia del par de datos (xk,yk) del modelo local particular. Si las columnas de Xe son linealmente independientes y µi,k > 0 para 1≤ k≤ N, entonces la expresión. θ i = [ X eT Wi X e ] −1 X eT Wi y. (3.21). es la solución del problema de los mínimos cuadrados Xeθ ≈ y, en donde el késimo par (xk,yk) es ponderado por µi,k. Los parámetros ai y bi son dados entonces por a i = [θ 1 , θ 2 ,...,θ p ], bi = [θ p+1 ]. (3.22). Si las columnas de Xe son linealmente dependientes, deben usarse técnicas basadas en factorización ortogonal de Xe. En este caso, en lugar de aplicar los mínimos cuadrados ponderados, sólo pueden ser usadas aquellas muestras de datos que correspondan al i-ésimo cluster en un grado mayor que un umbral especificado α para obtener la estimación de los parámetros para el consecuente de la i-ésima regla. Si un número suficiente de muestras de datos está disponible en cada cluster, el enfoque α-corte brinda estimaciones menos desplazadas, dado que se consideran sólo los datos que pertenecen en un alto grado al cluster. Por otro lado, la varianza de la estimación puede aumentar en la medida en que estén disponilbes menos muestras de datos..
(36) 29. 3.2.3.3. Estimación de los Parámetros del Consecuente por Mínimos. Cuadrados Ordinario- Enfoque Global.. El enfoque de mínimos cuadrados. ponderados da una estimación óptima de los parámetros de los modelos locales, pero no proporciona un modelo TS óptimo en términos de mínimo error de predicción. Para obtener un predictor global óptimo debe tenerse en cuenta la agregación de las reglas. Al usar la defuzificación difusa media, la cual es una combinación convexa lineal, puede resolverse un problema de mínimos cuadrados globales para obtener la estimación de los parámetros del consecuente. Los grados de pertenencia βi,k = µA,(xk) que representan los grados de cumplimiento (degree of fulfillment) de la i-ésima regla para cada dato, pueden obtenerse de la matriz de partición difusa U. Recuérdese que cada fila de U contiene una definición punto a punto de la función de pertenencia para los datos en el espacio producto X x Y. Para obtener la función de pertenencia Ai en el espacio regresor X debe proyectarse la i-ésima fila de U, denotada U i sobre el espacio regresor: N. β i.k = proj N pp+1. (3.23). donde el proj (⋅) es el operador de proyección punto a punto. El resultado del paso de proyección es que un conjunto de vectores de datos con regresores repetidos xk son asignados al máximo grado de pertenencia de este conjunto. Para escribir en una forma matricial todos los datos (xk,yk), 1<k<N, denote Bi una matriz diagonal en RNxN que tiene los grados de pertenencia normalizados γi como su késimo elemento diagonal. Finalmente, denote X’ la matriz en RNxcN comformada a partir de los productos de matrices de Bi y Xe como X´= [(B1X e ); (B 2 X e );...; (B c X e )] T .. (3.24). Denote θ ´ el vector en Rc(p+1) dado por θ ´= [θ 1T ;θ 2T ;...; θ cT1 ]. en donde θi =[aiT bi]T para 1 ≤ i ≤ c.. (3.25). El problema resultante de mínimos. cuadrados globales X’[θ ´ ] ≈ y tiene la solución.
(37) 30. θ ´= [( X ´)T X ´]−1 ( X ´)T y. (3.26). A partir de (3.25) los parámetros ai y bi son obtenidos por a i = [θ´q +1 , θ´q + 2 ,..., θ´ q+ p ]T , bi = [θ´q + p +1 ],. q = (i − 1)( p − 1).. (3.27). 3.2.4. Generación de Funciones de Pertenencia del Antecedente. La matriz de partición difusa U proyectada sobre el espacio del antecedente define las funciones de pertenencia punto a punto para los datos disponibles. Para obtener un modelo de predicción o un modelo apropiado para el diseño a nivel del control, se necesita que las funciones de pertenencia del antecedente sean expresadas de una forma que permita el cálculo de los grados de pertenencia para cualquier dato de entrada.. Generación de las funciones de pertenencia por Proyección.. El principio de este método es proyectar los conjuntos difusos multidimensionales definidos punto a punto en las filas de la matriz de partición U sobre las variables individuales del antecedente de las reglas. Estas variables pueden ser las variables originales de regresión en cuyo caso la proyección es justamente una proyección ortogonal de los datos. También pueden obtenerse variables transformadas del antecedente por medio de la proyección del vector propio usando los primeros p vectores propios de las matrices de covarianza de cluster. Esta proyección del vector propio es útil para clusters que son opacos hacia el eje del espacio de regresión, y no pueden ser representados con precisión por proyección ortogonal del eje. En ambos casos las funciones de pertenencia proyectadas (definidas punto a punto) son aproximadas por algunas funciones paramétricas convenientes según se ilustra en la Figura 6. :.
(38) 31. Figura No. 6 Aproximación de los datos proyectados por una función de pertenencia paramétrica.. 3.3 FUZZY MODELING AND IDENTIFICATION TOOLBOX (FMID)12. El Toolbox de Identificación y modelamiento difuso es una colección de funciones en Matlab para la construcción de modelos difusos takagi sugeno. Este toolbox provee varias categorías de herramientas:. •. Construcción del modelo. Provee funciones que generan automáticamente un modelo difuso TS a partir de datos de entrada y de salida.. Los. parámetros de los modelos obtenidos son almacenados es una sencilla estructura de Matlab.. Esto permite manejar fácilmente, almacenar y. documentar modelos difusos. También contiene funciones que facilita la simplificación y reducción automática de los modelos difusos removiendo funciones de pertenencia y reglas redundates. re-estimar los parámetros del consecuente.. •. 12. Simulación. Simula un modelo difuso. Manual Fuzzy Modeling and Identification Toolbox. Otras funciones permiten.
(39) 32. •. Exporta los parámetros almacenados de la estructura del modelo difuso en un archivo LATEX.. •. Provee demostraciones de modelos difusos estáticos y dinámicos..
(40) 4. MODELACIÓN DE SISTEMAS NO LINEALES QUE PRESENTAN PEQUEÑAS VARIACIONES CON EL TIEMPO. Esta sección fue trabajada con dos técnicas diferentes.. 4.1 TÉCNICA 1. ACTUALIZACIÓN MODELO GLOBAL A PARTIR DE MODELO LOCAL. Uno de los requisitos indispensables es que la planta tenga variaciones muy lentas con el tiempo. Por lo tanto se realiza en primera instancia, estando la planta offline, un modelamiento global mediante clustering difuso, excitando el sistema con una señal que barra la mayoría de los puntos de operación y que además excite localmente la planta.. Figura No.7 Obtención datos entrada - salida. Con este modelo global se trabaja la planta (on-line) en un punto de operación determinado; como la planta está variando con el tiempo llegará un punto en que la salida del modelo difuso anterior va a ser muy diferente que la salida de la planta.. En ese instante se activa una señal SBPA de un 10% del valor del punto de operación y se lo sumo a este punto. Con esta nueva señal tomo nuevos datos a.
(41) 34. la entrada y a la salida de la planta.. Y ejecutando un algoritmo de mínimos. cuadrados obtengo el modelo local del sistema.. Figura No. 8. Técnica 1. Actualización Modelo Global a partir Modelo Local. El modelo local obtenido del sistema tiene la estructura:. yˆ (k ) = αyˆ (k − 1) + βuˆ (k − 1). A partir de esta estructura (que es válida unicamente en una. (4.1). egion pequeña. sobre el punto de operación) se obtiene una actualización del modelo global, cambiando únicamente algunos parámetros de los consecuentes de las reglas, dependiendo del grado de pertenencia del punto de operación sobre estas reglas.. Es necesario en primer lugar llevar el modelo local lineal a un modelo local incrementalmente lineal para obtener su correspondiente offset. Es decir:. xˆ (k ) = x (k ) − x. El modelo local incrementalmente lineal queda de la forma:. (4.2).
(42) 35. y (k ) − y = α ( y (k − 1) − y ) + β (u (k − 1) − u ) y (k ) = αy (k − 1) + βu (k − 1) + (1 − α ) y − βu. (4.3). Según Takagi-Sugeno la ponderación del modelo local a partir del global se hace de la siguiente manera:. ∑ y= ∑. K. i =1 K. β i ( x) yi. β ( x) i =1 i. (4.4). Ahora se requiere el proceso contrario, como a partir del local (4.3) se pueden obtener los parámetros del modelo global yi. Si se tienen reglas de la forma:. R1 : If. y ( k − 1) is A11 and u (k − 1) is A12 then y ( k ) = a1 y ( k − 1) + b1u ( k − 1) + c1. R 2 : If. y (k − 1) is A21 and u ( k − 1) is A22 then. (4.5). y ( k ) = a 2 y (k − 1) + b2 u (k − 1) + c 2 La aplicación de (4.4) sería:. (1 − α ) y − βu =. α=. µ A11 ( x)a1 + µ A 21 ( x)a2 µ A11 ( x) + µ A 21 ( x). (4.6). β=. µ A12 ( x)b1 + µ A 22 ( x )b2 µ A12 ( x) + µ A 22 ( x). (4.7). (µ A11 ( x) + µ A12 ( x))c1 + ( µ A21 ( x) + µ A22 ( x))c2 µ A11 ( x ) + µ A12 ( x) + µ A 21 ( x) + µ A22 ( x). (4.8).
(43) 36. Es necesario obtener los nuevos parámetros globales presentes en las reglas. a1 , a2 , b1 , b2 , c1 y c2 .. Como la planta varia lentamente con el tiempo, al parámetro. que tenga menos ponderación, dado por las funciones de pertenencia, en ese punto de operación lo dejo igual que con el modelo inicial por clustering, mientras que el que tenga más ponderación, es decir aquel que afecte en un mayor grado el modelo global, le hago la actualización utilizando las fórmulas anteriores y de esa forma actualizo el modelo global.. 4.2 TÉCNICA 2. RE-EJECUCIÓN DE CLUSTERING. Inicialmente se ejecuta el algoritmo de clustering difuso obteniendo el modelo global.. Se trabaja la planta en un punto de operación determinado; como la planta está variando con el tiempo llegará un punto en que la salida del modelo difuso alcance el umbral de un error establecido. En ese instante se activa una señal persistente de un 10% del valor del punto de operación y se lo sumo a este punto. Con esta nueva señal tomo nuevos datos a la entrada y a la salida de la planta. Estos nuevos datos son añadidos al espacio de entrada – salida y los puntos más viejos alrededor de este punto de operación son removidos, para volver a ejecutar nuevamente el algoritmo de clustering (Sin necesidad de colocar la planta fuera de línea).
(44) 37. Figura No. 9 Técnica 2. Re-ejecución de Clustering. Este método tiene la ventaja que no únicamente se están actualizando los parámetros del consecuente, sino que adicionalmente se está modificando levemente las funciones de pertenencia.. 4.3 RESULTADOS SIMULACIÓN. Con ayuda de matlab y simulink, se hizo la simulación de los algoritmos tanto en la técnica 1 como en la técnica 2. La planta utilizada fue un tanque sencillo al que se le colocó el parámetro Cv o β de la válvula de salida variante con el tiempo. La planta utilizada para esta simulación fue:. Figura No. 10 Planta utilizada.
(45) 38. Los parámetros del proceso son los siguientes:. •. El radio del tanque r = 5cms.. •. El área del tanque A = 78.54cm2. •. rango h(t )[0 − 16] cms. •. rango Wi[0 − 160] cms3/s. La ecuación diferencial que describe el proceso es:. [. 1 h& = wi − β h A. ]. (4.9). Se escogió una planta sencilla para poder obtener un modelo teórico que tenga un grado de validez alto para probar la eficiencia del algoritmo cuando la planta este variando con el tiempo.. 4.3.1 Técnica 1.. Actualización Modelo Global a partir Modelo Local.. Inicialmente se ejecutó el algoritmo de clustering con la planta off-line de la siguiente forma:. 4.3.1.1. Obtención De Datos Entrada Salida. La obtención de los datos de. entrada – salida del proceso real se realizó de la siguiente manera:. Se excitó el sistema con una señal rica en componentes de frecuencia y en diferentes niveles de amplitud como se muestra en la figura a continuación:.
(46) 39. Figura No. 11 Señal de excitación al sistema. Esta señal se introdujo como flujo de entrada a la planta:. Figura No. 12. Diagrama Bloques Simulink Obtención datos entrada -salida. La Salida obtenida de esa simulación fue la siguiente:. Figura No. 13 Señal de salida del sistema.
(47) 40. Esas dos señales fueron almacenadas en dos vectores, donde las primeras 4000 muestras fueron utilizadas para el proceso de la identificación y las otras 4000 para la correspondiente validación.. 4.3.1.2 Espacio Entrada Salida. Con los vectores almacenados de entrada – salida, se obtuvo el siguiente espacio de entrada – salida.. Figura No. 14 Espacio Entrada - Salida. Basados en este espacio, se escogieron 3 centros de clusters para realizar el modelo difuso suficientes para obtener un modelo válido.. Entre más centros de. cluster se utilicen más reglas se obtienen y el control posterior será más complejo. 4.3.1.3. Reglas Modelo Difuso. El Modelo Takagi – Sugeno resultante de la. simulación está conformado por las 3 reglas siguientes:.
(48) 41. La funciones de pertenencia son:. Figura No. 15 Funciones de Pertenencia. 4.3.1. 4 Ejecución Algoritmo Variante con el Tiempo. En simulink se realizó la simulación:.
(49) 42. Figura No. 16 Simulación Técnica 1. En un punto de operación de 100cm3/s, se observa la salida del modelo y salida de la planta, como esta última está variando con el tiempo se presenta un error apreciable en algún tiempo y es cuando se inserta la SBPA para obtener un modelo local.. Figura No. 17. SBPA de entrada sobre un punto de operación. Más o menos en la muestra 3500 se hace el ajuste al nuevo modelo global. Al ejecutar el algoritmo de mínimos cuadrados, el modelo obtenido fue:. y (k ) = 0.8179y(k - 1) + 0.0109u(k - 1) + 0.0276.
(50) 43. De este modelo, comparándolo con la ecuación (4,3), se obtienen los parámetros. α , β y (1 − α ) y − βu . Estos datos se aplican a las ecuaciones (4,6), (4,7) y (4,8):. 0.8179 =. µ A11 ( x )a1 + µ A21 ( x)a2 + µ A31 ( x )a3 µ A11 ( x) + µ A 21 ( x) + µ A31 ( x)a3. 0.0109 =. µ A12 ( x)b1 + µ A 22 ( x)b2 + µ A32 ( x)b3 µ A12 ( x) + µ A22 ( x) + µ A32 ( x)b3. 0.0276 =. ( µ A11 ( x) + µ A12 ( x))c1 + ( µ A21 ( x) + µ A22 ( x))c 2 + (µ A31 ( x) + µ A32 ( x))c3 µ A11 ( x) + µ A12 ( x) + µ A21 ( x) + µ A22 ( x) + µ A31 ( x) + µ A32 ( x). Como se tienen 9 incognitas, del modelo global: a1 , a 2 , a3 , b1 , b2 , b3 , c1 , c 2 y c 2 , y sólo hay 3 ecuaciones, lo que se hace es que para cada ecuación se busca cual de estas variables tiene asociada un grado de pertenencia mayor en el punto de operación: µ A11 ( x ) .. Y a esta variable se le hace la actualización. Las otras se. dejan quietas.. Después de actualizar el modelo, se ve como la salida del modelo difuso tiende a un valor cercano al de la salida de la planta.. Los resultados se muestran a continuación:. Figura No. 18 Salida Modelo Difuso – Salida Planta.
(51) 44. 4.3.2 Técnica 2. Re-ejecución de Clustering. Con esta técnica nuevamente se parte de un modelo clustering inicial tal cual como se hizo en la técnica 1 en los numerales 4.3.1.1 a 4.3.1.3 y cuando el error alcanza un umbral establecido se introduce una señal persistente del 10% de punto de operación.. Figura No. 19 Simulación Técnica 2. Con estos nuevos datos a la entrada y a la salida, juntos con los datos anteriores, quitando los datos más viejos que se encuentran alrededor del punto de operación, se genera el nuevo espacio entrada –salida, donde se observa un agrupamiento de datos sobre este punto de operación, y se vuelve a ejecutar el algoritmo de clustering..
(52) 45. Figura No. 20 Nuevo Espacio Entrada – Salida. Ahora el algoritmo genera las nuevas funciones de pertenencia.. Figura No. 21 Nuevas Funciones de Pertenencia.
(53) 46. Si se comparan estas nuevas funciones de pertenencia con las del modelo inicial se observa que cambian muy poco en los puntos lejanos a 100 cm3/s, mientras que sobre este rango la variación es un poco mayor.. Lo mismo sucede con las nuevas reglas:. Los resultados obtenidos se muestran a continuación:. Figura No. 22. Salida Modelo Difuso – Salida Planta.
(54) 5. RESULTADOS PRÁCTICOS DE CLUSTERING DIFUSO APLICADO A UNA PLANTA REAL NO LINEAL. 5.1 CARACTERÍSTICAS FÍSICAS. La planta real utilizada para la aplicación de clustering, consistió en dos tanques acoplados, uno de los cuales era complemente alineal y se pretende modelar la salida h en función del flujo de entrada qin. Figura No. 23. Planta Real. 5.1.1 Entrada del Sistema. La entrada del sistema se implementó a través de una bomba de 12V,.
(55) 48. Figura No. 24 Bomba de Alimentación. Cuya curva característica, fue obtenida realizando diferentes mediciones de volumen de liquido almacenado en un tiempo determinado. Esta curva se muestra a continuación:. Figura No. 25. Curva Flujo – Corriente de la Bomba. Debido al gran consumo de corriente por parte de la bomba, fue necesario incluir un circuito de potencia para el correcto funcionamiento. 5.1.2 Salida del Sistema. La salida h, se implementó mediante un sensor de presión, ubicado en el tanque no lineal..
(56) 49. Figura No. 26. Sensor de Presión. Este dispositivo sensa la presión en el fondo del segundo tanque, que es proporcional a la altura del mismo.. La salida es diferencial y mediante un. amplificador diferencial se toma la señal.. La curva característica de este dispositivo se muestra a continuación:. Figura No. 27. Curva Altura – Voltaje Sensor de Presión.
(57) 50. 5.1.3 Señales de entrada y salida. Tanto la señal que maneja la bomba, como la señal que suministra el sensor de presión son manejadas por un dispositivo de entradas y salidas análogas llamado Fieldpoint.. Figura No. 28 Fieldpoint. 5.1.4. Sistema Completo.. A continuación se muestra el sistema de tanques. completo, con su bomba de entrada, el sensor de presión y el Fieldpoint.. Figura No. 29 Sistema Completo Vista 1.
(58) 51. Figura No. 30 Sistema Completo Vista 2. 5.2 MODELAMIENTO TEÓRICO. Las ecuaciones de estado que describen el comportamiento del sistema son:. 1 h&1 = [qin − qo1 − qo3 ] A1.
(59) 52. 1 h&2 = [qo3 − qo 2 ] A2. El área del tanque 1 A1, permanece constante, mientras que el área 2 depende de la altura del tanque. A1 = 0.01cm2 0.01 ⎧ ⎪ 0.2h ⎪ 2 A2 = ⎨ ⎪0.08 − 0.2h2 ⎪⎩ 0.02. h2 < 0.1 0.1 ≤ h2 < 0.2 0.2 ≤ h2 < 0.3 h2 ≥ 0.3. Para calcular los flujos, se determinó que clase de flujo pasaba por la manguera, laminar o turbulento basandose en el número de Reynolds. De este análisis se llegó a los siguientes resultados. qo1 = 0.000025318 h1 qo 2 = 0.000041169 h2 qo 3 = 0.00038547(h1 − h2 ). 5.3. IDENTIFICACIÓN POR CLUSTERING AL MODELO TEÓRICO DE LA. PLANTA REAL. Al modelo teórico anterior se le aplicó la técnica de clustering, excitando el sistema y tomando los datos de entrada y los datos de salida:.
(60) 53. Figura No. 31. Toma de datos del modelo teórico. Los resultados obtenidos, trabajando con el modelo teórico de la planta fueron muy buenos y se muestran a continuación.. Figura No 32 Simulación Modelo Difuso. Figura No. 33 Salida Planta – Salida Modelo Difuso.
(61) 54. Al comparar las dos gráficas se observa una gran similitud entre ambas, asegurando que el modelo obtenido mediante clustering se aproxima mucho a la realidad. 5.4 APLICACIÓN CLUSTERING DIFUSO A LA PLANTA REAL. Ahora aplicando el algoritmo de clustering a la planta real, es decir excitando la planta y tomando los datos a la entrada y la salida de la misma, se obtuvo el siguiente espacio entrada-salida.. Figura No. 34 Espacio Entrada – Salida Planta Real. Con los datos recolectados de entrada y salida se aplicó el algoritmo de clustering.. Las funciones de pertenencia generadas por el algoritmo se muestran a continuación:.
(62) 55. Figura No. 35 Funciones de Pertenencia Planta Real. Y por ultimo la estimación de los parámetros del consecuente, arrojó como resultado el siguiente conjunto de reglas:. Al simular este modelo difuso de la planta real con diferentes entrada pasos, para excitar la planta en varios puntos de operación se obtuvo:.
(63) 56. Figura No. 36 Salida Modelo Difuso. Figura No. 37 Salida Planta Real. Si se observan las dos gráficas anteriores se puede observar que el modelo obtenido es muy válido. En el segundo punto de operación se observa el mayor error. Esto es debido a que faltó excitar un poco más la planta por estos puntos..
(64) 6. CONCLUSIONES Y RECOMENDACIONES. Se aplicó de forma correcta el algoritmo de clustering difuso a una planta real invariante con el tiempo. El algoritmo de clustering da una muy buena aproximación de plantas no lineales, siempre y cuando la señal de entrada, para la identificación, recorra la mayoría de los puntos de operación como tambien excite localmente el sistema.. La técnica 1, Actualización Modelo Global a partir Modelo Local, empleada para el modelamiento de plantas variantes con el tiempo, presenta el inconveniente que depende del punto de operación donde se esté trabajando; presenta mayores problemas cuando el punto de operación activa dos reglas en un grado de pertenencia muy similar.. Aplicar el algoritmo de clustering difuso en plantas reales o industriales es bastante lento, debido a que es necesario encontrar una señal que recorra la mayoría de los puntos de operación, y por lo general estas plantas son muy lentas.. La forma como fue aplicada la técnica 2 para el modelamiento de plantas variantes con el tiempo, puede dar inicio para realizar una recolección de datos, en plantas en las que no se puedan hacer barridos en diferentes puntos de operación. Se empezaría por hacer pequeñas modificaciones en la entrada sobre un punto y observar la salida, cuando la planta cambie de punto de operación se repite la operación hasta ir obteniendo un espacio entrada-salida lo más completo posible para ejecutar en forma correcta el algoritmo de clustering..
(65) 58. En la actualidad la técnica de identificación mediante clustering difuso es muy utilizado en simulación con óptimos resultados.
(66) 7. REFERENCIAS. BABUSKA, R., Fuzzy Modeling for Control, Kluwer Academic Publishers: Massachusetts, USA, 1998. Driankov, D. Hellendoorn, H. Fuzzy Model Identification. 1997.. LJUNG, Lennart. System Identification. 1999. Passino, Kevin. Yurkovich, Stephen. Fuzzy Control. 1998. SODERSTROM, Torsten. System Identification. 1990. R. Haber and L. Keviczky.. Nonlinear System Identification – Input-Output. Modeling Approach. 1999. J. Abony and R. Babuska and F. Szeifert. Modified Gath-Geva Fuzzy Clustering for Identification of Takagi-Sugeno Fuzzy Models.. J. Abony and R. Babuska. Local and global identification and interpretation of parameters in Takagi-Sugeno fuzzy models.. R. Babuska. Fuzzy Systems, Modeling and Identification.. J. Abony and R. Babuska. Identification of MIMO systems by input-output TS fuzzy models..
(67) 60. J. Abony and J. Roubus and M. Oosterom and F. Szeifert. Compact TS-Fuzzy Models through Clustering and OLS plus FIS Model Reduction. Gustafson, D.E. and W.C. Kessel. Fuzzy clustering with a fuzzy covariance matrix.. T. Takagi and M. Sugeno. Fuzzy identification of systems and its application to modeling and control..
(68)
Documento similar
Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en
- Dificultad para apuntar la tarea diaria de cada asignatura.. - Es desorganizado en
Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura
[r]
[r]
[r]
First, we must remember that time travel (specially a trip to the past, or a two-way trip) would only be possible in the block universe. In the presentist alternative,