Supervisión de procesos, detección y diagnóstico de fallas - combinación de métodos analíticos y basados en el conocimiento

Texto completo

(1)S UPERVIS IÓN DE PROCES OS, DETECCIÓN Y DIAGNÓS TICO DE FALLAS Combinación de métodos analíticos y basados en el conocimiento.. ANDRES ES COBAR DIAZ. 200229030. UNIVERS IDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERIA ELECTRONICA S ANTAFE D E BOGOTA, DC. AGOS TO DE 2005.

(2) S UPERVIS IÓN DE PROCES OS, DETECCIÓN Y DIAGNÓS TICO DE FALLAS Combinación de métodos analíticos y basados en el conocimiento.. PROYECTO DE GRADO PARA OPTAR AL TITULO DE MAGÍS TER EN INGENIERÍA ELECTRÓNICA Y D E COMPUTADORES. ANDRES ES COBAR DIAZ. 200229030. Director: ALAIN GAUTHIER. UNIVERS IDAD DE LOS ANDES FACULTAD DE INGENIERÍA DEPARTAMENTO DE INGENIERIA ELECTRONICA S ANTAFE D E BOGOTA, DC. AGOS TO DE 2005.

(3) TABLA D E CONTENIDO. INTRODUCCION .........................................................................................................................4 OBJETIVOS ..................................................................................................................................6 GENERAL ....................................................................................................................................6 ESP ECIFICOS..............................................................................................................................6. 1. MODELOS DIS CRETOS CON ES TRUCTURA LINEAL..................................................7 1.1 RESUMEN DE IDENTIFICACIO N LINEAL DE SISTEMAS................................................7 1.2 ESTRUCTURA GENERAL DE LOS MO DELOS LINEALES DISCRETO S.........................9 1.5 APLICACIONES DE UN MO DELO .....................................................................................16 1.5.1 SIMULACION.......................................................................................................................16 1.5.2 PREDICCION.......................................................................................................................18. 1.5 MODELO S MAS UTILIZADO S...........................................................................................19 1.5.1 ARX......................................................................................................................................19 1.5.2 ARMAX................................................................................................................................21 1.5.3 OE........................................................................................................................................22 1.5.4 COMENTARIOS SOBRE LOS DEMAS MODELOS.................................................................23. 2 ES TIMAC ION DE PARAMETROS EN TIEMPO REAL ..................................................24 2.1 ELEMENTO S PRINCIPALES EN UN SISTEMA DE IDENTIFICACIO N..........................24 2.2 MINIMOS CUADRADOS (LS) Y MO DELO S DE REGRESION. ........................................25 3.2.1 ESTIMACION MINIMOS CUADRADOS ................................................................................27 2.2.2 INTERPRETACION ESTADISTICA.......................................................................................30 2.2.2.1 Propiedades estadísticas de la estimación de mininos cuadrados. ............................................ 31 2.2.3 CALCULOS RECURSIVOS....................................................................................................32 2.2.3.1 Teorema. Matriz de inversión........................................................................................... 33 2.2.3.2 Estimación de mínimos cuadrados recursiva (RLS).............................................................. 34 2.2.3.3 Condiciones iniciales para P(t) y para θ(t)........................................................................... 35 2.2.4 PARAMETROS VARIANTES EN EL TIEMPO........................................................................36 2.2.4.1 Mininos cuadrados recursivos con olvido exponencial........................................................... 37.

(4) 2.3 ESIMACION DE PARAMETROS EN SISTEMAS DINAMICOS........................................37 2.3.1 MODELO DE RESPUESA FINITA AL IMPULSO (FIR)...........................................................37 2.3.2 MODELOS DE FUNCIONES DE TRANSFERENCIA...............................................................39 2.3.3 MODELOS ESTOCASTICOS.................................................................................................41 2.3.4 GENERALIZACION..............................................................................................................42. 2.4 SIMULACIO N DE ES TIMACIO N RECURSIVA.................................................................43. 3. NIVELES DE CONTROL......................................................................................................64 4. DETECCIÓN Y DIAGNÓS TICO DE FALLAS ................................................................65 4.1. GENERACIÓ N ANALÍTICA DE RESIDUO S....................................................................65 4.2 GENERACIÓ N HEURÍSTICA DE RESIDUOS...................................................................65 4.3. DIAGNOSTICO DE FALLAS ............................................................................................ 66 4.4. MÉTO DOS DE DETECCIO N DE FALLAS BASADOS EN MO DELO S............................ 66 4.5. MO DELAMIENTO DE FALLAS.........................................................................................67 4.6. DETECCIÓ N DE FALLAS CO N ESTIMACIÓ N DE PARÁMETRO S ............................. 68 4.6.1. GENERACIÓ N DE RESIDUOS ........................................................................................68 4.7. MÉTO DO DE DIAGNÓSTICO DE FALLAS ..................................................................... 69. 5. DES ARRO LLO DE LA APLICAC IÓN ...............................................................................75 5.1 PROCESO ............................................................................................................................ 75 5.2 INSTRUMENTACIÓ N......................................................................................................... 76 5.3 CONTRO L........................................................................................................................... 78 5.4 GENERACIO N DE RESUDUOS Y CO MPO RTAMIENTO CO N FALLAS........................ 79 5.5 DIAGNOSTICO DE FALLAS .............................................................................................. 80. CONCLUS IONES .......................................................................................................................85 ANEXO C .....................................................................................................................................88 C.1 NO TACION..........................................................................................................................88 C.2 ABREVIATURAS.................................................................................................................88. BIBLIOGRAFIA .........................................................................................................................90.

(5) SUPERVISION, DETECCION Y DISTICION DE FALLAS. LIS TA DE FIGURAS Figura 1.1 Resumen de los métodos de identificación de sistemas lineales.....................................7 Figura. 1.2. M odelo lineal general. (a) definición de las funciones de transferencia. (b) Definición de los polinomios de las funciones de transferencia. (c) y (b) Diferenciación de.las dinámicas estocástica y determinística......................................................................................................10 Figura. 1.5 Un modelo de serie de tiempo general lineal. La entrada del modelo v(k ) es una señal de ruido blanco.........................................................................................................................11 Figura. 1.6. M odelo determinístico general lineal. La entrada del modelo u (k ) es una señal determinística. No hay influencia estocástica. .........................................................................11 Figura. 1.7. Resumen de los modelos de series de tiempo. Autoregressive (auto regresivo) AR, M oving average (promedio móvil) M A, y autoregressive moving average (promedio móvil y autoregresivo) ARMA...........................................................................................................11 Figura. 1.8. Resumen de los modelos dinámicos lineales comunes. (a) ARX (b) ARMAX (c) ARARX (d) OE (e) BJ (f) FIR.................................................................................................13 Figura. 1.9. Clasificación de los modelos lineales según: (a) su respuesta al impulso. (b) tipo de error (c) si tiene entradas. (d) las propiedades de ruido. Dinámica igual se refiere a que los denominadores de la parte determinística y estocástica son iguales........................................17 Figura. 1.10. Concepto de simulación ............................................................................................18 Figura. 1.11. Concepto de predicción.............................................................................................19 Figura 2.1. Los círculos en azul representan datos medidos. Los resultados de la estimación, rojo para parábola, negro para recta. (a) Datos contaminados con ruido con desviación estándar 0.05.(b) con desviación estándar 0.3........................................................................................29 Figura 2.2 Diagrama de bloques de un estimador paramétrico recursivo para un modelo FIR. ....38 Figura. 2.3 Diagrama de bloques del estimador de mínimos cuadrados basado en el modelo error de salida (OE)...........................................................................................................................41 Figura 2.5. La línea roja es la salida el proceso real, la azul es la salida contaminada con ruido, media 0 y desviación estándar 0.001. La línea negra es la salida predicha en cada instante de.

(6) SUPERVISION, DETECCION Y DISTICION DE FALLAS. muestreo. (a) Salida del sistema ante un impulso. (b) Salida del sistema ante un paso.(c) amplicion de la Fig 3.5(b) alrededor del tiempo 29.................................................................45 Figura 2.6 Evolución parámetros en el tiempo. Las líneas negras horizontales corresponden a los parámetros reales. el parámetro a corresponde es rojo y b corresponde a azul.(a) parámetros estimados , entrada impulso.(b) parámetros estimados, entrada escalón.................................46 Figura 2.7. Velocidad de convergencia de los parámetros dependiendo la condición inicial de P..(a) P=1, (b) P=10, (c)P=50, (d)P = 1000.............................................................................47 Figura 2.8. Estimación de un modelo OE primer orden. (a) λ=1, (b) λ=0.98, (c) λ=0.978, (d) λ=0.9745. Las líneas negras horizontales son los parámetros reales, las líneas de color son los parámetros estimados...............................................................................................................49 Figura 2.9. Preedición de la salida del sistema; línea azul salida real , línea negra salida predicha. (a) Estimación para el modelo ARX (b) Estimación para el modelo OE (c) Estimación para el modelo ARM AX......................................................................................................................51 Figura 2.10. Evolución de los parámetros. Líneas negras horizontales son los parámetros reales. línea roja parámetro a , línea azul parámetro b, verde parámetro c, magenta parámetro d. (a) Parámetros modelo ARX (b) Parámetros modelo OE (c) parámetros modelo ARM AX........52 Figura 2.11. Comportamiento de los residuos de estimación con el paso del tiempo. (a) para el modelo ARX (b) Para el modelo OE (c) Para el modelo ARM AX.........................................53 Figura 2.12. Estimación de los parámetros en el tiempo para un modelo ARM AX. Con P(0)=100000. M ejora la velocidad de convergencia con respecto a Fig. 3.10 (c)...................54 Figura 2.13. Estimación de los parámetros en el tiempo para un modelo OE. Con P(0)=1010 . M ejora la velocidad de convergencia con respecto a Fig. 3.10 (b)..........................................54 Figura 2.14. Preedición de la salida del sistema. Línea Roja salida real del sistema, línea azul. salida contaminada con ruido, línea negra la salida predicha. (a) Comportamiento en todo el tiempo. (b) ampliación alrededor del tiempo 40s. ...................................................................56 Figura 2.15. Estimación de los parámetros en el tiempo. Parámetro a es la línea roja, parámetro b es la línea azul. Parámetros reales iniciales líneas negras horizontales. Segundos parámetros reales líneas verdes horizontales..............................................................................................57 Figura 2.16. Comportamiento de los residuos de estimación en el tiempo....................................57 Figura 2.17. Predicción de la salida del sistema en cada instante de muestreo. Línea roja salida real del sistema. Línea azul contaminación con ruido. Línea. negra predicción de los.

(7) SUPERVISION, DETECCION Y DISTICION DE FALLAS. algoritmos. (a) para el modelo ARX (b) para el modelo OE (c) para el modelo ARM AX. Línea verde es la salida de la parte determinística del modelo ARM AX................................60 Figura 2.18. Estimación de los parámetros. Líneas continua negras horizontales son los parámetros reales. La estimación para el parámetro d es una línea magenta, para c es verde, para b es azul y para a es roja. (a) para el modelo ARX. (b) para el modelo OE (c) para el modelo ARM AX......................................................................................................................61 Figura 2.19. Comportamiento en el tiempo de los residuos de estimación. (a) para el modelo ARX (b) para el modelo OE (c) para el modelo ARM AX......................................................62 Figura 4.1. Esquema General de Detección de Fallas Basado en M odelos...................................67 Figura 4.2 Dependencia de Tiempo de las Fallas ...........................................................................67 Figura 4.3. Esquema de estimación de parámetros……………………………………………...65 Figura 4.4. Diagnóstico de Fallas usando M étodos de Clasificación……………………………67 Figura 4.5. Red adaptiva………………………………………………………………………….68 Figura 4.6. Red adaptiva ANFIS modelo Sugeno……………………………………………….69 Figura 5.1. Sistema de Tanques .....................................................................................................75 Figura 5.2. Sistema de Tanques. Acercamiento Bomba…………………………………………79 Figura 5.3. Válvula on / off………………………………………………………………………80 Figura 5.4. Sistema de Conexiones………………………………………………………………80 Figura 5.5. Interfaz Tarjeta de Adquisición………………………………………………………81 Figura 5.6. Interfaz Tarjeta de Adquisición. Figura 5.7. Subsistema 1…………………………..81 Figura 5.8. Subsistema 2………………………………………………………………………….82 Figura 5.9. Subsistemas del proceso……………………………………………………………..82 Figura. 5.10. Esquema Control…………………………………………………………………...82 Figura 5.11. Sistema de dos entradas una salida. 25 reglas………………………………………83 Figura 5.12. Funciones de pertenencia para la entrada de error………………………………….84 Figura 5.13. Funciones de pertenencia para la entrada la integral del error…………………...…84 Figura 5.14. Funciones de pertenencia del universo de salida señal de control………………….85 Figura 5.15. Superficie de control………………………………………………………………..86 Figura 5.16. Comportamiento de los residuos ante la falla………………………………………87 Figura. 5.17. M odelo de diagnostico de fallas……………………………………………………87 Figura 5.18. Respuesta del modelo de diagnóstico de fallas…………………………………….88.

(8) SUPERVISION, DETECCION Y DISTICION DE FALLAS. INTRODUCCION. El control automático ha sido el soporte del acelerado proceso de industrialización en la segunda mitad del siglo XX, ha hecho posible que la máquina sustituya al hombre en los trabajos más difíciles y peligrosos así como en la posibilidad de efectuar cada vez trabajos mas complejos. Esto ha derivado en una mejora significativa de nuestra calidad de vida a través de mejoras en los procesos de producción, manufactura y la vida cotidiana. En este sentido la electrónica ha jugado un papel fundamental en el desarrollo del control, al prácticamente reemplazar a las familias precedentes de controladores neumáticos, hidráulicos y mecánicos. Esto sin mencionar las ventajas económicas de la implementación electrónica tanto en la instalación de sensores como en todo el proceso de control. Las operaciones de procesos industriales. requieren ampliamente supervisión avanzada y el. diagnostico de fallas para incrementar su seguridad, confiabilidad y economía. Es por esto que la detección y distinción de fallas es un área importante porque convierte grandes sistemas y procesos en mecanismos muchos más autónomos y automáticos. También es posible considerar hoy, por las herramientas tecnológicas disponibles, la integración de sistemas de diagnostico en el diseño de controladores industriales. La detección y distinción de fallas basados en métodos combinados, analíticos y cualitativos han venido tomando un papel importante en supervisión y control automático moderno. Hay dos pasos importantes en la detección y distinción de fallas, la generación de residuos: indicación de los cambios en el proceso; y la evaluación residual: concluir que falla hay en el proceso. En el primer paso muchos métodos analíticos son usados, puesto son las características del proceso las.

(9) SUPERVISION, DETECCION Y DISTICION DE FALLAS. que determinan que método utilizar. El segundo paso es un problema de decisión; Es por eso que los métodos de razonamiento cualitativo son los más usados. Estos dos pasos que hay que seguir para realizar con eficiencia un proceso de supervisión completo; diagnostico: detección y distinción de fallas, representa un desafió para encontrar teorías que cumplan con eficiencia la generación y evaluación de los residuos. La combinación de métodos analíticos y basados en el conocimiento han demostrado que son una mezcla eficaz para resolver el problema básico de supervisón, con el objetivo de lograr resultados robustos en todo sentido..

(10) SUPERVISION, DETECCION Y DISTICION DE FALLAS. OBJETIVOS. GEN ERAL. Estudiar y desarrollar. un sistema de supervisión que ejecute en tiempo real la detección y. evaluación de cambios de un proceso, encontrando la mejor combinación entre. técnicas. analíticas y las basadas en conocimiento para realizar estas tareas y que finalmente especifique fallas que ocurran en un proceso.. ES PECIFICOS. •. Estudiar los conceptos y modelos de la teoría de supervisión de procesos.. •. Estudiar los conceptos y teorías sobre la generación de residuos.. •. Estudiar los conceptos y métodos de razonamiento cualitativo, que sirva para la evaluación de los residuos.. •. Implementar el sistema de generación de residuos.. •. Implementar el sistema de evaluación de residuos.. •. Desarrollar e implementar un sistema completo de supervisión..

(11) CAPITULO 1 MODELOS LINEALES DISCRETOS. 1. MODELOS DIS CRETOS CON ES TRUCTURA LINEAL. En el momento que se quiere representar el comportamiento de un proceso, es necesario tener modelos predefinidos. Al conocer estos modelos, se analizan y se comparan entre ellos con el objetivo de decidir cual puede representar el proceso que se este estudiando. En un controlador auto ajustable la definición del modelo con que se representa el proceso es parte fundamental, puesto que define la naturaleza del estimador de parámetros del modelo, como toda la estrategia de control para definir la ley de control que actuará sobre el proceso. En este capitulo se hará un pequeño resumen de sistemas de identificación lineal y se estudiara un poco mas a fondo los modelos discretos de estructura lineal, haciendo énfasis en los modelos mas utilizados. 1.1 RES UMEN D E ID ENTIFIC ACION LINEAL D E S IS TEMAS En la figura 2.1 se observa un resumen sobre los métodos de identificación de sistemas lineales. Identificación de sistemas lineales. Métodos de estimación paramétricos. Métodos de estimación no paramétricos. Dominio del tiempo. Dominio frecuencial. Mínimos cuadrados.. Mínimos. Análisis respuesta al. Análisis re spuesta en. Optimización. cuadrados.. impulso.. frecuencia.. Optimización no. Análisis. no. lineal. Repetido. mínimos. Dominio del tiempo. repuesta. Dominio frecuencial. Análisis de Fourier. transciente.. Figura 1.1 Resumen de los métodos de identificación de sistemas line ales.. Los métodos de identificación se clasifican en paramétricos y no paramétricos; por consiguiente estos ayudan a distinguir claramente el modelo y el tipo de método a utilizar para determinar los.

(12) CAPITULO 1 MODELOS LINEALES DISCRETOS. grados de libertad del modelo a utilizar para representar un proceso. Los modelos pueden ser paramétricos y no paramétricos. •. Modelos paramétricos. se asume que son capaces de describir el verdadero. comportamiento de un proceso con un número finito de parámetros. Las ecuaciones diferenciales o en diferencias son ejemplos de este tipo de modelos. En ocasiones los parámetros tienen una relación directa con cantidades físicas del proceso, Ej., masa, volumen, longitud, etc. •. Modelos no paramétricos. Generalmente requieren un número infinito de parámetros para describir exactamente el proceso. Un modelo FIR es un ejemplo de estos modelos.. Los métodos de estimación son clasificados como. •. Métodos. paramétricos. Determina un pequeño número relativo de parámetros.. Usualmente estos parámetros son optimizados según algún objetivo. Una regresión lineal es un ejemplo de estos métodos. Un modelo paramétrico puede usarse para determinar una aproximación a un modelo no paramétrico, el cual el numero de parámetros ha sido reducido a un numero finito. Tal como un modelo FIR, quizá sea estimado con un método paramétrico, si la serie infinita es aproximada a un número finito de parámetros. •. Métodos no parametritos. Son más flexibles que los métodos paramétricos. Estos son utilizados cuando ninguna estructura es impuesta sobre el modelo. Un típico ejemplo de estos métodos es el análisis de Fourier, el cual lleva a funciones de frecuencia, el cual no determina un número finito de parámetros. Incluso en una implementación, los métodos no parametritos muestran un numero finito de “parámetros“, este numero es grande e independiente de cualquier estructura de modelo, Ej. Las magnitudes complejas para todos los intervalos de frecuencia discretizados, en un análisis de Fourier de tiempo discreto. Así entonces el número de parámetros en los métodos no paramétricos, depende de algún factor tal como el número de muestras o la cuantificación.. Los modelos no paramétricos, tal como un modelo FIR, quizá sea estimado con un método paramétrico, si la serie infinita es aproximada a un numero finito de parámetros..

(13) CAPITULO 1 MODELOS LINEALES DISCRETOS. 1.2 ES TRUCTURA GEN ERAL D E LOS MODELOS LINEALES DISCRETOS. Al principio se define una estructura general para los modelos lineales y sobre esta se puede derivar por simplificación todos los casos particulares de estos modelos. Normalmente el modelo general no se utiliza mucho en la práctica, pero sirve para unificar todos los modelos lineales. La salida y (k ) de un sistema determístico linear en el tiempo k puede ser calculada filtrando las entradas u (k ) a través de un filtro lineal G (q) , q es el operador de desplazamiento. ~ B ( q) y (k ) = G(q )u( k ) = ~ u (k ) A( q). (1.1). ~ ~ B ( q) y A( q) son el numerador y el denominador de la función de transferencia lineal G (q) respectivamente. En adición a la parte determinística, un parte estocástica puede ser introducida. Si se filtra un ruido blanco v(k ) a través de un filtro lineal H (q) cualquier característica de frecuencia de ruido puede ser modelada. El filtro H (q) desde el punto de vista estocástico en llamado un filtro de forma. Así una señal arbitraria n(k ) de ruido puede ser modelada. ~ C ( q) n(k ) = H ( q)v (q) = ~ v( q) D(q). (1.2). Un modelo lineal general describiendo influencias determinísticas y estocásticas es obtenido combinando las dos partes como el la Fig. 2.2 (a). y (k ) = G(q )u( k ) + H ( q)v (k ).. (1.3). El filtro G (q) es llamado la función de transferencia de entrada, desde que esta relacione la entrada u (k ) con la salida y (k ) , y el filtro H (q) es llamado función de transferencia del ruido, desde que esta relacione el ruido con la salida. Las funciones de transferencia G (q) y H (q) pueden ser divididas en polinomios que representan sus numeradores y sus denominadores, Fig. 2.2 b. Es necesario a veces separar las dinámicas de la parte estocástica y de la determinística, que se reflejan en la representación de los polinomios denominadores de cada parte. Fig. 2.2 c y ~ ~ Fig. 2.2 d. Entonces se define F (q ) A(q ) = A y D( q) A( q) = D ..

(14) CAPITULO 1 MODELOS LINEALES DISCRETOS. Figura. 1.2. Modelo lineal general. (a) de finición de las funciones de transfe rencia. (b) Definición de los polinomios de las funcione s de transfe rencia. (c) y (b) Dife renciación de.las dinámicas estocástica y de te rminística.. ~ ~ Si A( q) y D( q) no comparten factores comunes entonces A(q ) = 1 . Entonces el modelo general lineal puede ser escrito.. y (k ) =. C ( q) B( q) u (k ) + v( k ) F ( q) A( q) D(q) A (q). (1.4). o también se puede escribir. A(q ) y (k ) =. C (q ) B (q ) u (k ) + v( k ) F ( q) D ( q). (1.5). Asumiendo ciertas cosas especiales sobre los polinomios A, B, C , D, F ; los modelos lineales ampliamente aplicados son obtenidos de la forma general de los modelos lineales. 1.3. CLAS IFICACION Y TERMINOLOGIA Analizando el modelo general desde el punto de vista de las series de tiempo, la terminología usada es lógica y clara. Se empieza analizando las series de tiempo, es decir no se toma en cuenta la entrada en el modelo, u (k ) = 0, entonces los modelos analizados serán totalmente.

(15) CAPITULO 1 MODELOS LINEALES DISCRETOS. estocásticos como se ve en la Fig. 2.5 en oposición al modelo totalmente determinístico de la Fig. 2.6. Una serie de tiempo con solo el polinomio del denominador. Fig. 2.7. es llamado un modelo Autoregressive (Autoregresivo) AR.. Figura. 1.5 Un modelo de se rie de tiempo gene ral line al. La entrada del modelo v(k ) e s una señal de ruido blanco.. Figura. 1.6. Modelo dete rminístico gene ral line al. La entrada del modelo u (k ) es una señal de terminística. No hay influencia estocástica.. Un modelo de serie de tiempo solo con el polinomio del numerador, Fig. 2.7, es llamado un modelo Moving average (promedio móvil) M A. Una modelo de serie de tiempo con polinomio numerador y denominador, Fig 2.7, es un modelo llamado autoregressive moving average (promedio móvil auto regresivo) ARM A.. Figura. 1.7. Re sumen de los modelos de se ries de tie mpo. Autoregressive (auto regresivo) AR, Moving ave rage (prome dio móvil) MA, y autore gressive moving ave rage (prome dio móvil y autoregresivo) ARMA.. Es obvio que un modelo basado únicamente en una serie de tiempo, sin tener en cuenta las variables de entrada, no puede ser preciso. Por esto, modelos más precisos pueden ser construidos incorporando las variables de entrada dentro del modelo. Esta entrada u (k ) es llamada una.

(16) CAPITULO 1 MODELOS LINEALES DISCRETOS. entrada exogenous (exógena). Teniendo en cuenta lo anterior, los modelos de series de tiempo pueden ser extendidos, Fig. 2.7, pueden ser extendidos incorporando una “X” por la entrada exógena. El modelo “MAX” derivado del modelo de serie de tiempo M A, incorporando la variable exógena, es muy raro y es muy poco usado. La Fig. 2.8 esta un resumen de los mas importantes modelos entrada/salida lineales. Los modelos del lado izquierdo de la Fig. 2.8, denominados AR…, pertenecen a la clase de modelos equation error (error de ecuación). Su característica es que el filtro 1/ A(q) es común a ambos, al modelo del proceso determinístico y al modelo de ruido estocástico. Todos los modelos del lado derecho de la Fig 2.8 pertenecen a la clase de modelos output error (error de la salida), los cuales son caracterizados por un modelo de ruido que es independiente del modelo del proceso determinístico. El modelo ARX, autoregressive with exogenous input, (auto regresivo con variable exógena) es una extensión del modelo AR, Fig. 2.8 (a). En una considerable parte de la literatura y en viejas publicaciones, el modelo ARX es llamado modelo “ARM A” para expresar el factor que ambos el polinomio numerador y un denominador existe.. y (k ) =. 1 B( q) u (k ) + v (k ) A( q) A( q). (1.6).

(17) CAPITULO 1 MODELOS LINEALES DISCRETOS. Figura. 1.8. Re sumen de los modelos dinámicos lineale s comunes. (a) ARX (b) ARMAX (c) ARARX (d) O E (e ) BJ (f) FIR.. El termino “auto regresivo” se relaciona a que la función de transferencia esta afectada desde la entrada u (k ) a la salida y (k ) tan bien como la función de transferencia del ruido desde v(k ) a y (k ) . La parte estocástica y la parte determinística del modelo ARX tienen dinámicas con idéntico denominador. El modelo autoregressive moving average with exogenous input (promedio móvil auto regresivo con variable exógena) ARM AX, es un extensión del modelo ARM A. Fig.2.8 (b)..

(18) CAPITULO 1 MODELOS LINEALES DISCRETOS. C (q) B( q) u (k ) + v( k ) A( q) A( q). y (k ) =. (1.7). Como para el modelo ARX, el modelo ARM AX asume igual dinámica con idéntico denominador para la entrada y la función de transferencia del ruido. Sin embargo la función de transferencia del ruido es más flexible debido al polinomio de promedio móvil C (q) . El modelo autoregressive autoregressive with exogenous input (auto regresivo auto regresivo con variable exógena) ARARX, es una extensión del modelo AR. Fig. 2.8 (d). y (k ) =. Este es un modelo ARX. 1 B( q) u (k ) + v( k ) A( q) D(q) A (q). (1.8). con flexibilidad adicional en el denominador de la función de. transferencia del ruido. Así, en vez de un filtro adicional de promedio móvil C (q) como en el modelo ARM AX, el modelo ARARX tiene un filtro adicional auto regresivo 1/ D(q ) . El ultimo de este tipo es el modelo autoregressive autoregresive moving average with exogenous input. (Promedio móvil Auto regresivo auto regresivo con variable exógena) ARARM AX, es definido como. y (k ) =. C (q) B( q) u (k ) + v( k ) A( q) D(q) A (q). (1.9). Todos los modelos AR… comparten el polinomio A(q ) como dinámica en el denominador en la función de transferencia de entrada y la función de transferencia del ruido.. Estos modelos. también son llamados modelos equation error (error de ecuación). Esto corresponde a que el ruido no influye directamente a la salida y (k ) del modelo, pero en cambio se introduce al modelo antes por medio del filtro 1/ A(q) . Estos modelos adoptados son razonables si verdaderamente el ruido se introduce al proceso primero, entonces sus características de frecuencia son determinadas por la dinámica del proceso. Si el ruido es principalmente medidas de ruido que típicamente y directamente perturba la salida, los llamados modelos output error (error de salida) son mas realistas. Los modelos output error son caracterizados por modelos de ruido que no contienen la dinámica del proceso. Así, el ruido se asume que afecta la salida del proceso directamente..

(19) CAPITULO 1 MODELOS LINEALES DISCRETOS. El mas evidente de los modelos entrada/salida es el output error (error de salida) OE. Fig.2.8 (d). y (k ) =. B (q ) u ( k ) + v (k ) F ( q). (1.10). Este modelo OE es un modelo especial de la clase de los modelos output error. No hay que confundir la clase de modelos output error con el caso especial de modelo output error, por causa que tienen el mismo nombre. Para aclarar, la abreviatura OE siempre se refiere a el caso especial de modelo output error EC 2.10. En comparación con el modelo ARX, el ruido blanco se introduce al modelo OE directamente sin ningún filtro. Este modelo OE puede ser aumentado en flexibilidad, filtrando el ruido blanco a través de un filtro ARM A. Esto define el modelo Box-Jenkins BJ. Fig. 2.8 (e). y (k ) =. C (q ) B (q ) u (k ) + v( k ) F ( q) D( q). (1.11). El modelo BJ se relaciona al modelo ARARM AX como el modelo OE se relaciona al modelo ARX. La entrada y la función de transferencia del ruido son parametrizados separadamente y por lo tanto independientes. El caso especial de C ( q) = 1 o D( q) = 1 no tiene nombres especiales. Finalmente un modelo bastante diferente pertenece a la clase de modelos output error.. El. modelo respuesta al impulso finita, FIR es definido por. y (k ) = B( q)u (k ) + v( k ). (1.12). El modelo FIR es un modelo OE o ARX sin realimentación de salida, esto es, F (q ) = 1 o A(q ) = 1, respectivamente. Una extensión del modelo FIR es el modelo orthonormal basis functions (funciones de base orthonormal) OBF. Note que por simplicidad los procesos y los modelos se asumen que no tienen tiempo muerto. Sin embargo, en cualquier ecuación el tiempo muerto puede ser fácilmente introducido reemplazando la entrada u (k ) con la entrada retrasada d pasos u (k − d ) . A demás, esto supone que los procesos y los modelos no tienen camino directo desde la entrada a la salida, entonces u (k ) no afecta.

(20) CAPITULO 1 MODELOS LINEALES DISCRETOS. inmediatamente la salida. Entonces, los términos como bou (k ) no aparecen en las ecuaciones de diferencia. Estas suposiciones son cumplidas por casi cualquier proceso del mundo real.. Tabla 1.1 Ecuaciones de los modelos lineales mas comunes.. 1.5 APLICACIONES DE UN MODELO La aplicación más común de un modelo es pronosticar el comportamiento futuro de un proceso. Para esto se tienen dos conceptos diferentes simulación y predicción.. 1.5.1 S IMULACION Si la respuesta del modelo a una secuencia de entrada se calcula mientras la salida de proceso es desconocida, a esto se le llama simulación. En la Fig. 2.10. se observa el concepto de simulación. La simulación puede ser completamente determinística EC.2.13. yˆ (k ) = G(q )u( k ). (1.13). También la simulación puede tener en cuenta la parte estocástica EC. 2.14 yˆ (k ) = G(q )u( k ) + H ( q)w( k ). (1.14).

(21) CAPITULO 1 MODELOS LINEALES DISCRETOS. (a). (b). (c). (d) Figura. 1.9. Clasificación de los modelos lineales se gún: (a) su respuesta al impulso. (b) tipo de e rror (c) si tiene entradas. (d) las propie dades de ruido. Dinámica igual se re fie re a que los denominadores de la parte de terminística y estocástica son iguales..

(22) CAPITULO 1 MODELOS LINEALES DISCRETOS. Figura. 1.10. Conce pto de simulación. Donde w(k ) es ruido blanco. La EC 2.14. es solo una mejor salida que la EC 2.13. El menor error de simulación debe esperarse de la EC 2.13. desde que w(k ) sea una señal de ruido diferente que la original pero no medible v(k ) .. 1.5.2 PREDICCION. Si las salidas del proceso son conocidas en algún instante de tiempo, por decir k − 1 , y este valor es utilizado para calcular la salida del modelo l pasos en el futuro; a este proceso se le llama predicción. Esto quiere decir que la información de salidas anteriores del proceso son utilizadas. Entonces un óptimo predictor debe combinar las entradas y salidas anteriores del proceso en alguna forma. Entonces un predictor lineal óptimo puede ser definido como la combinación lineal de entradas filtradas y de salidas del proceso filtradas. EC 2.15. yˆ (k ) = s0 u( k ) + s1 u( k − 1) + Λ + sns u (k − ns) + t 1 y( k − 1) + Λ + t nt y (k − nt ) yˆ (k ) = S (q)u (k ) + T (q) y (k ). (2.15) (2.16). El termino S (q )u( k ) contiene información sobre la parte determinística y el termino T ( q) y ( k ) introduce la parte estocástica en el predictor, desde que y (k ) sea contaminada con ruido. En la Fig. 2.11 se observa el concepto de predicción..

(23) CAPITULO 1 MODELOS LINEALES DISCRETOS. Figura. 1.11. Conce pto de pre dicción.. 1.5 MODELOS MAS UTILIZADOS. Los modelos con realimentación de la salida son los mas conocidos y aplicados; se dicen que estos son con realimentación de la salida debido a que el modelo utiliza para calcular la salida, salidas anteriores del modelo; esto se hace especialmente evidente cuando se observa la ecuación en diferencias del modelo. Especialmente los modelos ARX, ARM AX, y OE; particularmente son los que se estudiaran y utilizaran a fondo.. 1.5.1 ARX. El modelo ARX es el más ampliamente aplicado de los modelos lineales dinámicos. Usualmente un modelo ARX es tratado primero y solo si su desempeño no es satisfactorio, se examinan modelos con estructuras más complejas. Sin embargo el modelo ARX es especialmente realista puesto que coincide con estructuras de muchos procesos del mundo real. La popularidad del modelo ARX es debido a la facilidad de cálculo de sus parámetros. Los parámetros es este modelo pueden estimarse con la técnica lineal de mínimos cuadrados, esto si el error de predicción es lineal en los parámetros..

(24) CAPITULO 1 MODELOS LINEALES DISCRETOS. El modelo ARX esta dibujado en la Fig 2.8 (a) y descrito por la EC 2.6. y (k ) =. 1 B( q) u (k ) + v (k ) A( q) A( q). (1.16). El predictor es. yˆ (k ) = B( q)u (k ) + (1 − A(q )) y (k ). (1.17). El cual puede ser escrito de la forma. yˆ (k ) = b0 u (k ) + b1 u( k − 1) + Λ + bm u( k − m) + a1 y (k − 1) + Λ + an y (k − n). (1.18). Donde n es el orden de A(q ) y m-1 es el orden B (q ) . La EC 2.18 es también la representación de la ecuación en diferencias del modelo ARX. El predictor ARX es estable, si y solo si no tiene realimentación, incluso si el polinomio A(q ) y por consiguiente el modelo ARX es inestable. Esto permite modelar procesos que son inestables con modelos ARX. Esta característica la tienen todos los modelos equation error (error de ecuación) puesto que el polinomio A(q ) solo aparece en el denominador de sus predictores, entonces los predictores son estables incluso si A(q ) es inestable. Con la EC 2.17. el error de predicción de un modelo ARX es. e(k ) = A(q) y (k ) − B (q)u (k ). (1.19). El término A(q ) y (k ) actúa como un filtro blanqueador sobre las perturbaciones correlacionadas. La salida medida y (k ) puede dividirse en dos partes: la salida no contaminada del proceso y u (k ) y las perturbaciones n(k ) , donde y (k ) = y u (k ) + n( k ) . Desde que n(k ) = 1 / A (q)v (k ) con v(k ) siendo ruido blanco A(q ) y (k ) = A( q) yu (k ) + v (k ) . Entonces, el filtro A(q ) en la EC 2.19 hace las perturbaciones y consecuentemente e(k ) es blanco. Como se observa en la Fig. 2.8 (a), una de las características del modelo ARX es que las perturbaciones, Ej. Ruido blanco v(k ) , se asume que entra al proceso antes que la dinámica del.

(25) CAPITULO 1 MODELOS LINEALES DISCRETOS. denominador A(q ) . También se puede decir que el modelo ARX tiene un modelo de ruido 1/ A(q) . Entonces el denominador del modelo de ruido es idéntico al modelo de ruido del proceso. Lo que se asume puede ser justificado si la perturbaciones entran al proceso antes, incluso también en este caso las perturbaciones podrían pasar a través de alguna parte de la dinámica del numerador B (q ) . Sin embargo algunas veces lo que se asume del modelo de ruido se viola en la practica. Perturbaciones en la salida del proceso se analizan con el modelo OE.. 1.5.2 ARMAX. El modelo ARM AX es probablemente el segundo modelo lineal más popular después del modelo ARX. Comparada con ARX, el modelo ARMAX es más flexible porque posee una extensión en modelo de ruido. A pesar de esto con esta extensión el modelo ARM AX llega a ser no linear en sus parámetros. El algoritmo de mínimos cuadrados extendidos ELS, se utiliza para estimar sus parámetros. El modelo ARM AX es dibujado en la figura 2.8 (b) esta descrito por la EC. 2.7. C (q) B( q) u (k ) + v( k ) A( q) A( q). (1.7). A(q ) B (q) u( k ) + (1 − ) y (k ) C (q) C (q ). (1.20). y (k ) =. El predictor óptimo ARM AX es. yˆ (k ) =. El predictor es estable incluso si el polinomio A(q ) y por consiguiente el modelo ARM AX es inestable. Sin embargo, el polinomio C (q) se requiere que sea estable. Con la EC 2.20. el error de predicción de un modelo ARM AX es. e(k ) =. A(q) B( q) y (k ) − u (k ) B (q) C( q). (1.21).

(26) CAPITULO 1 MODELOS LINEALES DISCRETOS. Viendo las anteriores ecuaciones el modelo ARM AX es una extensión del modelo ARX debido a la introducción del filtro C (q) . Si el filtro C ( q) = 1 ARMAX se simplifica al modelo ARX. Debido al adicional filtro C (q) el modelo ARM AX es más flexible. Ej. Si C ( q) = A(q ) el modelo ARM AX puede imitar el modelo OE. Como el filtro de ruido C ( q) / A( q) contiene el polinomio de la dinámica del modelo determinístico, el modelo ARM AX pertenece a la clase de modelos equation error (error de ecuación).. 1.5.3 OE. Juntos con los modelos ARX y ARMAX, el modelo OE es la estructura mas ampliamente usada. Este modelo es la mas simple representación de la clase de modelos output error (error de salida). El ruido se asume que contamina aditivamente al proceso en la salida, no en alguna parte interior en el proceso como se asume en modelos equation error. M uchas veces lo modelos output error. son mas realistas, y estos usualmente de desempeñan mejor que los modelos. equation error. Sin embargo, porque los modelos de ruido no incluyen el denominador de la dinamica del proceso 1/ A(q) , todos los modelos output error son no lineales en sus parámetros y consecuentemente sus parámetros son mas duros de estimar. El modelo OE es dibujado en Fig. 2.8 (d) y esta descrito por. y (k ) =. B (q ) u ( k ) + v (k ) F ( q). (1.10). El predictor optimo es de hecho un simulador puesto que este no utiliza ninguna de la mediciones de salida de proceso y (k ) . yˆ (k ) =. Desafortunadamente el predictor. B (q ) u (k ) F ( q). (1.22). es inestable si el polinomio F (q ) es inestable. Como. consecuencia el modelo OE no puede ser usado para modelamiento de sistemas inestables. Lo mismo se mantiene para todos los modelos pertenecientes a la clase de modelos output error. Con la EC 2.22. el error de predicción para un modelo OE es..

(27) CAPITULO 1 MODELOS LINEALES DISCRETOS. e(k ) = y (k ) −. B( q) u(k ) F (q). (1.23). Para ilustrar porque la salida predicha, EC 2.23, de un modelo OE es no linear es sus parámetros se analiza lo siguiente. yˆ (k ) = b0 u( k − 1) + Λ + bm u( k − m) − f1 yˆ (k − 1) + Λ + f n yˆ ( k − n). (1.24). Comparando con el modelo ARX, la salida medida en EC 2.17. es reemplazada con la salida predicha o simulada, para el caso de OE es lo mismo. Entonces aquí esta la razón de la no linealidad de los parámetros en la EC 2.24. Las salidas del modelo predichas yˆ (k − i ) dependen de ellas mismas sobre es modelo de parámetros. Entonces en los términos f i yˆ( k − i ) ambos factores dependen de los parámetros del modelo, lo cual resulta en una dependencia no lineal. Para superar estas dificultades una forma es aproximar en la EC 2.24 las salidas del modelo yˆ (k − i ) por las salidas del proceso medidas y (k − i ) . Entonces el modelo OE se simplifica al modelo ARX, el cual es verdaderamente lineal en sus parámetros.. 1.5.4 COMENTARIOS SOBRE LOS DEMAS MODELOS. Los modelos ARARX, BJ, ARARMAX, como tienen muchos mas parámetros que se tiene que estimar, en la practica no son muy utilizados. Los modelos OBF los cuales contienen los modelos FIR, son ampliamente utilizados. Ej. cuando un modelo ARX o ARM AX o OE no representa satisfactoriamente un proceso estudiado, se intenta representar el modelo con una estructura OBF. Sin embargo los modelos OBF no son estudiados en este trabajo, porque se hace énfasis en los modelos mas utilizados. Los modelos M A, AR, ARM A no tienen mucha importancia desde el punto de vista de control, puesto que los modelos no tienen entrada con la cual se pueda modificar el comportamiento del proceso. Sin embargo pueden ser utilizados para estudiar y analizar el comportamiento estocástico de un proceso estudiado..

(28) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. 2 ES TIMAC ION DE PARAMETROS EN TIEMPO REAL. La determinación en línea o en tiempo real de los parámetros de un proceso, es el elemento clave que permite el desarrollo del control adaptativo. En un controlador auto ajustable un estimador recursivo de parámetros del proceso es un componente indispensable y explícito en su estructura básica. En este capitulo se desarrolla un método de estimación de parámetros llamado mininos cuadrados, LS, empezando con una conceptualización bás ica de sistemas de identificación, hasta llegar a una estimación en tiempo real. El método LS es ampliamente utilizado por su eficacia, sencillez y eficiencia computacional. Se trabaja con sistemas SISO.. 2.1 ELEMENTOS PRINCIPALES EN UN S IS TEMA D E IDENTIFICACION.. La identificación paramétrica es un método ampliamente utilizado en sistemas de identificación. Los elementos principales de un sistema de identificación son: a. Selección de la estructura del modelo. b. Diseño de experimento. c. Estimación paramétrica. d. Validación. El objetivo de un sistema de. identificación en sistemas adaptativos es que se ejecute. automáticamente, por esto es necesario tener un entendimiento total de todos los aspectos del problema y de los elementos del sistema de identificación. La selección de la estructura del modelo y la parametrización son partes irrelevantes en la identificación. Los problemas de identificación se simplifican significativamente si los modelos.

(29) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. que se utilizan son lineales en sus parámetros. El diseño del experimento es vital para un sistema de identificación exitosa, esto se refiere en el campo del control, a la selección de una señal de entrada adecuada al proceso, esta elección requiere de algún conocimiento previo del proceso y del uso proyectado del modelo a utilizar. Hay una complicación en sistemas adaptativos aplicados en sistemas de control, puesto que las señales de entrada al proceso son generadas por realimentación, y en algunos casos por esta razon, los parámetros no pueden ser calculados singularmente. Esta situación tiene consecuencias indeseables, llevando en algunos casos a introducir señales de perturbación. En control adaptativo los parámetros del proceso cambian continuamente, lo que hace necesario tener métodos de estimación que actualicen recursivamente los parámetros.. Por esto en la. resolución de problemas de control es muy importante la validación de resultados, especialmente en control adaptativo, en el cual la identificación es hecha automáticamente. El método de mínimos (LS) cuadrados es la técnica básica de identificación parametrica, es simple si el modelo tiene la propiedad de ser lineal en sus parámetros, así las estimación de los parámetros por este método puede ser calculado analíticamente.. 2.2 MINIMOS CUADRADOS (LS ) Y MODELOS DE REGRES ION.. Karl Friedrich Gauss formulo el principio de LS al final del siglo XVIII. El principio dice que parámetros no conocidos de un modelo matemático deben ser escogidos de forma que: La suma de los cuadrados de las diferencias entre valores observados y valores calculados, multiplicados por números que midan el grado de precisión; sea un mínimo. El método de mínimos cuadrados puede aplicarse a una gran variedad de problemas. El modelo matemático es particularmente simple y puede ser escrito de la siguiente manera. y (i) = ϕ 1(i) *θ 1(i ) + ϕ 2(i ) * θ 2(i ) + ⋅ ⋅ ⋅ + ϕ n(i) * θn(i ) = ϕ T (i) * θ o (i). (2.1).

(30) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. Donde. y es la variable observada, que en términos de control es el valor de salida de un. proceso en un instante i; θ1, θ 2,...,θn son los parámetros del modelo para ser determinados, y. ϕ1,ϕ 2,...,ϕn son funciones conocidas que quizás dependan de otras funciones conocidas. En términos de control estas funciones son datos de entrada y salida pasados. Definiendo los siguientes vectores como:. ϕ T (i ) = [ϕ1(i) ϕ 2(i ).... ......ϕ n(i) ]. (2.2). θ o = [θ1(i ) θ 2(i ).... ......θ n(i )]T. (2.3). El modelo es indexado por la variable i, la cual generalmente denota la variable tiempo. Se asume que el conjunto indexado es un conjunto discreto. Las variables ϕ .i son llamadas variables de regresión o regresores, y el modelo de la EC 3.1 es llamado modelo de regresión. La pareja de observaciones y regresores. {( y (i ),ϕ (i ) ), i = 1,2,...t } son obtenidos en un experimento.. El problema es entonces determinar los parámetros de tal forma que las salidas calculadas del modelo de la EC 3.1 concuerde tan cerca como se posible con la medida de las variables y (i) en el sentido de mínimos cuadrados. Esto es, los parámetros θ o deben ser escogidos para minimizar la función de perdida mínimos cuadrados. V (θ , t ) =. Desde que la variable medida. y (i). 1 t ( y (i ) − ϕ T (i ) * θ ) 2 ∑ 2 i =1. (2.4). es lineal en parámetros θ o y el criterio de mínimos. cuadrados es cuadrático, el problema admite una solución analítica. Introduciendo la notación. Y (t ) = [y (1). y( 2)... ...y (t ) ]. Ε(t ) = [ee(1) ee( 2)... ....ee(t )] ⎡ϕ T (1) ⎤ ⎢ ⎥ Φ=⎢ Μ ⎥ ⎢ϕ T (t ) ⎥ ⎣ ⎦. (2.5) (2.6). (2.7).

(31) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. t. P (t ) = (Φ T (t ) * Φ (t )) −1 = (∑ϕ (i) * ϕ T (i )) −1. (2.8). i= 1. Donde los residuos ee(i ) son definidos por. ∧. ee(i ) = y (i ) − y (i ) = y(i ) − ϕ T (i) * θ. (2.9). Con esta notación la función de perdida EC 3.4 se puede escribir. 1 t 2 1 1 V (θ , t ) = ∑ e (i ) = Ε T Ε = Ε 2 i =1 2 2. 2. (2.10). Donde Ε puede ser escrito como. ∧. Ε = Y − Y = Y − Φθ. (2.11). La solución para el problema de mínimos cuadrados es dada por el siguiente teorema.. 3.2.1 ES TIMAC ION MINIMOS CUADRADOS ∧. La función de la EC 3.4 es mínimo para parámetros θ tal que. ∧. ΦT Φθ = ΦT Y. (2.12). Si la matriz Φ T Φ es no singular, el mínimo es único y es dada por. ∧. θ = (Φ T Φ) −1 Φ T Y. (2.13). Comentarios. •. La ecuación EC 3.12 es llamada ecuación normal. La EC 3.13 puede ser escrita como. −1. ⎛ t ⎞ ⎛ t ⎞ ⎛ t ⎞ θ = ⎜ ∑ϕ (i)ϕ T (i ) ⎟ ⎜ ∑ ϕ (i ) y (i ) ⎟ = P(t )⎜ ∑ ϕ (t ) y (i ) ⎟ ⎝ i= 1 ⎠ ⎝ i =i ⎠ ⎝ i =1 ⎠ ∧. (2.14). •. La condición que la matriz Φ T Φ sea invertible es llamada condición de excitación.. •. El criterio de mínimos cuadrados pondera todos los errores e(i ) igualmente, y esto es consecuencia de asumir que todas las medidas tienen la misma importancia o precisión..

(32) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. Diferentes ponderación del error puede ser considerados cambiando la función de perdida EC 3.4 por V=. 1 T Ε WΕ 2. (2.15). Donde W es una matriz diagonal, con los diferentes pesos en la diagonal. La estimación de mínimos cuadrados es dada por. ∧. θ = (Φ T WΦ) −1 Φ TWY. (2.16). Ejemplo 2.1. Estimación mínimos cuadrados de un sistema estático. Se supone unos datos medidos de entrada salida de un sistema como se observa en la figura 3.1. Los datos son generados con el siguiente sistema. y (i) = c + b * u(i ) + a * u(i ) 2 + e(i ). (2.17). y es la salida del sistema , u es la entrada del sistema y e es un ruido Gaussiano con media cero y desviación estándar 0.05 o 0.3. El sistema es linear en los parámetros entonces puede ser escrito como la EC 3.1. El objetivo es estimar los parámetros de un modelo que se define antes, para representar el comportamiento de los datos. La salida es medida para 41 diferentes entradas como se observa en los círculos en la figura 3.1. En la practica el modelo no es conocido, pero se debe decidir un apropiado modelo. Se toman los siguientes modelos para estimar sus parámetros. M odelo 1: y (i) = b * u (i ) + c M odelo 2: y (i) = a * u(i ) 2 + b * u (i) + c.

(33) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. 3. 2. Salid a. 1. 0. -1. -2. -3 -1. -0. 8. -0. 6. -0. 4. -0.2. 0. 0.2. 0. 4. 0. 6. 0. 8. 0. 6. 0. 8. 1. (a) En trad a. 3. 2. Salida. 1. 0. -1. -2. -3 -1. -0. 8. -0.6. -0.4. -0. 2. 0. 0.2. 0. 4. 1. (b) Ent rada. Figura 2.1. Los círculos en azul re presentan datos me didos. Los resultados de la estimación, rojo para parábola, negro para recta. (a) Datos contaminados con ruido con de sviación estándar 0.05.(b) con de sviación estándar 0.3.. Para la estimación se define el vector regresor para construir la EC 3.7, el vector de parámetros y el vector de datos de salida EC 3.13.. ϕ T (i ) = [u 2 (i ) u (i) 1] θ o = [a b c ].

(34) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. Desviación. modelo. estándar del. ∧. a. ∧. ∧. c. V. b. ruido 0.05. 1. -. 2.000626. -0.644439. 0.198150. 0.05. 2. 0.968499. 2.000626. -0.983414. 0.002172. 0.3. 1. -. 2.065230. -0.638333. 0.221543. 0.3. 2. -0.996759. 0.010829. 1.024074. 2.065230. Tabla 2.1. Estimación de mínimos cuadrados, la función de pé rdida, para los mode los del ejemplo 2.1.. Construida la EC 3.7 se calculan los parámetros estimados mediante la EC 3.13. La tabla 3.1 muestra la estimación de mínimos cuadrados de los diferentes modelos con la función de pérdida resultante. La función de perdida es una medida de la precisión de la estimación. Se estimaron parámetros para datos medidos contaminados con ruido con desviación estándar 0.05 y 0.3. En la figura 3.1 se muestra la estimación para los diferentes modelos. Por supuesto el modelo 2 que equivale a la ecuación de una parábola representa mejor el comportamiento de los datos medidos. El modelo 1 que equivale al de una recta, no puede reproducir muy bien el comportamiento de los datos medidos. Lo anterior demuestra la importancia de escoger el modelo apropiado, es decir la cantidad de parámetros a calcular, para poder representar el comportamiento deseado. Si embargo también se pudo haber escogido un modelo que involucrara un término cúbico a demás en el modelo 2, es decir un parámetro a demás par calcular, pero no fue necesario porque la estimación arrojo muy buenos resultados utilizando el modelo2. Cuando se utiliza un modelo para representar un tipo determinado de comportamiento pero este mismo resultado se logra con un modelo que tiene menos parámetros para estimar, a este fenómeno se le conoce como sobre ajuste. Lo anterior resalta la importancia de escoger bien el modelo.. 2.2.2 INTERPRETACION ES TADIS TICA.

(35) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. El método de mínimos cuadrados puede ser interpretado en términos estadísticos. Entonces es necesario asumir algunas cosas sobre como fueron generados los datos. Se asume que el proceso es. y (i) = ϕ T (i) *θ o (i) + e(i ). (2.18). Donde θ o (i ) es el vector de parámetros “verdaderos” y e(i) { i=1,2,…} es un secuencia de independientes variables aleatorias igualmente distribuidas y con media cero. También se asume que e(i) es independiente de ϕ . Entonces la EC 3.11 puede ser escrita. Y = Φθ o + Ε. (. ). −1. M ultiplicando por ΦT Φ Φ T resulta.. (Φ Φ ) T. −1. ∧. ∧. (. ΦT Y = θ = θ o + ΦT Φ. ). −1. ΦT Ε. (2.19). Con tal que Ε sea independiente de Φ T , lo cual es equivalente a decir que e(i) es independiente ∧. o. de ϕ (i ) , la expectativa matemática de θ es igual a θ . Una estimación con esta propiedad es llamada imparcial.. 2.2.2.1 Propiedades estadísticas de la estimación de mininos cuadrados.. Considere la estimación de la EC 3.13 y se asume que los datos son generados de la EC 3.18, donde e(i), { i=1,2,…} es un secuencia de variables aleatorias independientes con media cero y varianza σ 2 . E denota la expectativa matemática y cov la covarianza de una variable aleatoria. Si Φ T Φ es no singular, entonces. ∧. (i). E θ (t)=θ o. (ii). Cov θ (t ) = σ 2 (Φ T Φ) −1. (iii). σ (t ) = 2 *V (θ , t ) /( t − n) es una estimación imparcial de σ 2 .. ∧. ∧2. ∧.

(36) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. ∧. Donde n es el numero de parámetros en θ o y θ y t es el numero de datos puntuales. Todo lo ∧. anterior manifiesta que la estimación es imparcial, esto es, E θ (t)=θ o . A demás, es deseable que una estimación converja a los verdaderos valores de los parámetros cuando el número de observaciones tiende hacia infinito. Esta propiedad es llamada. consistencia. Hay muchas. nociones de consistencia correspondiente a diferentes conceptos de convergencia para variables aleatorias. La convergencia media cuadrática es una posibilidad, la cual puede ser investigada simplemente analizando la varianza de la estimación. El resultado (ii) puede se usado para determinar como la varianza de la estimación decrece con el numero de observaciones.. 2.2.3 CALC ULOS RECURS IVOS. En controladores adaptativos las observaciones son obtenidas secuencial mente en tiempo real. Por esto es necesario hacer cálculos recursivos para ahorrar tiempo de cálculo. El cálculo de la estimación de mínimos cuadrados puede ser reconfigurada de tal forma que los resultados obtenidos en el tiempo t-1, puedan ser usados para la estimación en el tiempo t. La solución de la EC 3.13 para el problema de mínimos cuadrados se puede re-escribir de forma recursiva. Sea. θˆ la estimación de mínimos basada en las medidas hasta el tiempo t-1. Se asume que la matriz Φ T Φ es no singular para todo el tiempo. Se trabaja con la EC 3.8 entonces. t. t −1. i =1. i =1. P (t ) −1 = Φ T (t ) * Φ (t ) = ∑ ϕ (i ) * ϕ T (i ) == ∑ ϕ (i )ϕ T (i ) + ϕ (t )ϕ T (i) = P −1 (t − 1) + ϕ (t )ϕ T (t ). (3.20). La estimación de mínimos cuadrados es dada por la EC 3.14 ∧. ⎛. t. ⎞. ⎛ t −1. ⎞. ⎠. ⎝ i =1. ⎠. θ = P(t )⎜ ∑ ϕ (t ) y(i ) ⎟ = P (t )⎜ ∑ ϕ (i ) y (i ) + ϕ (t ) y (t ) ⎟ ⎝ i =1. Trabajando con la anterior EC y la EC 3.20 se tiene. t− 1. ∑ϕ (i ) y (i ) = P i= 1. −1. ∧. ∧. ∧. (t − 1) θ (t − 1) = P −1 (t )θ (t − 1) − ϕ (t )ϕ T (t ) θ (t − 1).

(37) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. La estimación en el tiempo t puede ser ahora escrita. ∧. ∧. ∧. θ = θ (t − 1) − P (t )ϕ (t )ϕ T (t )θ (t − 1) + P (t )ϕ (t ) y (t ) ∧. ∧. = θ (t − 1) + P (t )ϕ (t )( y (t ) − ϕ T (t )θ (t − 1)) ∧. = θ (t − 1) + K (t )ee(t ) Donde K (t ) = P (t )ϕ (t ) ∧. ee(t ) = y (t ) − ϕ T (t )θ (t − 1). El residuo ee(t ) puede ser interpretado con el error de predicción de la señal y (t ) un paso adelante basado en la estimación. Es necesario también deducir una ecuación recursiva para P (t ) preferiblemente que para P (t ) −1 . Utilizando el siguiente teorema.. 2.2.3.1 Teorema. Matriz de inversión.. Sea la matriz C , A , y C −1 + DA −1 B matices cuadradas no singulares. Entonces A + BCD es invertible, y. ( A + BCD) −1 = A −1 − A −1 B (C −1 + DA−1 B ) −1 DA −1 Aplicando el teorema anterior a P (t ) y usando la EC 3.20, se tiene.. (. P (t ) = (Φ T (t )Φ (t )) −1 = Φ T (t − 1)Φ(t − 1) + ϕ (t )ϕ T (t ). (. = P (t − 1) −1 + ϕ (t )ϕ T (t ). ). ). −1. −1. = P (t − 1) − P (t − 1)ϕ (t )( I + ϕ T (t )P (t − 1)ϕ (t )) −1 ϕ T (t )P (t − 1). Esto implica que. K (t ) = P (t )ϕ (t ) = P(t − 1)ϕ (t )( I + ϕ T (t ) P(t − 1)ϕ (t )) −1.

(38) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. Note que una matriz de inversión es necesaria para calcular P . De cualquier forma, la matriz es invertida y es de dimensión igual al número de medidas. Sin embargo, si el sistema es de una sola salida este cálculo da como resultado un escalar.. 2.2.3.2 Estimación de mínimos cuadrados recursiva (RLS ).. Se asume que la matriz Φ(t ) tiene rango completo, esto es, Φ T (t )Φ (t ) es no singular, para todo. (. ∧. el t ≥ to . Dado θ (to) y P (to) = Φ T (t )Φ(t ). ). −1. ∧. , la estimación de mínimos cuadrados θ (t ) debe. satisfacer las ecuaciones recursivas.. θ = θ (t − 1) + K (t )⎛⎜ y (t ) − ϕ T (t )θ (t − 1) ⎞⎟ ∧. ∧. ∧. ⎝. (2.21). ⎠. K (t ) = P (t )ϕ (t ) = P(t − 1)ϕ (t )( I + ϕ T (t ) P(t − 1)ϕ (t )) −1. (2.22). P (t ) = (I − K (t )ϕ T (t )) P (t − 1). (2.23). Comentarios.. •. ∧. La EC 3.21 tiene una gran apariencia intuitiva. La estimación θ (t) es obtenida ∧. adicionando una corrección a una previa estimación θ (t − 1) . La corrección es ∧. proporcional a y (t ) − ϕ T (t )θ (t − 1) , Donde el ultimo termino puede ser interpretado como el valor de. y en el tiempo t predicho por el modelo de la EC 3.1. El termino de la. corrección es así proporcional a la diferencia entre el valor medido de y (t ) y la predicción de y (t ) basado en los previos parámetros estimados. Los componentes del vector K (t ) son los factores de ponderación que dicen como la corrección y la previa estimación deben ser combinados. •. La estimación mínimos cuadrados pueden ser interpretados como un filtro de Kalman para el proceso..

(39) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. θ (t + 1) = θ (t ). (2.24). y (t ) = ϕ T (t )θ (t ) + e(t ). 2.2.3.3 Condiciones iniciales para P(t) y para θ(t).. La matriz P (t ) es definida solo cuando la matriz Φ T (t )Φ (t ) es no singular. Desde que. t. Φ T (t )Φ (t ) = ∑ϕ (i )ϕ T (i) i= 1. Entonces la matriz Φ T Φ es siempre no singular si t < n . Para obtener la condición inicial para P , es necesario escoger t = to tal que Φ T (to )Φ(to ) es no singular. Las condiciones iniciales son.. (. P (to) = Φ T (to)Φ (to). ). −1. ∧. θ (to) = P (to )Φ T (to )Y (to ) Las ecuaciones recursivas pueden ser usadas para t > to . Es entonces,. es conveniente. usualmente usar ecuaciones recursivas en todos los pasos. Si las ecuaciones recursivas son inicializadas con la condición inicial. P (0) = Po entonces Po es definida y positiva, entonces.. (. P (t ) = Po −1 + Φ T (t )Φ (t ). (. ). −1. Se ve que P (t ) puede ser hecho arbitrariamente cerca de Φ T (t )Φ (t ). ). −1. escogiendo Po. Lo suficientemente grande. En términos prácticos, el algoritmo recursivo requiere aproximar el valor inicial del vector de parámetros y de la matriz P(t). Si es posible realizar una primera estimación del vector de los parámetros, por ejemplo utilizando LS no recursivo. La matriz P(0) debe reflejar la confianza de los parámetros estimados. En el caso en que P(0) sea pequeño, K(t) será pequeño para los distintos t y los parámetros estimados no variaran mucho del valor inicial. M ientras que, si P(0) es grande la estimación de los parámetros variará rápidamente del valor inicial. En ausencia de.

(40) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. información previa para realizar una primera estimación de los parámetros, se acostumbra a considerar: θˆ (0) = 0 , P (0) = kI , donde k es un número grande. Usando la interpretación del filtro de Kalman del método de mínimos cuadrados, esto puede verse que la forma como la inicialización del calculo recursivo corresponde a la situación el la cual los parámetros tiene una distribución inicial con media θo y covarianza Po .. 2.2.4 PARAMETROS VARIANTES EN EL TIEMPO. En el modelo de mínimos cuadrados EC 3.1 los parámetros θ io se asumen que son constantes. En muchos problemas de control adaptativo es importante considerar la s ituación en la cual los parámetros son variantes en el tiempo. Dos casos son cubiertos con una simple extensión del método de los mínimos cuadrados. Uno es el caso en que los parámetros cambian abruptamente pero no con mucha frecuencia. El otro caso es que los parámetros cambien continuamente pero lentamente. El caso. en que los parámetros cambian abruptamente la solución es. reestablecimiento. La matriz P en el algoritmo de mínimos cuadrados es periódicamente reestablecida a α I , donde α es un numero grade. Esto implica que la ganancia K (t ) en el estimador llega a ser grande y la estimación puede ser actualizada con un paso más grande. El caso en el cual los parámetros varían en el tiempo pero lentamente puede ser trabajando con un simple modelo matemático.. Una aproximación. simple es cambiar el criterio de mínimos. cuadrados de la EC 3.4 con. V (θ , t ) =. 1 2. ∑ λ (y( i) − ϕ t. t −i. T. ( i )θ. ). 2. (2.25). i =1. Donde λ es un parámetro tal que 0 < λ ≤ 1 . El parámetro λ es llamado factor de olvido o factor de descuento. La función de perdida de la EC 3.25 implica que una ponderación variante en el tiempo es introducida. El más reciente dato se la da una ponderación de uno, pero el dato que esta n. unidades de tiempo antes es ponderado por λ n . El método es llamado olvido exponencial o. descuento exponencial..

(41) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. 2.2.4.1 Mininos cuadrados recursivos con olvido exponencial. Se asume que la matriz Φ(t ) tiene rango completo para t ≥ to . Los parámetros θ , los cuales minimizan la EC 3.25 son dadas recursivamente como.. θ = θ (t − 1) + K (t )⎛⎜ y (t ) − ϕ T (t )θ (t − 1) ⎞⎟ ∧. ∧. ∧. (2.21). ⎠. ⎝. (. K (t ) = P (t )ϕ (t ) = P(t − 1)ϕ (t ) λ I + ϕ T (t ) P (t − 1)ϕ (t ) P (t ) = (I − K (t )ϕ T (t )) P (t − 1) / λ. ). −1. (2.26) (2.27). Una desventaja del olvido exponencial es que el data es descontado incluso si P (t )ϕ (t ) = 0 . Esta condición implica que y (t ) no contiene alguna nueva información sobre los parámetros θ . En este caso la matriz P se incrementa exponencialmente con rata λ .. 2.3 ES IMAC ION DE PARAMETROS EN S IS TEMAS DINAMICOS. El método de mínimos cuadrado puede ser usado para estimar los parámetros en modelos de sistemas dinámicos. Esto depende de las características del modelo y de su parametrización. Esto quiere decir que todas las ecuaciones antes formuladas pueden ser utilizadas con estos modelos haciendo unos pequeños ajustes.. 2.3.1 MODELO DE RES PUES A FINITA AL IMPULS O (FIR). Un sistema dinámico lineal variante en el tiempo es singularmente caracterizado por su respuesta al impulso. La respuesta al impulso es en general dimensional-infinita. Para sistemas estables la respuesta al impulso tendera a cero exponencialmente rápido y quizá entonces sea trucada. Entonces, de cualquier forma, un numero grande de parámetros debe ser necesario para representar el modelo, si el tiempo de muestreo es pequeño en comparación con la constante de.

(42) CAPITULO 5 DESARROLLO DE LA APLICACIÓN. tiempo mas lenta del sistema. Esto resulta en el llamado modelo FIR, el cual es llamado un filtro transversal. El modelo puede ser descrito por la EC en diferencias. y (t ) = b1u (t − 1) + b2u (t − 2) + Λ + bnu(t − n) ó y (t ) = ϕ T (t − 1)θ. Donde el vector de parámetros a estimar y el vector regresor son respectivamente.. θ T = (b1 Λ. bn). ϕ T (t − 1) = (u (t − 1) Λ. u (t − n) ). Este modelo es idéntico al modelo de regresión de la EC 3.1. El modelo claramente encaja con toda la formulación de mínimos cuadrados, y el estimador esta entonces determinados por las ecuaciones del método de RLS. El estimador de parámetros puede ser representado por el diagrama de bloques de la figura 3.2. Este estimador puede ser considerado como un sistema con entradas u y y y salida θ . Desde que la señal sea ∧. ∧. ∧. y = b 1(t − 1)u(t − 1) + Λ + b n(t − 1)u(t − n) ∧. y este disponible en el sistema , también se puede considerar y (t ) como una salida. Desde que ∧. y (t ) sea una estimación de y , el estimador recursivo puede ser interpretado como un filtro adaptativo para predecir y .. Figura 2.2 Diagrama de bloque s de un estimador paramé trico recursivo para un modelo FIR..