• No se han encontrado resultados

Modelamiento , diseño y simulación de un sistema de control para un sistema de péndulo doble invertido. (SPDI)

N/A
N/A
Protected

Academic year: 2020

Share "Modelamiento , diseño y simulación de un sistema de control para un sistema de péndulo doble invertido. (SPDI)"

Copied!
65
0
0

Texto completo

(1)Universidad de los Andes Facultad de ingenieria Departamento de ingenieria eléctrica y electrónica MAESTRIA EN INGENIERIA ELECTRONICA Y TELECOMUNICACIONES. TESIS PARA OPTAR AL TITULO DE MAGISTER EN INGENIERIA ELECTRONICA CON ENFASIS EN CONTROL:. MODELAMIENTO, DISEÑO Y SIMULACIÓN DE UN SISTEMA DE CONTROL PARA UN SISTEMA DE PÉNDULO DOBLE INVERTIDO. (SPDI). Autor: Ing. Mg. Germán Velandia Peláez [email protected] Asesor tesis: Phd Mauricio Duque [email protected]. Bogotá, febrero 2007 i.

(2) A mi hijo Germán Roberto, quien siendo un niño especial me enseña a entender la integralidad del universo.. ii.

(3) TABLA DE CONTENIDO Pag. Resumen (abstract) ----------------------------------------------------------------------------------------------------Palabras claves ----------------------------------------------------------------------------------------------------------. 1 1. CAPITULO PRIMERO 1.- INTRODUCCIÓN ---------------------------------------------------------------------------------------------------1.1.- Presentación -------------------------------------------------------------------------------------------------1.2.- El Sistema de Péndulo Doble Invertido ---------------------------------------------------------------1.3.- Objetivos ------------------------------------------------------------------------------------------------------1.3.1.- Objetivo general -------------------------------------------------------------------------------------1.3.2.- Objetivos específicos -------------------------------------------------------------------------------. 2 2 2 2 2 2. CAPITULO SEGUNDO 2.- MARCO TEORICO -------------------------------------------------------------------------------------------------2.1.- La Teoría de Control Automático y los Sistemas Dinámicos ------------------------------------2.2.- Modelamiento matemático de Sistemas Dinámicos -----------------------------------------------2.3.- Análisis de Sistemas en el Espacio de Estados ----------------------------------------------------2.3.1.- Representación entrada-salida (E–S) ---------------------------------------------------------2.3.2.- Transformaciones canónicas --------------------------------------------------------------------2.3.3.- Controlabilidad y observabilidad en el espacio de estados ------------------------------2.3.3.1.- Controlabilidad completa del estado -------------------------------------------------2.3.3.2.- Observabilidad completa de estado --------------------------------------------------2.4.- Estabilidad de los Sistemas de Control ---------------------------------------------------------------2.4.1.- Teorema de Estabilidad de Lyapunov para sistemas estacionarios -------------------2.4.1.1.- Estabilidad Asintótica Global -----------------------------------------------------------2.4.1.2.- Inestabilidad --------------------------------------------------------------------------------2.4.1.3.- El Principio de Invariancia --------------------------------------------------------------2.4.1.4.- Región de Atracción ----------------------------------------------------------------------2.4.1.5.- Sistemas Lineales y Linealización ----------------------------------------------------2.4.2.- Teorema de Estabilidad de Lyapunov para sistemas inestacionarios -----------------2.4.2.1.- Sistema lineal inestacionario -----------------------------------------------------------2.4.2.1.- Teoremas Conversos ---------------------------------------------------------------------2.5.- Estrategia de control ----------------------------------------------------------------------------------------2.5.1.- Control Óptimo Cuadrático -------------------------------------------------------------------------. 3 3 5 6 7 7 7 8 13 16 17 19 19 20 20 21 24 25 26 27 27. CAPITULO TERCERO 3.- Modelamiento Matemático del Sistema -----------------------------------------------------------------------3.1.- Descripción del Sistema -----------------------------------------------------------------------------------3.2.- Ecuaciones dinámicas del péndulo doble invertido -------------------------------------------------3.2.1 Cálculo de la Energía Cinética y de la Energía Potencial del sistema de péndulo doble invertido ----------------------------------3.2.2 Ecuaciones de Euler-Lagrange ---------------------------------------------------------------------. 30 30 32 32 35. CAPITULO CUARTO 4. Representación en el Espacio de Estados ---------------------------------------------------------------------4.1 Modelo de Estado no lineal ---------------------------------------------------------------------------------4.2 Modelo de Estado Lineal ------------------------------------------------------------------------------------4.2.1 Punto de operación -----------------------------------------------------------------------------------4.2.2.- Cambio de variables de estado -------------------------------------------------------------------. 38 38 42 44 46. iii.

(4) 4.3.- Parámetros para el ejercicio de simulación del sistema de péndulo doble invertido -------- 47 4.3.1. Relación entre los parámetros del sistema ----------------------------------------------------- 48 4.3.2. Matrices y ecuación característica del sistema ---------------------------------------------- 48. CAPITULO QUINTO 5. Control Óptimo -------------------------------------------------------------------------------------------------------- 48 5.1 Regulador Linear Cuadrático ------------------------------------------------------------------------------- 49 5.2. Determinación de las matrices de ponderación ------------------------------------------------------- 50. CAPITULO SEXTO 6. Resultados -------------------------------------------------------------------------------------------------------------6.1. Simulación del sistema en tiempo continúo -----------------------------------------------------------6.1.2. Resultados simulación sistema del péndulo doble invertido ------------------------------6.1.2.1. Modelo con fricción ------------------------------------------------------------------------6.1.2.2. Modelo con fricción despreciable ------------------------------------------------------6.2. Análisis simulación del sistema del péndulo doble invertido --------------------------------------6.2.1. Modelo no lineal en lazo abierto ------------------------------------------------------------------6.2.2. Modelo lineal en lazo abierto ----------------------------------------------------------------------6.2.3. Modelo no lineal en lazo cerrado -----------------------------------------------------------------6.2.4. Modelo lineal en lazo cerrado ---------------------------------------------------------------------6.3. Sistema en Tiempo Discreto -------------------------------------------------------------------------------6.3.1. Sistema discreto en lazo abierto ------------------------------------------------------------------6.3.2. Sistema discreto en lazo cerrado -----------------------------------------------------------------6.4 Simulación del sistema del péndulo doble invertido con fricción despreciable -----------------. 50 50 50 50 55 57 57 57 58 58 59 59 60 60. CAPITULO SEPTIMO 7. Conclusiones ----------------------------------------------------------------------------------------------------------- 60 BIBLIOGRAFIA ----------------------------------------------------------------------------------------------------------- 61 INDICE DE FIGURAS Figura 2.1. Diagrama de un sistema dinámico -------------------------------------------------------------------Figura 2.2. Diagrama de un sistema de control de lazo cerrado --------------------------------------------Figura 2.3 Diagrama de bloques de un sistema en el espacio de estados -------------------------------Figura 2.4 Representación geométrica de los conjuntos para el teorema de Lyapunov --------------Figura 2.5 Curvas de nivel de una función de Lyapunov ------------------------------------------------------Figura 2.6. Sistema de control lazo cerrado ----------------------------------------------------------------------Figura 3.1. Sistema de Péndulo Doble Invertido -----------------------------------------------------------------Figura 3.2. Sistema del péndulo doble invertido montado en un carrito -----------------------------------Figura 4.1. Sistema lineal en variables de estado. Lazo abierto ---------------------------------------------Figura 5.1. Sistema lineal en variables de estado. Lazo cerrado --------------------------------------------Figura 6.1. Pulso de entrada ------------------------------------------------------------------------------------------Figura 6.2. Sistema no lineal en lazo abierto ---------------------------------------------------------------------Figura 6.3. Sistema lineal en lazo abierto -------------------------------------------------------------------------Figura 6.4. Sistema no lineal en lazo cerrado --------------------------------------------------------------------Figura 6.5. Sistema lineal en lazo cerrado ------------------------------------------------------------------------Figura 6.6. Respuesta en tiempo discreto. Lazo abierto ------------------------------------------------------Figura 6.7. Respuesta en tiempo discreto. Lazo cerrado ------------------------------------------------------. 3 5 6 17 18 29 31 34 47 49 50 57 57 58 58 59 60. iv.

(5) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. Modelamiento, diseño y simulación de un sistema de control para un sistema de péndulo doble invertido. (SPDI) GERMAN VELANDIA PELAEZ CODIGO 200418412 [email protected] Resumen (abstract) – En este trabajo se realiza el modelamiento matemático, el diseño y simulación de un sistema de control para un sistema de péndulo doble invertido, (SPDI), de modo que pueda mantenerse en la posición vertical invertida ante posibles perturbaciones. El modelamiento esta basado en las ecuaciones de euler-lagrange obtenidas especificando el lagrangiano como la diferencia de la energía cinética y la energía potencial del sistema de péndulo doble invertido montado en un carrito que se desplaza en un riel horizontal de longitud limitada, obteniendo un sistemas de tres ecuaciones diferenciales de segundo orden, que se transforman a un formato de seis ecuaciones diferenciales ordinarias de primer orden. La estrategia de control seguida ha sido la de un sistema de control óptimo que minimiza un funcional de costo cuadrático probando un regulador lineal cuadrático (LQR). La simulación nos presenta un adecuado desempeño para el sistema de LQR, alrededor del punto de equilibrio: posición vertical invertida del péndulo doble; ante desviaciones de dicha posición del péndulo doble invertido. La simulación nos presenta un comportamiento tanto del modelo linealizado, como del modelo no lineal aceptable. Palabras claves: Grados de libertad (DOF), Sistema de péndulo doble invertido (SPDI), Modelo no lineal (MNL), Modelo linealizado (ML). Control Óptimo.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 1 de 61.

(6) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. CAPITULO PRIMERO 1.- INTRODUCCIÓN 1.1.- Presentación Nos proponemos con este trabajo la aplicación de los conocimientos adquiridos en los diversos estudios correspondientes a la maestría en ingeniería electrónica, en lo que se refiere a análisis y diseño de sistemas de control, por ello elegimos como sistema de estudio un sistema de péndulo doble invertido (SPDI). El SPDI representa un problema muy interesante desde el punto de vista de control ya que permite involucrarnos en varias de las dificultades asociadas con los problemas de control de los sistemas dinámicos, a su vez presenta particular interés académico, porque permite la aplicación de diversas técnicas de control e ilustrar su comportamiento. Son varias las universidades que tienen entre sus elementos de laboratorio este tipo de sistemas para probar diferentes estrategias de control. El péndulo simple invertido (PSI) es usado en laboratorios de control para demostrar la efectividad de los sistemas de control en analogía con el control de muchos sistemas reales, [1], [2] dada la conveniencia en investigar y verificar diferentes métodos de control para sistemas dinámicos con no-linealidades de orden superior. El SPDI es más difícil de estabilizar y controlar que el péndulo simple invertido (PSI), porque hay dos brazos de péndulo vinculados entre si y montados en un carrito. Controlar del SPDI, además de considerar el desplazamiento del carrito, exige considerar la dinámica de dos péndulos y esto aumenta la complejidad del problema. El SPDI es un sistema dinámico sub-actuado que tiene menos entradas de control que grados de libertad (DOF). Hay muchos sistemas similares al SPDI, como el Acrobot, el Pendubot, el robot de gimnasta de tres-eslabones, el péndulo triple invertido, etc. El SPDI también es diferente del péndulo invertido doble rotante. El SPDI pertenece a la clase de sistemas mecánicos sub-actuados que consiste en tres sistemas interconectados (dos péndulos y un carrito) con un sólo actuador: una fuerza usada para controlar tres grados de libertad. 1.2.- El Sistema de Péndulo Doble Invertido Desde la década de los 7O, la dinámica y control de péndulos invertidos ha llamado mucho la atención. Existe una bibliografía extensa sobre estabilización [10] de péndulos simple [6, 7], de péndulos dobles [1, 3, 4], y péndulos triples [5] invertidos. Hay varios estudios sobre el swing-up [2] (balanceo-arriba) de un péndulo simple invertido y del péndulo doble invertido [5, 7]. Desde la década anterior la dinámica y control de mecanismos sub-actuados ha estado bajo investigación. Algunos trabajos interesantes se han llevado a cabo en los manipuladores sub-actuados [8, 9, 10] y robots sub-actuados tales como el Acrobot [11] y el Pendubot [12]. Estos trabajos muestran el control de posición de las junturas pasivas vía su acoplamiento dinámico con las activas. Hay varios estudios sobre trayectorias de optimización para los robots industriales [13, 14], y muchos otros sistemas totalmente actuados. Estos estudios usan métodos de disparo y colocación así como la optimización cuadrática [15] para obtener la solución óptima del problema de las condiciones de frontera. Algunos de estos estudios también se han extendido a los sistemas sub-actuados [16] y han tenido éxito con ejemplos como el dos-DOF Acrobot, una cadena simple echada y un siete-DOF el buzo humano. El sistema de péndulo doble invertido es un sistema sub-actuado. Tiene un grado de libertad (DOF) actuado y dos DOF's no actuados. Es diferente de todas las plantas mencionadas antes, dado que tiene dos coordenadas pasivas generalizadas, que hace de él un desafío real [20] para diseñar controladores. 1.3.- Objetivos El procedimiento para el diseño de un sistema de control para un sistema dinámico, se basa esencialmente en dos aspectos: el primero es el análisis del comportamiento del sistema dinámico y el segundo es la síntesis del controlador. En el análisis de sistemas dinámicos se busca verificar diferentes propiedades del sistema, en especial lo que tiene que ver con la estabilidad. El proceso de síntesis apunta a la obtención de un controlador que cumpla con determinadas condiciones y garantice el desempeño deseado del sistema dinámico. En ambas situaciones se requiere el uso de un modelo o estructura matemática que formule la dinámica del sistema dinámico de manera apropiada, o sea, que represente el comportamiento de las variables de interés del la manera mas cercana (confiable) a su comportamiento real. Por ello nos hemos propuesto los siguientes objetivos: 1.3.1.- Objetivo general El objetivo principal es el modelamiento matemático, el diseño y simulación de un sistema de control para el sistema del péndulo doble invertido SPDI, de modo que pueda mantenerse en una posición vertical invertida ante posibles perturbaciones. 1.3.2.- Objetivos específicos 1. Reconocer el estado del arte del problema en el control de un péndulo doble invertido.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 2 de 61.

(7) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. 2. 3. 4. 5.. Realizar el modelamiento matemático del péndulo doble invertido. Especificar requerimientos de diseño. Proponer un método de control por optimización cuadrática para el péndulo doble invertido Validar el modelo matemático y sistema de control por medio de simulación.. CAPITULO SEGUNDO 2.- MARCO TEORICO 2.1.- La Teoría de Control Automático y los Sistemas Dinámicos Se define un sistema como la combinación de un conjunto de componentes que interactúan entre si y con el medio, para la realización de acciones que permitan alcanzar un objetivo determinado. Un sistema dinámico es aquel que cambia en el tiempo debido a la interacción con su entorno. La influencia del entorno sobre el sistema dinámico se expresa en términos de lo que llamamos variables de entrada (u(t)), las cuales producen cambios en el estado dinámico del sistema, que se manifiesta a través las que llamamos variables de estado,(x(t)) que nos permiten describir el comportamiento dinámico del sistema. Estos cambios en comportamiento dinámico del sistema se manifiestan en las que llamamos variables de salida que pueden ser medidas y que denominamos variables de salida medibles (y(t)). (Figura 2.1) La figura 2.1 muestra el diagrama general de un sistema dinámico. Para estos sistemas tenemos tres conceptos fundamentales: entrada, estado y salida. Las entradas son cantidades que pueden afectar la evolución tanto de los estados como de las salidas del sistema dinámico. El estado de un sistema son todos aquellos componentes dinámicos del sistema que permiten identificarlo en cualquier instante de tiempo dado. Las salidas del sistema dinámico son todas aquellas funciones del estado, tales como los propios estados o alguna combinación de ellos que puedan ser medibles. Las cantidades asociadas con las entradas al sistema pueden ser variables de control o variables de entrada actuantes inciertas o variables de perturbación salida están representadas por. w (t ) , el sistema dinámico esta representando por las variables de estado x (t ). u (t ). y entradas. y las variables de. y (t ) .. w(t) SISTEMA DINAMICO x(t). u(t). y(t). Figura 2.1. Diagrama de un sistema dinámico En aplicaciones de control la dinámica de un sistema dinámico se representa por medio de ecuaciones diferenciales. En tiempo continuo, tenemos ecuaciones diferenciales ordinarias. En tiempo discreto, tenemos de ecuaciones en diferencias finitas. En aplicaciones de sistemas de control un sistema dinámico lo podemos representar de diversas formas. En la llamada teoría de control clásica que se desarrolló desde antes del advenimiento de las computadoras digitales y del concepto de estado de un sistema dinámico, la representación del sistema dinámico se establece en términos de sistemas vistos como sistemas entrada – salida, [18] (sistemas E–S), este enfoque se fundamenta en la obtención de ecuaciones diferenciales escalares de orden n, de una entrada y una salida, sistemas (SISO), que describen la dinámica del sistema en el sentido de la evolución de la salida debido a la entrada. Las técnicas de análisis de estos sistemas en su mayoría, emplean el método de convertir la ecuación diferencial en una ecuación algebraica por medio de la transformada de Laplace y se basan en el análisis en el dominio de la frecuencia.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 3 de 61.

(8) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. El desarrollo más reciente de la teoría de control, llamada teoría de control moderna, se fundamenta [18] en los métodos matriciales y los modelos en el espacio de estados, para describir de forma más general los sistemas dinámicos y donde están incluidos tanto los sistemas SISO como los sistemas de varias entradas y varias salidas, (sistemas MIMO). Las técnicas de análisis de estos sistemas, se basan en el análisis en el dominio del tiempo y en técnicas de tipo numérico y computacional que permiten manejar grandes sistemas de muchas entradas y muchas salidas. Estas técnicas emplean métodos fundamentados en vectores y valores característicos, en lugar de los métodos de la transformada de Laplace, aunque no se descarta su empleo. El modelo general de un sistema dinámico consta de dos conjuntos de ecuaciones: el primero formado por ecuaciones diferenciales ordinarias de primer orden y el segundo formado por ecuaciones algebraicas, ambos expresados en forma vectorial mediante:. x (t ) = f(x(t ),u (t ) ) y (t ) = g(x (t ),u (t ) ) Donde. (. ). d dt. (2.1). se emplea para significar la variación respecto al tiempo t, de una variable dada. Las ecuaciones (2.1) se conocen. como ecuación de estado y ecuación de salida respectivamente y en conjunto se conocen como las ecuaciones dinámicas de un sistema de control. En general f(x ( t ) ,u ( t ) ) y que dependen del tiempo.. g(x (t ),u (t ) ). son funciones vectoriales con argumentos. x (t ) y u (t ) , los cuales son variables vectoriales. El problema general del control automático de un sistema dinámico consiste en determinar un algoritmo para generar la entrada de control (ley de control) u ( t ) al sistema dinámico con el fin de alcanzar un comportamiento aceptable para los estados x ( t ) dadas las especificaciones deseadas, a pesar de las perturbaciones que puedan presentarse. A la relación funcional para generar u ( t ) se le conoce como controlador. El objetivo de diseño en control automático es encontrar la forma funcional para un controlador que producirá un comportamiento o desempeño aceptable (deseado) del sistema dinámico. Utilizaremos la denominación de entrada de comando y la notación r(t) para denotar las entradas externas al controlador; r(t) puede ser un vector de varias entradas de comando externas. Esta forma funcional puede variar dependiendo de la aplicación. En algunas aplicaciones [18] la forma funcional puede ser igual simplemente a la entrada de comando, es decir. u = r(t) , o puede ser. una función del tiempo y de la entrada de comando u = u(r(t), t ) . En estos casos la entrada de control o ley de control no depende explícitamente de la salida del sistema dinámico, esta forma de control se conoce como control de lazo abierto. En otras aplicaciones la forma funcional puede ser una función de la entrada de comando y la salida del sistema dinámico u = u(r(t), y(t)) . Esta situación donde la ley de control depende de la entrada de comando y la salida del sistema dinámico se conoce como control en lazo cerrado. El término lazo cerrado se refiere al hecho de que la salida es utilizada para realimentar la información de la medición como parte del algoritmo de control. El control en lazo cerrado se puede clasificar según la naturaleza de la señal de realimentación. Si la entrada de control depende explícitamente de la salida y ( t ) , es decir u = u(r(t), y(t)) , se denomina control por realimentación de salida. Si los estados del sistema dinámico se miden o se estiman mediante cualquier otro proceso y se realimentan hacia el sistema de modo que la entrada de control u ( t ) dependa explícitamente de los estados del sistema, es decir u = u(r(t), x(t)) , se denomina control de lazo cerrado por realimentación de estado. La característica principal y deseable de un sistema en lazo cerrado es la estabilidad del sistema, es decir, que si una entrada aplicada al sistema dinámico es finita, la salida o salidas producidas también sean finitas. Nos interesa en este proyecto el control automático en lazo cerrado. La figura 2.2 nos muestra un diagrama de bloques general de un sistema de control en lazo cerrado. La variable e ( t ) representa el error de control, que es la diferencia entre el valor deseado y el valor real de las variables a controlar (las cuales en este caso deben ser medibles).. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 4 de 61.

(9) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. e(t). r(t) Comparador. u(t) Controlador. Planta. y(t). Sensor. Figura 2.2. Diagrama de un sistema de control de lazo cerrado El problema fundamental del control automático esta asociado con el objetivo de alcanzar un desempeño determinado de las variables de estado x ( t ) del sistema dinámico, dadas unas especificaciones deseadas, a pesar de las perturbaciones que puedan presentarse. Comúnmente, el desempeño de una variable se especifica por medio de un punto de ajuste o Set-point, el cual indica el valor deseado de la variable de interés en cualquier instante, que puede ser un valor constante o una trayectoria. De esta manera controlar significa entonces medir el valor de las salidas medibles y a partir de este conocimiento modificar las variables de control para evitar, corregir o limitar desviaciones del valor medido con respecto al punto de ajuste, causadas por perturbaciones presentes. Además, un sistema de control es una estructura externa que se adiciona a un proceso o planta para hacer que las salidas y/o los estados de éste, sigan una trayectoria de referencia (control de seguimiento) o se mantengan en una determinada franja de valores, alrededor de un punto de ajuste (regulación), a pesar de la presencia de perturbaciones. 2.2.- Modelamiento matemático de Sistemas Dinámicos Un modelo matemático es una descripción matemática de un sistema dinámico o proceso real, en la cual mediante relaciones y funciones matemáticas, se expresan las relaciones existentes entre las diversas variables que caracterizan e intervienen en el proceso dinámico [19]. Un modelo matemático permite expresar mediante relaciones y funciones matemáticas la dinámica del sistema al cual pertenece. En los sistemas dinámicos y en aplicaciones de control el modelo matemático se representa por medio de ecuaciones diferenciales ordinarias. El tratamiento de estas ecuaciones diferenciales proporciona información sobre el comportamiento dinámico del sistema con determinado grado de confiabilidad, que normalmente es utilizada en el análisis del sistema real, para aproximarnos al conocimiento de su evolución ante determinados cambios en el entorno. El conjunto de métodos y técnicas que permiten encontrar el modelo matemático de un sistema dinámico se llama modelamiento e identificación de sistemas dinámicos. En general, el modelo se compone de dos partes: la estructura generada por las relaciones entre las variables del sistema y los parámetros que hacen parte de ésta. El modelamiento de sistemas es el procedimiento que permite encontrar la estructura del modelo y la identificación de sistemas se encarga de seleccionar el valor de los parámetros para que el modelo pueda ser especificado. La estructura de un modelo puede representar varios sistemas físicos pero con la estimación del valor de los parámetros asociados se encuentra la representación específica del sistema de nuestro interés. Para la formulación del modelo matemático de un sistema dinámico, es necesario establecer supuestos y simplificaciones que establecen un compromiso entre la aproximación del modelo matemático obtenido al sistema dinámico real y la complejidad del mismo, puesto que justamente esa misma complejidad de los procesos reales, los modelos obtenidos pueden ser de dimensiones muy grandes y su análisis resulta muy dispendioso desde el punto de vista teórico y computacional. Cualquier modelo es una imitación de la realidad. El modelo obtenido dadas las suposiciones y simplificaciones establecidas, es una representación fiel de sólo algunas características del proceso, definidas según el problema presentado. Por lo tanto cualquier análisis del sistema real a través de su modelo es limitado y se deben esperar diferencias entre el comportamiento real del proceso y el comportamiento predicho por el modelo. La meta del modelamiento es entonces encontrar un modelo que represente satisfactoriamente (con un grado razonable de confiabilidad) el comportamiento dinámico de las variables importantes del proceso. Los sistemas dinámicos son inherentemente no lineales, en muchas aplicaciones hay que utilizar procesos de linealización del modelo matemático de los sistemas dinámicos alrededor de un punto de operación para así obtener un modelo lineal que refleje el comportamiento del sistema no lineal en una vecindad del punto de operación, donde es posible considerar que su comportamiento es lineal o aproximadamente lineal. El modelo linealizado permite su representación por medio de ecuaciones entrada – salida y/o en ecuaciones dinámicas en el espacio de estados y a partir de estas representaciones se realiza el análisis del sistema.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 5 de 61.

(10) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. 2.3.- Análisis de Sistemas en el Espacio de Estados. La teoría de control moderna se fundamenta en tres conceptos fundamentales: estado, salida y entrada. El estado de un sistema son todos aquellos componentes dinámicos del sistema que permiten identificarlo en cualquier momento dado. Las salidas del sistema dinámico son todas aquellas funciones del estado, tales como los propios estados o alguna combinación de ellos que puedan ser medibles. Las entradas al sistema dinámico son cantidades que pueden afectar la evolución tanto de los estados como de las salidas del sistema dinámico. El modelo matemático de un sistema dinámico en el espacio de estados, se hace en términos de ecuaciones diferenciales de primer orden y de ecuaciones algebraicas, a partir de las cuales se realiza el análisis temporal de tales sistemas. Esta representación es aplicable tanto a sistemas SISO como a sistemas MIMO y comprende la representación de sistemas no lineales y variantes en el tiempo. El espacio de estados es el espacio n-dimensional definido por las variables de estado del sistema. El estado de un sistema dinámico esta definido por el conjunto mínimo de variables, denominadas variables de estado,. x (t ) = [ x1 (t ). xn (t ) ]. T. x2 (t ). , a partir de las. cuales se puede conocer el comportamiento dinámico del sistema, en cualquier tiempo futuro a partir de las condiciones del momento actual (condiciones iniciales); es decir, conociendo su valor en de tiempo. t = t0 , x (t 0 ) , y el valor de las entradas de control, u (t ) , en el intervalo. [t0 , t1 ] es posible conocer el estado en cualquier instante t ∈ (t0 , t1 ) .. La estructura matemática para la representación en el espacio de estado de un sistema dinámico lineal se presenta como:. x ( t ) = A ( t ) x ( t ) + B ( t )u ( t ) y ( t ) = C ( t ) x ( t ) + D ( t )u ( t ) donde:. x. es el vector de estados de orden n x 1,. u. (2.2). es el vector de entradas de control de dimensión p x 1,. y. es el vector de salidas. medibles del sistema de orden m x 1, A es la matriz de estado de orden n x n asociada con la respuesta natural del sistema, B es la matriz de entrada de orden n x p asociada con la respuesta forzada del sistema, C es la matriz de salida orden m x n y D es la matriz de transmisión directa de orden m x p. Si las matrices A , B , C y D son matrices de elementos constantes, es decir no son función del tiempo (parámetros del sistema invariantes con el tiempo) el sistema es un sistema invariante en el tiempo. Ver figura 2.3.. ⎡ u1 ⎤ ⎡ x1 ⎤ ⎡ y1 ⎤ ⎢ ⎥ ⎢ ⎥ x = ⎢ ⎥ ; u = ⎢ ⎥ ; y = ⎢⎢ ⎥⎥ ⎢u p ⎥ ⎢⎣ xn ⎥⎦ ⎢⎣ ym ⎥⎦ ⎣ ⎦ ⎛ b11 … b1 p ⎞ ⎛ d11 … d1 p ⎞ ⎛ a11 … a1n ⎞ ⎛ c11 … c1n ⎞ ⎟ ⎜ ⎟ ⎜ ⎟; B=⎜ ⎜ ⎟ ; C= ; D=⎜ A=⎜ ⎜ ⎟ ⎟ ⎟ ⎜ ⎟ ⎜a ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ bnp ⎠ d mp ⎟⎠ ann ⎠ cmn ⎠ ⎝ n1 ⎝ cm1 ⎝ bn1 ⎝ d m1. Figura 2.3 Diagrama de bloques de un sistema en el espacio de estados GERMAN VELANDIA PELAEZ Código 200418412. Pag. 6 de 61.

(11) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. La estructura matemática para la representación en el espacio de estado de un sistema dinámico lineal de parámetros lineales e invariantes en el tiempo es:. x (t ) = Ax (t ) + Bu (t ) y (t ) = Cx (t ) + Du (t ). (2.3). 2.3.1.- Representación entrada-salida (E–S) La representación entrada-salida de un modelo matemático se usa fundamentalmente para sistemas SISO. Esta forma de representación describe las relaciones dinámicas (no físicas) de la variable de salida del sistema respecto de la variable de entrada al mismo, a partir de una ecuación diferencial de enésimo orden, en la cual el orden esta determinado por el numero de estados del sistema dinámico.. y ( n ) + an −1 y ( n −1) +. + a1 y + a0 y = bmu ( m ) + bm −1u ( m −1) +. + b1u + b0u ; con n ≥ m. A partir de esta ecuación diferencial y por la aplicación de los métodos de la transformada de Laplace se obtiene una función de transferencia para sistemas SISO o una matriz de transferencia para sistemas MIMO. Esta representación se logra esencialmente para sistemas lineales e invariantes en el tiempo bajo la suposición de condiciones iniciales iguales a cero. La función de transferencia obtenida por tales métodos, está expresada en función de la variable compleja denomina la frecuencia compleja y por lo tanto el análisis se realiza por lo general en el dominio de la frecuencia.. s = σ + jω , que se. 2.3.2.- Transformaciones canónicas La elección de las variables de estado en un sistema dinámico no es única en general. La selección final se puede basar en factores físicos, pero a menudo se emplean métodos de transformaciones matemáticas para varios tipos de análisis. Se presentan dos formas canónicas [18] de las ecuaciones de estado, dependiendo de la elección del sistema coordenado, esto es de la elección de las variables de estado. Una representación desacopla las ecuaciones de estado y la otra conduce a una descripción del estado en términos de un sistema de entrada –salida de una sola ecuación diferencial de orden n. La representación más simple de un sistema en el espacio de estados se tiene cuando las ecuaciones de estado están desacopladas, esto es, cuando la matriz de estado A esta en forma diagonalizada:. ⎛λ ⎜ 1 A = diag[λ1 ,..., λn ] ⎜ ⎜ ⎜0 ⎝. 0 ⎞⎟. ⎟ ⎟ ⎟ λn ⎠. De modo que la evolución de cada una de las variables de estado depende solamente de si misma y de las entradas, pero no de las otras variables de estado. 2.3.3.- Controlabilidad y observabilidad en el espacio de estados1 Los conceptos de controlabilidad y observabilidad fueron introducidos por Kalman en el año 1960. Estos conceptos enfrentan respectivamente la relación que existe entre la entrada y el estado (la controlabilidad), y entre el estado y la salida (la observabilidad). La controlabilidad de un sistema responde a la siguiente pregunta: ¿Existe siempre una entrada de control u ( t ) la cual puede transferir el sistema desde el estado inicial x0 a cualquier otro estado x1 deseado en un tiempo finito? Mientras que la observabilidad responde a la pregunta: ¿El estado inicial x0 del que parte un sistema, puede siempre identificarse mediante la observación de la salida u (t ) sobre un tiempo finito t? 1. y (t ). y de la entrada. http://www.ib.cnea.gov.ar/~dsc/capitulo6/Capitulo6. Controlabilidad y Observabilidad. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 7 de 61.

(12) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. Estas características del sistema pueden ser contestadas mediante las propiedades de las matrices. A, B, C. y. D . Ya que las. matrices A , y B , tienen que ver con la relación entre entrada y estado. A este par de matrices se las conoce como el par de controlabilidad y definen la matriz de controlabilidad. En cambio, como las matrices A y C involucran el estado con la salida, a estas dos matrices se las conoce como el par de observabilidad y por tanto definen la matriz de observabilidad. Se dice entonces, que un sistema es controlable en el instante t0 si es posible llevarlo de cualquier estado inicial x(t0) a cualquier otro estado x(t), empleando un vector de control no acotado, en un lapso finito. Y se dice que un sistema es observable en el tiempo t si, con el sistema en el estado x(t), es posible determinar dicho estado a partir de las mediciones de la salida con un retaso finito de tiempo. El trabajo pionero de R. Kalman en el año de 19602 introdujo los conceptos de controlabilidad y de observabilidad, que juegan un papel fundamental en el diseño de los sistemas de control usando las técnicas de estado espacio. Las condiciones de controlabilidad y de observabilidad determinan la existencia de una solución completa para el problema del diseño de un sistema de control. Tal vez no exista una solución a este problema si el sistema estudiado es no controlable. Aunque la mayoría de los sistemas físicos son controlables y observables, los modelos matemáticos correspondientes pueden no tener la propiedad de controlabilidad y//o de observabilidad. En tal caso, es esencial conocer las condiciones bajo las cuales un sistema es controlable y observable. Veamos primero el análisis de las condiciones de la controlabilidad y luego el análisis de las condiciones de la observabilidad. En cuanto a la controlabilidad, veamos primero la condición para la controlabilidad completa de estado y enseguida la condición para la controlabilidad de la salida. 2.3.3.1.- Controlabilidad completa del estado. Consideremos al sistema en tiempo continuo:. x = Ax + Bu. (2.4). En las cuales por brevedad de escritura hemos omitido el subíndice temporal y en donde x = vector de estado (vector de orden n) u = vector de control (vector de orden p) A = matriz de orden n x n B = matriz de orden n x p Se dice que el sistema dado por la ecuación anterior es de estado controlable en t = t0 si es posible construir p señales de control sin restricción alguna que transfieran un estado inicial a cualquier otro estado finito en un intervalo de tiempo finito t0 ≤ t ≤ t1. Si todos los estados son controlables, se dice que el sistema es de estado completamente controlable. 2.3.3.1.1.- Condición para una controlabilidad completa de estado. Sin perder la generalidad, suponemos que el estado final es el origen en el espacio de estados y que el tiempo inicial es cero, o t0 = 0. La solución de la ecuación (2.4) es: t. x ( t ) = e At x (0) + ∫ e − A (t −τ ) Bu (τ ) dτ. (2.5). 0. Aplicando la definición de controlabilidad completa del estado recién establecida, tenemos: t1. x ( t1 ) = 0 = e At x (0) + ∫ e − A ( t1 −τ ) Bu (τ ) dτ 0. O sea que: t1. x (0) = − ∫ e − At Bu (τ ) dτ 0. 2. (2.6). ibid. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 8 de 61.

(13) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. Según el Teorema de Cayley-Hamilton, podemos escribir n −1. e − At = ∑ α k (τ ) A k. n −1. , por tanto:. k =0. Definimos:. ∫. t1. 0. e − At. como:. x (0) = − ∑ A k B ∫ α k (τ )u (τ ) dτ t1. 0. k =0. α k (τ )u (τ ) dτ = U k. Donde. Uk. es un vector columna de orden p. De esta manera la ecuación anterior se. convierte en: n −1. x (0) = −∑ A k BU k. (2.7). k =0. ⎡ U0 ⎤ ⎢U ⎥ A n-1B ⎤⎦ ⎢ 1 ⎥ ⎢M ⎥ ⎢ ⎥ ⎣⎢ U n-1 ⎦⎥. x(0) = - ⎡⎣ B AB. (2.8). Si el sistema es de estado completamente controlable, entonces dado cualquier estado inicial x(0), la ecuación (2.8) se debe satisfacer. Esto significa que el rango de la matriz de n filas y np columnas. ⎡⎣ B AB. A n-1B ⎤⎦. sea de rango n, o que contenga n vectores. columna linealmente independientes. La matriz. S = ⎡⎣ B AB. A n-1B ⎤⎦. (2.9). Se conoce con el nombre de matriz de controlabilidad. 2.3.3.1.2.- Forma alternativa de la condición para la controlabilidad de estado Si los valores propios de la matriz A de la ecuación (2.4) son distintos, es posible encontrar una matriz de transformación P tal que:. ⎡λ1 0 ⎢0 λ 2 P -1 AP = ⎢ ⎢ ⎢ ⎣⎢ 0. 0⎤ ⎥ ⎥ (Matriz diagonal) ⎥ ⎥ λn ⎦⎥. Es de notar que si los valores propios de A son distintos, los vectores propios de A también son distintos; no obstante, lo contrario no es verdad. Por ejemplo, una matriz simétrica real de n x n con valores propios repetidos, tiene vectores propios diferentes. Se debe considerar que cada columna de la matriz de transformación P es un vector propio de A asociado con. λi (i = 1, 2,..., n). Para obtener la matriz diagonal definimos un nuevo vector de estado z, tal que: x = Pz. (2.10). Sustituyendo en la ecuación (2.4) la ecuación (2.10) se obtiene. z = P-1 APz + P-1Bu. (2.11). GERMAN VELANDIA PELAEZ Código 200418412. Pag. 9 de 61.

(14) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. P -1B = F = f (ij) , la ecuación la ecuación (2.11) se puede escribir, como: z1 = λ1 + f11u1 + f12u2 + + f1 p u p. Si definimos. z2 = λ2 + f 21u1 + f 22u2 +. + f2 pu p. . . . zn = λn + f n1u1 + f n 2u2 +. + f np u p. Ahora bien, nótese que si todos los elementos de cualquier renglón de la matriz F de n x p son cero, entonces la variable de estado asociada. zi. no es controlable por cualquiera de los controles. ui .Por tanto, la condición de controlabilidad completa de estado se define. como que, si los valores propios de A son distintos, el sistema es de estado completo controlable si y sólo si ningún renglón de. P -1B = F = f (ij). tiene todos sus elementos cero.. Para aplicar la condición alterna de controlabilidad para analizar la controlabilidad completa de estado, debemos poner en forma diagonal a la matriz A de la ecuación (2.4), es decir desacoplar las variables de estado, mediante la matriz de transformación P. 2.3.3.1.3.- Forma canónica de Jordán Por otra parte, si la matriz A de la ecuación (2.4) presenta valores propios repetidos, la diagonalización es imposible. En tal caso, transformamos A en la forma canónica de Jordán. Por ejemplo, si A tiene valores propios λ1, λ1, λ1 ,λ4, λ4 y λ6; esto es tiene tres raíces iguales entre sí, otras dos iguales entre sí, distintas a la primeras y una sexta diferente de las anteriores, la forma de Jordán de A resulta ser:. ⎡ λ1 ⎢0 ⎢ ⎢0 J=⎢ ⎢ ⎢ ⎢ ⎣⎢ 0. 1. 0. λ1. 1. 0. λ1 λ4. 1. 0. λ4 0. 0⎤ ⎥ ⎥ ⎥ ⎥ ⎥ 0⎥ ⎥ λ6 ⎦⎥. Las submatrices cuadradas de la diagonal principal se denominan bloques de Jordán. Para obtener la forma canónica de Jordán hallamos una matriz M de transformación tal que:. M -1 AM = J Y definimos un nuevo vector de vector de estado z mediante x = Mz. (2.12). Sustituimos la ecuación (2.12) en la ecuación (2.4) y obtenemos:. z = M -1 AMz + M -1Bu = Jz + M -1Bu. (2.13). La condición para una controlabilidad de estado completo del sistema dado por (2.4) se enuncia del siguiente modo: El sistema es de estado completamente controlable si y sólo si:. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 10 de 61.

(15) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. a) b) c). Dos bloques de Jordán en J de la ecuación (2.13) no están asociados con los mismos valores propios. Los elementos de cualquier renglón de M-1B que corresponden al último renglón de cada bloque no son todos cero y Los elementos de cada renglón de M-1B que corresponden a valores propios distintos no son todos cero.. 2.3.3.1.4.- Condición para la controlabilidad completa de estado en el dominio de la frecuencia. La condición para una controlabilidad completa del estado se plantea también en términos de las funciones de transferencia o las matrices de transferencia. Una condición necesaria y suficiente para una controlabilidad completa de estado es que no ocurra una cancelación de polos en la función de transferencia o en la matriz de transferencia. Si ocurre dicha cancelación el sistema no puede ser controlado en la dirección del modo cancelado. Si ocurre una cancelación de un factor entre el numerador y el denominador de una función de transferencia, el orden del sistema se reduce en número igual al número de polos cancelados y se debería representar mediante una matriz A de orden n-1. Debido a dicha cancelación el sistema de orden n no es de estado completamente controlable. 2.3.3.1.5.- Forma canónica controlable en sistemas SISO. Para los sistemas SISO en el espacio de estados, existe una representación que puede conducir a la descripción del sistema en términos de una sola ecuación diferencial de orden superior. Se dice entonces que un sistema SISO esta en forma compañía si la matriz de estado A es una matriz compañía, de la forma:. ⎛ 0 ⎜ ⎜ 0 A=⎜ ⎜ ⎜ 0 ⎜ −a ⎝ 1. 1 0. 0 1. 0. 0. −a2. −a3. y la entrada de control escalar. 0 ⎞ ⎟ 0 ⎟ ⎟ ⎟ 1 ⎟ − an ⎟⎠. u. solo entra en la ecuación de. xn. con la matriz columna de entrada. B. de la forma:. ⎛0⎞ ⎜ ⎟ 0 B=⎜ ⎟ ⎜ ⎟ ⎜⎜ ⎟⎟ ⎝1⎠ Ahora, un sistema SISO se puede convertir entonces en una única forma compañía si y solo si la matriz de controlabilidad, definida por:. S = [B. AB A 2 B. A n-1B]. es de rango completo, es decir la matriz controlable.. S. es de rango n. Si esta condición se satisface decimos que el sistema es completamente. 2.3.3.1.6.- Controlabilidad de la salida de sistemas de tiempo continúo. En el diseño práctico de un sistema de control se pretende normalmente controlar la salida en lugar del estado del sistema. Una controlabilidad completa de estado no es necesaria ni suficiente para controlar la salida del sistema. Por dicha razón es útil definir una controlabilidad completa de la salida por separado. Considerar el sistema descrito por:. x = Ax + Bu y = Cx + Du. (2.14). En donde. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 11 de 61.

(16) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. x = vector de estado (vector de orden n) u = vector de control (vector de orden p) y = vector de salida (vector de orden m) A = matriz del sistema de orden n x n B = matriz de control de orden n x p C = matriz de salida de orden m x n D = matriz de transmisión directa de orden m x p Se dice que el sistema dado por (2.14) es de salida completamente controlable si es posible construir un vector de control u(t) no acotado, tal que transfiera cualquier salida inicial determinada y(t0) a cualquier salida final y(t1) en un intervalo de tiempo finito t0 ≤ t ≤ t1 Es factible demostrar que la condición para una controlabilidad completa de la salida es la siguiente: el sistema descrito mediante las ecuaciones (2.14) es de salida completamente controlable si y sólo si la matriz de orden m x (n + 1)p. S = ⎡⎣CB CAB CA 2 B. CA n-1B D ⎤⎦. (2.15). es de rango m. 2.3.3.1.7.- Controlabilidad completa de estado para sistemas en tiempo discreto Consideremos al sistema de control en tiempo discreto definido por. x[( k + 1)T ] = Fx ( kT ) + Gu ( kT ). (2.16). y ( kT ) = Cx ( kT ) + Du ( kT ). (2.17). donde. x ( kT ) = vector de estado de orden n en el periodo k de muestreo u ( kT ) = vector de control de orden p en el periodo k de muestreo. y ( kT ). = vector de salida de orden m en el periodo k de muestreo F = matriz de estado de orden n x n, constante. G = matriz de control de orden n x p, constante. C = matriz de salida de orden m x n, constante. D = matriz de transmisión directa de orden m x p T = Periodo de muestreo. Se entiende que. u ( kT ). es constante para kT ≤ t ≤ (k+1)T. Por tanto el sistema en tiempo discreto dado por (2.16) es de controlabilidad. completa de estado si existen p secuencias de control continuo a trozos muestreo, de tal manera que iniciando desde cualquier estado. ui ( kT ) definidas. sobre un número finito de periodos de. x ( kT ) , este pueda ser transferido al estado deseado x f en n periodos. de muestreo. Se demuestra que la condición para la controlabilidad completa de estado es que la matriz de n filas y np columnas:. S = ⎡⎣G FG F 2G O bien que. (. F n-1G ⎤⎦. rango ⎣⎡G FG F 2G. sea de rango n.. ). F n-1G ⎦⎤ = n. 2.3.3.1.8.- Controlabilidad de la salida de sistemas de tiempo discreto. El sistema de control dado por las ecuaciones (2.16) y (2.17) es controlable a la salida si la matriz de m filas por (n+1)p columnas. S = ⎡⎣ D CG CFG CF 2G. CF n-1G ⎤⎦ es de rango m.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 12 de 61.

(17) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. 2.3.3.1.9.- Sistema estabilizable. Cuando un sistema no es controlable de estado completo, pero sucede que la parte no controlable es estable, se dice entonces que el sistema es estabilizable, aunque no sea controlable. Un sistema controlable de estado completo es siempre estabilizable. 2.3.3.2.- Observabilidad completa de estado. Analizaremos ahora la observabilidad de los sistemas lineales. Consideremos el sistema sin excitación descrito por las ecuaciones siguientes:. x = Ax y = Cx. (2.18). en donde x = vector de estado (vector de orden n) y = vector de salida (vector de orden m) A = matriz del sistema de orden n x n C = matriz de salida de orden m x n Se dice que el sistema es completamente observable si el estado x(t) se determina a partir de la medición de y(t) durante un intervalo de tiempo finito t0 ≤ t ≤ t1. Por tanto el sistema es completamente observable si todas las transiciones de estado afectan eventualmente a todos los elementos del vector de salida. El concepto de observabilidad es útil al resolver el problema de reconstruir señales o variables de estado no medibles a partir de variables que sí son medibles en un tiempo lo menor posible. Puesto que estamos considerando que el sistema es lineal e invariante en el tiempo; podemos sin perder generalidad suponer que t0 = 0. El concepto de observabilidad es muy importante porque, en el terreno práctico, la dificultad que se encuentra con el control mediante retroalimentación del estado es que algunas variables de estado no son asequibles para una medición directa, por lo que se hace necesario estimar las variables de estado no medibles para formar las señales de control. Se puede demostrar que tales estimaciones de las variables de estado son posibles si y sólo si el sistema es completamente observable. Para analizar las condiciones de observabilidad consideramos el sistema sin excitación como el que se obtiene mediante las ecuaciones (2.18), por una razón muy simple: si el sistema se describe mediante. x = Ax + Bu y = Cx + Du Entonces: t. t. x ( t ) = e At x (0) + ∫ e A ( t −τ ) Bu (τ ) dτ 0. y. y (t ) = Ce At x (0) + C∫ e A (t −τ ) Bu (τ ) dτ + Du 0. Dado que las matrices A, B, C y D se conocen al igual que u(t), los dos últimos términos del segundo miembro de la ecuación anterior son cantidades conocidas. Como estas cantidades se restan del valor observado y(t), para obtener una condición necesaria y suficiente para la observabilidad completa de estado, basta considerar el sistema descrito por las ecuaciones (2.18). 2.3.3.2.1.- Observabilidad completa de sistemas de tiempo continuo Considere al sistema dado por (2.18), vuelto a escribir como. x = Ax y = Cx el vector de salida y(t) es. y (t ) = Ce At x (0) GERMAN VELANDIA PELAEZ Código 200418412. Pag. 13 de 61.

(18) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. n −1. Según el teorema de Cayley-Hamilton tenemos que:. e − At = ∑ α k (τ ) A k k =0. Por tanto: n −1. y ( t ) = Ce At x (0) = ∑ α k (τ )CA k x (0) k =0. es decir:. y ( t ) = α 0 ( t )Cx (0) + α1 ( t )CAx (0) +. + α n −1 (t )CA n −1x (0). (2.19). Entonces el sistema es completamente observable, si dada la salida y(t) durante un intervalo de tiempo 0 ≤ t ≤ t1, x(0) se determina únicamente a partir de la ecuación (2.18). Se puede demostrar que esto requiere que el rango de la matriz de nm filas y n columnas:. ⎡ C ⎤ ⎢ CA ⎥ ⎥ sea n. La matriz O recibe el nombre de matriz de observabilidad. O=⎢ ⎢ ⎥ ⎢ n-1 ⎥ ⎣CA ⎦ 2.3.3.2.2.- Condiciones para la observabilidad completa en el dominio de la frecuencia Las condiciones para la observabilidad completa de estado también se analizan en términos de las funciones de transferencia o las matrices de transferencia. La condición necesaria y suficiente para una observabilidad completa de estado es que no ocurra una cancelación en la función de transferencia o en la matriz de transferencia. Si ocurre una cancelación el modo cancelado no se puede observar en la salida. La función de transferencia o la matriz de transferencia no presenta cancelación si y sólo si el sistema de estado-espacio es de estado completamente controlable y completamente observable. 2.3.3.2.3.- Forma alternativa de la condición para la observabilidad completa Consideremos el sistema descrito por las ecuaciones (2.18), vueltas a escribir como:. x = Ax y = Cx Definimos la matriz de transformación P que transforma la matriz de estado A en una matriz diagonal V. Para obtener la matriz diagonal definimos un nuevo vector de estado z, tal que: x = Pz De esta manera las ecuaciones (2.18) quedan como:. z = P -1 APz y = CPz ⎡λ1 0 ⎢0 λ 2 -1 P AP = V = ⎢ ⎢ ⎢ ⎢⎣ 0. (2.20). 0⎤ ⎥ ⎥ ⎥ ⎥ λn ⎥⎦. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 14 de 61.

(19) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. Por tanto. y ( t ) = CPe Vt z (0) O también:. ⎡ e λ1t ⎢ 0 y ( t ) = CP ⎢ ⎢ ⎢ ⎣⎢ 0. 0 e λ2 t. ⎡ e λ1t z1 (0 ) ⎤ 0 ⎤ ⎢ λ2 t ⎥ ⎥ ⎥ z ( 0 ) = CP ⎢ e z 2 (0) ⎥ ⎢ ⎥ ⎥ ⎢ ⎥ ⎥ λn t e λn t ⎦⎥ ⎣⎢ e z n ( 0 ) ⎦⎥. El sistema es completamente observable si ninguna de las columnas de la matriz CP de orden m x n está formada sólo por ceros. Esto se debe a que si la columna j de CP está formada sólo por ceros, la variable de estado. z j (0). no aparecerá en la ecuación de salida y, por. z. tanto, no puede determinarse a partir de la observación de y(t). En tal caso x (0) que se relaciona con (0) mediante la matriz no singular P, no puede determinarse. Esta condición sólo es aplicable si los valores propios λi de A son diferentes. 2.3.3.2.4.- Observabilidad completa del estado para sistemas en tiempo discreto. Consideremos al sistema de control en tiempo discreto definido por. x[( k + 1)T ] = Fx ( kT ) + Gu ( kT ). (2.23). y ( kT ) = Cx ( kT ) + Du ( kT ). (2.24). donde. x ( kT ) = vector de estado de orden n en el periodo k de muestreo u ( kT ) = vector de control de orden p en el periodo k de muestreo. y ( kT ) = vector de salida de orden m en el periodo k de muestreo. F = matriz de estado de orden n x n, constante. G = matriz de control de orden n x p, constante. C = matriz de salida de orden m x n, constante. D = matriz de transmisión directa de orden m x p T = Periodo de muestreo. Por comodidad y brevedad omitimos el periodo de muestreo T en las dos ecuaciones anteriores, por lo que es común que éstas se presenten como. x ( k + 1) = Fx ( k ) + Gu ( k ). (2.23A). y ( k ) = Cx ( k ) + Du ( k ). (2.24A). Se dice que el sistema dado por (2.23) y (2.24) es observable de estado completo si es posible determinar el estado. y. x (0). a partir de las. observaciones de ( k ) sobre un número finito de periodos de muestreo. El sistema es observable si cada transición de estado afecta eventualmente a la salida. Se puede demostrar que el sistema dado por (2.23) y (2.24) es completamente observable si la matriz de nm filas y n columnas:. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 15 de 61.

(20) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. ⎡ C ⎤ ⎢ CF ⎥ ⎥ Nd = ⎢ ⎢ ⎥ ⎢ n-1 ⎥ ⎣CF ⎦. es de rango n.. Nd. es la matriz de observabilidad, en tiempo discreto.. 2.3.3.2.5.- Sistema detectable. Si un sistema es no observable de estado completo, pero su parte no observable es estable, entonces se dice que dicho sistema es solamente detectable. Un sistema observable de estado completo es siempre detectable. 2.3.3.2.6.- Forma canónica observable en sistemas SISO.. Si la matriz de estado la forma canónica:. ⎛0 ⎜ ⎜1 A = ⎜0 ⎜ ⎜ ⎜0 ⎝. 0 0. 0 0. 1. 0. 0. 1. Y la matriz de salida. C = [0 0. C. A de un sistema dinámico se puede representar en. −a1 ⎞ ⎟ −a2 ⎟ −a3 ⎟ ⎟ ⎟ −an ⎟⎠ para una sola salida, toma la forma:. 0 1]. Tenemos así el sistema dinámico representado en forma canónica observable y por tanto podemos construir la matriz de observabilidad definida como:. ⎛ C ⎞ ⎜ ⎟ CA ⎟ ⎜ N= ⎜ M ⎟ ⎜⎜ n-1 ⎟ ⎟ ⎝ CA ⎠ Ahora, si la matriz observable.. N es de rango completo, es decir es de rango n, decimos entonces que el sistema dinámico es completamente. 2.4.- Estabilidad de los Sistemas de Control3 La teoría de estabilidad juega un rol central en teoría de sistemas e ingeniería. El requisito indispensable para todo sistema de control es la estabilidad en lazo cerrado del sistema global. Esto garantiza que algunas acciones de control aplicadas al sistema en determinados instantes de tiempo no produzcan respuestas que tiendan a crecer indefinidamente. De hecho el objetivo principal de un sistema de control sobre una planta es hacer que los puntos de operación deseados para ella sean equilibrios estables, de tal forma que si una perturbación saca al sistema de este punto, éste pueda regresar a él. La estabilidad de los puntos de equilibrio se caracteriza generalmente como estabilidad en el sentido de Lyapunov, un matemático e ingeniero ruso que estableció las bases de la teoría que hoy lleva su nombre. Aleksandr Lyapunov (1857-1918). Un punto de equilibrio (PE) se dice estable si todas las soluciones que se inicien en las cercanías del punto de equilibrio permanecen en las cercanías del punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asintóticamente estable si todas las soluciones que se inicien en las cercanías del punto de equilibrio no sólo permanecen en las cercanías del punto de 3. http://www.eng.newcastle.edu.au/~jhb519/teaching/snolin/material/cap03.pdf. Estabilidad Según Lyapunov.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 16 de 61.

(21) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. equilibrio, sino que además tienden hacia el equilibrio a medida que el tiempo se aproxima a infinito. Los teoremas de estabilidad de Lyapunov dan condiciones suficientes para estabilidad de puntos de equilibrio. 2.4.1.- Teorema de Estabilidad de Lyapunov para sistemas estacionarios. Para el sistema estacionario, descrito por la ecuación:. x (t ) = f ( x ). donde. f :D→. (2.25) n. es un mapa localmente Lipschitz continuo4 desde un dominio D. un punto de equilibrio (PE) de (2.25), es decir Entonces decimos que el PE a) b) c). x = 0 de (2.25) es:. Teorema 2.4.1.1. Lyapunov. Sea el origen x = 0 un PE de (2.25) y sea D ⊂ función continuamente diferenciable tal que: V(0) = 0 y V(x) > 0 en D ― {0}. ⊂. n. en. n. Supongamos que. x ∈ D es. f ( x ) = 0 . Sin perder generalidad y por conveniencia asumimos que x = 0 .. Estable si para cada ε > 0 existe un δ = δ ( ε ) tal que: x (0) < δ Inestable si no es estable. Asintóticamente estable (AE) si es estable y δ puede elegirse tal que. V (0) ≤ 0. (u(t ) = 0). <ε. ⇒ x(t ) x (0) n. <. δ ⇒ lim x (t ) = 0. un dominio que contiene el origen. Sea V : D →. una. (2.26). en D. (2.27). Entonces x = 0 es estable. Más aún si. V (0) < 0 en D ― {0}.. (2.28). Entonces x = 0 es AE. Demostración. Dado ε > 0, elijamos r Є (0, ε] tal que Sea. α = min x =r V ( x) . Entonces α > 0. Br = {x ∈. n. por (2.26). Tomemos. x ≤ r} ⊂ D . β ∈ (0, α ). y sea. Ω β esta en el interior de Br , puesto que si no fuera así, existiría un punto p ∈ Ω β este punto,. Ω β = {x ∈ Br V ( x ) ≤ β } . Entonces. que se encuentra sobre la frontera de. Br . En. V ( p ) ≥ α > β , pero para todo x ∈ Ω β , V ( x) ≤ β lo cual seria una contradicción. Figura 2.1.. Figura 2.4 Representación geométrica de los conjuntos para el teorema de Lyapunov.. 4. Lipschitz continúa. En matemática, una función f : M → N entre espacios métricos M y N es llamada Lipschitz continua (o se dice que satisface una condición de Lipschitz) si existe una constante K > 0 tal que d(f(x), f(y)) ≤ K d(x, y) para todo x y y en M. En tal caso, K es llamada la constante Lipschitz de la función. La condición de Lipschitz es una hipótesis importante para demostrar la existencia y unicidad de soluciones para las ecuaciones diferenciales ordinarias.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 17 de 61.

(22) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. El conjunto. Ωβ. tiene la propiedad de que toda trayectoria que comienza en. se deduce de (2.27) puesto que Como. Ωβ. en t = 0 permanece en. Ωβ. para todo. t ≥ 0 . Esto. V ( x (t )) ≤ 0 ⇒ V ( x (t )) ≤ V ( x (0)) ≤ β , ∀t ≥ 0. Ω β es un conjunto compacto /cerrado por definición y acotado porque esta contenido en Br ) se concluye que (2.25) tiene una. solución única definida para todo t ≥ 0 cuando. x(0) ∈ Ω β .. Como V es continua y V(0) = 0, existe un. δ. > 0 tal que. x ≤ δ ⇒ V ( x) < β Entonces. Bδ ⊂ Ω β ⊂ Br. Por lo tanto. x(0). <. y. x(0) ∈ Bδ ⇒ x(0) ∈ Ω β ⇒ x(t ) ∈ Ω β ⇒ x(t ) ∈ Br , ∀t ≥ 0. δ ⇒ x(t ). <. r ≤ ε , ∀t ≥ 0. lo que muestra que el PE en x = 0 es estable.. x(t ) → 0 cuando t → ∞ . t → ∞ . Como V(x(t)) es monotónicamente decreciente y. Ahora veamos (2.28). Para establecer que (2.25) es asintóticamente estable (AE), debemos probar que Como V es continua y V(0) = 0, es suficiente mostrar que V(x(t))→0 cuando acotada inferiormente por 0,. V ( x (t )) → c ≥ 0 cuando t → ∞ Vamos a mostrar que c ≥ 0 por contradicción. Supongamos que c > 0. Por continuidad de V(x), existe d > 0 tal que. V ( x (t )) → c > 0 implica que la trayectoria x(t) permanece fuera de la bola Bd cual existe porque la función continua por (2.28). Integrando. V ( x). V ( x). para todo t ≥ 0. Sea. alcanza un máximo sobre el conjunto compacto {d. Bd ⊂ Ω c . El limite. −γ = maxd ≤ x ≤ rV ( x) , el. ≤ x ≤ r} . Sabemos que −γ. <0. tenemos que: t. V ( x (t )) = V ( x (0)) + ∫ V ( x (τ ))dτ ≤ V ( x (0)) − γ t 0. Como el lado derecho se va a hacer negativo después de un cierto tiempo, la desigualdad contradice la suposición de que c > 0. Una función continuamente diferenciable que satisface (2.26) y (2.27), se denomina Función de Lyapunov. La superficie V(x) = c se denomina superficie de Lyapunov o superficie de nivel. La figura 2.2 da una interpretación intuitiva del Teorema de Lyapunov.. Figura 2.5 Curvas de nivel de un función de Lyapunov.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 18 de 61.

(23) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. V ≤ 0 implica que cuando la trayectoria cruza n conjunto Ω c = {x ∈ V ( x) ≤ c} y nunca puede salir de él.. La condición. la superficie de Lyapunov V(x) = c se introduce en el. Cuando V < 0, la trayectoria se mueve de una superficie de Lyapunov a otra superficie de Lyapunov interior con un c menor. A medida que c decrece, la superficie de Lyapunov V(x) = c se achica hasta transformarse en el origen, mostrando que la trayectoria tiende al origen. t → ∞ . Si sólo sabemos que V ≤ 0 , no podemos asegurar que la trayectoria tienda al origen, pero podemos concluir que el origen es estable porque la trayectoria puede ser encerrada en cualquier bola Bε sólo con requerir que el estado inicial x(0) pertenezca a. cuando. una superficie de Lyapunov contenida en dicha bola. Una función V(x) que satisface (2.26) se dice definida positiva. Si satisface la condición más débil V ( x) ≥ 0 para x ≠ 0, se dice semidefinida positiva. Una función se dice definida negativa o semidefinida negativa si -V(x) es definida positiva o semidefinida positiva, respectivamente. Si V(x) no tiene signo definido con respecto a alguno de estos cuatro casos se dice indefinida. El teorema de Lyapunov se puede enunciar, usando esta nueva terminología como: el origen es estable si existe una función definida positiva y continuamente diferenciable tal que V ( x) es semidefinida negativa, y es AE si V ( x) es definida negativa. Es decir; siendo V la forma cuadrática V(x) = xTPx donde P es una matriz real y simétrica. V(x) es (semi)definida positiva sí y solo si todos los autovalores de P son (no negativos) positivos, lo que vale sí y solo si todos los menores principales de P son (no negativos) positivos. Si V(x) = xTPx es (semi)definida positiva, decimos que la matriz P es (semi)definida positiva y escribimos (P ≥ 0) P > 0. 2.4.1.1.- Estabilidad Asintótica Global Teorema 2.4.1.2. Barbashin-Krasovskii. Sea x = 0 un PE de (2.25). Sea que. V (0) = 0 y V(x) > 0 , ∀x ≠ 0 x → ∞ ⇒ V ( x) → ∞. (2.30). ∀x ≠ 0. (2.31). V ( x). < 0,. V:. n. →. una función continuamente diferenciable tal. (2.29). entonces x = 0 es GAE asintóticamente estable globalmente 2.4.1.2.- Inestabilidad Vamos a ver un teorema que prueba que un PE es inestable. Sea. D⊂. n. V :D→. una función continuamente diferenciable en un dominio. que contiene al origen x = 0.. Supongamos que V(0) = 0 y que hay un punto x0 arbitrariamente cercano al origen tal que V(x0) > 0. Elijamos r > 0 tal que la bola Br. = {x ∈. n. x ≤ r} esté contenida en D, y sea. U = {x ∈ Br V ( x) > 0}. (2.32). El conjunto U es no vacío. Su frontera está dada por la superficie V(x) = 0 y la esfera. x = r . Como V(0) = 0, el origen está sobre la. frontera de U en el interior de Br. Teorema 2.4.1.3. Chetaev. Sea x = 0 un PE de (2.25). Sea V(x0) > 0 para algún x0 con. x. V :D→. una función continuamente diferenciable tal que V(0) = 0 y. arbitrariamente pequeña. Definamos el conjunto U como en (2.32) y supongamos que. V ( x) > 0 en U.. Entonces x = 0 es inestable.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 19 de 61.

(24) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. Demostración. El punto x0 está en el interior de U y V(x0) = a > 0. La trayectoria x(t) que comienza en x(0) = x0 debe dejar el conjunto U. Para probar esto, notemos que mientras x(t) permanezca en U, V(x(t)) ≥ a porque. V ( x) > 0. en U. Sea. γ = min{V ( x) x ∈ U y V ( x) ≥ a} que. existe. porque. la. función. continua. V ( x) tiene {x ∈ U y V ( x) ≥ a} = {x ∈ Br V ( x) ≥ a} Entonces γ > 0 y. un. mínimo. en. el. conjunto. compacto. t. V ( x ( t )) = V ( x (0)) + ∫ V ( x ( s ))ds ≥ a + γ t 0. Esta desigualdad muestra que x(t) no se puede quedar indefinidamente en U porque V(x) está acotada en U. Ahora, x(t) no puede dejar U a través de la superficie V(x) = 0 porque V(x(t)) ≥ a. Por lo tanto debe dejar U a través de la esfera para. x0. x = r . Como esto pasa. arbitrariamente pequeña, el origen es inestable.. 2.4.1.3.- El Principio de Invariancia. V(x(t)) debe decrecer a cero y en consecuencia x(t)→0 cuando t → ∞. Esta idea puede formalizarse en el llamado principio de Invariancia de LaSalle, el cual pasaremos a enunciar y demostrar una vez presentemos algunos conceptos. Sea x(t) una solución de (2.25). • • • •. Un punto p es un punto límite positivo de x(t) si existe una secuencia {tn}, con tn →∞ cuando n → ∞ , tal que x(tn) → p cuando n → ∞. El conjunto de todos los puntos límites positivos de x(t) se denomina el conjunto límite positivo de x(t). Un conjunto M es un conjunto invariante con respecto a (2.25) si. x(0) ∈ M ⇒ x(t ) ∈ M , ∀t ∈. • •. Un conjunto M es un conjunto invariante positivo si. •. Decimos que x(t) tiende a M cuando t tiende a infinito si para cada ε > 0 existe T > 0 tal que:. x(0) ∈ M ⇒ x(t ) ∈ M , ∀t ≥ 0. donde dist(p,M) denota la distancia de un punto p a un conjunto M, es decir,. dist ( x(t ), M ) < ε , ∀t > T dist ( p, M ) = inf x∈M p − x .. Un PE AE es el conjunto límite positivo de toda solución que comience suficientemente cerca del PE. Un ciclo límite estable es conjunto límite positivo de toda solución que comience suficientemente cerca del ciclo límite. La solución tiende al ciclo límite cuando t → ∞ pero no necesariamente a algún punto específico del ciclo límite, es decir el conjuntos. invariantes. conjunto Ω c. = {x ∈. porque n. toda. solución. que. limt →∞ x(t ). comience. sobre. no necesariamente existe. El PE y el ciclo límite son. ellos. se. queda. allí. para. todo t ∈. .. El. V ( x) ≤ c} V ( x) ≤ 0 para todo x ∈ Ω c es un conjunto invariante positivo.. Lema 2.4.1.1.- Si una solución x(t) de (2.25) es acotada y permanece en D para todo t ≥ 0, entonces su conjunto límite positivo L+ es un conjunto invariante, no vacío y compacto. Además, x(t) → L+ cuando t → ∞. 2.4.1.4.- Región de Atracción Sea el origen x = 0 un PE AE del sistema no lineal descrito en (2.25) donde dominio que contiene el origen. Sea RA, se define como:. φ (t , x). f :D→. es localmente Lipschitz y. D⊂. n. es un. la solución de (2.25) con estado inicial x en t = 0. La región de atracción (RA) del origen,. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 20 de 61.

(25) TESIS DE MAESTRIA EN INGENIERIA ELECTRONICA. AREA CONTROL. RA = {x ∈ D φ (t , x) → 0 cuando t → ∞} El método de Lyapunov puede usarse para encontrar estimas de la RA. Por una estima de la RA entendemos un conjunto que toda trayectoria que comienza en. Ω. Ω ⊂ RA. tal. tienda al origen cuando t → ∞.. 2.4.1.5.- Sistemas Lineales y Linealización El sistema lineal invariante:. x = Ax. (2.33). tiene un equilibrio en el origen, que es aislado sí y solo si det A ≠ 0. Si det A = 0, todo punto en el kernel o subespacio nulo de A es un PE. Un sistema lineal no puede tener múltiples PE aislados, porque si x y z son dos PE de (2.33), entonces, por linealidad, todo punto en la recta que conecta a x y z es un PE. Las propiedades de estabilidad del origen pueden caracterizarse mediante la ubicación de los autovalores de A. 2.4.1.5.1.- Teorema de la Estabilidad del Origen en Sistemas Lineales. El PE x = 0 de (2.33) es estable sí y solo si todos los autovalores de A tienen parte real no positiva y cada autovalor con parte real nula tiene un bloque de Jordán asociado de orden 1. El PE x = 0 es GAE sí y solo si todos los autovalores de A tienen parte real negativa. Cuando todos los autovalores de A tienen parte real negativa, se dice que A es una matriz de estabilidad o matriz Hurwitz. La estabilidad del origen puede también investigarse usando el método de Lyapunov. Consideremos la candidata a función de Lyapunov V(x) = xTPx donde P es una matriz real simétrica definida positiva. La derivada de V(x) sobre las trayectorias del sistema está dada por:. V ( x) = xT Px + xT Px = xT ( PA + AT P) x = - xT Qx donde Q es una matriz simétrica definida por:. PA + AT P = -Q. (2.34). Si Q es definida positiva, podemos concluir por el Teorema de Lyapunov que el origen es AE. En el caso de sistemas lineales, es posible revertir los pasos del método de Lyapunov. Supongamos que comenzamos eligiendo Q como una matriz real simétrica definida positiva, y resolvemos (2.34) para encontrar P. Si (2.34) tiene una solución definida positiva, podemos nuevamente concluir que el origen es AE. La ecuación (2.34) se denomina ecuación de Lyapunov. Teorema 2.4.1.5.2. Una matriz A es Hurwitz, o sea, todos sus autovalores tienen parte real negativa, síí dada una matriz Q simétrica y definida positiva, existe una matriz P simétrica y definida positiva que satisface la ecuación de Lyapunov (2.34). Más aún, si A es Hurwitz, entonces P es la única solución de (2.34). Demostración. La suficiencia sigue del Teorema 1 con la función de Lyapunov V(x) = xTPx, como ya mostramos. Para probar la necesidad, supongamos que todos los autovalores de A tienen parte real negativa y consideremos la siguiente matriz P. ∞. P = ∫ e A t Qe At dt T. (2.35). 0. El integrando es una suma de términos de la forma. t k +1eλi t. con. Re λi < 0 . Por lo tanto, la integral existe. La matriz P es simétrica.. Para probar que es definida positiva, suponemos lo contrario, es decir, que existe un vector x ≠ 0 tal que xTPx = 0.. GERMAN VELANDIA PELAEZ Código 200418412. Pag. 21 de 61.

Referencias

Documento similar