Controlabilidad y observabilidad
En las próximas clases discutiremos dos conceptos fundamentales de la teoría de sistemas: controlabilidad y observabilidad . Esos dos conceptos describen la interacción de un sistema entre el mundo externo (entradas y salidas) y las variables internas (estados).
Informalmente, la controlabilidad es la propiedad que indica si el
comportamiento de un sistema se puede controlar actuando sobre sus entradas.
La observabilidad es la propiedad que indica si el comportamiento interno de un sistema puede detectarse desde sus salidas.
Controlabilidad
Considere el sistema LTI representado por la ecuación de estados de n estados, q entradas
˙x(t) = Ax(t) + Bu(t); (1)
donde A ∈ Rn×n y B ∈ Rn×q. La controlabilidad solo relaciona entradas y
estados, así la ecuación de salida y(t) = Cx(t) + Du(t) es irrelevante.
Controlabilidad: La ecuación de estado (1) o el par (A; B) se dice controlable
si para todo estado inicial x(0) = x0 y todo estado final x1, hay una entrada
que transfiere x0 a x1 en tiempo finito. En otro caso, (1) o (A; B) se dice no
controlable
Esta definición solo requiere que la entrada sea capaz de llevar el estado a cualquier lugar en el espacio de estados en tiempo finito sin importar qué trayec-toria siga el estado.
Controlabilidad
Ejemplo (Sistema no controlable). Considere el sistema eléctrico de la izquierda
en la figura de abajo.
Es un sistema de primer orden con variable de estado x, el voltaje en el capacitor. Si el capacitor no tiene carga inicial, x(0) = 0, entonces
x(t) = 0 ∀t > 0, sin imporat la entrada aplicada. La entrada no tiene efecto sobre el voltaje en el capacitor. Este sistema, o más precisamente, la
ecuación de estado que lo describe no es controlable.
El sistema a la derecha tiene dos variables de estado. La entrada puede transferir x1 o x2 a cualquier valor deseado, pero no importa qué entrada se
aplique, x1(t) siempre será igual a x2(t). Este sistema tampoco es
controlable. − + + x − 1F u + − y 1Ω 1Ω 1Ω 1Ω − + u + − 1Ω 1Ω + − x1 x2 1F 1F
Prueba de controlabilidad
Teorema (Prueba de controlabilidad). Las siguientes declaraciones son
equivalentes.
1. El par n dimensional (A; B) es controlable. 2. La matriz de controlabilidad
C = B AB A2B . . . An−1B , tiene rango n (rango fila completo).
3. La matriz n × n, Wc(t) = Z t 0 eAτBBTeATτdτ no es singular ∀t > 0.
Prueba de controlabilidad
Ejemplo. La ecuación de espacio de estados linealizada del sistema de péndulo
invertido a la derecha está dada por, ˙y ¨ y ˙θ ¨ θ = 0 1 0 1 0 0 −1 0 0 0 0 1 0 0 5 0 + 0 1 0 −2 u u θ m mg l M y La matriz de controlabilidad es C = B AB A2B A3B = 0 1 0 0 1 0 2 0 0 −2 0 −10 −2 0 −10 0
la cual tiene rango fila completo, luego el sistema es controlable. Si θ se desvía un poco de 0, sabemos que existe un control que lo devolverá al equilibrio en tiempo finito.
Controlabilidad & equivalencia algebraica
La controlabilidad es una propiedad de un sistema que es invariante respecto a transformaciones de equivalencia algebraicas (cambio de coordenadas).
Considere el par (A; B) con C = B AB . . . An−1B
y un par algebraicamente equivalente ( ¯A; ¯B), donde ¯A = PAP−1
, ¯B = P B, y P es una matriz no singular. Entonces la matriz de controlabilidad del par ( ¯A; ¯B) es
¯ C = B¯ B ¯¯A . . . A¯ n−1B¯ = PB PAP−1 PB . . . PAn−1P−1 PB = P B AB . . . An−1B = PC
Gramiano de controlabilidad
La matriz Wc(t) utilizada para chequear la controlabilidad de (A; B) se puede
usar para construir una señal de control de lazo abierto u(t) que lleve al estado x desde cualquier x0 a cualquier x1 en tiempo finito.
Wc(t) =
Z t
0
eAτBBTeATτdτ
Tal ley de control está dada por:
u(t) = −BTeAT(t1−t)W−1
c (t1)(eAt1x0 − x1)
Esta ley de control usa la menor cantidad de energía para transferir x desde x0 a
x1 en tiempo t1. Esto significa que cualquier otro control ¯u(t) que realice la misma transferencia, Z t1 0 ||¯u||2dτ ≥ Z t1 0 ||u||2dτ
Por ejemplo, si x0 = 0, la mínima energía de control es,
Rt1
0 ||u|| 2
dτ = ||W−12
Gramiano de controlabilidad
Si la matriz A is Hurwitz (todos sus autovalores tiene parte real negativa), entonces Wc(t) converge para t → ∞, y se denota simplemente como Wc,
Wc =
Z ∞
0
eAτBBTeATτdτ;
y se denomina Gramiano de controlabilidad de (A; B).
Si deseamos llevar el estado x desde 0 a x1 en tiempo infinito, (t1 → ∞), se
encuentra que la mínima energía de control requerida debería ser, Z ∞
0
||u||2dτ = ||W−12
c x1||2
Entre más cercano a cero sea cualquier autovalor de Wc, más cercano estará
Wc de la singularidad, y más grande será la energía mínima requerida para llevar el estado hasta x1.
Gramiano de controlabilidad
Para el caso de tiempo infinito, no se requiere resolver la integral de tiempo infinito para calcular Wc. Si (A; B) es controlable, (C tiene rango fila completo), Wc es la
única solución de la matriz lineal de Lyapunov,
AWc + WcAT = −BBT
la cual puede resolverse con MATLAB usando Wc = lyap(A,B*B’), o usando la función Wc = gram(SYS,’c’).
Controlabilidad y muestreo
Como se dijo, la mayoría de los sistemas de control se implementan en forma digital, para lo cual es necesario un modelo de tiempo discreto del sistema.
c - ZOH - -c@@c -c T {A, B, C, D} {Ad, Bd, C, D} y[k] u[k] T
Antes hemos visto como obtener un modelo de tiempo discreto a partir de uno en tiempo continuo que es exacto en los instantes de muestreo.
˙x = Ax + Bu y = Cx + Du ⇒ x[k + 1] = Adx[k] + Bdu[k] y[k] = Cx[k] + Du[k] Donde Ad = eAT y Bd = RT 0 e Aτ Bdτ.
La pregunta es: Si el sistema de tiempo continuo es controlable, ¿el sistema de tiempo discreto siempre es controlable?.
Controlabilidad y muestreo
La controlabilidad del sistema discretizado depende del período de muestreo T y los autovalores de la planta de tiempo continuo. La controlabilidad se puede
perder después del muestreo .
Teorema (Muestreo no patológico). Si el par (A; B) es controlable, entonces
el par discretizado (Ad; Bd) es controlable con periodo de muestreo T si para
cualquier dos autovalores λi; λj de A tales que Re[λi − λj] = 0, la condición de
muestreo no patológico
Im[λi − λj] 6=
2πm
T para m = 1, 2, . . . se satisfaga.
El teorema da una condición necesaria que preserva la controlabilidad después del muestreo. Esta condición también es suficiente para sistemas de una sola entrada.
Controlabilidad y muestreo
Ejemplo (Muestreo patológico). Considere el sistema de tiempo continuo
˙x(t) = 0 1 −1 0 x(t) + 0 1 u(t)
Su discretización exacta con período de muestreo T es x[k + 1] = cos T sin T − sin T cos T x[k] + 1 − cos T sin T u[k]
Note que si T = mπ, con m = 1; 2; . . . , este sistema se hace no controlable, i.e., x[k + 1] = (−1) m 0 0 (−1)m x[k] + 1 − (−1) m 0 u[k]
Controlabilidad y muestreo
Un par de observaciones finales acerca del muestreo y la controlabilidad: La condición de muestreo no patológico solo aplica a sistemas con
autovalores complejos; un sistema discretizado con solo autovalores reales es controlable para todo T > 0 si su contraparte de tiempo continuo lo es. La condición de muestreo no patológico solo es suficiente para un sistema MIMO; si el muestreo es patológico, la controlabilidad se puede perder después del muestreo.
Ejemplos de controlabilidad
x1 u
y
x2
En el sistema hidráulico de la izquierda es obvio que la entrada no puede afectar el nivel x2, así que
in-tuitivamente es evidente que este sistema de 2 tan-ques no es controlable.
Un modelo linealizado de este sistema con parámetros unitarios da, ˙x(t) = −1 0 0 0 x(t) + 1 0 u(t) y(t) = 1 0 x(t)
La matriz de controlabilidad es C = [B AB] = 1 −1 0 0
la cual no es de rango completo, luego el sistema no es controlable.
Ejemplos de controlabilidad
Example.
y x2
x1 x3
u La controlabilidad del sistema hidráulico de la
izquierda no es tan obvia, aunque podemos ver que x1(t) y x3(t) no se pueden afectar independiente-mente con u(t).
El modelo linealizado en este caso es, x(t) = −1 1 0 1 −3 1 0 1 −1 x(t) + 0 1 0 u(t) y(t) = 0 1 0 x(t) La matriz de controlabilidad es C = [B AB A2B] = 0 1 −4 1 −3 11 0 1 −4 la cual tiene rango 2, mostrando que el sistema no es controlable.
Ejemplos de controlabilidad
x1 u
x2 x3
y
Ahora en el sistema previo suponga que la entrada se aplica en el primer tanque, como se muestra en la figura.
En este caso el modelo linealizado es el mismo de antes, excepto que la matriz B ahora es diferente. x(t) = −1 1 0 1 −3 1 0 1 −1 x(t) + 1 0 0 u(t) y(t) = 0 1 0 x(t) 1 −1 2