Lecci´
on 5
Controlabilidad y observabilidad
1
Eventos alcanzables y controlables
Σ = (T , U, U, X, Y, ψ, η) un sistema de control arbitrario T × X= Espacio de eventos
(t, x) ∈ T × X= el estado del sistema en el instante t es x
Definici´on de controlabilidad-alcanzabilidad
(a) El evento (t, x) es alcanzable desde el evento (t0, x0) si
existe un control u(·) ∈ U tal que ψ(t; t0, x0, u(·)) = x.
Tambi´en se dice que (t0, x0) puede controlarse hasta (t, x).
(b) Si x0, x1 ∈ X, t ∈ T , (t ≥ 0) y ∃t0, t1 ∈ T tales que
t1 − t0 = t y (t1, x1) es alcanzable desde (t0, x0) entonces se
dice que el estado x1 es alcanzable desde el estado x0 en tiempo t. Tambi´en se dice que x0 es controlable hasta x1 en tiempo t.
(c) El estado x1 es alcanzable desde el estado x0 (o x0 es
controlable hasta x1) si ∃t ∈ T tal que x1 es alcanzable desde x0 en tiempo t ( o x0 es controlable hasta x1 en tiempo t).
Controlabilidad de sistemas lineales (dimensi´on finita)
T ⊂ R un intervalo. X = Kn, U = Km, Y = Kp (K = R o C) (Σ) ˙x(t) = A(t)x(t) + B(t)u(t) t ∈ T y(t) = C(t)x(t) + D(t)u(t) A(·) ∈ C(T, Rn×n), B(·) ∈ C(T, Rn×m), C(·) ∈ C(T, Rp×n), D(·) ∈ C(T, Rp×m)Definici´on de controlabilidad de sistemas lineales
(Σ) es controlable en [t0, tf] ⊂ T si para (x0, x1) ∈ Rn × Rn
existe una funci´on de control u(·) ∈ C([t0, tf],Rm) tal que la ´unica
soluci´on del P.C.I. ˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 cumple x(tf) = x1 ((t0, x0) es controlable a (tf, x1) o (tf, x1) es alcanzable desde (t0, x0)). Nota
Para sistemas continuos alcanzabilidad y controlabilidad son conceptos (matem´aticamente) equivalentes.
3
Soluci´on de los sistemas lineales
La ´unica soluci´on del P.C.I. ˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 es x(t) = Φ(t, t0)x0 + Z t t0 Φ(t, s)B(s)u(s) ds, t ∈ T
donde Φ(t, t0) es la matriz fundamental de soluciones o matriz de
transici´on de estados: ´unica soluci´on de
˙X(t) = A(t)X(t), t ∈ T X(t0) = In
Recordar concepto y poner ejemplo
Sistemas diferenciales lineales invariantes en el tiempo
˙x(t) = Ax(t) + Bu(t), t ∈ R A ∈ Rn×n, B ∈ Rn×m y(t) = Cx(t) + Du(t) C ∈ Rp×n, D ∈ Rp×m Matriz fundamental de soluciones o de transici´on de estados: Φ(t, t0) = eA(t−t0) eAt = ∞ X k=0 tk k!A k, t ∈ R (Matlab: expm) Soluci´on (funci´on de transici´on de estados):
x(t) = eA(t−t0)x0 + Z t
t0
eA(t−τ)B(τ )u(τ ) dτ, t ∈ R
Respuesta del sistema:
y(t) = Cx(t)+Du(t) = CeA(t−t0)x0+ Z t
t0
CeA(t−τ)B(τ )u(τ ) dτ +Du(t)
5
Matriz de transici´on: Forma de Jordan
Si A ∈ Rn×n, existe T ∈ Cn×n t.q. T−1AT = J, con J = J1 . .. Jr , Jj = λj 1 0 · · · 0 0 λj 1 · · · 0 . . . . . . . .. . .. . . . 0 0 · · · λj 1 0 0 · · · 0 λj ∈ Cnj ×nj,
Esta es la forma de Jordan de A y λ1, . . . , λr ∈ C son los valores
propios (v.p.) distintos (λi 6= λj) de A. Se cumple que:
eJt = eJ1t . .. eJkt , eJj t = eλj t 1 t t 2 2! · · · tnj −2 (nj− 2)! tnj −1 (nj− 1)! 0 1 t · · · t nj −3 (nj− 3)! tnj −2 (nj− 2)! . . . . . . . . . . .. . . . . . . 0 0 0 · · · 1 t 0 0 0 · · · 0 1 . Si λj = aj + ibj ⇒ eλjt = eajteibjt = eajt(cos(bjt) + i sen(bjt)) eA(t−τ) = T eJ(t−τ)T−1
(Matlab: eig) (valores propios)
(Matlab (symbolic toolbox): jordan) (forma de Jordan)
Oscilador lineal amortiguado
m¨x + c ˙x + kx = 0 (movimiento libre) x(0) = x0, ˙x(0) = v0 Con el cambio ω0 = r k m ζ = c 2√km(frecuencia natural) (raz´on de amortiguamiento) ¨ x + 2ζω0 ˙x + ω02x = 0 Ecuaciones de estado (x1 = x, x2 = ˙x): ˙x1 ˙x2 = 0 1 −ω02 −2ζω0 x1 x2 , x1(0) x2(0) = x0 v0 7
Oscilador lineal amortiguado
Polinomio caracter´ıstico: λ2 + 2ζω0λ + ω20 = λ + ζω0 ± ω0 p ζ2 − 1 Soluci´on general: x(t) = T eJtT−1 x0 v0 Movimiento subamortiguado: 0 < ζ < 1. eJt = e(−ζω0+ωdi)t 0 0 e(−ζω0−ωdi)t ωd = ω0 p
ζ2 − 1 (frecuencia natural amortiguada) e(−ζω0±ωdi)t = e−ζω0t(cos(ω dt) ± i sen(ωdt)) x(t) = e−ζω0t(A cos(ω dt) + B sen(ωdt)) Movimiento sobreamortiguado: ζ > 1. eJt = " e(−ζ+√ζ2−1)ω0t 0 0 e(−ζ−√ζ2−1)ω0t # x(t) = Ae(−ζ+√ζ2−1)ω0t + Be(−ζ−√ζ2−1)ω0t 8
Oscilador lineal amortiguado
Movimiento cr´ıticamente amortiguado: ζ = 1. J = −ω0 1 0 −ω0 , eJt = e−ω0t 1 t 0 1 Soluci´on general: x(t) = T eJtT−1 x0 v0 x(t) = e−ω0t[(v 0 + ω0x0)t + x0]
Observaci´on: Las tres figuras tienen una caractr´ıstica com´un:
despu´es de un tiempo en el que el sistema evoluciona con cambios significativos, tiende al estado estacionario. Es una propiedad
general de los sistemas lineales. 9
Respuesta de estado estacionario
˙x(t) = Ax(t) + Bu(t), t ∈ R A ∈ Rn×n, B ∈ Rn×1 y(t) = Cx(t) + Du(t) C ∈ R1×n, D ∈ R1×1 Hip´otesis: Una entrada (m = 1), la funci´on salto unidad
γ(t) :=
0, t < 0
1, t ≥ 0 Condici´on inicial: x(0) = 0 Respuesta del sistema (A invertible):
y(t) =
Z t 0
CeA(t−τ)B(τ )u(τ ) dτ + Du(t) = C Z t 0 eA(t−τ)D dτ + D = = C Z t 0
eAσD dσ = C(A−1 eAσB)σ=tσ=0 + D = = CA−1eAtB −CA−1B + D
respuesta transitoria respuesta de estado estacionario Si parte real de λi(A) < 0, CA−1eAtB → 0
Una caracterizaci´on algebraica de la controlabilidad
Recordemos: x(t) = Φ(t, t0)x0 + Z t
t0
Φ(t, s)B(s)u(s) ds es la ´unica soluci´on del P.C.I.:
˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 Observaciones importante: R(tf, t0) = Z tf t0 Φ(tf, s)B(s)u(s) ds : u(·) ∈ U es un espacio vectorial, (U = C(R, Rm)). Espacio de estados alcanzables desde (t0, 0) en tiempo tf − t0.
(tf, x1) alcanzable desde (t0, x0) sii x1 − Φ(tf, t0)x0 ∈ R(t0, tf). ¿ Se puede caracterizar R(t0, tf) algebraicamente?
Matriz Grammiana de controlabilidad: W (tf, t0) =
Z tf
t0
Φ(tf, t)B(t)B(t)TΦ(tf, t)T dt
R(tf, t0) = Im(W (tf, t0)) 11
Controlabilidad y matriz Grammiana
(Σ) es controlable en [t0, tf] si y s´olo si R(tf, t0) = Rn
(Σ) es controlable en [t0, tf] si y s´olo si W (t0, tf) es invertible.
w(t) = B(t)TΦ(tf, t)TW (tf, t0)−1(x1 − Φ(tf, t0)x0) lleva el estado x0 en t = t0 al estado x1 en t = tf, y Z tf t0 kw(t)k2 dt ≤ Z tf t0
ku(t)k2 dt entre todos los controles
u(·) ∈ C([t0, tf],Rm) para los que ψ(tf; t0, x0, u(·)) = x1. Interpretaci´on: w(t) es el control que minimiza la energ´ıa o el consumo.
Controlabilidad de sistemas invariantes en el tiempo
(Σ)
˙x(t) = Ax(t) + Bu(t) t ∈ T y(t) = Cx(t) + Du(t)
Matriz fundamental de soluciones (transmisi´on de estados): Φ(t, t0) = eA(t−t0)
Propiedad importante basada en el Teorema de
Hamilton-Cayley: eAt = α0(t)I + α1(t)A +· · · + αn−1(t)An−1 Teorema Fundamental: rang W (t0, tf) = rang B AB · · · An−1B Ker W (t0, tf) = Ker B AB · · · An−1BT C(A, B) = B AB · · · An−1B ∈ Rn×nm Matriz de controlabilidad de (Σ)
(Σ) controlable si y s´olo si rangC(A, B) = n
13
Sistema carro-p´endulo linealizado
˙x(t) = Ax(t) + Bu(t) y(t) = Cx(t) A = 0 1 0 0 0 −c(J + m` 2) M0 m2`2g M0 − M `cP M0 0 0 0 1 0 −m`c M0 (M + m)mg` M0 − (M + m)cP M0 B = 0 βJ + m` 2 M0 0 βm` M0 , C = 1 0 0 0 0 0 1 0 (M0 = (M + m)J + m`2M ) 14
C´odigo Matlab para calcular la matriz de controlabilidad
syms c J m l cp M g b M0
A=[0 1 0 0; 0 -c*(J+m*l^2)/M0 m^2*l^2*g/M0 -M*l*cp/M0;... 0 0 0 1;0 -m*l*c/M0 (M+m)*m*g*l/M0 -(M+m)*cp/M0]
B=[0;b*(J+m*l^2)/M0;0;b*m*l/M0] C=simplify([B A*B A^2*B A^3*B]) de=simplify(det(C)) m=0.1;M=1;g=9.68;J=1/2; l=1; cp=0.1;c=0.2; M0=(M+m)*J+m*l^2*M; Cs=subs(C) des=det(Cs) 15
Sat´elite en ´orbita geoestacionaria
˙x(t) = 0 1 0 0 3Ω2 0 0 2R0Ω 0 0 0 1 0 −2Ω R0 0 0 x(t) + 0 0 1 0 0 0 0 1 R0 u(t) y(t) = 0 0 1 0x(t)
C´odigo Matlab para calcular la matriz la matriz de controlabilidad y un control de norma m´ınima
echo on syms w R0 t
A=[0 1 0 0; 3*w^2 0 0 2*w*R0; 0 0 0 1; 0 -2*w/R0 0 0] B=[0 0;1 0; 0 0; 0 1/R0]
C=[B A*B A^2*B A^3*B] rangomc=rank(C)
%Control con motor radial estropeado (u_1=0) B1=B(:,2)
Ct=[B1 A*B1 A^2*B1 A^3*B1]
Continuaci´on c´odigo Matlab
%Control con motor tangencial estropeado (u_2=0) B2=B(:,1)
Cr=[B2 A*B2 A^2*B2 A^3*B2] r1=rank(Cr)
%calculo del control para partiendo del reposos en $t=0$ se llegue al %estado [0;0;1;0] en 1 segunto (tf=1)
% Radio de la ´orbita estacionaria y velocidad angular R0=42164
w=7.27*10^(-5)
A=subs(A); vpa(A,4) B=subs(B); vpa(B,4) [T J]=jordan(A)
%necesitamos forma de Jordan real’)
T1=real(T), T2=imag(T), J1=real(J), J2=imag(J) T=[T1(:,1) T1(:,2) T1(:,3) T2(:,3)]
JR=blkdiag(J1(1:2,1:2), [0 J2(3,3); -J2(3,3) 0]) %comprobamos que est´a bien calculado
A-T*JR*T^(-1)
17
Continuaci´on c´odigo Matlab
%A por la grammiana %matriz de transicion E=simplify(T*expm(JR*(1-t))*T^(-1)); vpa(E,4) %integrando W0=simplify(E*B*B’*E’);vpa(W0,4) %matriz grammiana W=int(W0,0,1); vpa(W,4) %Control u=B’*E’*W^(-1)*[0;0;1;0]; vpa(u,4) 18
Descomposici´on de Kalman y el test PBH
Teorema (Descomposici´on de Kalman)
Si (A, B) no es controlable y rangC(A, B) = r < n, existe T ∈ Gln(R) tal que T−1AT = A1 A2 0 A3 T B = B1 0 donde A1 ∈ Rr×r, B1 ∈ Rr×m y (A1, B1) es controlable.
Teorema
(A, B) es controlable si y s´olo si se cumple cualquiera de las dos siguientes condiciones equivalentes:
(i) rangλIn − A B = n para todo λ ∈ C
(ii) rangλIn − A B = n para cada valor propio de A.
(i) y (ii) =Test PBH 1 de rango. 1Popov-Belevitch-Hautus
19
Sistemas diferenciales no lineales (i. t.)
(Σ) ˙x(t) = f (x, u), t ∈ T
x ∈ X ⊂ Rn (estados) y u ∈ U ⊂ Rm (controles), O = X × U abierto, f ∈ C∞(O, Rn).
Definici´on (Controlabilidad global)
(Σ) es (globalmente) controlable en [t0, tf] ⊂ T si para cada
(x0, x1) ∈ X × X existe u(·) ∈ U = C([t0, tf], U ) tal que la
soluci´on del P.C.I.
˙x = f (x, u(t)), t ∈ [t0, t1]
x(t0) = x0
cumple x(tf) = x1.
Referencias
J. M. Coron: Control and Nonlinearity. AMS (2007) Mathematical Surveys and Monographs, vol 136.
E. D. Sontag: Mathematical Control Teory. Springer-Verlag
Controlabilidad local de sistemas no lineales
Definici´on (Controlabilidad local)
Sea (xe, ue) un punto de equilibrio de (Σ). Este sistema se dice
localmente controlable instantaneamente en (xe, ue) si para
cada n´umero real ε > 0 existe un n´umero real δ > 0 tal que para cada par de puntos x0, x1 ∈ Bδ(xe) := {x ∈ Rn : kx − xek < δ}
existe u(·) ∈ C([0, ε], R) tal que ku(t) − uek < ε para todo
t ∈ [0, ε] y la soluci´on del P.C.I.
˙x = f (x, u(t)), x(0) = x0
cumple x(ε) = x1.
Una condici´on suficiente
Sea (xe, ue) un punto de equilibrio de ˙x = f (x, u). Si su sistema
de control linealizado en (xe, ue) es controlable entonces el sistema
˙x = f (x, u) es localmente controlable instantaneamente en (xe, ue).
21
Observabilidad de los sistemas lineales
Observabilidad= capacidad de determinar el estado del sistema a partir de las salidas (conocido el control).
(Σ)
˙x(t) = A(t)x(t) + Bu(t), t ∈ T y(t) = C(t)x(t) + D(t)u(t)
Definici´on de observabilidad
(Σ) es observable en [t0, tf] si cualquier estado inicial x(t0) = x0
est´a determinado de manera ´unica por la salida y(t) en [t0, tf].
y(t) = C(t)Φ(t, t0)x(t0) + Z t t0 C(t)Φ(t, τ )B(τ )u(τ ) dt + Du(t) | {z } yr(t)= respuesta forzada
La respuesta forzada no juega ning´un papel en la determinaci´on de x0 = x(t0) a partir del conocimiento de y(·) en [t0, tf].
Un criterio de observabilidad
Si C(t)Φ(t, t0)x1 = C(t)Φ(t, t0)x2 en [t0, tf] el sistema no es
observable (hay dos estados iniciales distintos que producen la misma salida).
La aplicaci´on L : Rn → C ([t0, tf],Rp)
x → C(t)Φ(t, t0)x
es lineal y el sistema es no observable si y s´olo si Ker L 6= {0}.
Ker L = Ker M (tf, t0) donde M (tf, t0) es la matriz
grammiana de observabilidad: M (tf, t0) =
Z tf
t0
Φ(t, t0)TC(t)TC(t)Φ(t, t0) dt
(Σ) es observable en [t0, tf] si y s´olo si det M (tf, t0) 6= 0.
El estado inicial determinado por la salida es: x(t0) = M (tf, t0)−1
Z tf t0
Φ(t, t0)TC(t)Ty(t) dt
23
Observabilidad de sistemas invariantes en el tiempo
(Σ)
˙x(t) = Ax(t) + Bu(t) t ∈ T y(t) = Cx(t) + Du(t)
Matriz fundamental de soluciones: Φ(t, t0) = eA(t−t0)
Teorema Fundamental: Si MT = CT ATCT · · · (AT)n−1CT C CA .. . CAn−1 entonces Im M (tf, t0) = Im MT = Im CT ATCT · · · (AT)n−1CTT y Ker M (tf, t0) = Ker MT = Ker
CT ATCT · · · (AT)n−1CT O(A, C) = C CA .. . CAn−1 ∈ R pn×n Matriz de observabilidad de (Σ)
Sat´elite en ´orbita geoestacionaria
˙x(t) = 0 1 0 0 3Ω2 0 0 2R0Ω 0 0 0 1 0 −2Ω R0 0 0 x(t) + 0 0 1 0 0 0 0 1 R0 u(t) y(t) = 0 0 1 0x(t) O(A, C) = 0 0 1 0 0 0 0 1 0 −2Ω R0 0 0 −6Ω 3 R0 0 0 −4Ω2 Si y(t) = 1 0 0 0x(t) el sistema no ser´ıa observable.