Controlabilidad y observabilidad

(1)

Lecci´

on 5

Controlabilidad y observabilidad

1

Eventos alcanzables y controlables

Σ = (_{T , U, U, X, Y, ψ, η) un sistema de control arbitrario} T × X= Espacio de eventos

(t, x) _{∈ T × X= el estado del sistema en el instante t es x}

Definici´on de controlabilidad-alcanzabilidad

(a) El evento (t, x) es alcanzable desde el evento (t0, x0) si

existe un control u(_{·) ∈ U tal que ψ(t; t}0, x0, u(·)) = x.

Tambi´en se dice que (t0, x0) puede controlarse hasta (t, x).

(b) Si x0, x1 _{∈ X, t ∈ T , (t ≥ 0) y ∃t}0, t1 ∈ T tales que

t1 − t0 = t y (t1, x1) es alcanzable desde (t0, x0) entonces se

dice que el estado x1 es alcanzable desde el estado x0 en tiempo t. Tambi´en se dice que x0 es controlable hasta x1 en tiempo t.

(c) El estado x1 es alcanzable desde el estado x0 (o x0 es

controlable hasta x1) si _{∃t ∈ T tal que x}1 es alcanzable desde x0 en tiempo t ( o x0 es controlable hasta x1 en tiempo t).

(2)

Controlabilidad de sistemas lineales (dimensi´on finita)

T ⊂ R un intervalo. X = Kn, U = Km, Y = Kp (K = R o C) (Σ) ˙x(t) = A(t)x(t) + B(t)u(t) t _{∈ T} y(t) = C(t)x(t) + D(t)u(t) A(_{·) ∈ C(T, R}n×n), B(_{·) ∈ C(T, R}n×m), C(_{·) ∈ C(T, R}p×n), D(_{·) ∈ C(T, R}p×m)

Definici´on de controlabilidad de sistemas lineales

(Σ) es controlable en [t0, tf] ⊂ T si para (x0, x1) ∈ Rn × Rn

existe una funci´on de control u(_{·) ∈ C([t}0, tf],Rm) tal que la ´unica

soluci´on del P.C.I. ˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 cumple x(tf) = x1 ((t0, x0) es controlable a (tf, x1) o (tf, x1) es alcanzable desde (t0, x0)). Nota

Para sistemas continuos alcanzabilidad y controlabilidad son conceptos (matem´aticamente) equivalentes.

3

Soluci´on de los sistemas lineales

La ´unica soluci´on del P.C.I. ˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 es x(t) = Φ(t, t0)x0 + Z t t0 Φ(t, s)B(s)u(s) ds, t _{∈ T}

donde Φ(t, t0) es la matriz fundamental de soluciones o matriz de

transición de estados: única solución de

˙_{X(t) = A(t)X(t),} _t _{∈ T} X(t0) = In

Recordar concepto y poner ejemplo

(3)

Sistemas diferenciales lineales invariantes en el tiempo

˙x(t) = Ax(t) + Bu(t), t _{∈ R A ∈ R}n×n, B _{∈ R}n×m y(t) = Cx(t) + Du(t) C _{∈ R}p×n, D _{∈ R}p×m Matriz fundamental de soluciones o de transición de estados: Φ(t, t0) = eA(t−t0) eAt = ∞ X k=0 tk k!A k_, _t ∈ R (Matlab: expm) Solución (función de transición de estados):

x(t) = eA(t−t0)_x0 ₊ Z t

t0

eA(t−τ)B(τ )u(τ ) dτ, t _{∈ R}

Respuesta del sistema:

y(t) = Cx(t)+Du(t) = CeA(t−t0)_x0₊ Z t

t₀

CeA(t−τ)B(τ )u(τ ) dτ +Du(t)

5

Matriz de transici´on: Forma de Jordan

Si A _{∈ R}n×n, existe T _∈ Cn×n t.q. T−1AT = J, con J =     J1 . ._. Jr     , Jj =         λ_j 1 0 · · · 0 0 λ_j 1 · · · 0 . . . . . . . .. . .. . . . 0 0 · · · λ_j 1 0 0 · · · 0 λj         ∈ Cnj ×nj,

Esta es la forma de Jordan de A y λ1, . . . , λr ∈ C son los valores

propios (v.p.) distintos (λi 6= λj) de A. Se cumple que:

eJt =      eJ1t . ._. eJkt     , eJj t = eλj t               1 t t 2 2! · · · tnj −2 (n_j− 2)! tnj −1 (n_j− 1)! 0 1 t · · · t nj −3 (n_j− 3)! tnj −2 (n_j− 2)! . . . . . . . . . . .. . . . . . . 0 0 0 · · · 1 t 0 0 0 · · · 0 1               . Si λj = aj + ibj ⇒ eλjt = eajteibjt = eajt(cos(bjt) + i sen(bjt)) eA(t−τ) = T eJ(t−τ)T−1

(Matlab: eig) (valores propios)

(Matlab (symbolic toolbox): jordan) (forma de Jordan)

(4)

Oscilador lineal amortiguado

m¨x + c ˙x + kx = 0 (movimiento libre) x(0) = x0, ˙x(0) = v0 Con el cambio ω0 = r k m ζ = c 2√km

(frecuencia natural) (raz´on de amortiguamiento) ¨ x + 2ζω0 ˙x + ω₀2x = 0 Ecuaciones de estado (x1 = x, x2 = ˙x): ˙x1 ˙x2 = 0 1 −ω02 −2ζω0 x1 x2 , x1(0) x2(0) = x0 v0 7

Oscilador lineal amortiguado

Polinomio caracter´ıstico: λ2 + 2ζω0λ + ω20 = λ + ζω0 ± ω0 p ζ2 _{− 1} Soluci´on general: x(t) = T eJtT−1 x0 v0 Movimiento subamortiguado: 0 < ζ < 1. eJt = e(−ζω0+ωdi)t ₀ 0 e(−ζω0−ωdi)t ωd = ω0 p

ζ2 _{− 1 (frecuencia natural amortiguada)} e(−ζω0±ωdi)t _{= e}−ζω0t_(cos(ω dt) ± i sen(ωdt)) x(t) = e−ζω0t_{(A cos(ω} dt) + B sen(ωdt)) Movimiento sobreamortiguado: ζ > 1. eJt = " e(−ζ+√ζ2−1)ω0t ₀ 0 e(−ζ−√ζ2−1)ω0t # x(t) = Ae(−ζ+√ζ2−1)ω0t _{+ Be}(−ζ−√ζ2−1)ω0t 8

(5)

Oscilador lineal amortiguado

Movimiento cr´ıticamente amortiguado: ζ = 1. J = −ω0 1 0 _−ω0 , eJt = e−ω0t 1 t 0 1 Soluci´on general: x(t) = T eJtT−1 x0 v0 x(t) = e−ω0t_[(v 0 + ω0x0)t + x0]

Observaci´on: Las tres figuras tienen una caractr´ıstica com´un:

despu´es de un tiempo en el que el sistema evoluciona con cambios significativos, tiende al estado estacionario. Es una propiedad

general de los sistemas lineales. 9

Respuesta de estado estacionario

˙x(t) = Ax(t) + Bu(t), t _{∈ R A ∈ R}n×n, B _{∈ R}n×1 y(t) = Cx(t) + Du(t) C _{∈ R}1×n, D _{∈ R}1×1 Hip´otesis: Una entrada (m = 1), la funci´on salto unidad

γ(t) :=

0, t < 0

1, t _{≥ 0} Condici´on inicial: x(0) = 0 Respuesta del sistema (A invertible):

y(t) =

Z t 0

CeA(t−τ)B(τ )u(τ ) dτ + Du(t) = C Z t 0 eA(t−τ)D dτ + D = = C Z t 0

eAσD dσ = C(A−1 eAσB)σ=t_σ=0 + D = = CA−1eAtB _−CA−1B + D

respuesta transitoria respuesta de estado estacionario Si parte real de λi(A) < 0, CA−1eAtB → 0

(6)

Una caracterizaci´on algebraica de la controlabilidad

Recordemos: x(t) = Φ(t, t0)x0 + Z t

t0

Φ(t, s)B(s)u(s) ds es la ´unica soluci´on del P.C.I.:

˙x(t) = A(t)x(t) + B(t)u(t) x(t0) = x0 Observaciones importante: R(tf, t0) = Z tf t0 Φ(tf, s)B(s)u(s) ds : u(·) ∈ U es un espacio vectorial, (_{U = C(R, R}m)). Espacio de estados alcanzables desde (t0, 0) en tiempo tf − t0.

(tf, x1) alcanzable desde (t0, x0) sii x1 − Φ(tf, t0)x0 ∈ R(t0, tf). ¿ Se puede caracterizar _R(t0, tf) algebraicamente?

Matriz Grammiana de controlabilidad: W (tf, t0) =

Z tf

t0

Φ(tf, t)B(t)B(t)TΦ(tf, t)T dt

R(tf, t0) = Im(W (tf, t0)) ₁₁

Controlabilidad y matriz Grammiana

(Σ) es controlable en [t0, tf] si y s´olo si R(tf, t0) = Rn

(Σ) es controlable en [t0, tf] si y s´olo si W (t0, tf) es invertible.

w(t) = B(t)TΦ(tf, t)TW (tf, t0)−1(x1 − Φ(tf, t0)x0) lleva el estado x0 en t = t0 al estado x1 en t = tf, y Z t_f t0 kw(t)k2 dt ≤ Z t_f t0

ku(t)k2 dt entre todos los controles

u(_{·) ∈ C([t}0, tf],Rm) para los que ψ(tf; t0, x0, u(·)) = x1. Interpretaci´on: w(t) es el control que minimiza la energ´ıa o el consumo.

(7)

Controlabilidad de sistemas invariantes en el tiempo

(Σ)

˙x(t) = Ax(t) + Bu(t) t _{∈ T} y(t) = Cx(t) + Du(t)

Matriz fundamental de soluciones (transmisi´on de estados): Φ(t, t0) = eA(t−t0)

Propiedad importante basada en el Teorema de

Hamilton-Cayley: eAt = α0(t)I + α1(t)A +· · · + αn₋₁(t)An−1 Teorema Fundamental: rang W (t0, tf) = rang B AB _{· · · A}n−1B Ker W (t0, tf) = Ker B AB _{· · · A}n−1BT C(A, B) = B AB _{· · · A}n−1B _{∈ R}n×nm Matriz de controlabilidad de (Σ)

(Σ) controlable si y s´olo si rang_{C(A, B) = n}

13

Sistema carro-p´endulo linealizado

˙x(t) = Ax(t) + Bu(t) y(t) = Cx(t) A =         0 1 0 0 0 ₋c(J + m` 2₎ M0 m2`2g M0 − M `cP M0 0 0 0 1 0 ₋m`c M0 (M + m)mg` M0 − (M + m)cP M0         B =        0 βJ + m` 2 M0 0 βm` M0        , C = 1 0 0 0 0 0 1 0 (M0 = (M + m)J + m`2M ) 14

(8)

C´odigo Matlab para calcular la matriz de controlabilidad

syms c J m l cp M g b M0

A=[0 1 0 0; 0 -c*(J+m*l^2)/M0 m^2*l^2*g/M0 -M*l*cp/M0;... 0 0 0 1;0 -m*l*c/M0 (M+m)*m*g*l/M0 -(M+m)*cp/M0]

B=[0;b*(J+m*l^2)/M0;0;b*m*l/M0] C=simplify([B A*B A^2*B A^3*B]) de=simplify(det(C)) m=0.1;M=1;g=9.68;J=1/2; l=1; cp=0.1;c=0.2; M0=(M+m)*J+m*l^2*M; Cs=subs(C) des=det(Cs) 15

Sat´elite en ´orbita geoestacionaria

˙x(t) =      0 1 0 0 3Ω2 0 0 2R0Ω 0 0 0 1 0 ₋2Ω R0 0 0     x(t) +      0 0 1 0 0 0 0 1 R0     u(t) y(t) = 0 0 1 0x(t)

C´odigo Matlab para calcular la matriz la matriz de controlabilidad y un control de norma m´ınima

echo on syms w R0 t

A=[0 1 0 0; 3*w^2 0 0 2*w*R0; 0 0 0 1; 0 -2*w/R0 0 0] B=[0 0;1 0; 0 0; 0 1/R0]

C=[B A*B A^2*B A^3*B] rangomc=rank(C)

%Control con motor radial estropeado (u_1=0) B1=B(:,2)

Ct=[B1 A*B1 A^2*B1 A^3*B1]

(9)

Continuaci´on c´odigo Matlab

%Control con motor tangencial estropeado (u_2=0) B2=B(:,1)

Cr=[B2 A*B2 A^2*B2 A^3*B2] r1=rank(Cr)

%calculo del control para partiendo del reposos en $t=0$ se llegue al %estado [0;0;1;0] en 1 segunto (tf=1)

% Radio de la ´orbita estacionaria y velocidad angular R0=42164

w=7.27*10^(-5)

A=subs(A); vpa(A,4) B=subs(B); vpa(B,4) [T J]=jordan(A)

%necesitamos forma de Jordan real’)

T1=real(T), T2=imag(T), J1=real(J), J2=imag(J) T=[T1(:,1) T1(:,2) T1(:,3) T2(:,3)]

JR=blkdiag(J1(1:2,1:2), [0 J2(3,3); -J2(3,3) 0]) %comprobamos que est´a bien calculado

A-T*JR*T^(-1)

17

Continuaci´on c´odigo Matlab

%A por la grammiana %matriz de transicion E=simplify(T*expm(JR*(1-t))*T^(-1)); vpa(E,4) %integrando W0=simplify(E*B*B’*E’);vpa(W0,4) %matriz grammiana W=int(W0,0,1); vpa(W,4) %Control u=B’*E’*W^(-1)*[0;0;1;0]; vpa(u,4) 18

(10)

Descomposici´on de Kalman y el test PBH

Teorema (Descomposici´on de Kalman)

Si (A, B) no es controlable y rang_{C(A, B) = r < n, existe} T _{∈ Gl}n(R) tal que T−1AT = A1 A2 0 A3 T B = B1 0 donde A1 ∈ Rr×r, B1 ∈ Rr×m y (A1, B1) es controlable.

Teorema

(A, B) es controlable si y s´olo si se cumple cualquiera de las dos siguientes condiciones equivalentes:

(i) rangλIn − A B = n para todo λ ∈ C

(ii) rangλIn − A B = n para cada valor propio de A.

(i) y (ii) =Test PBH 1 de rango. 1_{Popov-Belevitch-Hautus}

19

Sistemas diferenciales no lineales (i. t.)

(Σ) ˙x(t) = f (x, u), t _{∈ T}

x _{∈ X ⊂ R}n (estados) y u _{∈ U ⊂ R}m (controles), _{O = X × U} abierto, f _{∈ C}∞(_{O, R}n).

Definici´on (Controlabilidad global)

(Σ) es (globalmente) controlable en [t0, tf] ⊂ T si para cada

(x0, x1) _{∈ X × X existe u(·) ∈ U = C([t}0, tf], U ) tal que la

soluci´on del P.C.I.

˙x = f (x, u(t)), t _{∈ [t}0, t1]

x(t0) = x0

cumple x(tf) = x1.

Referencias

J. M. Coron: Control and Nonlinearity. AMS (2007) Mathematical Surveys and Monographs, vol 136.

E. D. Sontag: Mathematical Control Teory. Springer-Verlag

(11)

Controlabilidad local de sistemas no lineales

Definici´on (Controlabilidad local)

Sea (xe, ue) un punto de equilibrio de (Σ). Este sistema se dice

localmente controlable instantaneamente en (xe, ue) si para

cada n´umero real ε > 0 existe un n´umero real δ > 0 tal que para cada par de puntos x0, x1 _{∈ B}δ(xe) := {x ∈ Rn : kx − xek < δ}

existe u(_{·) ∈ C([0, ε], R) tal que ku(t) − u}ek < ε para todo

t _{∈ [0, ε] y la soluci´on del P.C.I.}

˙x = f (x, u(t)), x(0) = x0

cumple x(ε) = x1.

Una condici´on suficiente

Sea (xe, ue) un punto de equilibrio de ˙x = f (x, u). Si su sistema

de control linealizado en (xe, ue) es controlable entonces el sistema

˙x = f (x, u) es localmente controlable instantaneamente en (xe, ue).

21

Observabilidad de los sistemas lineales

Observabilidad= capacidad de determinar el estado del sistema a partir de las salidas (conocido el control).

(Σ)

˙x(t) = A(t)x(t) + Bu(t), t _{∈ T} y(t) = C(t)x(t) + D(t)u(t)

Definici´on de observabilidad

(Σ) es observable en [t0, tf] si cualquier estado inicial x(t0) = x0

est´a determinado de manera ´unica por la salida y(t) en [t0, tf].

y(t) = C(t)Φ(t, t0)x(t0) + Z t t0 C(t)Φ(t, τ )B(τ )u(τ ) dt + Du(t) | {z } yr(t)= respuesta forzada

La respuesta forzada no juega ning´un papel en la determinaci´on de x0 = x(t0) a partir del conocimiento de y(·) en [t0, tf].

(12)

Un criterio de observabilidad

Si C(t)Φ(t, t0)x1 = C(t)Φ(t, t0)x2 en [t0, tf] el sistema no es

observable (hay dos estados iniciales distintos que producen la misma salida).

La aplicaci´on L : Rn _{→ C ([t}0, tf],Rp)

x _{→ C(t)Φ(t, t}0)x

es lineal y el sistema es no observable si y s´olo si Ker L _{6= {0}.}

Ker L = Ker M (tf, t0) donde M (tf, t0) es la matriz

grammiana de observabilidad: M (tf, t0) =

Z tf

t0

Φ(t, t0)TC(t)TC(t)Φ(t, t0) dt

(Σ) es observable en [t0, tf] si y s´olo si det M (tf, t0) 6= 0.

El estado inicial determinado por la salida es: x(t0) = M (tf, t0)−1

Z t_f t0

Φ(t, t0)TC(t)Ty(t) dt

23

Observabilidad de sistemas invariantes en el tiempo

(Σ)

˙x(t) = Ax(t) + Bu(t) t _{∈ T} y(t) = Cx(t) + Du(t)

Matriz fundamental de soluciones: Φ(t, t0) = eA(t−t0)

Teorema Fundamental: Si MT = CT ATCT _{· · · (A}T)n−1CT      C CA .. . CAn−1      entonces Im M (tf, t0) = Im MT = Im CT ATCT _{· · · (A}T)n−1CTT y Ker M (tf, t0) = Ker MT = Ker

CT ATCT _{· · · (A}T)n−1CT O(A, C) =      C CA .. . CAn−1      ∈ R pn_×n _{Matriz de observabilidad de (Σ)}

(13)

Sat´elite en ´orbita geoestacionaria

˙x(t) =      0 1 0 0 3Ω2 0 0 2R0Ω 0 0 0 1 0 ₋2Ω R0 0 0     x(t) +      0 0 1 0 0 0 0 1 R0     u(t) y(t) = 0 0 1 0x(t) O(A, C) =        0 0 1 0 0 0 0 1 0 ₋2Ω R0 0 0 −6Ω 3 R0 0 0 _−4Ω2       

Si y(t) = 1 0 0 0x(t) el sistema no ser´ıa observable.