Teoría de Estabilidad y Control Isaac A. García

(1)

(2)

(3)

Teoría de estabilidad y control

Isaac A. García

Seminari de Sistemes Dinàmics

Departament de Matemàtica

(4)

ISBN: 978-84-8409-422-7

Maquetación:

Servei de Publicacions (UdL) Diseño cubierta:

cat & cas Impresión: Cargraphics

La reproducción total o parcial de esta obra por cualquier procedimiento, incluidos la grafía y el tratamiento informático, y la distribución de ejemplares mediante alquiler o présta-mo público, queda rigurosamente prohibida sin la autorización de los titulares del copyright, y será sometida a las sanciones establecidas por la ley.

EINES es una col·lección del Institut de Ciències de l’Educació de la Universitat de Lleida.

(5)

(6)

(7)

Indice general

1. Introducci´on y Ejemplos 1

1.1. Breve historia de control autom´atico . . . 1

1.2. Algunos ejemplos f´ısicos . . . 3

1.2.1. Part´ıcula en movimiento unidimensional . . . 3

1.2.2. Termostato y transferencia de calor . . . 3

2. Control Cl´asico y Transformada de Laplace 5 2.1. El problema cl´asico de control . . . 5

2.2. Transformada de Laplace y funci´on de transferencia . . . 5

3. Soluci´on de Sistemas Lineales 7 3.1. Soluci´on espectral de sistemas lineales . . . 7

3.1.1. La matriz exponencial . . . 8

3.1.2. El teorema de Cayley-Hamilton y la matriz exponencial . 11 3.2. Soluci´on de sistemas controlados . . . 12

3.2.1. Existencia y unicidad de la soluci´on . . . 13

3.3. Relaci´on entre espacio de estados y el control cl´asico . . . 13

3.4. Problemas resueltos . . . 16

4. Sistemas de Control Lineal 23 4.1. Introducción . . . 23 4.2. Controlabilidad . . . 23 4.3. Equivalencia Algebraica . . . 31 4.4. Problemas resueltos . . . 32 5. Observabilidad 37 5.1. Observabilidad . . . 37 5.2. Problemas resueltos . . . 40 6. Realimentación Lineal 43 6.1. Definición y preliminares . . . 43

6.1.1. Realimentaci´on y funci´on de transferencia . . . 46

6.2. Realimentaci´on frente a control precalculado . . . 46

6.2.1. Sensibilidad a las condiciones iniciales . . . 48

Pr´ologo IX

(8)

6.2.2. Sensibilidad a perturbaciones externas . . . 48

7. Estabilidad 53 7.1. Introducci´on y deﬁniciones . . . 53

7.2. Estabilidad en sistemas lineales . . . 54

7.3. Teor´ıa de Liapunov de la estabilidad . . . 56

7.3.1. Aplicaci´on a sistemas lineales . . . 58

7.3.2. Estabilidad mediante linearizaci´on . . . 59

7.4. Estabilidad y control . . . 61

7.4.1. Estabilidad entrada–salida . . . 61

7.4.2. Estabilizaci´on por realimentaci´on lineal . . . 63

7.4.3. Linealizaci´on de sistemas de control no lineales . . . 63

8. C´alculo de Variaciones 75 8.1. Un ejemplo: braquistocrona . . . 75

8.2. Introducci´on . . . 77

8.3. Ecuaciones de Euler–Lagrange . . . 77

8.3.1. Lema fundamental del c´alculo de variaciones . . . 77

8.3.2. Ecuaciones de Euler–Lagrange . . . 78

8.3.3. Integrales primeras en casos simples . . . 80

8.4. Extremos con restricciones . . . 81

8.5. Ap´endice: Multiplicadores de Lagrange . . . 82

8.5.1. Problemas isoperim´etricos . . . 82

9. Control ´Optimo 95 9.1. Introducci´on . . . 95

9.2. Control ´optimo: m´etodo hamiltoniano . . . 97

9.3. El regulador lineal . . . 99

9.4. Teor´ıa de Pontryagin . . . 101

10.Pr´acticas 115 10.1. Control de la temperatura de una c´amara . . . 115

10.1.1. Realizaci´on de la pr´actica . . . 116

10.2. Dinámica de satélites de comunicación . . . 117

10.2.1. Un modelo matemático para la dinámica de satélites . . . 117

10.3. El p´endulo doble invertido . . . 119

10.4. Estabilidad en el p´endulo c´onico . . . 121

10.5. Un modelo de gr´ua con servomecanismo y regulador . . . 123

10.6. El regulador centr´ıfugo de Watt . . . 125

(9)

Pr´

ologo

El presente libro de teor´ıa y problemas corresponde a los temas básicos de un primer curso de introducción al la teor´ıa de control y estabilidad en variables de ca Industrial aunque el libro es igualmente recomendable para estudiantes de otras titulaciones técnicas.

El objetivo principal es que el alumno disponga de un material preliminar para el curso, con los resultados principales y algunas demostraciones de estos. Además es interesante que el alumno pueda seguir paso a paso la resolución de numerosos problemas de los temas mencionados como ejemplificación de los conceptos y resultados teóricos, complementando as´ı los realizados en clase. Se ha procurado presentar las soluciones en la forma más práctica y directa.

Me gustar´ıa que este libro facilitase el aprendizaje de la asignatura y, agrade-cer´ıa cualquier sugerencia o comentario que pueda mejorarlo dirigiéndose a la siguiente dirección electrónica: [email protected].

Dr. Isaac A. Garc´ıa, Septiembre de 2004

(10)

(11)

ecni-Introducci´

on y Ejemplos

1.1. Breve historia de control autom´

atico

En este cap´ıtulo introductorio revisaremos, en primer lugar, una breve in-troducci´on hist´orica de la teor´ıa del control autom´atico.

El llamado control por retroalimentación es un mecanismo b´asico a través del cual sistemas de naturaleza muy diferente (mecánicos, eléctricos, biol´ ogi-cos, etc...) mantienen su equilibrio. Por ejemplo, un cambio en la temperatura corporal de 1 grado es, en general, una se¯nal de algún tipo de enfermedad. De hecho, de la teor´ıa de la evolución de las especies de Darwin se desprende que la retroalimentación sobre largos periodos temporales es responsable de tal evolución.

Se puede definir el control por retroalimentación como el uso de diferentes se¯nales, determinadas a partir de la comparación del estado actual del sistema y del estado deseado, para controlar el sistema. Un ejemplo cotidiano de sistema controlado por retroalimentación es el control de la velocidad de un coche me-diante el uso de la diferencia entre la velocidad actual y la deseada para variar el flujo de gasolina. El hecho de que la salida del sistema sea usada para regular la entrada del sistema da lugar a lo que se llama sistema de control en lazo cerrado. El control por retroalimentación es una disciplina de la ingenier´ıa y, co-mo tal, está estrechamente relacionada con diversos problemas aplicados que la humanidad ha querido resolver a lo largo de su historia. Más concretamente, existió una época muy importante para el desarrollo de la teor´ıa de control que se comprende entre la Revolución Industrial y la primera y segunda Guerra Mundial. El control necesitó adquirir el lenguaje de las matemáticas para poder expresarse correctamente. De este modo J.C. Maxwell introdujo el análisis ri-guroso de la teor´ıa de control en 1868. Existen diversos periodos remarcables: ´

epoca primitiva desde 1868–1900; época clásica desde 1900–1960; época moderna desde 1960 hasta la actualidad.

(12)

La Revolución Industrial en Europa introdujo nuevas máquinas que no se pod´ıan regular con la mano. De este modo se iniciaron los primeros dispositivos de control automático. Algunos de ellos son los reguladores de temperatura, de presión, de velocidad, etc...

En 1840, el astrónomo G.B. Airy desarrolló un sistema de retroalimentación para colocar su telescopio mediante un control de la velocidad con el fin de compensar la rotación terrestre. Airy descubrió que un dise¯no poco adecuado del sistema de lazo cerrado de retroalimentación produc´ıa oscilaciones indeseables en el sistema. De este modo introdujo el concepto de inestabilidad y la herramienta de las ecuaciones diferenciales en su análisis.

J.C. Maxwell (1868) fue el primero en linearizar las ecuaciones diferenciales del movimiento para hallar la ecuaci´on caracter´ıstica del sistema y analizar los efectos de los par´ametros del sistema en su estabilidad.

En 1877, E.J. Routh muestra una técnica numérica para determinar cuando una ecuación caracter´ıstica tiene ra´ıces estables. Ese mismo a¯no, I.I. Vishnegrad-sky analizó la estabilidad de los reguladores usando ecuaciones diferenciales.

En 1892, A.M. Liapunov introdujo un trabajo b´asico en teor´ıa de control, estudiando la estabilidad de sistemas no lineales usando una generalizaci´on del concepto de energ´ıa.

Entre los a¯nos 1892–1898, O. Heaviside inventó el cálculo operacional e in-trodujo la llamada actualmente función de transferencia.

La teor´ıa de control clásica usa básicamente técnicas de dominio frecuen-cial en el plano complejo. Se basa en metodos de transformadas y es aplicable principalmente a sistemas lineales autónomos. Los métodos de Nyquist y Bode analizan la magnitud y la fase de la respuesta en frecuencia del sistema. Tiene la gran ventaja de que la respuesta en frecuencia del sistema puede ser medida experimentalmente y se puede pues calcular la función de transferencia. No se necesita bajo este punto de vista una descripción interna exacta del sistema en el dominio temporal, es decir, sólo es importante el comportamiento entrada– salida del sistema.

Sin embargo esta teor´ıa de control clásica es dif´ıcil de aplicar a sistemas con varias entradas y múltiples salidas. La teor´ıa de control moderna es fundamen-talmente una teor´ıa de dise¯no en el dominio temporal (a diferencial de la clásica que es en el dominio frecuencial). Se requiere un modelo en el espacio de estados del sistema que se desea controlar. Esta visión moderna es la que se dará en este libro.

(13)

1.2. Algunos ejemplos f´ısicos

1.2.1. Part´ıcula en movimiento unidimensional

Consideremos una part´ıcula que se mueve en una recta y sea s(t) su distancia al origen en función del tiempo. Supongamos que sobre la part´ıcula actúa una fuerza por unidad de masa u₁(t) que le produce una aceleraci´on pero también act´ua una fuerza de rozamiento u₂(t) por unidad de masa. Si las ´unicas canti-dades cinemáticas de interés son la posici´on de la part´ıcula x₁(t) = s(t) y su velocidad x₂(t) = ˙s(t), aplicando las leyes de la mec´anica clásica, el estado de la part´ıcula (x₁(t), x₂(t)) verifica el sistema de ecuaciaciones diferenciales

˙

x₁= x₂ , x˙₂= u₁(t)− u₂(t) .

Por supuesto, este sistema se puede escribir en notación matricial de la forma ˙ x = Ax + Bu , (1.1) siendo x = x₁ x₂ , u = u₁ u₂ , A = 0 1 0 0 , B = 0 0 1 −1 . Se puede preguntar cómo puede llegar la part´ıcula a un cierto punto fijo en el menor tiempo posible o bien con un consumo m´ınimo de una cierta variable. Matem´aticamente se trata de determinar las variables de control u₁(t) y u₂(t) con un cierto objetivo.

1.2.2. Termostato y transferencia de calor

La temperatura interior Tide un horno se quiere controlar variando la

entra-da de calor u en las paredes. Deﬁnamos las capacientra-dades calor´ıﬁcas de la pared y del interior del horno como cp y ci respectivamente. Denotemos por Ai y Ae

las ´areas interiores y exteriores de la pared del horno y por Ri y Re los

coefi-cientes de radiación de las superficies interior y exterior del horno. Ignorando otros efectos, si las temperaturas de la pared y del exterior del horno son Tp y

Te, se tiene, tomando Ti> Tp> Te, para la pared

cpT˙p=−AeRe(Tp− Te)− AiRi(Tp− Ti) + u ,

y para el interior del horno

ciT˙i= AiRi(Tp− Ti) .

Suponiendo Te constante, si deﬁnimos las variables de estado x1 = Tp− Te y

x₂= Ti− Tese tiene ˙ x₁ = T˙p− ˙Te= ˙Tp=−1 cpAeRex1− 1 cpAiRi(x1− x2) + u cp , ˙ x₂ = T˙i− ˙Te= ˙Ti= 1 ciAiRi(x1− x2) .

(14)

Estas ecuaciones se pueden escribir de la forma ˙x = Ax + bu, siendo x = (x₁, x₂)T, A = −(AeRe+ AiRi)/cp (AiRi)/cp (AiRi)/ci −(AiRi)/ci , b = 1/cp 0 .

El objetivo puede ser analizar un controlador que regule, mediante una v´ alvu-la por ejemplo, alvu-la cantidad de calor u(t) que se debe suministrar dependiendo de la temperatura que marquen los term´ometros.

(15)

Control Cl´

asico y

Transformada de Laplace

2.1. El problema cl´

asico de control

La teor´ıa de control cl´asica estudia sistemas con una entrada escalar u(t)∈ R y una salida escalar z(t)∈ R. Si se requiere que z(t) est´e lo m´as cerca posible (en un cierto sentido) de una cierta se¯nal de referencia r(t), el sistema de control se llama servomecanismo. Un caso particular es cuando r es constante, entonces el sistema de control se llama regulador.

El modelo de la teor´ıa de control clásica es una ecuación diferencial lineal de orden n a coeficientes constantes, es decir, z(t) verifica la ecuaci´on

z(n)+ k₁z(n−1)+· · · + k_n−1z+ knz = β0u(m)+ β1u(m−1)+· · · + βmu , (2.1)

donde los supra´ındices indican derivadas respecto de la variable independiente t y ki y βi son constantes.

2.2. Transformada de Laplace y funci´

on de

trans-ferencia

Definici´on 1. Sea z :R+→ R una función real y continua a trozos. Se define la transformada de Laplace ¯z(s) de z(t) de la forma

¯

z(s) =L{z(t)} = _∞

0

z(t) exp(−st) dt . (2.2) Algunas de las propiedades de esta transformaci´on son las siguientes:

Linealidad:L{n_i=1cizi(t)} =n_i=1ciL{zi(t)} para todo ci∈ R.

(16)

Derivaci´on:

L{z(j)_(t)_{} = s}j_¯_z_{− s}j−1_z(0)_{− s}j−2_z(1)₍₀₎_{− · · · − sz}(j−2)₍₀₎_{− z}(j−1)_{(0) .}

(2.3) Tomando transformadas de Laplace en ambos miembros de la ecuaci´on (2.1) y teniendo en cuenta la propiedad (2.3) se tiene k(s)¯z(s) = β(s)¯u(s), siendo los polinomios

k(s) = sn+ k₁sn−1+· · · + k_n−1s + kn , (2.4)

β(s) = β₀sm+ β₁sm−1+· · · + β_m−1s + βm. (2.5)

Es habitual presentarlo de la forma ¯

z(s) = g(s)¯u(s) , (2.6)

siendo

g(s) = β(s)

k(s) , (2.7)

una funci´on racional conocida como funci´on de transferencia.

Es preciso resaltar que este método sólo es aplicable a sistemas lineales con coeficientes constantes. Nosotros seguiremos ideas diferentes para atacar los problemas básicos del control.

(17)

Soluci´

on de Sistemas

Lineales

3.1. Soluci´

on espectral de sistemas lineales

Consideraremos sistemas lineales sin variables de control, es decir, sistemas del tipo

˙

x = Ax , (3.1)

con A∈ Mn(R) una matriz cuadrada de orden n y x ∈ Rn. Tomaremos un

pro-blema de valor inicial o de Cauchy, de este modo impondremos que x(0) = x₀. Supondremos que todos los valores propios λicon i = 1, . . . , n, de la matriz A

son distintos1. Sean wi, con i = 1, . . . , n los vectores propios de A asociados a los

valores propios λi, es decir, Awi = λiwi. Puesto que λi= λj con i= j, se sabe

que el conjunto de vectores propios{w₁, . . . , wn} son linealmente independientes

y en particular forman base deRn. En consecuencia se puede expresar la soluci´on de (3.1) de la forma x(t) = n i=1 ci(t)wi ,

siendo ci(t) funciones escalares del tiempo. Derivando respecto de t la ecuaci´on

anterior y sustituyendo en (3.1) se obtiene

n i=1 ˙ci(t)wi= A n i=1 ci(t)wi = n i=1 λici(t)wi .

1_{Esta no es una restricci´}_{on fuerte en los sistemas que aparecen en las aplicaciones reales} puesto que una peque¯na perturbación en los coeficientesaijde la matrizA es suficiente para separar las ra´ıces iguales del polinomio caracter´ıstico deA. Recordemos que, habitualmente dichos coeficientes provienen de medidas experimentales y son, por lo tanto, conocidos hasta un cierto grado de precisión.

(18)

Puesto que el conjunto de vectores propios {w₁, . . . , wn} son linealmente

inde-pendientes, se obtiene

˙ci= λici , i = 1, . . . , n ,

cuya soluci´on es

ci(t) = exp(λit) ci(0) , i = 1, . . . , n .

Se tiene, en deﬁnitiva, que

x(t) =

n

i=1

ci(0) exp(λit)wi . (3.2)

Sin embargo, interesa dar la soluci´on x(t) en funci´on de x(0). Para ello, deﬁ-namos la matriz

W = [w₁, . . . , wn]∈ Mn(R)

cuyas columnas son los vectores wi. Sea W−1 la matriz inversa de W , que

siempre existe puesto que rangW = n, y definamos sus filas como los vectores fila vi con i = 1, . . . , n, es decir,

W−1= ⎡ ⎢ ⎣ v₁ .. . vn ⎤ ⎥ ⎦ ∈ Mn(R) .

Puesto que W−1W = In, siendo Inla matriz identidad de orden n, se veriﬁca

viwi = 1 y viwj = 0 si i= j. Multiplicando la ecuaci´on (3.2) por la izquierda

por el vector vj y tomando ﬁnalmente t = 0 se obtiene vjx(0) = cj(0). De este

modo, la soluci´on de (3.1) viene dada por

x(t) =

n

i=1

(vix(0)) exp(λit)wi . (3.3)

Esta expresi´on se conoce como la forma espectral de la soluci´on de (3.1).

3.1.1. La matriz exponencial

Veamos en esta secci´on una forma alternativa para obtener la soluci´on de (3.1). Esta nueva forma evita el c´alculo de los vectores propios wi de la matriz

A necesarios en la forma espectral (3.3) de la soluci´on de (3.1).

La idea se basa en generalizar el caso escalar n = 1, con lo cual A es un escalar en (3.1) y su soluci´on viene dada por

x(t) = exp(At)x₀ . (3.4)

Para conseguir dicha generalizaci´on, deﬁnamos la matriz exponencial

exp(At) = ∞ k=0 tk k!A k _{= I} n+ tA + t 2 2!A 2₊_{· · · .} _(3.5)

(19)

Esta serie inﬁnita de matrices es convergente2 para cualquier A ∈ Mn(R) y

para todo t∈ R debido al hecho de que exp(zt) converje para cualquier pareja de escalares finitos z y t. Es claro que, a partir de su definici´on (3.5), se tiene exp(O) = In siendo O la matriz nula de orden n. Adem´as, derivando término a

t´ermino (3.5) respecto de t se veriﬁca d dtexp(At) = A + tA 2₊ 1 2!t 2_A3₊_{· · · = A}_I n+ tA + 1 2!t 2_A2₊_{· · ·} = A exp(At) , con lo cual d dtexp(At) = A exp(At) ,

de modo que podemos concluir que (3.4) representa la soluci´on de (3.1). La soluci´on del problema de Cauchy

˙

x = Ax , x(t₀) = x₀, (3.6)

se encuentra, en la literatura de control, de la forma

x(t) = Φ(t, t₀)x₀ , (3.7)

donde

Φ(t, t₀) = exp[A(t− t₀)] , (3.8)

es una matriz cuadrada de orden n llamada matriz de transición de estados. Es fácil demostrar que dicha matriz verifica las siguientes propiedades:

d

dtΦ(t, t0) = AΦ(t, t0) , (3.9)

Φ(t, t) = In , (3.10)

Φ(t₀, t) = Φ−1(t, t₀), (3.11)

Φ(t, t₀) = Φ(t, t₁)Φ(t₁, t₀). (3.12) Observar que, en particular, la propiedad (3.11) implica

(exp(At))−1 = exp(−At) . (3.13)

Resumimos a continuaci´on algunas de las propiedades m´as importantes de la matriz exponencial.

A y exp(A) conmutan, es decir, A exp(A) = exp(A)A.

2_{Una sucesi´}_{on de matrices}_{A_k_{} converge hacia A si l´ım}_k→∞_A_k_{− A = 0 para cualquier} norma matricial. La serie matricial ∞_k=0_A_kconverge si la sucesión de sumas parciales_{S_n_} conSn= n_k=0A_kconverge cuandon → ∞. Si la función escalar f(z) se puede representar por una serie de potenciasf(z) = ∞_k=0c_kxk convergente para|z| < R entonces la función matricialf(A) = ∞_k=0c_kAk converge si todos los valores propiosλ_ide la matriz cuadrada A verifican |λi| < R.

(20)

exp(On) = In, siendo On e In las matrices nulas e identidad de orden n.

Si A y B conmutan, es decir, AB = BA entonces exp(AB) = exp(A) exp(B). (exp(A))−1= exp(−A).

(exp(A))T = exp(AT). d exp(tA)/dt = A exp(tA).

Sea P una matriz no singular tal que B = P−1AP . Entonces exp(B) = P−1exp(A)P .

Si D = diag{λ₁, . . . , λn} es una matriz diagonal con elementos λi en la

diagonal principal, entonces exp(D) = diag{exp(λ₁), . . . , exp(λn)} es una

matriz diagonal con elementos exp(λi) en la diagonal principal.

Las dos ´ultimas propiedades permiten calcular de forma eﬁcaz la exponencial de una matriz A diagonalizable. En efecto, si A es diagonalizable existe una matriz de cambio de base P no singular tal que D = P−1AP , siendo D una matriz diagonal con los valores propios de A en la diagonal principal.

M´etodos para calcular la matriz exponencial

(i) Si todos los valores propios λi de A son distintos, la f´ormula de Sylvester

viene dada por

exp(At) = n k=1 Zkexp(λkt) , (3.14) siendo Zk = n j=1 j=k A− λjIn λk− λj , (3.15)

matrices constantes que s´olo dependen de A y de sus valores propios λj, pero no

de sus vectores propios wi. Notar la semejanza entre la f´ormula de Sylvester y la

fórmula de interpolación polinomial de Lagrange utilizada en métodos num´ eri-cos.

(ii) Otro m´etodo alternativo para calcular la matriz exponencial de A cuando todos sus valores propios λi son diferentes es el siguiente.

exp(At) = r(A) , (3.16)

siendo r(λ) un polinomio de grado menor o igual que n− 1 cuyos coeﬁcientes son funciones del tiempo t obtenidos de la forma

r(λi) = exp(λit) , i = 1, . . . , n .

(21)

(iii) El c´alculo de la matriz exponencial es tedioso en muchas ocasiones, de modo que los manipuladores algebraicos son de gran ayuda en dicho c´alculo. Por ejemplo, con el programa Mathematica, el comando MatrixExp[A] calcula la matriz exponencial de la matriz A.

3.1.2. El teorema de Cayley-Hamilton y la matriz

expo-nencial

Sea A∈ Mn(R). En este m´etodo no es necesario suponer ni que los valores

propios de A son distintos ni que A diagonaliza.

En primer lugar, denotamos por k(λ) el polinomio caracter´ıstico de A, y sean λi los valores propios de A con multiplicidad algebraica mi para i = 1, . . . , k,

siendo k≤ n. Por el Teorema de Cayley-Hamilton se sabe que k(A) = 0. Se efect´ua la descomposici´on en fracciones simples

1 k(λ) = k i=1 pi(λ) (λ− λi)mi ,

siendo pi(λ) polinomios de grado menor o igual que mi − 1. Deﬁniendo los

polinomios qi(λ) = k(λ)/(λ− λi)mi, con i = 1, . . . , k, la anterior ecuaci´on se

reescribe de la forma 1 = k i=1 pi(λ)qi(λ) . (3.17)

Evaluando este polinomio en A se tiene la identidad

In= k

i=1

pi(A)qi(A) .

Por otra parte, observemos que

exp(At) = exp(λitIn) exp[(A− λiIn)t] = exp(λit)Inexp[(A− λiIn)t]

= exp(λit) ∞ j=0 tj(A− λiIn)j j! ,

de modo que, multiplicando por la izquierda ambos miembros por qi(A) se

obtiene la siguiente igualdad con suma ﬁnita

qi(A) exp(At) = exp(λit) mi−1

j=0

tjqi(A)(A− λiIn)j

j! , (3.18)

donde se ha teniendo en cuenta el Teorema de Cayley-Hamilton de modo que qi(A)(A− λiIn)j = k(A)(A− λiIn)j−mi = 0. Multiplicando ﬁnalmente la

(22)

ecuaci´on (3.18) por la izquierda por pi(A), sumando para todo i desde 1

has-ta k y teniendo en cuenhas-ta (3.17) se obtiene la siguiente expresi´on de la matriz exponencial exp(At) = k i=1 ⎡

⎣exp(λit)pi(A)qi(A) mi−1 j=0 tj(A− λiIn)j j! ⎤ ⎦ . (3.19)

Nota2. Observar que los grados de los polinomios p_i y q_i son m_i− 1 y n − m_i respectivamente, de modo que, en el caso particular de que todos los valores propios de A sean distintos, es decir, mi = 1, entonces exp(At) = r(A) siendo

r un polinomio de grado menor o igual que n− 1 veriﬁcando adem´as r(λi) =

exp(λit) para i = 1, . . . , n.

3.2. Soluci´

on de sistemas controlados

Consideremos el sistema controlado ˙

x = Ax + Bu , x(0) = x₀, (3.20)

con A ∈ Mn(R), B ∈ Mn×m(R) matrices constantes, x(t) ∈ Rn y u(t) ∈

Rm_{. Multiplicando por la izquierda ambos miembros de (3.20) por la matriz}

exp(−At) se obtiene

exp(−At) ˙x − exp(−At)Ax = exp(−At)Bu .

Utilizando ahora que las matrices exp(−At) y A conmutan y teniendo en cuenta la propiedad (3.9), es decir,

d

dt[exp(−At)] = −A exp(−At) , se llega a que

d

dt[exp(−At)x] = exp(−At)Bu .

Integrando dicha ecuaci´on respecto de t y teniendo en cuenta (3.13) se tiene

x(t) = exp(At) x₀+ t 0 exp(−Aτ)Bu(τ) dτ . (3.21)

Si se utiliza la condici´on inicial x(t₀) = x₀, integrando entre t₀y t se obtiene

x(t) = Φ(t, t₀) x₀+ t t₀ Φ(t₀, τ )Bu(τ ) dτ . (3.22)

(23)

3.2.1. Existencia y unicidad de la soluci´

on

Presentamos a continuaci´on un resultado sobre la existencia y unicidad del problema de Cauchy asociado a una sistema lineal controlado por un control continuo a trozos de gran utilidad en aplicaciones a la ingenier´ıa.

Definici´on 3. El control u(t) : [t₀, t₁]→ Rmes continuo a trozos en el intervalo [t₀, t₁] si existe una partición finita de dicho intervalo t₀= s₀< s₁<· · · < sh=

t₁, tal que la funci´on u(t) es continua en cada subintervalo abierto (s_i−1, si) para

i = 0, 1, . . . , h. Adem´as, para cada i, l´ım_t→s+

i u(t) existe y es ﬁnito si i= h y

l´ım_t→s−

i u(t) existe y es ﬁnito si i= 0.

Definici´on 4. Una soluci´on del problema de Cauchy ˙x = Ax + Bu(t) con x(t₀) = x₀ y u(t) continua a trozos en el intervalo [t₀, t₁] es una función x(t) : [t₀, t₁]→ Rn continua y con derivada continua en [t₀, t₁] excepto en los puntos de discontinuidad de u(t) que además verifique ˙x = Ax + Bu(t) donde exista. Teorema 5. El problema de Cauchy ˙x = Ax + Bu(t) con x(t₀) = x₀y u(t) con-tinua a trozos en el intervalo [t₀, t₁] admite una única solución x(t) : [t₀, t₁]→ Rn _{que viene dada por (3.22).}

3.3. Relaci´

on entre espacio de estados y el

con-trol cl´

asico

Consideremos la ecuaci´on diferencial escalar lineal de orden n a coeﬁcientes constantes que aparece en teor´ıa de control cl´asica

z(n)+ k₁z(n−1)+· · · + knz = u(t) , (3.23)

siendo u(t)∈ R la variable de control. Realizando el cambio de variable w₁= z , w₂= ˙z , . . . , wn= z(n−1) , (3.24)

y teniendo en cuenta que ˙wi= wi+1 para i = 1, . . . , n− 1, la ecuaci´on (3.23) se

puede escribir de la forma can´onica controlable3 ˙ w = Cw + du , (3.25) donde w = (w₁, . . . , wn)T, d = (0, . . . , 0, 1)T and C = ⎛ ⎜ ⎜ ⎜ ⎜ ⎝ 0 1 0 . . . 0 0 0 1 . . . . . . . . . . . . . . . . . . −kn −kn−1 −kn−2 . . . −k1 ⎞ ⎟ ⎟ ⎟ ⎟ ⎠∈ Mn(R) , (3.26)

3_{En el cap´ıtulo siguiente (ver Teorema 14) se entender´}_{a mejor el nombre “can´}_onica con-trolable”.

(24)

es la llamada matriz “companion”. Observar que el polinomio caracter´ıstico k(λ) de C es

k(λ) = det(λIn− C) = λn+ k1λn−1+· · · + kn .

Notar que este polinomio caracter´ıstico es justo el denominador de la funci´on de transferencia que se obtiene si se aplican transformadas de Laplace a la ecuaci´on (3.23).

Hemos visto que la ecuaci´on escalar (3.23) se puede escribir en forma matri-cial con las variables de estado. Es natural preguntarse si el inverso es siempre posible, es decir, nos preguntamos si cualquier sistema lineal ˙x = Ax + bu(t) con u escalar se puede escribir en la forma cl´asica (3.23) mediante un cambio de variables lineal. La respuesta la contiene el siguiente resultado.

Teorema 6. El sistema lineal ˙x = Ax + bu con A∈ Mn(R) matriz constante,

b∈ Rn vector columna y u(t)∈ R puede ser transformado mediante un cambio lineal w = T x con T ∈ Mn(R) no singular en la forma can´onica controlable

(3.25) si y s´olo si

rang[b, Ab, A2b, . . . , An−1b] = n . (3.27)

Demostración. Demostremos la suficiencia, es decir, supongamos que se ve-rifica (3.27) y veamos que existe la matriz T del enunciado.

Realizando el cambio de variables w = T x en el sistema ˙x = Ax + bu se obtiene el sistema transformado

˙

w = T AT−1w + T bu . (3.28)

Veamos que es posible construir la matriz T de modo que la ecuaci´on (3.28) sea (3.25). Impongamos la siguiente forma de dicha T

T = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ξ ξA ξA2 .. . ξAn−1 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦∈ M n(R) , (3.29)

siendo ξ∈ Rnun vector ﬁla tal que T sea no singular. De momento supondremos que tal ξ existe. Denotemos por si a la i-´esima columna de la matriz T−1, es

decir, sea T−1 = [s₁, . . . , sn]. Consideremos la matriz

T AT−1= ⎛ ⎜ ⎜ ⎜ ⎝

ξAs₁ ξAs₂ · · · · ξAsn

ξA2s₁ ξA2s₂ · · · ξA2sn

..

. ... ... ... ... ξAns₁ ξAns₂ · · · ξAnsn

⎞ ⎟ ⎟ ⎟ ⎠ .

(25)

Comparando los coeﬁcientes de esta matriz con los coeﬁcientes que se obtienen de la identidad T T−1= In, es decir, ⎛ ⎜ ⎜ ⎜ ⎝ ξs₁ ξs₂ · · · · ξsn

ξAs₁ ξAs₂ · · · · ξAsn

..

. ... ... ... ...

ξAn−1s₁ ξAn−1s₂ · · · ξAn−1sn

⎞ ⎟ ⎟ ⎟ ⎠= In ,

se deduce que la i-ésima fila de la matriz T AT−1coincide con la i + 1-´esima fila de la matriz identidad In para i = 1, . . . , n− 1. Por lo tanto, la matriz T AT−1

coincide con la matriz companion C dada en (3.26) con ki=−ξAnsn−i+1.

Para que (3.28) coincida con (3.25) s´olo nos falta imponer que T b = d. Sustituyendo en esta igualdad la matriz (3.29) y teniendo en cuenta que d = (0, . . . , 0, 1)T se obtiene

ξb = 0 , ξAb = 0, . . . , ξAn−2b = 0 , ξAn−1b = 1 , (3.30) o, de forma equivalente,

ξ[b, Ab, . . . , An−1b] = dT . (3.31) Observar que esta ecuación tiene una única soluci´on ξ debido a la condici´on de rango máximo (3.27).

´

Unicamente falta por demostrar que la matriz T es, en efecto, no singular. Lo probaremos mostrando que sus ﬁlas son linealmente independientes. Realizamos por lo tanto la combinaci´on lineal de las ﬁlas de T siguiente

α₁ξ + α₂ξA +· · · + αnξAn−1= 0 ,

con ciertos escalares αi. Multiplicando esta combinaci´on lineal por la derecha

por b y usando (3.30) se tiene que αn= 0. De forma an´aloga, es decir,

multipli-cando por la derecha por Ab, luego A2b y as´ı sucesivamente y usando (3.30) se llega a que α_n−1=· · · = α₁= 0. En resumen, T es no singular.

Demostremos ahora la necesidad, es decir, supongamos que existe la matriz T no singular tal que el sistema (3.28) coincida con el sistema (3.25). En particular se tiene T b = d y T AT−1= C.

Definamos r = rang[b, Ab, A2b, . . . , An−1b]. Queremos llegar a ver que r = n. Puesto que T es no singular, es claro que r = rang[T b, T Ab, T A2b, . . . , T An−1b]. Reordenando se obtiene que r = rang[T b, (T AT−1)T b, . . . , (T AT−1)n−1T b]. Pero es claro que entonces r = rang[d, Cd, . . . , Cn−1d]. Teniendo en cuenta que C tiene la forma dada en (3.26) y que d = (0, . . . , 0, 1)T por definición, es fácil comprobar que la matriz U = [d, Cd, . . . , Cn−1d] tiene forma triangular. M´as concretamente, si denotamos por uij a los elementos de la matriz U entonces

uij=

1 si i = j , 0 si i > j . En particular el rango r de U es m´aximo, o sea r = n.

(26)

Nota 7. Observar que la demostraci´on del Teorema 6 es constructiva en el sentido de que T se puede construir mediante (3.29) donde ξ es la soluci´on de (3.31).

3.4. Problemas resueltos

1. Hallar la soluci´on general del sistema lineal ˙ x ˙ y = 0 1 −2 −3 x y

utilizando diferentes m´etodos:

(i) Mediante la forma espectral de la soluci´on.

(ii) Calculando la matriz exponencial mediante la f´ormula de Sylvester. (iii) Calculando la matriz exponencial como un polinomio matricial

ade-cuado.

Soluci´on. (i) La forma espectral de la soluci´on general del sistema lineal ˙

z = Az viene dado por z(t) =

n

i=1

(viz(0)) exp(λit)wi ,

siendo λi y wi los valores y vectores propios asociados a la matriz A.

Adem´as, si W = col{w₁, . . . , wn}, entonces W−1= ﬁl{v1, . . . , vn}.

En nuestro caso se tiene A = 0 1 −2 −3 ,

de modo que, el polinomio caracter´ıstico k(λ) asociado a A es k(A) = det(λI₂− A) = λ −1

2 λ− 3

 = λ2_{− 3λ + 2 = (λ + 1)(λ + 2) .}

Entonces, los valores propios (ra´ıces del polinomio caracter´ıstico) de A son λ₁=−1 , λ₂=−2 .

Los vectores propios wiveriﬁcan Awi= λiwio bien, de forma equivalente

(A− λiI2)wi= 0. Entonces se tiene

w₁= (α₁, β₁) veriﬁca el sistema lineal homog´eneo 1 1 −2 −2 α₁ β₁ = 0 0 ,

(27)

Sea w₂= (α₂, β₂). Entonces se veriﬁca el sistema lineal homog´eneo 2 1 −2 −1 α₂ β₂ = 0 0 ,

cuya soluci´on es 2α₂+ β₂= 0, de modo que, w₂= (1,−2)T. Se tiene pues que

W = 1 1 −1 −2 , por lo tanto su matriz inversa es

W−1= 2 1 −1 −1 ,

de lo que v₁ = (2, 1) y v₂ = (−1, −1). Finalmente, aplicando la f´ormula de la soluci´on en forma espectral se obtiene

x(t) y(t) = v₁ x(0) y(0) exp(λ₁t)w₁+ v₂ x(0) y(0) exp(λ₂t)w₂ = (2, 1) x(0) y(0) exp(−t) 1 −1 + (−1, −1) x(0) y(0) exp(−2t) 1 −2 =

[2x(0) + y(0)] exp(−t) − [x(0) + y(0)] exp(−2t) −[2x(0) + y(0)] exp(−t) + 2[x(0) + y(0)] exp(−2t)

.

(ii) Como todos los valores propios λide A son distintos, se puede utilizar

la f´ormula de Sylvester (3.14) dada por exp(At) = n k=1 Zkexp(λkt) , siendo Zk = n j=1 j=k A− λjIn λk− λj ,

matrices constantes que s´olo dependen de A y de sus valores propios λj.

En nuestro problema se tiene

exp(At) = Z₁exp(−t) + Z₂exp(−2t) , donde Z₁ = A + 2I2 −1 + 2 = 2 1 −2 −1 , Z₂ = A + I2 −2 + 1= −1 −1 2 2 .

(28)

De este modo, la soluci´on general del sistema lineal es x(t) y(t) = exp(At) x(0) y(0) , siendo la matriz exponencial de A

exp(At) = exp(−t) 2 1 −2 −1 + exp(−2t) −1 −1 2 2 .

(iii) Otro m´etodo alternativo para calcular la matriz exponencial de A cuando todos sus valores propios λi son diferentes viene dado (3.16), es

decir, puesto que A∈ M₂(R) se tiene exp(At) = r(A)

con r(λ) un polinomio de grado menor o igual que 1 cuyos coeﬁcientes son funciones del tiempo t obtenidos de la forma

r(λi) = exp(λit) , i = 1, 2 .

Sea r(λ) = r₀(t) + r₁(t)λ. Entonces, la anterior condici´on se escribe como r₀(t)− r₁(t) = exp(−t) , r₀(t)− 2r₁(t) = exp(−2t) ,

cuya soluci´on es

r₀(t) = 2 exp(−t) − exp(−2t) , r₁(t) = exp(−t) − exp(−2t) . En conclusi´on, la soluci´on general del sistema lineal es

x(t) y(t) = exp(At) x(0) y(0) , siendo la matriz exponencial de A

exp(At) = r₀(t)I₂+ r₁(t)A = [2 exp(−t) − exp(−2t)] 1 0 0 1 + [exp(−t) − exp(−2t)] 0 1 −2 −3 .

2. Demostrar que L{exp(At)} = (sIn− A)−1, siendo A∈ Mn(R) y L{.} la

transformada de Laplace.

Soluci´on. Consideremos el problema de Cauchy ˙x = Ax, x(0) = x₀. Tomando transformadas de LaplaceL{ ˙x} = L{Ax} y teniendo en cuenta la condici´on inicial x(0) = x₀ se obtiene

(29)

de donde, despejando tenemos ¯

x(s) = (sIn− A)−1x0 .

Antitransformando en esta ecuaci´on se obtiene x(t) =L−1{(sIn− A)−1x0}

Comparando esta expresi´on con la soluci´on x(t) = exp(At)x₀del problema de Cauchy ˙x = Ax, x(0) = x₀ se concluye queL{exp(At)} = (sIn− A)−1

tal y como se quer´ıa probar.

3. Hallar la soluci´on del problema de Cauchy ˙ x₁ ˙ x₂ = 0 1 −1 0 x₁ x₂ + 0 t , x₁(0) x₂(0) = 0 0 .

Soluci´on. El sistema del enunciado se puede escribir como ˙x = Ax + Bu, siendo x = (x₁, x₂)T ∈ R2, A = 0 1 −1 0 ,

y donde el t´ermino Bu se puede tomar de varias formas. Por ejemplo B = 0 1 ∈ R2 _{, u(t) = t}_{∈ R .}

Teniendo en cuenta (3.22), la soluci´on del problema de Cauchy ˙x = Ax + Bu con x(0) = x₀es x(t) = Φ(t, 0) x₀+ t 0 Φ(0, τ )Bu(τ ) dτ ,

siendo Φ(t, 0) = exp(At) la matriz de transici´on de estados. Es f´acil com-probar que dicha matriz es una matriz de rotaci´on en el plano

Φ(t, 0) = cos t sin t − sin t cos t , siendo su inversa Φ(0, t) = cos t sin t − sin t cos t ₋₁ = cos t − sin t sin t cos t . Se tiene pues que

x(t) = cos t sin t − sin t cos t 0 0 + t 0 cos τ − sin τ sin τ cos τ 0 τ dτ , de modo que, tras ﬁnalizar todos los c´alculos involucrados se obtiene

x(t) = t− sin t 1− cos t .

(30)

4. Sea u(t) la fuerza total por unidad de masa que actúa sobre una part´ıcula. Demostrar que la posición en función del tiempo x(t) viene dada por

x(t) = x(0) + ˙x(0)t + t

0

(t− τ)u(τ) dτ .

Solución. La ecuaci´on del movimiento es, según las leyes de la mecánica clásica, ¨x = u(t). Pasando a las variables de estado o variables de fase y = ˙x se tiene

˙

x = y , ˙y = u(t) .

Podemos escribir este sistema en forma matricial como ˙ x ˙ y = 0 1 0 0 x y + 0 1 u(t) ,

es decir, deﬁniendo z = (x, y)T, se tiene ˙z = Az + bu, siendo

A = 0 1 0 0 , b = 0 1 .

La soluci´on z(t) viene expresada, seg´un (3.21), por

z(t) = exp(At) z₀+ t 0 exp(−Aτ)bu(τ) dτ , (3.32) siendo z(0) = z₀.

Realizamos ahora un paréntesis para calcular la matriz exp(−Aτ). Un simple cálculo por cualquiera de los métodos explicados en teor´ıa muestra que exp(At) = I₂+ At = 1 t 0 1 . (3.33)

En realidad, en este caso particular es f´acil ver que A2 = O, es decir, la matriz A es nilpotente. Por lo tanto, la expresión dada de exp(At) se sigue de la propia definición de matriz exponencial (3.5) donde la serie es truncada y se convierte en polinomial, es decir,

exp(At) = ∞ k=0 tk k!A k_{= I} 2+ tA +t 2 2!A 2₊_{· · · = I} 2+ tA .

Introduciendo (3.33) en (3.32) y teniendo en cuenta las expresiones de A y b se tiene z(t) = x(t) y(t) = 1 t 0 1 x(0) y(0) + t 0 1 −τ 0 1 0 1 u(τ ) dτ .

(31)

Finalmente, extrayendo de esta ecuaci´on la primera componente x(t) y recordando que y = ˙x se obtiene el resultado deseado

x(t) = x(0) + ˙x(0)t + t

0

(t− τ)u(τ) dτ .

5. Averiguar si el sistema lineal ˙ x₁ ˙ x₂ = 1 −3 4 2 x₁ x₂ + 1 1 u(t) ,

puede ser transformado en la forma can´onica controlable mediante un cam-bio lineal de coordenadas. Dar, si es posible, dicho camcam-bio y la forma can´onica controlable asociada al sistema.

Soluci´on. El sistema del enunciado se puede escribir en forma compacta

como ˙x = Ax + bu con las deﬁniciones usuales, es decir, A = 1 −3 4 2 , b = 1 1 .

Puesto que A ∈ M₂(R), recordemos que, la forma canónica controlable (3.25) dada por ˙w = Cw + du con w∈ R2, d = (0, 1)T y C ∈ M₂(R) la matriz “companion”, no es más que la expresión de un sistema lineal que provenga mediante el cambio usual de una ecuación diferencial escalar de segundo orden a coeficientes constantes (3.23), es decir, ¨z + k₁z + k˙ ₂z = u(t).

Sabemos, por el Teorema 6, que existirá un cambio de variables lineal w = T x con T ∈ M₂(R) no singular que transformará el sistema dado en el enunciado a la forma canónica controlable si y s´olo si rang[b, Ab] = 2. En nuestro problema se tiene

[b, Ab] = 1 −2 1 6 , de modo que se veriﬁca rang[b, Ab] = 2.

Una vez se sabe que existe la transformaci´on lineal w = T x, s´olo falta hallar la matriz T ∈ M₂(R). Para ello recordemos la Nota 7, es decir, T se puede construir mediante (3.29) donde ξ es la soluci´on de (3.31). En otras palabras, T = ξ ξA ∈ M2(R) , donde ξ veriﬁca ξ[b, Ab] = dT .

(32)

En nuestro problema, despejando ξ de la anterior ecuaci´on se tiene ξ = dT[b, Ab]−1= (0, 1) 1 −2 1 6 ₋₁ = 1 8(0, 1) 6 2 −1 1 =1 8(−1, 1) . Finalmente, se tiene T = ξ ξA =1 8 −1 1 3 5 .

Sabemos que, ver (3.28), realizando el cambio de variables w = T x en el sistema ˙x = Ax + bu se obtiene el sistema transformado

˙

w = T AT−1w + T bu ,

con C = T AT−1 y T b = d = (0, 1)T. Desarrollando se tiene ˙ w₁ ˙ w₂ = 0 1 −14 3 w₁ w₂ + 0 1 u(t) ,

que, obviamente, corresponde a una ecuación escalar de segundo orden del control clásico. M´as concretamente, definiendo z = w₁ = 1/8(−x₁+ x₂) se concluye que

¨

(33)

Sistemas de Control Lineal

4.1. Introducci´

on

En este cap´ıtulo abordaremos algunos de los problemas propios del control. Consideremos el sistema lineal controlado

˙

x = Ax + Bu , (4.1)

con A∈ Mn(R) y B ∈ Mn×m(R) matrices constantes, x(t) ∈ Rn y u(t)∈ Rm.

4.2. Controlabilidad

Deﬁnici´on 8. El sistema (4.1) se dice que es completamente controlable si, para cualquier t₀, cualquier estado inicial x(t₀) = x₀y cualquier estado ﬁnal xf,

existe un tiempo ﬁnito t₁con t₁> t₀ y un control u(t) deﬁnido para t₀≤ t ≤ t₁ tal que x(t₁) = xf.

El término “completamente”significa que la anterior definición se satisface “para todo”x₀ y xf.

Nota _{9. Es habitual suponer que el control u(t) es cotinuo a trozos, es decir,} continuo excepto en un n´umero ﬁnito de tiempos del intervalo [t₀, t₁].

Nota10. En la Definición 8 se puede tomar el estado final x_f= 0 sin pérdida de generalidad. Además, puesto que A y B son matrices constantes (no dependen del tiempo) también se puede elegir el origen de tiempos de modo que t₀= 0.

La Nota 10 es debida a que, la soluci´on x(t) de (4.1) viene dada por (3.22), es decir, x(t) = Φ(t, t₀) x₀+ t t0 Φ(t₀, τ )Bu(τ ) dτ . De este modo se tiene

xf = Φ(t1, t0) x₀+ t₁ t0 Φ(t₀, τ )Bu(τ ) dτ , 23

(34)

que, reagrupando t´erminos, se puede escribir como 0 = Φ(t₁, t₀) {x0− Φ(t0, t1)xf} + t1 t0 Φ(t₀, τ )Bu(τ ) dτ ,

puesto que la matriz Φ(t₁, t₀) es no singular, siendo su inversa Φ(t₀, t₁). Por lo tanto se observa que, si el control u(t) transfiere el estado inicial x₀en el estado final xf, entonces tambien transfiere el estado x0− Φ(t0, t1)xf al origen en el

mismo tiempo t₁− t₀.

El siguiente resultado muestra un criterio algebraico que caracteriza a los sistemas lineales (4.1) completamente controlables.

Teorema 11. El sistema ˙x = Ax + Bu dado en (4.1) es completamente con-trolable si y s´olo si la matriz de controlabilidad

U = [B, AB, A2B, . . . , An−1B]∈ M_n×nm(R) (4.2) tiene rango m´aximo, es decir, rangU = n.

Demostraci´on. Probemos en primer lugar la necesidad. Suponemos pues que el sistema (4.1) es completamente controlable (asumiendo t₀ = 0 y xf = 0

debido a la Nota 10) y queremos ver entonces que rangU = n. Utilizaremos una demostraci´on por reducci´on al absurdo, es decir, supondremos que rangU < n y llegaremos a una contradicci´on.

Si rangU < n entonces existe una combinación lineal de filas de U que da el vector fila nulo. Dicho de otro modo, existe un vector fila q∈ Rn con q= 0 tal que

qB = 0 , qAB = 0 , . . . , qAn−1B = 0 . (4.3) Utilizando la soluci´on (3.21) del sistema (4.1) con las condiciones x(0) = x₀ se tiene x(t) = exp(At) x₀+ t 0 exp(−Aτ)Bu(τ) dτ , de modo que, tomando t = t₁ con x(t₁) = 0 se obtiene

−x0=

t₁

0

exp(−Aτ)Bu(τ) dτ .

Teniendo en cuenta que exp(−At) = r(A) con r un polinomio de grado menor o igual que n− 1, la anterior ecuaci´on queda de la forma

−x0=

t1

0

(r₀(τ )In+ r1(τ )A +· · · + rn−1(τ )An−1)Bu(τ ) dτ ,

siendo ri(t) ∈ R los coeﬁcientes del polinomio r. Multiplicando esta ecuaci´on

por la izquierda por el vector ﬁla q y utilizando (4.3) se llega a que qx₀ = 0. Como el sistema (4.1) es completamente controlable, el desarrollo efectuado an-teriormente sirve para cualquier x₀. Entonces la condici´on qx₀= 0 implica q = 0

(35)

en contradicci´on con la hip´otesis inicial rangU < n.

Probemos en segundo lugar la suﬁciencia. Para ello supondremos que rangU = n y hemos de demostrar que el sistema (4.1) es completamente controlable, es decir, que existe una funci´on de control u(t) deﬁnida en el intervalo de tiempo 0≤ t ≤ t₁ tal que x(t₁) = 0.

Consideremos la siguiente matriz cuadrada M =

t₁

0

exp(−Aτ)BBTexp(−ATτ ) dτ ∈ Mn(R) . (4.4)

Es obvio que M es una matriz constante. Adem´as M es sim´etrica puesto que

MT =

t1

0

exp(−Aτ)BBTexp(−ATτ ) dτ T

= t1

0

exp(−Aτ)BBTexp(−ATτ )T dτ =

t1

0

[exp(−ATτ )]TBBT[exp(−Aτ)]T dτ =

t₁

0

exp(−Aτ)BBTexp(−ATτ ) dτ = M .

Vamos a probar que M es no singular demostrando que es, en realidad, una matriz definida positiva. Sea α∈ Rnun vector columna arbitrario y definamos el vector fila β(τ ) = αTexp(−Aτ)B. Asociamos a M la siguiente forma cuadrática

αTM α = t₁ 0 β(τ )βT(τ ) dτ = t₁ 0 β(τ) 2 _dτ _{≥ 0 ,} _(4.5)

de modo que M es semidefinida positiva. Vamos a ver a continuación que M es no singular por reducci´on al absurdo. Se sabe que M es singular si y s´olo si existe un vector columna, ˜α= 0 tal que ˜αTM ˜α = 0. Esto implica, teniendo en cuenta (4.5), que ˜β(τ ) = ˜αTexp(−Aτ)B ≡ 0 para todo 0 ≤ τ ≤ t₁. Utilizando la definición de matriz exponencial, la anterior condición se escribe como

˜ αT In− τA + τ 2 2!A 2₊_{· · ·}_B_{≡ 0 , 0 ≤ τ ≤ t} 1 .

Ello es equivalente a imponer que ˜

αTB = 0 , ˜αTAB = 0 , ˜αTA2B = 0, . . . ,

de manera que ˜αTU = 0 siendo U la matriz de controlabilidad (4.2). Pero, como por hip´otesis U tiene rango m´aximo, es decir rango n, es imposible que existe un vector ˜α= 0 veriﬁcando ˜αTU = 0.

Hemos llegado pues a una contradicci´on y por lo tanto M es no singular. Entonces es posible tomar el siguiente control

(36)

Sustituyendo este control en la soluci´on (3.21) dada por x(t) = exp(At) x₀+ t 0 exp(−Aτ)Bu(τ) dτ , del sistema (4.1) se tiene

x(t₁) = exp(At₁)

x₀− t₁

0

exp(−Aτ)BBTexp(−ATτ )M−1x₀ dτ = exp(At₁)x₀− MM−1x₀= 0 ,

donde en el segundo paso se ha utilizado (4.4).

Nota_{12. Debido al Teorema 11, es habitual hablar de la controlabilidad del par} [A, B] en lugar del sistema ˙x = Ax + Bu.

Corolario 13. Si rangB = r entonces la condici´on (4.2) del Teorema 11 se reduce a la siguiente restricci´on

rang[B, AB, A2B, . . . , An−rB] = n .

Demostraci´on. Deﬁnimos las siguientes matrices

Uk= [B, AB, A2B, . . . , AkB] , k = 0, 1, 2, . . .

Observar que, si rangU = rangU+1, entonces todas las columnas de la

ma-triz A+1B son linealmente dependientes con respecto a las columnas de U.

Además, en este caso, se verificará tambi´en que todoas las columnas de A+2B, A+3B, . . ., son tambi´en linealmente dependientes con respecto a las columnas de U. Se tiene pues que rangU= rangU+1= rangU+2=· · · .

De este modo se ve que el rango de Uk aumenta al menos en 1 cuando ¿k

aumenta en 1 hasta que el m´aximo rango de Uk se alcanza para k = . Como

rangU₀= rangB = r y adem´as rangUk ≤ n se tiene que r + ≤ n y por lo tanto

≤ n − r.

El siguiente resultado relaciona el sistema de control cl´asico (3.25) con el concepto de controlabilidad.

Teorema 14. El sistema lineal ˙x = Ax + bu con A∈ Mn(R) matriz constante,

b∈ Rn vector columna y u(t)∈ R puede ser transformado mediante un cambio lineal en la forma can´onica controlable (3.25) si y s´olo si es completamente controlable.

Demostraci´on. Como b ∈ Rn es un vector columna, es decir, estamos en el caso m = 1, la matriz B reduce al vector b. Entonces, la condici´on (4.2) del Teorema 11 es exactamente igual a la condici´on (3.27) del Teorema 6. El teorema se demustra pues teniendo en cuenta el Teorema 11 y el Teorema 6.

(37)

Nota 15. Debido al Teorema 14, el sistema clásico (3.25) se suele decir que está en la forma canónica controlable.

Observemos que el Teorema 11 es puramente existencial, es decir, a partir de ´el se sabe que existe un vector control u(t) de modo que el sistema es com-pletamente controlable. Sin embargo no determina cual es dicho control. Para responder a esta pregunta se dispone del siguiente resultado.

Teorema 16. El sistema ˙x = Ax + Bu es completamente controlable si y s´olo si la matriz de controlabilidad sim´etrica

U (t₀, t₁) = t1

t0

Φ(t₀, τ )BBTΦT(t₀, τ ) dτ ∈ Mn(R) (4.7)

es no singular, siendo Φ la matriz de transición de estados definida en (3.8). Además, en este caso el control u(t) definido para t₀ ≤ t ≤ t₁ que transfiere el estado x(t₀) = x₀ al estado x(t₁) = xf viene dado por

u(t) =−BTΦT(t₀, t)U−1(t₀, t₁)[x₀− Φ(t₀, t₁)xf] . (4.8)

Demostraci´on. Demostremos en primer lugar la suﬁciencia. Asumimos pues que U es no singular, de modo que el control dado por (4.8) existe. S´olo falta por ver que, aplicando dicho control, se obtiene x(t₁) = xf. Para ello, recordemos

que la soluci´on (3.22) del sistema ˙x = Ax+Bu con la condici´on inicial x(t₀) = x₀ viene dada por

x(t) = Φ(t, t₀) x₀+ t t0 Φ(t₀, τ )Bu(τ ) dτ . (4.9)

Se tiene pues, sustituyendo el control u(t) dado en (4.8), que

x(t1) = Φ(t1, t0) x0+ t t0 Φ(t0, τ)B −BTΦT(t0, τ)U−1(t0, t1)[x0− Φ(t0, t1)xf] dτ = Φ(t1, t0) x0− t1 t0 Φ(t0, τ)BBTΦ(t0, τ) dτ U−1(t0, t1)(x0− Φ(t0, t1)xf) = xf ,

como se quer´ıa ver. Hemos tenido en cuenta que Φ(t₁, t₀)Φ(t₀, t₁) = In y que

además, la expresión encerrada entre llaves{.} es justo la definición de U(t₀, t₁). Demostremos ahora la necesidad. Hemos de probar que, si el sistema ˙x = Ax + Bu es completamente controlable, entonces U (t₀, t₁) es no singular.

Como U (t₀, t₁) es una matriz sim´etrica, tomando un vector columna arbi-trario α∈ Rn podemos construir la forma cuadr´atica

αTU (t₀, t₁)α = t₁ t0 βT(τ, t₀)β(τ, t₀) dτ = t₁ t0 β(τ, t0)2dτ ≥ 0 , (4.10)

(38)

donde se ha deﬁnido el vector columna β(τ, t₀) = BTΦT(t₀, τ )α∈ Rn. Se tiene pues que U (t₀, t₁) es una matriz semideﬁnida positiva.

Veamos por reducci´on al absurdo que, en realidad, U (t₀, t₁) es una matriz deﬁnida positiva y por lo tanto no singular. Supongamos pues que entonces que existe un vector ˆα= 0 tal que ˆαTU (t₀, t₁) ˆα = 0. Teniendo en cuenta (4.10) con α = ˆα se tiene que

t1

t0

 ˆβ(τ, t0)2 dτ = 0

donde ˆβ(τ, t₀) = BTΦT(t₀, τ ) ˆα∈ Rn. Por lo tanto, por las propiedades de la norma, concluimos que ˆβ(τ, t₀)≡ 0 para t₀≤ τ ≤ t₁.

Sin embargo, puesto que por hipótesis el sistema ˙x = Ax + Bu es completa-mente controlable, se sabe que existe un vector control ˆu(t)∈ Rn de modo que x(t₁) = 0 cuando x(t₀) = ˆα. Entonces, utilizando (4.9) con la condici´on inicial x(t₀) = ˆα y la final x(t₁) = 0 se tiene ˆ α =− t1 t0 Φ(t₀, τ )B û(τ ) dτ . De este modo ˆα2_{= ˆ}_αT_{α =}_ˆ ₋ t1 t0 ˆ uT(τ )BTΦ(t₀, τ )Tα dτ =ˆ − t₁ t0 ˆ uT(τ ) ˆβ(τ, t₀) dτ = 0 ,

contradiciendo la hip´otesis ˆα= 0.

Es importante observar que pueden haber, en general, otros controles u(t) diferentes del control (4.8) que transﬁeran el estado x(t₀) = x₀al estado x(t₁) = xf. Sin embargo veremos a continuaci´on que el control (4.8) tiene una propiedad

especial que le conﬁere optimabilidad respecto del resto de posibles controles.

Teorema 17. Consideremos el sistema ˙x = Ax+Bu. Sea û(t) un vector control que lleva el estado inicial x(t₀) = x₀ al estado final x(t₁) = xf verificando

ˆ

u(t)≡ u(t) para t₀≤ t ≤ t₁, donde u(τ ) es el control (4.8). Entonces t1

t0

ˆu(τ)2 _{dτ >} t1

t0

u(τ)2 _{dτ .}

Demostración. Puesto que ambos controles u(t) y û(t) transfieren el estado inicial x(t₀) = x₀al estado final x(t₁) = xf, deben verificar, según (3.22),

xf = Φ(t1, t0) x₀+ t₁ t0 Φ(t₀, τ )B ˆu(τ ) dτ , xf = Φ(t1, t0) x₀+ t₁ t0 Φ(t₀, τ )Bu(τ ) dτ .

(39)

Restando estas expresiones se obtiene 0 =

t₁ t0

Φ(t₀, τ )B[ˆu(τ )− u(τ)] dτ . Multiplicando esta ecuaci´on por la izquierda por

[x₀− Φ(t₀, t₁)xf]T[U−1(t0, t1)]T , se llega a 0 = t1 t0 [x₀− Φ(t₀, t₁)xf]T[U−1(t0, t1)]TΦ(t0, τ )B[ˆu(τ )− u(τ)] dτ .

Teniendo en cuenta que u(τ ) es el control (4.8), es claro que la expresi´on dentro de las llaves{.} es justo −uT(τ ) de modo que

0 = t₁

t0

uT(τ )[û(τ )− u(τ)] dτ . (4.11) Por otra parte, utilizando las propiedades del producto escalar y de la norma se tiene que (u− û)T(u− û) = u2+û2− 2uTu. Entonces,ˆ

t₁ t0

u(τ) − ˆu(τ)2_dτ ₌ t1

t0

[(u(τ )− ˆu(τ))T(u(τ )− ˆu(τ))T] dτ =

t₁ t0

[u(τ)2+ˆu(τ)2− 2uT(τ )ˆu(τ )] dτ =

t1

t0

[ˆu(τ)2− u(τ)2] dτ ,

donde, en el ´ultimo paso, se ha utilizado (4.11). De aqu´ı, ﬁnalmente obtenemos t₁

t0

ˆu(τ)2 _{dτ =} t1

t0

[u(τ)2+u(τ) − ˆu(τ)2] dτ > t₁

t0

u(τ)2 _dτ

como se quer´ıa probar. Observar que en la ´ultima desigualdad se ha utilizado que u(t)≡ ˆu(t) en el intervalo t₀≤ t ≤ t₁.

Nota_{18. Dado un control u(t), en muchas aplicaciones f´ısicas se interpreta la} integral_tt1

0 u(τ)

2 _{dτ como la energ´ıa o bien el consumo necesario para llevar}

el sistema desde el estado inicial x(t₀) = x₀ al estado ﬁnal x(t₁) = xf. De este

modo, el Teorema 17 se interpreta de manera que, de todos los posibles controles ˆ

u(t) admisibles, el que minimiza la energ´ıa o el consumo es justo el control u(t) dado por (4.8).

Si el sistema lineal ˙x = Ax + Bu no es completamente controlable, no es una buena terminolog´ıa llamarle incontrolable. Ello es bebido a que cuando no se verifica la Definición 8 de sistema completamente controlable sólo significa

(40)

que hay ciertos estados ﬁnales xf que no pueden ser alcanzados con ning´un

control. Para caracterizar si un estado ﬁnal xf es alcanzable con alg´un control,

independientemente de si el sistema es completamente controlable o no y adem´as conocer qu´e control u(t) es admisible se tiene el siguiente resultado.

Teorema 19. Si, para un cierto estado ﬁnal xf, existe un vector columna

cons-tante ξ∈ Rn tal que

U (t₀, t₁)ξ = x₀− Φ(t₀, t₁)xf , (4.12)

entonces el control

u(t) =−BTΦ(t₀, t)ξ , (4.13)

transﬁere el sistema ˙x = Ax + Bu desde el estado inicial x(t₀) = x₀ al estado ﬁnal x(t₁) = xf.

Demostraci´on. La soluci´on del sistema ˙x = Ax + Bu con la condici´on inicial x(t₀) = x₀viene dada por (3.22), es decir,

x(t) = Φ(t, t₀) x₀+ t t0 Φ(t₀, τ )Bu(τ ) dτ .

Sustitutendo en esta expresi´on el control u(t) dado en (4.13) y evaluando para t = t₁se obtiene x(t₁) = Φ(t₁, t₀) x₀− t1 t0 Φ(t₀, τ )BBTΦ(t₀, τ )ξ dτ .

Teniendo en cuenta, según (4.7), la expresión de la matriz de controlabilidad U (t₀, t₁), la anterior ecuación se reescribe como

x(t₁) = Φ(t₁, t₀) [x₀− U(t₀, t₁)ξ] . Imponiendo ahora la condici´on (4.12) se obtiene

x(t₁) = Φ(t₁, t₀)Φ(t₀, t₁)xf = xf ,

como se quer´ıa probar.

Nota20. Si el sistema ˙x = Ax+Bu es completamente controlable, entonces, por el Teorema 4.8, la matriz de controlabilidad U (t₀, t₁) es invertible y la expresi´on dada en (4.13) para el control u(t) reduce a la expresi´on (4.8).

Nota _{21. Se puede demostrar, ver por ejemplo la p´}_{agina 77 de [2], que el} rec´ıproco del Teorema 19 es cierto. De este modo, s´olo los estados ﬁnales xf

para los cuales (4.12) se verifique pueden ser alcanzados con algún control. Existe otra forma análoga al Teorema 19 demostrada en la página 167 de [11] que es la siguiente.

Teorema 22. Un cierto estado inicial x(t₀) = x₀ se puede transferir al estado ﬁnal xf si ambos vectores x0y xf pertenecen al subespacio vectorial engendrado