• No se han encontrado resultados

Teoría de Estabilidad y Control Isaac A. García

N/A
N/A
Protected

Academic year: 2021

Share "Teoría de Estabilidad y Control Isaac A. García"

Copied!
140
0
0

Texto completo

(1)
(2)
(3)

Teoría de estabilidad y control

Isaac A. García

Seminari de Sistemes Dinàmics

Departament de Matemàtica

(4)

ISBN: 978-84-8409-422-7

© Edicions de la Universitat de Lleida, 2005 © El autor

Maquetación:

Servei de Publicacions (UdL) Diseño cubierta:

cat & cas Impresión: Cargraphics

La reproducción total o parcial de esta obra por cualquier procedimiento, incluidos la grafía y el tratamiento informático, y la distribución de ejemplares mediante alquiler o présta-mo público, queda rigurosamente prohibida sin la autorización de los titulares del copyright, y será sometida a las sanciones establecidas por la ley.

EINES es una col·lección del Institut de Ciències de l’Educació de la Universitat de Lleida.

(5)
(6)
(7)

Indice general

1. Introducci´on y Ejemplos 1

1.1. Breve historia de control autom´atico . . . 1

1.2. Algunos ejemplos f´ısicos . . . 3

1.2.1. Part´ıcula en movimiento unidimensional . . . 3

1.2.2. Termostato y transferencia de calor . . . 3

2. Control Cl´asico y Transformada de Laplace 5 2.1. El problema cl´asico de control . . . 5

2.2. Transformada de Laplace y funci´on de transferencia . . . 5

3. Soluci´on de Sistemas Lineales 7 3.1. Soluci´on espectral de sistemas lineales . . . 7

3.1.1. La matriz exponencial . . . 8

3.1.2. El teorema de Cayley-Hamilton y la matriz exponencial . 11 3.2. Soluci´on de sistemas controlados . . . 12

3.2.1. Existencia y unicidad de la soluci´on . . . 13

3.3. Relaci´on entre espacio de estados y el control cl´asico . . . 13

3.4. Problemas resueltos . . . 16

4. Sistemas de Control Lineal 23 4.1. Introducci´on . . . 23 4.2. Controlabilidad . . . 23 4.3. Equivalencia Algebraica . . . 31 4.4. Problemas resueltos . . . 32 5. Observabilidad 37 5.1. Observabilidad . . . 37 5.2. Problemas resueltos . . . 40 6. Realimentaci´on Lineal 43 6.1. Definici´on y preliminares . . . 43

6.1.1. Realimentaci´on y funci´on de transferencia . . . 46

6.2. Realimentaci´on frente a control precalculado . . . 46

6.2.1. Sensibilidad a las condiciones iniciales . . . 48

Pr´ologo IX

(8)

6.2.2. Sensibilidad a perturbaciones externas . . . 48

6.3. Problemas resueltos . . . 49

7. Estabilidad 53 7.1. Introducci´on y definiciones . . . 53

7.2. Estabilidad en sistemas lineales . . . 54

7.3. Teor´ıa de Liapunov de la estabilidad . . . 56

7.3.1. Aplicaci´on a sistemas lineales . . . 58

7.3.2. Estabilidad mediante linearizaci´on . . . 59

7.4. Estabilidad y control . . . 61

7.4.1. Estabilidad entrada–salida . . . 61

7.4.2. Estabilizaci´on por realimentaci´on lineal . . . 63

7.4.3. Linealizaci´on de sistemas de control no lineales . . . 63

7.5. Problemas resueltos . . . 64

8. C´alculo de Variaciones 75 8.1. Un ejemplo: braquistocrona . . . 75

8.2. Introducci´on . . . 77

8.3. Ecuaciones de Euler–Lagrange . . . 77

8.3.1. Lema fundamental del c´alculo de variaciones . . . 77

8.3.2. Ecuaciones de Euler–Lagrange . . . 78

8.3.3. Integrales primeras en casos simples . . . 80

8.4. Extremos con restricciones . . . 81

8.5. Ap´endice: Multiplicadores de Lagrange . . . 82

8.5.1. Problemas isoperim´etricos . . . 82

8.6. Problemas resueltos . . . 85

9. Control ´Optimo 95 9.1. Introducci´on . . . 95

9.2. Control ´optimo: m´etodo hamiltoniano . . . 97

9.3. El regulador lineal . . . 99

9.4. Teor´ıa de Pontryagin . . . 101

9.5. Problemas resueltos . . . 103

10.Pr´acticas 115 10.1. Control de la temperatura de una c´amara . . . 115

10.1.1. Realizaci´on de la pr´actica . . . 116

10.2. Din´amica de sat´elites de comunicaci´on . . . 117

10.2.1. Un modelo matem´atico para la din´amica de sat´elites . . . 117

10.2.2. Realizaci´on de la pr´actica . . . 119

10.3. El p´endulo doble invertido . . . 119

10.3.1. Realizaci´on de la pr´actica . . . 120

10.4. Estabilidad en el p´endulo c´onico . . . 121

10.4.1. Realizaci´on de la pr´actica . . . 122

10.5. Un modelo de gr´ua con servomecanismo y regulador . . . 123

10.5.1. Realizaci´on de la pr´actica . . . 123

10.6. El regulador centr´ıfugo de Watt . . . 125

(9)

Pr´

ologo

El presente libro de teor´ıa y problemas corresponde a los temas b´asicos de un primer curso de introducci´on al la teor´ıa de control y estabilidad en variables de ca Industrial aunque el libro es igualmente recomendable para estudiantes de otras titulaciones t´ecnicas.

El objetivo principal es que el alumno disponga de un material preliminar para el curso, con los resultados principales y algunas demostraciones de estos. Adem´as es interesante que el alumno pueda seguir paso a paso la resoluci´on de numerosos problemas de los temas mencionados como ejemplificaci´on de los conceptos y resultados te´oricos, complementando as´ı los realizados en clase. Se ha procurado presentar las soluciones en la forma m´as pr´actica y directa.

Me gustar´ıa que este libro facilitase el aprendizaje de la asignatura y, agrade-cer´ıa cualquier sugerencia o comentario que pueda mejorarlo dirigi´endose a la siguiente direcci´on electr´onica: [email protected].

Dr. Isaac A. Garc´ıa, Septiembre de 2004

(10)
(11)

ecni-Introducci´

on y Ejemplos

1.1.

Breve historia de control autom´

atico

En este cap´ıtulo introductorio revisaremos, en primer lugar, una breve in-troducci´on hist´orica de la teor´ıa del control autom´atico.

El llamado control por retroalimentaci´on es un mecanismo b´asico a trav´es del cual sistemas de naturaleza muy diferente (mec´anicos, el´ectricos, biol´ ogi-cos, etc...) mantienen su equilibrio. Por ejemplo, un cambio en la temperatura corporal de 1 grado es, en general, una se¯nal de alg´un tipo de enfermedad. De hecho, de la teor´ıa de la evoluci´on de las especies de Darwin se desprende que la retroalimentaci´on sobre largos periodos temporales es responsable de tal evoluci´on.

Se puede definir el control por retroalimentaci´on como el uso de diferentes se¯nales, determinadas a partir de la comparaci´on del estado actual del sistema y del estado deseado, para controlar el sistema. Un ejemplo cotidiano de sistema controlado por retroalimentaci´on es el control de la velocidad de un coche me-diante el uso de la diferencia entre la velocidad actual y la deseada para variar el flujo de gasolina. El hecho de que la salida del sistema sea usada para regular la entrada del sistema da lugar a lo que se llama sistema de control en lazo cerrado. El control por retroalimentaci´on es una disciplina de la ingenier´ıa y, co-mo tal, est´a estrechamente relacionada con diversos problemas aplicados que la humanidad ha querido resolver a lo largo de su historia. M´as concretamente, existi´o una ´epoca muy importante para el desarrollo de la teor´ıa de control que se comprende entre la Revoluci´on Industrial y la primera y segunda Guerra Mundial. El control necesit´o adquirir el lenguaje de las matem´aticas para poder expresarse correctamente. De este modo J.C. Maxwell introdujo el an´alisis ri-guroso de la teor´ıa de control en 1868. Existen diversos periodos remarcables: ´

epoca primitiva desde 1868–1900; ´epoca cl´asica desde 1900–1960; ´epoca moderna desde 1960 hasta la actualidad.

(12)

La Revoluci´on Industrial en Europa introdujo nuevas m´aquinas que no se pod´ıan regular con la mano. De este modo se iniciaron los primeros dispositivos de control autom´atico. Algunos de ellos son los reguladores de temperatura, de presi´on, de velocidad, etc...

En 1840, el astr´onomo G.B. Airy desarroll´o un sistema de retroalimentaci´on para colocar su telescopio mediante un control de la velocidad con el fin de compensar la rotaci´on terrestre. Airy descubri´o que un dise¯no poco adecuado del sistema de lazo cerrado de retroalimentaci´on produc´ıa oscilaciones indeseables en el sistema. De este modo introdujo el concepto de inestabilidad y la herramienta de las ecuaciones diferenciales en su an´alisis.

J.C. Maxwell (1868) fue el primero en linearizar las ecuaciones diferenciales del movimiento para hallar la ecuaci´on caracter´ıstica del sistema y analizar los efectos de los par´ametros del sistema en su estabilidad.

En 1877, E.J. Routh muestra una t´ecnica num´erica para determinar cuando una ecuaci´on caracter´ıstica tiene ra´ıces estables. Ese mismo a¯no, I.I. Vishnegrad-sky analiz´o la estabilidad de los reguladores usando ecuaciones diferenciales.

En 1892, A.M. Liapunov introdujo un trabajo b´asico en teor´ıa de control, estudiando la estabilidad de sistemas no lineales usando una generalizaci´on del concepto de energ´ıa.

Entre los a¯nos 1892–1898, O. Heaviside invent´o el c´alculo operacional e in-trodujo la llamada actualmente funci´on de transferencia.

La teor´ıa de control cl´asica usa b´asicamente t´ecnicas de dominio frecuen-cial en el plano complejo. Se basa en metodos de transformadas y es aplicable principalmente a sistemas lineales aut´onomos. Los m´etodos de Nyquist y Bode analizan la magnitud y la fase de la respuesta en frecuencia del sistema. Tiene la gran ventaja de que la respuesta en frecuencia del sistema puede ser medida experimentalmente y se puede pues calcular la funci´on de transferencia. No se necesita bajo este punto de vista una descripci´on interna exacta del sistema en el dominio temporal, es decir, s´olo es importante el comportamiento entrada– salida del sistema.

Sin embargo esta teor´ıa de control cl´asica es dif´ıcil de aplicar a sistemas con varias entradas y m´ultiples salidas. La teor´ıa de control moderna es fundamen-talmente una teor´ıa de dise¯no en el dominio temporal (a diferencial de la cl´asica que es en el dominio frecuencial). Se requiere un modelo en el espacio de estados del sistema que se desea controlar. Esta visi´on moderna es la que se dar´a en este libro.

(13)

1.2.

Algunos ejemplos f´ısicos

1.2.1.

Part´ıcula en movimiento unidimensional

Consideremos una part´ıcula que se mueve en una recta y sea s(t) su distancia al origen en funci´on del tiempo. Supongamos que sobre la part´ıcula act´ua una fuerza por unidad de masa u1(t) que le produce una aceleraci´on pero tambi´en act´ua una fuerza de rozamiento u2(t) por unidad de masa. Si las ´unicas canti-dades cinem´aticas de inter´es son la posici´on de la part´ıcula x1(t) = s(t) y su velocidad x2(t) = ˙s(t), aplicando las leyes de la mec´anica cl´asica, el estado de la part´ıcula (x1(t), x2(t)) verifica el sistema de ecuaciaciones diferenciales

˙

x1= x2 , x˙2= u1(t)− u2(t) .

Por supuesto, este sistema se puede escribir en notaci´on matricial de la forma ˙ x = Ax + Bu , (1.1) siendo x =  x1 x2  , u =  u1 u2  , A =  0 1 0 0  , B =  0 0 1 −1  . Se puede preguntar c´omo puede llegar la part´ıcula a un cierto punto fijo en el menor tiempo posible o bien con un consumo m´ınimo de una cierta variable. Matem´aticamente se trata de determinar las variables de control u1(t) y u2(t) con un cierto objetivo.

1.2.2.

Termostato y transferencia de calor

La temperatura interior Tide un horno se quiere controlar variando la

entra-da de calor u en las paredes. Definamos las capacientra-dades calor´ıficas de la pared y del interior del horno como cp y ci respectivamente. Denotemos por Ai y Ae

las ´areas interiores y exteriores de la pared del horno y por Ri y Re los

coefi-cientes de radiaci´on de las superficies interior y exterior del horno. Ignorando otros efectos, si las temperaturas de la pared y del exterior del horno son Tp y

Te, se tiene, tomando Ti> Tp> Te, para la pared

cpT˙p=−AeRe(Tp− Te)− AiRi(Tp− Ti) + u ,

y para el interior del horno

ciT˙i= AiRi(Tp− Ti) .

Suponiendo Te constante, si definimos las variables de estado x1 = Tp− Te y

x2= Ti− Tese tiene ˙ x1 = T˙p− ˙Te= ˙Tp=1 cpAeRex1 1 cpAiRi(x1− x2) + u cp , ˙ x2 = T˙i− ˙Te= ˙Ti= 1 ciAiRi(x1− x2) .

(14)

Estas ecuaciones se pueden escribir de la forma ˙x = Ax + bu, siendo x = (x1, x2)T, A =  −(AeRe+ AiRi)/cp (AiRi)/cp (AiRi)/ci −(AiRi)/ci  , b =  1/cp 0  .

El objetivo puede ser analizar un controlador que regule, mediante una v´ alvu-la por ejemplo, alvu-la cantidad de calor u(t) que se debe suministrar dependiendo de la temperatura que marquen los term´ometros.

(15)

Control Cl´

asico y

Transformada de Laplace

2.1.

El problema cl´

asico de control

La teor´ıa de control cl´asica estudia sistemas con una entrada escalar u(t)∈ R y una salida escalar z(t)∈ R. Si se requiere que z(t) est´e lo m´as cerca posible (en un cierto sentido) de una cierta se¯nal de referencia r(t), el sistema de control se llama servomecanismo. Un caso particular es cuando r es constante, entonces el sistema de control se llama regulador.

El modelo de la teor´ıa de control cl´asica es una ecuaci´on diferencial lineal de orden n a coeficientes constantes, es decir, z(t) verifica la ecuaci´on

z(n)+ k1z(n−1)+· · · + kn−1z+ knz = β0u(m)+ β1u(m−1)+· · · + βmu , (2.1)

donde los supra´ındices indican derivadas respecto de la variable independiente t y ki y βi son constantes.

2.2.

Transformada de Laplace y funci´

on de

trans-ferencia

Definici´on 1. Sea z :R+→ R una funci´on real y continua a trozos. Se define la transformada de Laplace ¯z(s) de z(t) de la forma

¯

z(s) =L{z(t)} = 

0

z(t) exp(−st) dt . (2.2) Algunas de las propiedades de esta transformaci´on son las siguientes:

Linealidad:L{ni=1cizi(t)} =ni=1ciL{zi(t)} para todo ci∈ R.

(16)

Derivaci´on:

L{z(j)(t)} = sj¯z− sj−1z(0)− sj−2z(1)(0)− · · · − sz(j−2)(0)− z(j−1)(0) .

(2.3) Tomando transformadas de Laplace en ambos miembros de la ecuaci´on (2.1) y teniendo en cuenta la propiedad (2.3) se tiene k(s)¯z(s) = β(s)¯u(s), siendo los polinomios

k(s) = sn+ k1sn−1+· · · + kn−1s + kn , (2.4)

β(s) = β0sm+ β1sm−1+· · · + βm−1s + βm. (2.5)

Es habitual presentarlo de la forma ¯

z(s) = g(s)¯u(s) , (2.6)

siendo

g(s) = β(s)

k(s) , (2.7)

una funci´on racional conocida como funci´on de transferencia.

Es preciso resaltar que este m´etodo s´olo es aplicable a sistemas lineales con coeficientes constantes. Nosotros seguiremos ideas diferentes para atacar los problemas b´asicos del control.

(17)

Soluci´

on de Sistemas

Lineales

3.1.

Soluci´

on espectral de sistemas lineales

Consideraremos sistemas lineales sin variables de control, es decir, sistemas del tipo

˙

x = Ax , (3.1)

con A∈ Mn(R) una matriz cuadrada de orden n y x ∈ Rn. Tomaremos un

pro-blema de valor inicial o de Cauchy, de este modo impondremos que x(0) = x0. Supondremos que todos los valores propios λicon i = 1, . . . , n, de la matriz A

son distintos1. Sean wi, con i = 1, . . . , n los vectores propios de A asociados a los

valores propios λi, es decir, Awi = λiwi. Puesto que λi= λj con i= j, se sabe

que el conjunto de vectores propios{w1, . . . , wn} son linealmente independientes

y en particular forman base deRn. En consecuencia se puede expresar la soluci´on de (3.1) de la forma x(t) = n  i=1 ci(t)wi ,

siendo ci(t) funciones escalares del tiempo. Derivando respecto de t la ecuaci´on

anterior y sustituyendo en (3.1) se obtiene

n  i=1 ˙ci(t)wi= A n  i=1 ci(t)wi = n  i=1 λici(t)wi .

1Esta no es una restricci´on fuerte en los sistemas que aparecen en las aplicaciones reales puesto que una peque¯na perturbaci´on en los coeficientesaijde la matrizA es suficiente para separar las ra´ıces iguales del polinomio caracter´ıstico deA. Recordemos que, habitualmente dichos coeficientes provienen de medidas experimentales y son, por lo tanto, conocidos hasta un cierto grado de precisi´on.

(18)

Puesto que el conjunto de vectores propios {w1, . . . , wn} son linealmente

inde-pendientes, se obtiene

˙ci= λici , i = 1, . . . , n ,

cuya soluci´on es

ci(t) = exp(λit) ci(0) , i = 1, . . . , n .

Se tiene, en definitiva, que

x(t) =

n



i=1

ci(0) exp(λit)wi . (3.2)

Sin embargo, interesa dar la soluci´on x(t) en funci´on de x(0). Para ello, defi-namos la matriz

W = [w1, . . . , wn]∈ Mn(R)

cuyas columnas son los vectores wi. Sea W−1 la matriz inversa de W , que

siempre existe puesto que rangW = n, y definamos sus filas como los vectores fila vi con i = 1, . . . , n, es decir,

W−1= ⎡ ⎢ ⎣ v1 .. . vn ⎤ ⎥ ⎦ ∈ Mn(R) .

Puesto que W−1W = In, siendo Inla matriz identidad de orden n, se verifica

viwi = 1 y viwj = 0 si i= j. Multiplicando la ecuaci´on (3.2) por la izquierda

por el vector vj y tomando finalmente t = 0 se obtiene vjx(0) = cj(0). De este

modo, la soluci´on de (3.1) viene dada por

x(t) =

n



i=1

(vix(0)) exp(λit)wi . (3.3)

Esta expresi´on se conoce como la forma espectral de la soluci´on de (3.1).

3.1.1.

La matriz exponencial

Veamos en esta secci´on una forma alternativa para obtener la soluci´on de (3.1). Esta nueva forma evita el c´alculo de los vectores propios wi de la matriz

A necesarios en la forma espectral (3.3) de la soluci´on de (3.1).

La idea se basa en generalizar el caso escalar n = 1, con lo cual A es un escalar en (3.1) y su soluci´on viene dada por

x(t) = exp(At)x0 . (3.4)

Para conseguir dicha generalizaci´on, definamos la matriz exponencial

exp(At) =  k=0 tk k!A k = I n+ tA + t 2 2!A 2+· · · . (3.5)

(19)

Esta serie infinita de matrices es convergente2 para cualquier A ∈ Mn(R) y

para todo t∈ R debido al hecho de que exp(zt) converje para cualquier pareja de escalares finitos z y t. Es claro que, a partir de su definici´on (3.5), se tiene exp(O) = In siendo O la matriz nula de orden n. Adem´as, derivando t´ermino a

ermino (3.5) respecto de t se verifica d dtexp(At) = A + tA 2+ 1 2!t 2A3+· · · = AI n+ tA + 1 2!t 2A2+· · · = A exp(At) , con lo cual d dtexp(At) = A exp(At) ,

de modo que podemos concluir que (3.4) representa la soluci´on de (3.1). La soluci´on del problema de Cauchy

˙

x = Ax , x(t0) = x0, (3.6)

se encuentra, en la literatura de control, de la forma

x(t) = Φ(t, t0)x0 , (3.7)

donde

Φ(t, t0) = exp[A(t− t0)] , (3.8)

es una matriz cuadrada de orden n llamada matriz de transici´on de estados. Es f´acil demostrar que dicha matriz verifica las siguientes propiedades:

d

dtΦ(t, t0) = AΦ(t, t0) , (3.9)

Φ(t, t) = In , (3.10)

Φ(t0, t) = Φ−1(t, t0), (3.11)

Φ(t, t0) = Φ(t, t1)Φ(t1, t0). (3.12) Observar que, en particular, la propiedad (3.11) implica

(exp(At))−1 = exp(−At) . (3.13)

Resumimos a continuaci´on algunas de las propiedades m´as importantes de la matriz exponencial.

A y exp(A) conmutan, es decir, A exp(A) = exp(A)A.

2Una sucesi´on de matrices{Ak} converge hacia A si l´ımk→∞Ak− A = 0 para cualquier norma matricial. La serie matricial k=0Akconverge si la sucesi´on de sumas parciales{Sn} conSn= nk=0Akconverge cuandon → ∞. Si la funci´on escalar f(z) se puede representar por una serie de potenciasf(z) = k=0ckxk convergente para|z| < R entonces la funci´on matricialf(A) = k=0ckAk converge si todos los valores propiosλide la matriz cuadrada A verifican |λi| < R.

 

 

(20)

exp(On) = In, siendo On e In las matrices nulas e identidad de orden n.

Si A y B conmutan, es decir, AB = BA entonces exp(AB) = exp(A) exp(B). (exp(A))−1= exp(−A).

(exp(A))T = exp(AT). d exp(tA)/dt = A exp(tA).

Sea P una matriz no singular tal que B = P−1AP . Entonces exp(B) = P−1exp(A)P .

Si D = diag{λ1, . . . , λn} es una matriz diagonal con elementos λi en la

diagonal principal, entonces exp(D) = diag{exp(λ1), . . . , exp(λn)} es una

matriz diagonal con elementos exp(λi) en la diagonal principal.

Las dos ´ultimas propiedades permiten calcular de forma eficaz la exponencial de una matriz A diagonalizable. En efecto, si A es diagonalizable existe una matriz de cambio de base P no singular tal que D = P−1AP , siendo D una matriz diagonal con los valores propios de A en la diagonal principal.

M´etodos para calcular la matriz exponencial

(i) Si todos los valores propios λi de A son distintos, la f´ormula de Sylvester

viene dada por

exp(At) = n  k=1 Zkexp(λkt) , (3.14) siendo Zk = n j=1 j=k A− λjIn λk− λj , (3.15)

matrices constantes que s´olo dependen de A y de sus valores propios λj, pero no

de sus vectores propios wi. Notar la semejanza entre la f´ormula de Sylvester y la

f´ormula de interpolaci´on polinomial de Lagrange utilizada en m´etodos num´ eri-cos.

(ii) Otro m´etodo alternativo para calcular la matriz exponencial de A cuando todos sus valores propios λi son diferentes es el siguiente.

exp(At) = r(A) , (3.16)

siendo r(λ) un polinomio de grado menor o igual que n− 1 cuyos coeficientes son funciones del tiempo t obtenidos de la forma

r(λi) = exp(λit) , i = 1, . . . , n .

(21)

(iii) El c´alculo de la matriz exponencial es tedioso en muchas ocasiones, de modo que los manipuladores algebraicos son de gran ayuda en dicho c´alculo. Por ejemplo, con el programa Mathematica, el comando MatrixExp[A] calcula la matriz exponencial de la matriz A.

3.1.2.

El teorema de Cayley-Hamilton y la matriz

expo-nencial

Sea A∈ Mn(R). En este m´etodo no es necesario suponer ni que los valores

propios de A son distintos ni que A diagonaliza.

En primer lugar, denotamos por k(λ) el polinomio caracter´ıstico de A, y sean λi los valores propios de A con multiplicidad algebraica mi para i = 1, . . . , k,

siendo k≤ n. Por el Teorema de Cayley-Hamilton se sabe que k(A) = 0. Se efect´ua la descomposici´on en fracciones simples

1 k(λ) = k  i=1 pi(λ) (λ− λi)mi ,

siendo pi(λ) polinomios de grado menor o igual que mi − 1. Definiendo los

polinomios qi(λ) = k(λ)/(λ− λi)mi, con i = 1, . . . , k, la anterior ecuaci´on se

reescribe de la forma 1 = k  i=1 pi(λ)qi(λ) . (3.17)

Evaluando este polinomio en A se tiene la identidad

In= k



i=1

pi(A)qi(A) .

Por otra parte, observemos que

exp(At) = exp(λitIn) exp[(A− λiIn)t] = exp(λit)Inexp[(A− λiIn)t]

= exp(λit)  j=0 tj(A− λiIn)j j! ,

de modo que, multiplicando por la izquierda ambos miembros por qi(A) se

obtiene la siguiente igualdad con suma finita

qi(A) exp(At) = exp(λit) mi−1

j=0

tjqi(A)(A− λiIn)j

j! , (3.18)

donde se ha teniendo en cuenta el Teorema de Cayley-Hamilton de modo que qi(A)(A− λiIn)j = k(A)(A− λiIn)j−mi = 0. Multiplicando finalmente la

(22)

ecuaci´on (3.18) por la izquierda por pi(A), sumando para todo i desde 1

has-ta k y teniendo en cuenhas-ta (3.17) se obtiene la siguiente expresi´on de la matriz exponencial exp(At) = k  i=1

⎣exp(λit)pi(A)qi(A) mi−1 j=0 tj(A− λiIn)j j!⎦ . (3.19)

Nota2. Observar que los grados de los polinomios pi y qi son mi− 1 y n − mi respectivamente, de modo que, en el caso particular de que todos los valores propios de A sean distintos, es decir, mi = 1, entonces exp(At) = r(A) siendo

r un polinomio de grado menor o igual que n− 1 verificando adem´as r(λi) =

exp(λit) para i = 1, . . . , n.

3.2.

Soluci´

on de sistemas controlados

Consideremos el sistema controlado ˙

x = Ax + Bu , x(0) = x0, (3.20)

con A ∈ Mn(R), B ∈ Mn×m(R) matrices constantes, x(t) ∈ Rn y u(t)

Rm. Multiplicando por la izquierda ambos miembros de (3.20) por la matriz

exp(−At) se obtiene

exp(−At) ˙x − exp(−At)Ax = exp(−At)Bu .

Utilizando ahora que las matrices exp(−At) y A conmutan y teniendo en cuenta la propiedad (3.9), es decir,

d

dt[exp(−At)] = −A exp(−At) , se llega a que

d

dt[exp(−At)x] = exp(−At)Bu .

Integrando dicha ecuaci´on respecto de t y teniendo en cuenta (3.13) se tiene

x(t) = exp(At) x0+  t 0 exp(−Aτ)Bu(τ) dτ  . (3.21)

Si se utiliza la condici´on inicial x(t0) = x0, integrando entre t0y t se obtiene

x(t) = Φ(t, t0) x0+  t t0 Φ(t0, τ )Bu(τ ) dτ  . (3.22)

(23)

3.2.1.

Existencia y unicidad de la soluci´

on

Presentamos a continuaci´on un resultado sobre la existencia y unicidad del problema de Cauchy asociado a una sistema lineal controlado por un control continuo a trozos de gran utilidad en aplicaciones a la ingenier´ıa.

Definici´on 3. El control u(t) : [t0, t1]→ Rmes continuo a trozos en el intervalo [t0, t1] si existe una partici´on finita de dicho intervalo t0= s0< s1<· · · < sh=

t1, tal que la funci´on u(t) es continua en cada subintervalo abierto (si−1, si) para

i = 0, 1, . . . , h. Adem´as, para cada i, l´ımt→s+

i u(t) existe y es finito si i= h y

l´ımt→s

i u(t) existe y es finito si i= 0.

Definici´on 4. Una soluci´on del problema de Cauchy ˙x = Ax + Bu(t) con x(t0) = x0 y u(t) continua a trozos en el intervalo [t0, t1] es una funci´on x(t) : [t0, t1]→ Rn continua y con derivada continua en [t0, t1] excepto en los puntos de discontinuidad de u(t) que adem´as verifique ˙x = Ax + Bu(t) donde exista. Teorema 5. El problema de Cauchy ˙x = Ax + Bu(t) con x(t0) = x0y u(t) con-tinua a trozos en el intervalo [t0, t1] admite una ´unica soluci´on x(t) : [t0, t1] Rn que viene dada por (3.22).

3.3.

Relaci´

on entre espacio de estados y el

con-trol cl´

asico

Consideremos la ecuaci´on diferencial escalar lineal de orden n a coeficientes constantes que aparece en teor´ıa de control cl´asica

z(n)+ k1z(n−1)+· · · + knz = u(t) , (3.23)

siendo u(t)∈ R la variable de control. Realizando el cambio de variable w1= z , w2= ˙z , . . . , wn= z(n−1) , (3.24)

y teniendo en cuenta que ˙wi= wi+1 para i = 1, . . . , n− 1, la ecuaci´on (3.23) se

puede escribir de la forma can´onica controlable3 ˙ w = Cw + du , (3.25) donde w = (w1, . . . , wn)T, d = (0, . . . , 0, 1)T and C = ⎛ ⎜ ⎜ ⎜ ⎜ ⎝ 0 1 0 . . . 0 0 0 1 . . . . . . . . . . . . . . . . . . −kn −kn−1 −kn−2 . . . −k1 ⎞ ⎟ ⎟ ⎟ ⎟ ⎠∈ Mn(R) , (3.26)

3En el cap´ıtulo siguiente (ver Teorema 14) se entender´a mejor el nombre “can´onica con-trolable”.

(24)

es la llamada matriz “companion”. Observar que el polinomio caracter´ıstico k(λ) de C es

k(λ) = det(λIn− C) = λn+ k1λn−1+· · · + kn .

Notar que este polinomio caracter´ıstico es justo el denominador de la funci´on de transferencia que se obtiene si se aplican transformadas de Laplace a la ecuaci´on (3.23).

Hemos visto que la ecuaci´on escalar (3.23) se puede escribir en forma matri-cial con las variables de estado. Es natural preguntarse si el inverso es siempre posible, es decir, nos preguntamos si cualquier sistema lineal ˙x = Ax + bu(t) con u escalar se puede escribir en la forma cl´asica (3.23) mediante un cambio de variables lineal. La respuesta la contiene el siguiente resultado.

Teorema 6. El sistema lineal ˙x = Ax + bu con A∈ Mn(R) matriz constante,

b∈ Rn vector columna y u(t)∈ R puede ser transformado mediante un cambio lineal w = T x con T ∈ Mn(R) no singular en la forma can´onica controlable

(3.25) si y s´olo si

rang[b, Ab, A2b, . . . , An−1b] = n . (3.27)

Demostraci´on. Demostremos la suficiencia, es decir, supongamos que se ve-rifica (3.27) y veamos que existe la matriz T del enunciado.

Realizando el cambio de variables w = T x en el sistema ˙x = Ax + bu se obtiene el sistema transformado

˙

w = T AT−1w + T bu . (3.28)

Veamos que es posible construir la matriz T de modo que la ecuaci´on (3.28) sea (3.25). Impongamos la siguiente forma de dicha T

T = ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ξ ξA ξA2 .. . ξAn−1 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦∈ M n(R) , (3.29)

siendo ξ∈ Rnun vector fila tal que T sea no singular. De momento supondremos que tal ξ existe. Denotemos por si a la i-´esima columna de la matriz T−1, es

decir, sea T−1 = [s1, . . . , sn]. Consideremos la matriz

T AT−1= ⎛ ⎜ ⎜ ⎜ ⎝

ξAs1 ξAs2 · · · · ξAsn

ξA2s1 ξA2s2 · · · ξA2sn

..

. ... ... ... ... ξAns1 ξAns2 · · · ξAnsn

⎞ ⎟ ⎟ ⎟ ⎠ .

(25)

Comparando los coeficientes de esta matriz con los coeficientes que se obtienen de la identidad T T−1= In, es decir, ⎛ ⎜ ⎜ ⎜ ⎝ ξs1 ξs2 · · · · ξsn

ξAs1 ξAs2 · · · · ξAsn

..

. ... ... ... ...

ξAn−1s1 ξAn−1s2 · · · ξAn−1sn

⎞ ⎟ ⎟ ⎟ ⎠= In ,

se deduce que la i-´esima fila de la matriz T AT−1coincide con la i + 1-´esima fila de la matriz identidad In para i = 1, . . . , n− 1. Por lo tanto, la matriz T AT−1

coincide con la matriz companion C dada en (3.26) con ki=−ξAnsn−i+1.

Para que (3.28) coincida con (3.25) s´olo nos falta imponer que T b = d. Sustituyendo en esta igualdad la matriz (3.29) y teniendo en cuenta que d = (0, . . . , 0, 1)T se obtiene

ξb = 0 , ξAb = 0, . . . , ξAn−2b = 0 , ξAn−1b = 1 , (3.30) o, de forma equivalente,

ξ[b, Ab, . . . , An−1b] = dT . (3.31) Observar que esta ecuaci´on tiene una ´unica soluci´on ξ debido a la condici´on de rango m´aximo (3.27).

´

Unicamente falta por demostrar que la matriz T es, en efecto, no singular. Lo probaremos mostrando que sus filas son linealmente independientes. Realizamos por lo tanto la combinaci´on lineal de las filas de T siguiente

α1ξ + α2ξA +· · · + αnξAn−1= 0 ,

con ciertos escalares αi. Multiplicando esta combinaci´on lineal por la derecha

por b y usando (3.30) se tiene que αn= 0. De forma an´aloga, es decir,

multipli-cando por la derecha por Ab, luego A2b y as´ı sucesivamente y usando (3.30) se llega a que αn−1=· · · = α1= 0. En resumen, T es no singular.

Demostremos ahora la necesidad, es decir, supongamos que existe la matriz T no singular tal que el sistema (3.28) coincida con el sistema (3.25). En particular se tiene T b = d y T AT−1= C.

Definamos r = rang[b, Ab, A2b, . . . , An−1b]. Queremos llegar a ver que r = n. Puesto que T es no singular, es claro que r = rang[T b, T Ab, T A2b, . . . , T An−1b]. Reordenando se obtiene que r = rang[T b, (T AT−1)T b, . . . , (T AT−1)n−1T b]. Pero es claro que entonces r = rang[d, Cd, . . . , Cn−1d]. Teniendo en cuenta que C tiene la forma dada en (3.26) y que d = (0, . . . , 0, 1)T por definici´on, es f´acil comprobar que la matriz U = [d, Cd, . . . , Cn−1d] tiene forma triangular. M´as concretamente, si denotamos por uij a los elementos de la matriz U entonces

uij=



1 si i = j , 0 si i > j . En particular el rango r de U es m´aximo, o sea r = n.

(26)

Nota 7. Observar que la demostraci´on del Teorema 6 es constructiva en el sentido de que T se puede construir mediante (3.29) donde ξ es la soluci´on de (3.31).

3.4.

Problemas resueltos

1. Hallar la soluci´on general del sistema lineal  ˙ x ˙ y  =  0 1 −2 −3   x y 

utilizando diferentes m´etodos:

(i) Mediante la forma espectral de la soluci´on.

(ii) Calculando la matriz exponencial mediante la f´ormula de Sylvester. (iii) Calculando la matriz exponencial como un polinomio matricial

ade-cuado.

Soluci´on. (i) La forma espectral de la soluci´on general del sistema lineal ˙

z = Az viene dado por z(t) =

n



i=1

(viz(0)) exp(λit)wi ,

siendo λi y wi los valores y vectores propios asociados a la matriz A.

Adem´as, si W = col{w1, . . . , wn}, entonces W−1= fil{v1, . . . , vn}.

En nuestro caso se tiene A =  0 1 −2 −3  ,

de modo que, el polinomio caracter´ıstico k(λ) asociado a A es k(A) = det(λI2− A) = λ −1

2 λ− 3 

 = λ2− 3λ + 2 = (λ + 1)(λ + 2) .

Entonces, los valores propios (ra´ıces del polinomio caracter´ıstico) de A son λ1=−1 , λ2=−2 .

Los vectores propios wiverifican Awi= λiwio bien, de forma equivalente

(A− λiI2)wi= 0. Entonces se tiene

w1= (α1, β1) verifica el sistema lineal homog´eneo  1 1 −2 −2   α1 β1  =  0 0  ,

(27)

Sea w2= (α2, β2). Entonces se verifica el sistema lineal homog´eneo  2 1 −2 −1   α2 β2  =  0 0  ,

cuya soluci´on es 2α2+ β2= 0, de modo que, w2= (1,−2)T. Se tiene pues que

W =  1 1 −1 −2  , por lo tanto su matriz inversa es

W−1=  2 1 −1 −1  ,

de lo que v1 = (2, 1) y v2 = (−1, −1). Finalmente, aplicando la f´ormula de la soluci´on en forma espectral se obtiene

 x(t) y(t)  = v1  x(0) y(0)  exp(λ1t)w1+ v2  x(0) y(0)  exp(λ2t)w2 = (2, 1)  x(0) y(0)  exp(−t)  1 −1  + (−1, −1)  x(0) y(0)  exp(−2t)  1 −2  = 

[2x(0) + y(0)] exp(−t) − [x(0) + y(0)] exp(−2t) −[2x(0) + y(0)] exp(−t) + 2[x(0) + y(0)] exp(−2t)

 .

(ii) Como todos los valores propios λide A son distintos, se puede utilizar

la f´ormula de Sylvester (3.14) dada por exp(At) = n  k=1 Zkexp(λkt) , siendo Zk = n j=1 j=k A− λjIn λk− λj ,

matrices constantes que s´olo dependen de A y de sus valores propios λj.

En nuestro problema se tiene

exp(At) = Z1exp(−t) + Z2exp(−2t) , donde Z1 = A + 2I2 −1 + 2 =  2 1 −2 −1  , Z2 = A + I2 −2 + 1=  −1 −1 2 2  .

(28)

De este modo, la soluci´on general del sistema lineal es  x(t) y(t)  = exp(At)  x(0) y(0)  , siendo la matriz exponencial de A

exp(At) = exp(−t)  2 1 −2 −1  + exp(−2t)  −1 −1 2 2  .

(iii) Otro m´etodo alternativo para calcular la matriz exponencial de A cuando todos sus valores propios λi son diferentes viene dado (3.16), es

decir, puesto que A∈ M2(R) se tiene exp(At) = r(A)

con r(λ) un polinomio de grado menor o igual que 1 cuyos coeficientes son funciones del tiempo t obtenidos de la forma

r(λi) = exp(λit) , i = 1, 2 .

Sea r(λ) = r0(t) + r1(t)λ. Entonces, la anterior condici´on se escribe como r0(t)− r1(t) = exp(−t) , r0(t)− 2r1(t) = exp(−2t) ,

cuya soluci´on es

r0(t) = 2 exp(−t) − exp(−2t) , r1(t) = exp(−t) − exp(−2t) . En conclusi´on, la soluci´on general del sistema lineal es

 x(t) y(t)  = exp(At)  x(0) y(0)  , siendo la matriz exponencial de A

exp(At) = r0(t)I2+ r1(t)A = [2 exp(−t) − exp(−2t)]  1 0 0 1  + [exp(−t) − exp(−2t)]  0 1 −2 −3  .

2. Demostrar que L{exp(At)} = (sIn− A)−1, siendo A∈ Mn(R) y L{.} la

transformada de Laplace.

Soluci´on. Consideremos el problema de Cauchy ˙x = Ax, x(0) = x0. Tomando transformadas de LaplaceL{ ˙x} = L{Ax} y teniendo en cuenta la condici´on inicial x(0) = x0 se obtiene

(29)

de donde, despejando tenemos ¯

x(s) = (sIn− A)−1x0 .

Antitransformando en esta ecuaci´on se obtiene x(t) =L−1{(sIn− A)−1x0}

Comparando esta expresi´on con la soluci´on x(t) = exp(At)x0del problema de Cauchy ˙x = Ax, x(0) = x0 se concluye queL{exp(At)} = (sIn− A)−1

tal y como se quer´ıa probar.

3. Hallar la soluci´on del problema de Cauchy  ˙ x1 ˙ x2  =  0 1 −1 0   x1 x2  +  0 t  ,  x1(0) x2(0)  =  0 0  .

Soluci´on. El sistema del enunciado se puede escribir como ˙x = Ax + Bu, siendo x = (x1, x2)T ∈ R2, A =  0 1 −1 0  ,

y donde el t´ermino Bu se puede tomar de varias formas. Por ejemplo B =  0 1  ∈ R2 , u(t) = t∈ R .

Teniendo en cuenta (3.22), la soluci´on del problema de Cauchy ˙x = Ax + Bu con x(0) = x0es x(t) = Φ(t, 0) x0+  t 0 Φ(0, τ )Bu(τ ) dτ  ,

siendo Φ(t, 0) = exp(At) la matriz de transici´on de estados. Es f´acil com-probar que dicha matriz es una matriz de rotaci´on en el plano

Φ(t, 0) =  cos t sin t − sin t cos t  , siendo su inversa Φ(0, t) =  cos t sin t − sin t cos t −1 =  cos t − sin t sin t cos t  . Se tiene pues que

x(t) =  cos t sin t − sin t cos t   0 0  +  t 0  cos τ − sin τ sin τ cos τ   0 τ   , de modo que, tras finalizar todos los c´alculos involucrados se obtiene

x(t) =  t− sin t 1− cos t  .

(30)

4. Sea u(t) la fuerza total por unidad de masa que act´ua sobre una part´ıcula. Demostrar que la posici´on en funci´on del tiempo x(t) viene dada por

x(t) = x(0) + ˙x(0)t +  t

0

(t− τ)u(τ) dτ .

Soluci´on. La ecuaci´on del movimiento es, seg´un las leyes de la mec´anica cl´asica, ¨x = u(t). Pasando a las variables de estado o variables de fase y = ˙x se tiene

˙

x = y , ˙y = u(t) .

Podemos escribir este sistema en forma matricial como  ˙ x ˙ y  =  0 1 0 0   x y  +  0 1  u(t) ,

es decir, definiendo z = (x, y)T, se tiene ˙z = Az + bu, siendo

A =  0 1 0 0  , b =  0 1  .

La soluci´on z(t) viene expresada, seg´un (3.21), por

z(t) = exp(At) z0+  t 0 exp(−Aτ)bu(τ) dτ  , (3.32) siendo z(0) = z0.

Realizamos ahora un par´entesis para calcular la matriz exp(−Aτ). Un simple c´alculo por cualquiera de los m´etodos explicados en teor´ıa muestra que exp(At) = I2+ At =  1 t 0 1  . (3.33)

En realidad, en este caso particular es f´acil ver que A2 = O, es decir, la matriz A es nilpotente. Por lo tanto, la expresi´on dada de exp(At) se sigue de la propia definici´on de matriz exponencial (3.5) donde la serie es truncada y se convierte en polinomial, es decir,

exp(At) =  k=0 tk k!A k= I 2+ tA +t 2 2!A 2+· · · = I 2+ tA .

Introduciendo (3.33) en (3.32) y teniendo en cuenta las expresiones de A y b se tiene z(t) =  x(t) y(t)  =  1 t 0 1   x(0) y(0)  +  t 0  1 −τ 0 1   0 1  u(τ ) dτ  .

(31)

Finalmente, extrayendo de esta ecuaci´on la primera componente x(t) y recordando que y = ˙x se obtiene el resultado deseado

x(t) = x(0) + ˙x(0)t +  t

0

(t− τ)u(τ) dτ .

5. Averiguar si el sistema lineal  ˙ x1 ˙ x2  =  1 −3 4 2   x1 x2  +  1 1  u(t) ,

puede ser transformado en la forma can´onica controlable mediante un cam-bio lineal de coordenadas. Dar, si es posible, dicho camcam-bio y la forma can´onica controlable asociada al sistema.

Soluci´on. El sistema del enunciado se puede escribir en forma compacta

como ˙x = Ax + bu con las definiciones usuales, es decir, A =  1 −3 4 2  , b =  1 1  .

Puesto que A ∈ M2(R), recordemos que, la forma can´onica controlable (3.25) dada por ˙w = Cw + du con w∈ R2, d = (0, 1)T y C ∈ M2(R) la matriz “companion”, no es m´as que la expresi´on de un sistema lineal que provenga mediante el cambio usual de una ecuaci´on diferencial escalar de segundo orden a coeficientes constantes (3.23), es decir, ¨z + k1z + k˙ 2z = u(t).

Sabemos, por el Teorema 6, que existir´a un cambio de variables lineal w = T x con T ∈ M2(R) no singular que transformar´a el sistema dado en el enunciado a la forma can´onica controlable si y s´olo si rang[b, Ab] = 2. En nuestro problema se tiene

[b, Ab] =  1 −2 1 6  , de modo que se verifica rang[b, Ab] = 2.

Una vez se sabe que existe la transformaci´on lineal w = T x, s´olo falta hallar la matriz T ∈ M2(R). Para ello recordemos la Nota 7, es decir, T se puede construir mediante (3.29) donde ξ es la soluci´on de (3.31). En otras palabras, T = ξ ξA  ∈ M2(R) , donde ξ verifica ξ[b, Ab] = dT .

(32)

En nuestro problema, despejando ξ de la anterior ecuaci´on se tiene ξ = dT[b, Ab]−1= (0, 1)  1 −2 1 6 −1 = 1 8(0, 1)  6 2 −1 1  =1 8(−1, 1) . Finalmente, se tiene T = ξ ξA  =1 8  −1 1 3 5  .

Sabemos que, ver (3.28), realizando el cambio de variables w = T x en el sistema ˙x = Ax + bu se obtiene el sistema transformado

˙

w = T AT−1w + T bu ,

con C = T AT−1 y T b = d = (0, 1)T. Desarrollando se tiene  ˙ w1 ˙ w2  =  0 1 −14 3   w1 w2  +  0 1  u(t) ,

que, obviamente, corresponde a una ecuaci´on escalar de segundo orden del control cl´asico. M´as concretamente, definiendo z = w1 = 1/8(−x1+ x2) se concluye que

¨

(33)

Sistemas de Control Lineal

4.1.

Introducci´

on

En este cap´ıtulo abordaremos algunos de los problemas propios del control. Consideremos el sistema lineal controlado

˙

x = Ax + Bu , (4.1)

con A∈ Mn(R) y B ∈ Mn×m(R) matrices constantes, x(t) ∈ Rn y u(t)∈ Rm.

4.2.

Controlabilidad

Definici´on 8. El sistema (4.1) se dice que es completamente controlable si, para cualquier t0, cualquier estado inicial x(t0) = x0y cualquier estado final xf,

existe un tiempo finito t1con t1> t0 y un control u(t) definido para t0≤ t ≤ t1 tal que x(t1) = xf.

El t´ermino “completamente”significa que la anterior definici´on se satisface “para todo”x0 y xf.

Nota 9. Es habitual suponer que el control u(t) es cotinuo a trozos, es decir, continuo excepto en un n´umero finito de tiempos del intervalo [t0, t1].

Nota10. En la Definici´on 8 se puede tomar el estado final xf= 0 sin p´erdida de generalidad. Adem´as, puesto que A y B son matrices constantes (no dependen del tiempo) tambi´en se puede elegir el origen de tiempos de modo que t0= 0.

La Nota 10 es debida a que, la soluci´on x(t) de (4.1) viene dada por (3.22), es decir, x(t) = Φ(t, t0) x0+  t t0 Φ(t0, τ )Bu(τ ) dτ  . De este modo se tiene

xf = Φ(t1, t0) x0+  t1 t0 Φ(t0, τ )Bu(τ ) dτ  , 23

(34)

que, reagrupando t´erminos, se puede escribir como 0 = Φ(t1, t0) {x0− Φ(t0, t1)xf} +  t1 t0 Φ(t0, τ )Bu(τ ) dτ  ,

puesto que la matriz Φ(t1, t0) es no singular, siendo su inversa Φ(t0, t1). Por lo tanto se observa que, si el control u(t) transfiere el estado inicial x0en el estado final xf, entonces tambien transfiere el estado x0− Φ(t0, t1)xf al origen en el

mismo tiempo t1− t0.

El siguiente resultado muestra un criterio algebraico que caracteriza a los sistemas lineales (4.1) completamente controlables.

Teorema 11. El sistema ˙x = Ax + Bu dado en (4.1) es completamente con-trolable si y s´olo si la matriz de controlabilidad

U = [B, AB, A2B, . . . , An−1B]∈ Mn×nm(R) (4.2) tiene rango m´aximo, es decir, rangU = n.

Demostraci´on. Probemos en primer lugar la necesidad. Suponemos pues que el sistema (4.1) es completamente controlable (asumiendo t0 = 0 y xf = 0

debido a la Nota 10) y queremos ver entonces que rangU = n. Utilizaremos una demostraci´on por reducci´on al absurdo, es decir, supondremos que rangU < n y llegaremos a una contradicci´on.

Si rangU < n entonces existe una combinaci´on lineal de filas de U que da el vector fila nulo. Dicho de otro modo, existe un vector fila q∈ Rn con q= 0 tal que

qB = 0 , qAB = 0 , . . . , qAn−1B = 0 . (4.3) Utilizando la soluci´on (3.21) del sistema (4.1) con las condiciones x(0) = x0 se tiene x(t) = exp(At) x0+  t 0 exp(−Aτ)Bu(τ) dτ  , de modo que, tomando t = t1 con x(t1) = 0 se obtiene

−x0=

 t1

0

exp(−Aτ)Bu(τ) dτ .

Teniendo en cuenta que exp(−At) = r(A) con r un polinomio de grado menor o igual que n− 1, la anterior ecuaci´on queda de la forma

−x0=

 t1

0

(r0(τ )In+ r1(τ )A +· · · + rn−1(τ )An−1)Bu(τ ) dτ ,

siendo ri(t) ∈ R los coeficientes del polinomio r. Multiplicando esta ecuaci´on

por la izquierda por el vector fila q y utilizando (4.3) se llega a que qx0 = 0. Como el sistema (4.1) es completamente controlable, el desarrollo efectuado an-teriormente sirve para cualquier x0. Entonces la condici´on qx0= 0 implica q = 0

(35)

en contradicci´on con la hip´otesis inicial rangU < n.

Probemos en segundo lugar la suficiencia. Para ello supondremos que rangU = n y hemos de demostrar que el sistema (4.1) es completamente controlable, es decir, que existe una funci´on de control u(t) definida en el intervalo de tiempo 0≤ t ≤ t1 tal que x(t1) = 0.

Consideremos la siguiente matriz cuadrada M =

 t1

0

exp(−Aτ)BBTexp(−ATτ ) dτ ∈ Mn(R) . (4.4)

Es obvio que M es una matriz constante. Adem´as M es sim´etrica puesto que

MT =

 t1

0

exp(−Aτ)BBTexp(−ATτ ) dτ T

=  t1

0



exp(−Aτ)BBTexp(−ATτ )T =

 t1

0

[exp(−ATτ )]TBBT[exp(−Aτ)]T =

 t1

0

exp(−Aτ)BBTexp(−ATτ ) dτ = M .

Vamos a probar que M es no singular demostrando que es, en realidad, una matriz definida positiva. Sea α∈ Rnun vector columna arbitrario y definamos el vector fila β(τ ) = αTexp(−Aτ)B. Asociamos a M la siguiente forma cuadr´atica

αTM α =  t1 0 β(τ )βT(τ ) dτ =  t1 0 β(τ) 2 ≥ 0 , (4.5)

de modo que M es semidefinida positiva. Vamos a ver a continuaci´on que M es no singular por reducci´on al absurdo. Se sabe que M es singular si y s´olo si existe un vector columna, ˜α= 0 tal que ˜αTM ˜α = 0. Esto implica, teniendo en cuenta (4.5), que ˜β(τ ) = ˜αTexp(−Aτ)B ≡ 0 para todo 0 ≤ τ ≤ t1. Utilizando la definici´on de matriz exponencial, la anterior condici´on se escribe como

˜ αT  In− τA + τ 2 2!A 2+· · ·B≡ 0 , 0 ≤ τ ≤ t 1 .

Ello es equivalente a imponer que ˜

αTB = 0 , ˜αTAB = 0 , ˜αTA2B = 0, . . . ,

de manera que ˜αTU = 0 siendo U la matriz de controlabilidad (4.2). Pero, como por hip´otesis U tiene rango m´aximo, es decir rango n, es imposible que existe un vector ˜α= 0 verificando ˜αTU = 0.

Hemos llegado pues a una contradicci´on y por lo tanto M es no singular. Entonces es posible tomar el siguiente control

(36)

Sustituyendo este control en la soluci´on (3.21) dada por x(t) = exp(At) x0+  t 0 exp(−Aτ)Bu(τ) dτ  , del sistema (4.1) se tiene

x(t1) = exp(At1)

x0  t1

0

exp(−Aτ)BBTexp(−ATτ )M−1x0  = exp(At1)x0− MM−1x0= 0 ,

donde en el segundo paso se ha utilizado (4.4).

Nota12. Debido al Teorema 11, es habitual hablar de la controlabilidad del par [A, B] en lugar del sistema ˙x = Ax + Bu.

Corolario 13. Si rangB = r entonces la condici´on (4.2) del Teorema 11 se reduce a la siguiente restricci´on

rang[B, AB, A2B, . . . , An−rB] = n .

Demostraci´on. Definimos las siguientes matrices

Uk= [B, AB, A2B, . . . , AkB] , k = 0, 1, 2, . . .

Observar que, si rangU = rangU+1, entonces todas las columnas de la

ma-triz A+1B son linealmente dependientes con respecto a las columnas de U.

Adem´as, en este caso, se verificar´a tambi´en que todoas las columnas de A+2B, A+3B, . . ., son tambi´en linealmente dependientes con respecto a las columnas de U. Se tiene pues que rangU= rangU+1= rangU+2=· · · .

De este modo se ve que el rango de Uk aumenta al menos en 1 cuando ¿k

aumenta en 1 hasta que el m´aximo rango de Uk se alcanza para k = . Como

rangU0= rangB = r y adem´as rangUk ≤ n se tiene que r +  ≤ n y por lo tanto

≤ n − r.

El siguiente resultado relaciona el sistema de control cl´asico (3.25) con el concepto de controlabilidad.

Teorema 14. El sistema lineal ˙x = Ax + bu con A∈ Mn(R) matriz constante,

b∈ Rn vector columna y u(t)∈ R puede ser transformado mediante un cambio lineal en la forma can´onica controlable (3.25) si y s´olo si es completamente controlable.

Demostraci´on. Como b ∈ Rn es un vector columna, es decir, estamos en el caso m = 1, la matriz B reduce al vector b. Entonces, la condici´on (4.2) del Teorema 11 es exactamente igual a la condici´on (3.27) del Teorema 6. El teorema se demustra pues teniendo en cuenta el Teorema 11 y el Teorema 6.

(37)

Nota 15. Debido al Teorema 14, el sistema cl´asico (3.25) se suele decir que est´a en la forma can´onica controlable.

Observemos que el Teorema 11 es puramente existencial, es decir, a partir de ´el se sabe que existe un vector control u(t) de modo que el sistema es com-pletamente controlable. Sin embargo no determina cual es dicho control. Para responder a esta pregunta se dispone del siguiente resultado.

Teorema 16. El sistema ˙x = Ax + Bu es completamente controlable si y s´olo si la matriz de controlabilidad sim´etrica

U (t0, t1) =  t1

t0

Φ(t0, τ )BBTΦT(t0, τ ) dτ ∈ Mn(R) (4.7)

es no singular, siendo Φ la matriz de transici´on de estados definida en (3.8). Adem´as, en este caso el control u(t) definido para t0 ≤ t ≤ t1 que transfiere el estado x(t0) = x0 al estado x(t1) = xf viene dado por

u(t) =−BTΦT(t0, t)U−1(t0, t1)[x0− Φ(t0, t1)xf] . (4.8)

Demostraci´on. Demostremos en primer lugar la suficiencia. Asumimos pues que U es no singular, de modo que el control dado por (4.8) existe. S´olo falta por ver que, aplicando dicho control, se obtiene x(t1) = xf. Para ello, recordemos

que la soluci´on (3.22) del sistema ˙x = Ax+Bu con la condici´on inicial x(t0) = x0 viene dada por

x(t) = Φ(t, t0) x0+  t t0 Φ(t0, τ )Bu(τ ) dτ  . (4.9)

Se tiene pues, sustituyendo el control u(t) dado en (4.8), que

x(t1) = Φ(t1, t0) x0+ t t0 Φ(t0, τ)B −BTΦT(t0, τ)U−1(t0, t1)[x0− Φ(t0, t1)xf] dτ = Φ(t1, t0) x0 t1 t0 Φ(t0, τ)BBTΦ(t0, τ) dτ U−1(t0, t1)(x0− Φ(t0, t1)xf) = xf ,

como se quer´ıa ver. Hemos tenido en cuenta que Φ(t1, t0)Φ(t0, t1) = In y que

adem´as, la expresi´on encerrada entre llaves{.} es justo la definici´on de U(t0, t1). Demostremos ahora la necesidad. Hemos de probar que, si el sistema ˙x = Ax + Bu es completamente controlable, entonces U (t0, t1) es no singular.

Como U (t0, t1) es una matriz sim´etrica, tomando un vector columna arbi-trario α∈ Rn podemos construir la forma cuadr´atica

αTU (t0, t1)α =  t1 t0 βT(τ, t0)β(τ, t0) dτ =  t1 t0 β(τ, t0)2 ≥ 0 , (4.10)    

(38)

donde se ha definido el vector columna β(τ, t0) = BTΦT(t0, τ )α∈ Rn. Se tiene pues que U (t0, t1) es una matriz semidefinida positiva.

Veamos por reducci´on al absurdo que, en realidad, U (t0, t1) es una matriz definida positiva y por lo tanto no singular. Supongamos pues que entonces que existe un vector ˆα= 0 tal que ˆαTU (t0, t1) ˆα = 0. Teniendo en cuenta (4.10) con α = ˆα se tiene que

 t1

t0

 ˆβ(τ, t0)2 dτ = 0

donde ˆβ(τ, t0) = BTΦT(t0, τ ) ˆα∈ Rn. Por lo tanto, por las propiedades de la norma, concluimos que ˆβ(τ, t0)≡ 0 para t0≤ τ ≤ t1.

Sin embargo, puesto que por hip´otesis el sistema ˙x = Ax + Bu es completa-mente controlable, se sabe que existe un vector control ˆu(t)∈ Rn de modo que x(t1) = 0 cuando x(t0) = ˆα. Entonces, utilizando (4.9) con la condici´on inicial x(t0) = ˆα y la final x(t1) = 0 se tiene ˆ α =−  t1 t0 Φ(t0, τ )B ˆu(τ ) dτ . De este modo ˆα2= ˆαTα =ˆ  t1 t0 ˆ uT(τ )BTΦ(t0, τ )Tα dτ =ˆ  t1 t0 ˆ uT(τ ) ˆβ(τ, t0) dτ = 0 ,

contradiciendo la hip´otesis ˆα= 0.

Es importante observar que pueden haber, en general, otros controles u(t) diferentes del control (4.8) que transfieran el estado x(t0) = x0al estado x(t1) = xf. Sin embargo veremos a continuaci´on que el control (4.8) tiene una propiedad

especial que le confiere optimabilidad respecto del resto de posibles controles.

Teorema 17. Consideremos el sistema ˙x = Ax+Bu. Sea ˆu(t) un vector control que lleva el estado inicial x(t0) = x0 al estado final x(t1) = xf verificando

ˆ

u(t)≡ u(t) para t0≤ t ≤ t1, donde u(τ ) es el control (4.8). Entonces  t1

t0

ˆu(τ)2 dτ > t1

t0

u(τ)2 dτ .

Demostraci´on. Puesto que ambos controles u(t) y ˆu(t) transfieren el estado inicial x(t0) = x0al estado final x(t1) = xf, deben verificar, seg´un (3.22),

xf = Φ(t1, t0) x0+  t1 t0 Φ(t0, τ )B ˆu(τ ) dτ  , xf = Φ(t1, t0) x0+  t1 t0 Φ(t0, τ )Bu(τ ) dτ  .

(39)

Restando estas expresiones se obtiene 0 =

 t1 t0

Φ(t0, τ )B[ˆu(τ )− u(τ)] dτ . Multiplicando esta ecuaci´on por la izquierda por

[x0− Φ(t0, t1)xf]T[U−1(t0, t1)]T , se llega a 0 =  t1 t0  [x0− Φ(t0, t1)xf]T[U−1(t0, t1)]TΦ(t0, τ )B[ˆu(τ )− u(τ)] dτ .

Teniendo en cuenta que u(τ ) es el control (4.8), es claro que la expresi´on dentro de las llaves{.} es justo −uT(τ ) de modo que

0 =  t1

t0

uT(τ )[ˆu(τ )− u(τ)] dτ . (4.11) Por otra parte, utilizando las propiedades del producto escalar y de la norma se tiene que (u− ˆu)T(u− ˆu) = u2+ˆu2− 2uTu. Entonces,ˆ

 t1 t0

u(τ) − ˆu(τ)2 =  t1

t0

[(u(τ )− ˆu(τ))T(u(τ )− ˆu(τ))T] dτ =

 t1 t0

[u(τ)2+ˆu(τ)2− 2uT(τ )ˆu(τ )] dτ =

 t1

t0

[ˆu(τ)2− u(τ)2] dτ ,

donde, en el ´ultimo paso, se ha utilizado (4.11). De aqu´ı, finalmente obtenemos  t1

t0

ˆu(τ)2 dτ = t1

t0

[u(τ)2+u(τ) − ˆu(τ)2] dτ >  t1

t0

u(τ)2

como se quer´ıa probar. Observar que en la ´ultima desigualdad se ha utilizado que u(t)≡ ˆu(t) en el intervalo t0≤ t ≤ t1.

Nota18. Dado un control u(t), en muchas aplicaciones f´ısicas se interpreta la integraltt1

0 u(τ)

2 dτ como la energ´ıa o bien el consumo necesario para llevar

el sistema desde el estado inicial x(t0) = x0 al estado final x(t1) = xf. De este

modo, el Teorema 17 se interpreta de manera que, de todos los posibles controles ˆ

u(t) admisibles, el que minimiza la energ´ıa o el consumo es justo el control u(t) dado por (4.8).

Si el sistema lineal ˙x = Ax + Bu no es completamente controlable, no es una buena terminolog´ıa llamarle incontrolable. Ello es bebido a que cuando no se verifica la Definici´on 8 de sistema completamente controlable s´olo significa

(40)

que hay ciertos estados finales xf que no pueden ser alcanzados con ning´un

control. Para caracterizar si un estado final xf es alcanzable con alg´un control,

independientemente de si el sistema es completamente controlable o no y adem´as conocer qu´e control u(t) es admisible se tiene el siguiente resultado.

Teorema 19. Si, para un cierto estado final xf, existe un vector columna

cons-tante ξ∈ Rn tal que

U (t0, t1)ξ = x0− Φ(t0, t1)xf , (4.12)

entonces el control

u(t) =−BTΦ(t0, t)ξ , (4.13)

transfiere el sistema ˙x = Ax + Bu desde el estado inicial x(t0) = x0 al estado final x(t1) = xf.

Demostraci´on. La soluci´on del sistema ˙x = Ax + Bu con la condici´on inicial x(t0) = x0viene dada por (3.22), es decir,

x(t) = Φ(t, t0) x0+  t t0 Φ(t0, τ )Bu(τ ) dτ  .

Sustitutendo en esta expresi´on el control u(t) dado en (4.13) y evaluando para t = t1se obtiene x(t1) = Φ(t1, t0) x0  t1 t0 Φ(t0, τ )BBTΦ(t0, τ )ξ dτ  .

Teniendo en cuenta, seg´un (4.7), la expresi´on de la matriz de controlabilidad U (t0, t1), la anterior ecuaci´on se reescribe como

x(t1) = Φ(t1, t0) [x0− U(t0, t1)ξ] . Imponiendo ahora la condici´on (4.12) se obtiene

x(t1) = Φ(t1, t0)Φ(t0, t1)xf = xf ,

como se quer´ıa probar.

Nota20. Si el sistema ˙x = Ax+Bu es completamente controlable, entonces, por el Teorema 4.8, la matriz de controlabilidad U (t0, t1) es invertible y la expresi´on dada en (4.13) para el control u(t) reduce a la expresi´on (4.8).

Nota 21. Se puede demostrar, ver por ejemplo la p´agina 77 de [2], que el rec´ıproco del Teorema 19 es cierto. De este modo, s´olo los estados finales xf

para los cuales (4.12) se verifique pueden ser alcanzados con alg´un control. Existe otra forma an´aloga al Teorema 19 demostrada en la p´agina 167 de [11] que es la siguiente.

Teorema 22. Un cierto estado inicial x(t0) = x0 se puede transferir al estado final xf si ambos vectores x0y xf pertenecen al subespacio vectorial engendrado

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Esto viene a corroborar el hecho de que perviva aún hoy en el leonés occidental este diptongo, apesardel gran empuje sufrido porparte de /ue/ que empezó a desplazar a /uo/ a

Por PEDRO A. EUROPEIZACIÓN DEL DERECHO PRIVADO. Re- laciones entre el Derecho privado y el ordenamiento comunitario. Ca- racterización del Derecho privado comunitario. A) Mecanismos

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación