Departamento Acad´emico de Ingenier´ıa Aplicada
CONTROL MODERNO Y ´
OPTIMO (MT 227C)
Clase 10-02 Elizabeth Villota Cerna
Semestre2009 II - UNI 13/11/2009
4.
Problema del Regulador Cuadr´
atico Lineal - Horizonte Infinito
Consideremos ahora el problema LQR: para un sistema lineal invariante en el tiempo ˙x(t) = Ax(t) + Bu(t), x(to) = xo,
y = Cx(t) (1)
y el ´ındice de desempe˜no asociado
J(x) = Z ∞
0
(xTQx + uTRu)dt, donde Q = QT
≥ 0 es una matriz sim´etrica semidefinida positiva y R = RT > 0 es una matriz sim´etrica
y definida positiva. Nuestro objetivo es construir un controlador lineal por realimentaci´on de estados de la forma u = −Kx que estabiliza al sistema y minimiza el ´ındice de desempe˜no J(x). Denotamos a dicha ley de control lineal como u∗
.
Primero, asumimos que el controlador lineal por realimentaci´on de estados ´optimo existe tal que el sistema en lazo cerrado ´optimo
˙x = (A − BK)x
es asint´oticamente estable. Esta suposici´on implica que existe una funci´on de Lyapunov V = xTP x para el
sistema en lazo cerrado; esto es, para alguna matriz definida positiva P la derivada en funci´on del tiempo
dV
dt evaluada en las trayectorias del sistema en lazo cerrado es definida negativa.
Teorema 1.Si el controlador por realimentaci´on de estados u∗
= −Kx es tal que minu dV dt + x TQx + uTRu = 0, (2)
para alg´un V = xTP x, entonces el controlador es ´optimo. ⋄
Demostraci´onPodemos escribir la condici´on del teorema como dV dt u=u∗ + xTQx + u∗TRu∗ = 0. Luego, dV dt u=u∗ = −x T Qx − u∗TRu∗ .
Integrando ambos lados de la ecuaci´on resultante con respecto al tiempo desde 0 hasta ∞, obtenemos V (x(∞)) − V (x(0) = −
Z ∞ 0
(xTQx + u∗TRu∗
)dt.
Debido a la suposici´on de que el sistema en lazo cerrado es asint´oticamente estable, x(∞) = 0, y luego V (x(0) = xT oP xo= Z ∞ 0 (xTQx + u∗TRu∗ )dt.
Entonces, hemos demostrado que si un controlador lineal por realimentaci´on de estados satisface la suposici´on del teorema, entonces el valor del ´ındice de desempe˜no para tal controlador es
J(u∗
) = xT oP xo.
Para demostrar que tal controlador es de hecho ´optimo, usamos una prueba por contradicci´on. Asumimos que (2) se cumple y que u∗
no es ´optima. Sup´ongase que ˜u resulta en un menor valor de J, esto es, J(˜u) < J(u∗ ). De (2) tenemos que dV dt u=˜u + xTQx + ˜uTR˜ u ≥ 0, esto es, dV dt u=˜u≥ −x T Qx − ˜uTR˜u. Integrando la expresi´on arriba con respecto al tiempo de 0 a ∞ resulta
V (x(0)) ≤ Z ∞
0
(xTQx + ˜uTRu)dt
lo que implica que
J(u∗
) ≤ J(˜u),
lo que es una contradicci´on, y la demostraci´on ha sido completada. ⋄
4.1.
Ecuaci´
on de Riccati Algebraica (ARE, por sus siglas en ingl´
es)
Del teorema 1 se deduce que la s´ıntesis de la ley de control ´optima est´a relacionada con encontrar una funci´on de Lyapunov apropiada, o equivalentemente, la matriz P . La matriz P apropiada es encontrada minimizando
H(u) = dV dt + x
TQx + uTRu. (3)
Primero aplicamos a (3) la condici´on necesaria para minimizaci´on sin restricciones, ∂ ∂u dV dt + x TQx + uTRu u=u∗ = 0. Luego la expresi´on arriba se torna
∂ ∂u dV dt + x TQx + uTRu = ∂ ∂u 2x TP ˙x + xTQx + uTRu = ∂ ∂u 2x T P Ax + 2xTP Bu + xTQx + uTRu = 2xTP B + 2uTR = 0 .
Entonces, el candidato para la ley de control ´optimo tiene la forma u∗ = −R−1 BTP x, (4) donde K = R−1 BTP . N´otese que: ∂2 ∂u2 dV dt + x TQx + uTRu = ∂ 2 ∂u2 2x TP Ax + 2xTP Bu + xTQx + uTRu = ∂ ∂u 2x T P B + 2uTR = 2R > 0 .
Entonces la condici´on suficiente de segunda orden para que u∗
minimice (2) es satisfecha. Ahora concentramos nuestra atenci´on en encontrar una matriz P apropiada.
4.1.1. S´ıntesis de la ley de control ´optima: c´alculo de la matriz P El sistema en lazo cerrado ´optimo tiene la forma
˙x = (A − BR−1
BTP )x, x(0) = xo.
Nuestro controlador ´optimo satisface la ecuaci´on dV dt u=u∗ + xTQx + u∗TRu∗ = 0, esto es, 2xTP Ax + 2xTP Bu∗ + xTQx + u∗TRu∗ = 0. Substituyendo la expresi´on para u∗
, dada por (4), en la expresi´on de arriba se obtiene xT(ATP + P A)x − 2xTP BR−1 BTP x + xTQx + xTP BR−1 BTP x = 0. Factorizando x resulta xT(AT P + P A + Q − P BR−1 BTP )x = 0.
La ecuaci´on como mostrada se debe cumplir para cualquier x. Para que esto sea cierto debemos tener que ATP + P A + Q − P BR−1
BTP = 0. (5)
Esta ecuaci´on es conocida como la ecuaci´on de Riccati algebraica.
En conclusi´on, la s´ıntesis del controlador lineal por realimentaci´on de estados ´optimo minimiza el ´ındice de desempe˜no J = Z ∞ 0 (xTQx + uTRu)dt sujeto a ˙x = Ax + Bu, x(0) = xo
requiere que se resuelva la ecuaci´on de Riccati algebraica dada por (5).
4.1.2. Ejemplo
Considere el siguiente modelo de un sistema din´amico:
˙x = 2u1+ 2u2, x(0) = 3,
asi como el ´ındice de desempe˜no asociado J = Z ∞ 0 (x2 + ru2 1+ ru 2 2)dt,
donde r > 0 es un par´ametro.
1. Primero encontramos las soluci´on de ARE correspondiente al controlador lineal por realimentaci´on de estados ´optimo. Tenemos
A = 0, B =
2 2 , Q = 1, R = rI2.
La ARE para este problema es 0 = AT P + P A + Q − P BR−1 BT P = 1 −8rp2 , cuya soluci´on es p =r r 8.
2. Ahora escribimos el sistema en lazo cerrado que se obtiene usando el controlador ´optimo. El controlador ´optimo tienen la forma
u = −R−1 BT P x = −√1 2r 1 1 x. Entonces, el sistema en lazo cerrado ´optimo es descrito por
˙x =
2 2 u = −√4 2rx.
3. Finalmente, encontramos el valor de J para el sistema en lazo cerrado ´optimo. Tenemos que J = x(0)TP x(0) = 9
2 r r
2.
4.2.
Resolviendo la ARE usando el M´
etodo del Autovector
A continuaci´on presentamos un m´etodo para resolver la ARE referido como el m´etodo del autovector. Comenzamos representando la ARE de la forma
P −In A −BR−1 BT −Q −AT In P = 0. (6)
La matriz 2n × 2n en la mitad es denominada de matriz Hamiltoniana. usamos el s´ımbolo H para denotar a la matriz Hamiltoniana, esto es,
H = A −BR−1 BT −Q −AT . Entonces, la ARE puede ser representada como
P −In H In P = 0 Si premultiplicamos la ecuaci´on arriba por X−1
y luego postmultiplicamos esta por X, donde X es una matriz no singular n × n, X−1 P −X−1 H X P X = 0. (7)
Observese que si pudieramos encontrar matrices X y P X tal que H X P X = X P X Λ, luego la ecuaci´on (7) resulta en
X−1 P −X−1 X P X Λ = 0.
Luego hemos reducido el problema de resolver la ARE a aquel en el que construimos matrices X y P X apropiadas. Continuando, sea vi el autovector de H y sea si el autovalor correspondiente; entonces
Hvi= sivi.
Si asumimos que H tiene al menos n autovalores reales distintos entre sus 2n autovalores. (Los resultados obtenidos pueden ser generalizados para el cado cuando los autovalores de H son complejos o iguales.) Entonces, podemos escribir
H v1 v2 ... vn = v1 v2 ... vn s1 0 ... 0 0 s2 ... 0 .. . ... ... 0 0 ... sn . Sea X P X = v1 v2 ... vn
y Λ = s1 0 ... 0 0 s2 ... 0 .. . ... ... 0 0 ... sn .
La selecci´on de X y P X constituye una posible soluci´on de la ecuaci´on X−1 P −X−1 X P X Λ = 0.
Para construir P , particionamos la matriz de autovectores
v1 v2 ... vn de orden 2n × n en dos
submatrices de orden n × n como sigue v1 v2 ... vn = W Z . Luego, X P X = W Z .
Tomando X = W y P X = Z y asumiendo que W es invertible, obtenemos P = ZW−1
. (8)
Ahora tenemos que elegir que conjunto de n autovalores elegir, dentro de todos los autovalores de H, para poder contruir P . En el caso en que los 2n autovalores de H son diferentes, el n´umero de matrices P generadas con el m´etodo descrito arriba son
(2n)! (n!)2.
Sea Q = CTC una factorizaci´on de rango completo de Q. Del Teorema 3 de Kucera (ver referencias al
final) se concluye que la matriz Hamiltoniana H tiene n autovalores en el semiplano complejo izquierdo y n en el semiplano complejo derecho si y s´olo si el sistema como definido en (1) es estabilizable y detectable. La matriz P que nosotros buscamos corresponde a los autovalores asint´oticamente estables de H. Con P construido como deseado, tenemos el siguiente resultado.
Teorema 2.Los polos del sistema en lazo cerrado ˙x(t) = (A − BR−1
BTP )x(t)
son aquellos autovalores de H que tienen parte real negativa. ⋄
Demostraci´onSiendo que
v1 v2 ... vn = W Z , podemos escribir A −BR−1 BT −Q −AT W Z = W Z Λ. Realizando las multiplicaciones apropiadas de bloques de matrices n × n resulta
AW − BR−1 BTZ = W Λ, o A − BR−1 BTZW−1 = A − BR−1 BTP = W ΛW−1 , dado que P = ZW−1 . Entonces, la matriz A − BR−1
BTP es similar a la matriz Λ cuyos autovalores son
4.2.1. Ejemplo 1
Considere el siguiente modelo de un sistema din´amico ˙x = 2x + u, asi como el ´ındice de desempe˜no asociado
J = Z ∞ 0 (x2 + ru2 )dt.
Encuentre el valor de r tal que el sistema en lazo cerrado ´optimo tenga un polo en −3.
1. Formamos la matriz Hamiltoniana asociada H = A −BR−1 BT −Q −AT = 2 −1 r −1 −2 . 2. La ecuaci´on caracter´ıstica de H es det(sI2− H) = s 2 − 4 −1r = 0. Luego, r = 1 5
resulta en el sistema en lazo cerrado ´optimo teniendo su polo localizado en −3.
4.3.
Ejemplo 2
Considere un modelo simple de un robot manipulador como mostrado en la Fig. 1. El movimiento del brazo del robot es controlado por un motor DC a trav´es de un engranaje. El motor DC es controlado por armadura y su figura esquem´atica es presentada en la Fig. 2. Asumimos que el momento de inercia del motor es despreciable en comparaci´on con el del brazo del robot. Modelamos el brazo como una masa puntual m ubicada en el extremo final de la barra (sin masa) de longitud l. Entonces el momento de inercia del brazo Ib = ml2. Asumimos que el tren de engranajes no tiene juego, y que todos los ejes conectores son r´ıgidos.
Como podemos ver de la Fig. 1, la rotaci´on del brazo en sentido contrario a las agujas del reloj es definida como positiva, y la rotaci´on siguiendo las agujas del reloj es considerada como negativa; mientras que la rotaci´on del eje del motor en sentido contrario a las agujas del reloj es definida como negativa, y la rotaci´on del eje siguiendo las agujas del reloj es definida como positiva. El torque entregado por el motor es
Tm= Kmia,
donde Km es la constante del torque del motor, y ia es la corriente de armadura. Sea N la raz´on de los
engranajes. Luego tenemos: θp
θm
= radio del engranaje del motor radio del engranaje del brazo =
n´umero de dientes del engranaje del motor n´umero de dientes del engranaje del brazo =
1 N.
Esto ocurre puesto que los engranajes estan en contacto y luego
θp× radio del engranaje del brazo = θm× radio del engranaje del motor,
y los radios de los engranajes son proporcionales a sus n´umeros de dientes. El trabajo realizado por cada engranaje debe ser igual. Sea Tp que denota el torque aplicado al brazo del robot. Entonces,
Tpθp= Tmθm.
Entonces, el torque aplicado al p´endulo es
Gear 1: N
Massless rod of length l
p
Mass m
DC motor
Control voltage
⫹ u ⫺
Figura 1: Robot manipulador controlador por un motor DC via un engranaje.
Ra La if⫽ constant eb⫽ back emf m⫽ motor shaft position Field circuit Armature circuit ⫹ ⫺ ⫹ u ⫺ ia
Figura 2: Figura esquem´atica de un motor DC controlado por armadura.
Usando la segunda Ley de Newton para escribir la ecuaci´on que modela la din´amica del brazo, Ib
d2
θp
dt2 = mgl sin θp+ Tp. (9)
Sustituyendo en (9) las expresiones para Ib y Tp y luego rearreglando tenemos
ml2d 2
θp
dt2 = mgl sin θp+ N Kmia (10)
donde g = 9,8m/s2
es la aceleraci´on de la gravedad. Aplicado la Ley de Kirchhoff (voltaje) al circuito de armadura resulta en La dia dt + Raia+ KbN dθp dt = u, donde Kb es la constante emf. Asumiendo que La ≈ 0. Entonces,
u = Raia+ KbN
dθp
dt , (11)
A continuaci´on calculamos ia de (11) y sustituimos el resultado en (10) para obtener
ml2d 2 θp dt2 = mgl sin θp+ N Km u Ra − KbN dθp dt Ra ! . (12)
Ahora podemos construir el modelo de espacio de estados para el robot de un brazo. Escogiendo los siguientes estados y variables de salida:
x1= θp, x2=
dθp
dt = ωp, y y = x1.
Entonces, usando (12), obtenemos el siguiente modelo de espacio de estados simple del robot manipulador: ˙x1 ˙x2 = " x2 g l sin x1−KbKmN 2 ml2Ra x2+ N Km ml2Rau #
y = x1.
Par´ametros razonables para el robot son: l = 1m, m = 1kg, N = 10, Km = 0,1Nm/A, Kb = 0,1Vsec/rad,
Ra= 1Ω. Usando los valores de los par´ametros el modelo del robot toma la siguiente forma:
˙x1 ˙x2 = x2 9,8 sin x1− x2+ u y = x1.
Respuestas en el tiempo para las trayectorias de estado del sistema no lineal sin control, u = 0, son mostrados en la Fig. 3 para las condiciones iniciales x1(0) = 1 y x2(0) = 0. Un plano de fase del sistema no
lineal sin control es mostrado en la Fig. 4. El modelo linealizado alrededor de x = 0, u = 0 tiene la forma
d dt∆x = 0 1 9,8 −1 ∆x + 0 1 ∆u, ∆y = 1 0 ∆x. (13) 0 2 4 6 8 10 Time (sec) 5 4 3 2 1 0 ⫺1 ⫺2 ⫺3 x1 , x2 x1 x2 Figure 5.13
Figura 3: Gr´aficas de y = x1 y x2 versus tiempo para el sistema no lineal sin control.
10 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺5 0 5 10 ⫺10 ⫺10 x1 x2
Figura 4: Un plano de fase del sistema no lineal sin control.
En la Fig. 5 son mostradas las gr´aficas de y = x1 y x2 versus tiempo para el sistema lineal sin control.
Un plano de fase del sistema linealizado es mostrado en la Fig. 6. Sea J = Z ∞ 0 (y2 + u2 )dt.
Encontraremos una ley de control lineal por realimentaci´on de estados u = −kx que minimice J sujeto a las ecuaciones dadas por (13). Tenemos
Q = cTc = 1 0 0 0 y R = [1].
25 20 15 10 5 0 0 0.2 0.4 0.6 0.8 1 x1 , x2 Time (sec) x1 x2
Figura 5: Gr´aficas de y = x1y x2 versus tiempo para el sistema linealizado sin control.
10 x2 x1 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10
Figura 6: Un plano de fase del sistema linealizado sin control.
Resolviendo la ecuaci´on de Riccati, se define la matriz Hamiltoniana asociada como
H = A −BR−1 BT −Q −AT = 0 1 0 0 9,8 −1 0 −1 −1 0 0 −9,8 0 0 −1 1 ,
y calculando los autovalores y autovectores de H tenemos que
H −0,3443 −0,0485 0,2604 0,0496 −0,9298 −0,1770 −0,9499 −0,1339 −0,1124 −0,9196 0,1691 0,9555 0,0661 0,3473 0,0364 0,2582 = −0,3443 −0,0485 0,2604 0,0496 −0,9298 −0,1770 −0,9499 −0,1339 −0,1124 −0,9196 0,1691 0,9555 0,0661 0,3473 0,0364 0,2582 2,7003 0 0 0 0 3,6481 0 0 0 0 −3,6481 0 0 0 0 −2,7003 .
Identificando los autovectores correspondientes a los autovalores con parte real negativa se puede definir W = 0,2604 0,0496 −0,9499 −0,1339 y Z = 0,1691 0,9555 0,0364 0,2582 ,
luego sabiendo que P = ZW−1
se obtiene P = 72,3371 19,6509 19,6509 5,3484 . (14) Entonces k = 19,6509 5,3484 (15)
y Ac= 0 1 −9,8509 −6,3484 ∆x.
Las gr´aficas de x1 y x2 versus tiempo del sistema en lazo cerrado
˙x = (A − bk)x = Acx
y = x1,
cuando las condiciones iniciales son x1(0) = 1 y x2(0) = 0, son mostradas en la Fig. 7. Un plano de fase del
sistema linealizado en lazo cerrado es mostrado en la Fig. 8. Aplicando el controlador ´optimo al modelo no lineal, las gr´aficas de x1 y x2 versus tiempo para el sistema no lineal en lazo cerrado son mostradas en la
Fig. 9. Un plano de fase del sistema no lineal en lazo cerrado es mostrado en la Fig. 10. Los polos del sistema linealizado en lazo cerrado -esto es, los autovalores de Ac- son λ1= −2,7003 y λ2= −3,6481.
1 0.5 0 0 1 2 Time (sec) x1 , x2 x1 x2 3 4 ⫺0.5 ⫺1 ⫺1.5 5
Figura 7: Gr´aficas de x1y x2 versus tiempo para el sistema linealizado en lazo cerrado.
10 x2 x1 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10
A phase portrait of the linear closed-loop system of Example 5.13.
Figura 8: Un plano de fase del sistema linealizado en lazo cerrado.
x1 , x2 x1 x2 0 1 0.5 ⫺0.5 ⫺1 ⫺1.5 0 1 2 Time (sec) 3 4 5
x2 x1 10 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10
Figura 10: Un plano de fase del sistema no lineal en lazo cerrado.
4.3.1. Ejemplo Aeronave de Impulsi´on
Considere la din´amica original de la aeronave de impulsi´on presentada en clases anteriores, escrita en la forma espacio de estados como:
dz dt = z4 z5 z6 −g sin θ − c mz4 −g cos θ − c mz5 0 + 0 0 0 1 mcos θF1− 1 msin θF2 1 msin θF1+ 1 mcos θF2 r JF1 .
Los par´ametros del sistema son m = 4kg, J = 0,0475kgm2
, r = 0,25m, g = 9,8m/s2
, c = 0,05Ns/m, que corresponde a un modelo escalado del sistema. El punto de equilibrio para el sistema est´a dado por F1= 0,
F2= mg y ze= (xe, ye, 0, 0, 0, 0). Para derivar el sistema linealizado cerca del punto de equilibrio, calculamos
el sistema linealizado: A = 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 −g −c/m 0 0 0 0 0 0 −c/m 0 0 0 0 0 0 0 , B = 0 0 0 0 0 0 1 m 0 0 1 m r J 0 . C = 1 0 0 0 0 0 0 1 0 0 0 0 , D = 0 0 0 0 . Haciendo z = z − zey v = u − ue, el sistema linealizado est´a dado por:
dz
dt = Az + Bv, y = Cz. Se puede verificar que el sistema es alcanzable.
Para calcular el regulador cuadr´atico lineal para el sistema, escribimos la funci´on costo como: J =
Z ∞ 0
(zTQz + vTRv)dt,
donde z = z − ze y v = u − uerepresentan las coordenadas locales en torno al punto de equilibrio (ze, ue).
Comenzamos con matrices diagonales para los costos del estado y la entrada:
Q = 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 , R = 1 0 0 1 .
CONTROL ´OPTIMO - REGULADOR CUADR ´ATICO LINEAL
Luego la ley de control de la forma v = −Kz ser´a usada para derivar la ley de control en t´erminos de las variables originales:
u = v + ue= −K(z − ze) + ue.
Como especificado en clases anteriores, los puntos de equilibrio corresponden a ue = (0, mg) y ze =
(xe, ye, 0, 0, 0, 0). La respuesta del controlador a un cambio de la funci´on escal´on para la posici´on
desea-da es mostradesea-da en la Fig. 2a. La respuesta puede ser afinadesea-da cambiando los pesos en la funci´on de costo. La Fig. 11b muestra la respuesta en la direcci´on x para diferentes selecciones del peso ρ, siendo que R = ρI6.3. STATE FEEDBACK DESIGN 193 2.
0 2 4 6 8 10 0 0.5 1 Timet[s] Po sit ion x , y [m] x y
(a) Step response in
xand
y0 2 4 6 8 10 0 0.5 1 Timet[s] Po sit ion x [m] ρ
(b) Effect of control weight
ρ Figure 6.12:Step response for a vectored thrust aircraft. The plot in (a) shows the
xand
ypositions of the aircraft when it is commanded to move 1 m in each direction. In (b) the
xmotion is shown for control weights
1, 10
2, 10
4. A higher weight of the input term in
the cost function causes a more sluggish response.
level. Since other processes may be running on the server, the web server must
adjust its parameters in response to changes in the load.
A block diagram for the control system is shown in Figure 6.13. We focus on
the special case where we wish to control only the processor load using both the
and
parameters. We also include a “disturbance” on
themeasuredloadthatrepresentstheuseoftheprocessingcyclesbyotherprocesses
running on the server. The system has the same basic structure as the generic control
system in Figure 6.5, with the variation that the disturbance enters after the process
dynamics.
The dynamics of the system are given by a set of difference equations of the
form
x
[
k1]
Ax[
k]
Bu[
k]
ycpu[
k]
Ccpux[
k]
dcpu[
k]
where
x xcpu xmemisthestate,
u uka umcistheinput,
dcpuistheprocessing
load from other processes on the computer and
ycpuis the total processor load.
We choose our controller to be a state feedback controller of the form
u K xycpu mem krrcpu
Feedback
rcpu u d yPrecompensation
Controller
kr e C1
Server
PFigure 6.13:
Feedback control of a web server. The controller sets the values of the web
server parameters based on the difference between the nominal parameters (determined by
krr) and the current load
ycpu. The disturbance
drepresents the load due to other processes
running on the server. Note that the measurement is taken after the disturbance so that we
measure the total load on the server.
Figura 11: Respuesta al escal´on de una aeronave de impulsi´on. La Fig. a muestra las posiciones “x” e “y” de la aeronave cuando se le comanda moverse 1m en cada direcci´on. En Fig. b se muestra el movimiento x variando los pesos de control ρ = 1, 102
, 104
. Un peso m´as grande en el t´ermino de control de la funci´on costo causa una respuesa m´as lenta.
4.4.
Propiedades de robustez del dise˜
no LQR
Un sistema de control que usa el regulador cuadr´atico lineal presenta las siguientes caracter´ısticas de robustez. Esto es, los margenes de estabilidad de la matriz de funciones de transferencia en lazo abierto L(s) = K(sI − A)−1
B (equivalentemente, las condiciones para que |1 + L(iω)| > 1) est´an dados por:
Margen de ganancia (GM): 1
2 < GM < 1.
Margen de fase (PM): PM > 60o
.
La Fig. 12 presenta el diagrama de Nyquist de la funci´on de transferencia en lazo abierto, L(s), para un modelo simplificado de un sat´elite.
A = 0 1 0 0 , B = 0 1 , C = 1 0 , D = 0. 沖壟筚 愕 ͵΄͑櫶割柪
΄ΚΞΡΝΚΗΚΖΕ͑ΧΖΣΤΚΠΟ͑ΠΗ͑ͽ
΄ΚΞΡΝΖ͑ͺΟΧΖΣΥΖΕ͑ΖΟΕΦΝΦΞ
Ϋ͑ͮ͑Ϊ͑ΒΟΕ͑גU ͮ͑͢ד ʹΒΤΖ͑͑Î ͼͮΌͤͣͥ͑͑ͣͨͤ͟͟͞͞Ύ
ʹΠΞΡΒΣΚΤΠΟ͑ΓΖΥΨΖΖΟ͑ͽ͑ΒΟΕ͑ΡΠΝΖ͑ΡΝΒΔΖΞΖΟΥ
ͽ͑ΡΣΠΧΚΕΖΤ͑ΘΦΒΣΒΟΥΖΖΕ͑ΤΥΒΓΚΝΚΥΪ͑ΞΒΣΘΚΟΤ͑͝ΨΙΚΝΖ͑ΥΙΖ͑ΤΥΒΓΚΝΚΥΪ͑
ΞΒΣΘΚΟΤ͑ΠΗ͑ΤΥΒΥΖ͑ΗΖΖΕΓΒΔΜ͑ΡΠΝΖ͑ΡΝΒΔΖΞΖΟΥ͑ΥΖΔΙΟΚΦΖ͑ΒΣΖ͑ΟΠΥ͑
ΜΟΠΨΟ
ͤͧͧͩ͑͑ͧͧͨ͢͟͜͟͞͡͡Κ ͤͧͧͩ͑͢͟͞͞ ͧͧͨ͟͡͡Κ ͤͣͤͧ͑͑͑͟͢͞ ͣͨͤͤͦ͟͞ ͢ ͦͧͨ͑͑ͣͦͩ͢͟͜͟͢͞͡͡Κ ͦͧͨ͑͢͟͞͡͞ ͣͦͩ͟͢͡Κ ͣͩͤͣ͑͑͟͢͞ ͣͤͥ͟͢͢͞ ͟͢͡ ͣͣͤͩ͟͞͡ ͪͩͪͥͨ͟͞ ͣͣͦ͑͑͢͟͞͡͡ ͪͩͦ͢͢͟͢͞ ͢͡͡ ͣͥͪͤ͑͑ͥͥͪ͟͜͟͞͡͡͡Κ ͣͥͪͤ͑͟͞͡͞ ͥͥͪ͟͡͡Κ ͨͥͤ͑͑͑͟͢͞͡ ͥͪͩͧ͟͞͡ ͢͡ ͧͣ͑͑ͩͧ͢͟͜͟͞͡͡͡͡͡Κ ͧͣ͑͢͟͞͡͡͞ ͩͧ͟͡͡͡Κ ͣͪͩ͑͟͢͞͡ ͣͣͥ͟͢͞͡ ͟͢͡͡ Տ ͼ Օ 沖壟筚 愕 ͵΄͑櫶割柪ͽ͑͵ΖΤΚΘΟ͑͗͑ΠΓΦΤΥΟΖΤΤ
ΠΓΦΤΥΟΖΤΤ͑ΠΗ͑ͽ͑ΕΖΤΚΘΟ͑
΄ΥΒΓΚΝΚΥΪ͑ΞΒΣΘΚΟΤ͑ΠΗ͑ΠΡΖΟ͑ΝΠΠΡ͑ΤΪΤΥΖΞ͑
;͑ͫ͑ύ ͭ͑;͑ͭ͑
1
;͑ͫ͑;͑
¸ ͧ͡
ͿΪΦΚΤΥ ΡΝΠΥ͑ΠΗ͑ΠΡΖΟ͑ΝΠΠΡ͑ΥΣΒΟΤΗΖΣ͑ΗΦΟΔΥΚΠΟ͑ͽ͙Τ͚
͙΄ΒΥΖΝΝΚΥΖ͑ΡΝΒΟΥ͑ΖΩΒΞΡΝΖ͚
4.5.
Regla de Bryson para selecci´
on de matrices Q y R
Una elecci´on inicial de las matrices diagonales Q y R es la siguiente:
Qii = 1/m´aximo valor aceptable de x2i
Rii= 1/m´aximo valor aceptable de u 2 i
Fuente: Cap´ıtulo 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003. Fuente: Cap´ıtulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. ˚