4. Problema del Regulador Cuadrático Lineal - Horizonte Infinito

(1)

Departamento Acad´emico de Ingenier´ıa Aplicada

CONTROL MODERNO Y ´

OPTIMO (MT 227C)

Clase 10-02 Elizabeth Villota Cerna

Semestre_{2009 II - UNI} _13/11/2009

4. Problema del Regulador Cuadr´

atico Lineal - Horizonte Infinito

Consideremos ahora el problema LQR: para un sistema lineal invariante en el tiempo ˙x(t) = Ax(t) + Bu(t), x(to) = xo,

y = Cx(t) (1)

y el ´ındice de desempe˜no asociado

J(x) = Z ∞

0

(xTQx + uTRu)dt, donde Q = QT

≥ 0 es una matriz sim´etrica semidefinida positiva y R = RT _{> 0 es una matriz sim´etrica}

y definida positiva. Nuestro objetivo es construir un controlador lineal por realimentaci´on de estados de la forma u = −Kx que estabiliza al sistema y minimiza el ´ındice de desempe˜no J(x). Denotamos a dicha ley de control lineal como u∗

.

Primero, asumimos que el controlador lineal por realimentación de estados óptimo existe tal que el sistema en lazo cerrado óptimo

˙x = (A − BK)x

es asintóticamente estable. Esta suposición implica que existe una función de Lyapunov V = xT_{P x para el}

sistema en lazo cerrado; esto es, para alguna matriz definida positiva P la derivada en funci´on del tiempo

dV

dt evaluada en las trayectorias del sistema en lazo cerrado es definida negativa.

Teorema 1.Si el controlador por realimentaci´on de estados u∗

= −Kx es tal que minu dV dt + x T_{Qx + u}T_Ru = 0, (2)

para alg´un V = xT_{P x, entonces el controlador es ´}_optimo. _⋄

Demostraci´onPodemos escribir la condici´on del teorema como dV dt _u=u_∗ + xT_{Qx + u}∗T_Ru∗ = 0. Luego, dV dt _u=u_∗ = −x T Qx − u∗T_Ru∗ .

Integrando ambos lados de la ecuaci´on resultante con respecto al tiempo desde 0 hasta ∞, obtenemos V (x(∞)) − V (x(0) = −

Z ∞ 0

(xT_{Qx + u}∗T_Ru∗

)dt.

Debido a la suposici´on de que el sistema en lazo cerrado es asint´oticamente estable, x(∞) = 0, y luego V (x(0) = xT oP xo= Z ∞ 0 (xT_{Qx + u}∗T_Ru∗ )dt.

Entonces, hemos demostrado que si un controlador lineal por realimentación de estados satisface la suposición del teorema, entonces el valor del ´ındice de desempeño para tal controlador es

J(u∗

) = xT oP xo.

(2)

Para demostrar que tal controlador es de hecho ´optimo, usamos una prueba por contradicci´on. Asumimos que (2) se cumple y que u∗

no es óptima. Supóngase que ˜u resulta en un menor valor de J, esto es, J(˜u) < J(u∗ ). De (2) tenemos que dV dt _u=˜_u + xT_{Qx + ˜}_uT_R˜ u ≥ 0, esto es, dV dt _u=˜_u≥ −x T Qx − ˜uTR˜u. Integrando la expresión arriba con respecto al tiempo de 0 a ∞ resulta

V (x(0)) ≤ Z ∞

0

(xT_{Qx + ˜}_uT_Ru)dt

lo que implica que

J(u∗

) ≤ J(˜u),

lo que es una contradicci´on, y la demostraci´on ha sido completada. ⋄

4.1. Ecuaci´

on de Riccati Algebraica (ARE, por sus siglas en ingl´

es)

Del teorema 1 se deduce que la s´ıntesis de la ley de control óptima está relacionada con encontrar una función de Lyapunov apropiada, o equivalentemente, la matriz P . La matriz P apropiada es encontrada minimizando

H(u) = dV dt + x

T_{Qx + u}T_Ru. ₍₃₎

Primero aplicamos a (3) la condición necesaria para minimización sin restricciones, ∂ ∂u dV dt + x T_{Qx + u}T_Ru _u=u_∗ = 0. Luego la expresión arriba se torna

∂ ∂u dV dt + x T_{Qx + u}T_Ru = ∂ ∂u 2x T_{P ˙x + x}T_{Qx + u}T_Ru = ∂ ∂u 2x T P Ax + 2xTP Bu + xTQx + uTRu = 2xT_{P B + 2u}T_R = 0 .

Entonces, el candidato para la ley de control ´optimo tiene la forma u∗ = −R−1 BT_{P x,} ₍₄₎ donde K = R−1 BT_{P . N´}_{otese que:} ∂2 ∂u2 dV dt + x T_{Qx + u}T_Ru = ∂ 2 ∂u2 2x T_{P Ax + 2x}T_{P Bu + x}T_{Qx + u}T_Ru = ∂ ∂u 2x T P B + 2uTR = 2R > 0 .

Entonces la condici´on suficiente de segunda orden para que u∗

minimice (2) es satisfecha. Ahora concentramos nuestra atenci´on en encontrar una matriz P apropiada.

(3)

4.1.1. S´ıntesis de la ley de control óptima: cálculo de la matriz P El sistema en lazo cerrado óptimo tiene la forma

˙x = (A − BR−1

BTP )x, x(0) = xo.

Nuestro controlador óptimo satisface la ecuación dV dt _u=u_∗ + xT_{Qx + u}∗T_Ru∗ = 0, esto es, 2xTP Ax + 2xTP Bu∗ + xTQx + u∗TRu∗ = 0. Substituyendo la expresión para u∗

, dada por (4), en la expresi´on de arriba se obtiene xT(ATP + P A)x − 2xTP BR−1 BTP x + xTQx + xTP BR−1 BTP x = 0. Factorizando x resulta xT_(AT P + P A + Q − P BR−1 BT_{P )x = 0.}

La ecuaci´on como mostrada se debe cumplir para cualquier x. Para que esto sea cierto debemos tener que AT_{P + P A + Q − P BR}−1

BT_{P = 0.} ₍₅₎

Esta ecuaci´on es conocida como la ecuaci´on de Riccati algebraica.

En conclusión, la s´ıntesis del controlador lineal por realimentación de estados óptimo minimiza el ´ındice de desempeño J = Z ∞ 0 (xT_{Qx + u}T_Ru)dt sujeto a ˙x = Ax + Bu, x(0) = xo

requiere que se resuelva la ecuaci´on de Riccati algebraica dada por (5).

4.1.2. Ejemplo

Considere el siguiente modelo de un sistema din´amico:

˙x = 2u1+ 2u2, x(0) = 3,

asi como el ´ındice de desempe˜no asociado J = Z ∞ 0 (x2 + ru2 1+ ru 2 2)dt,

donde r > 0 es un par´ametro.

1. Primero encontramos las solución de ARE correspondiente al controlador lineal por realimentación de estados óptimo. Tenemos

A = 0, B =

2 2 , Q = 1, R = rI2.

La ARE para este problema es 0 = AT P + P A + Q − P BR−1 BT P = 1 −8_rp2 , cuya soluci´on es p =r r 8.

(4)

2. Ahora escribimos el sistema en lazo cerrado que se obtiene usando el controlador ´optimo. El controlador ´optimo tienen la forma

u = −R−1 BT P x = −√1 2r 1 1 x. Entonces, el sistema en lazo cerrado ´optimo es descrito por

˙x =

2 2 u = −√4 2rx.

3. Finalmente, encontramos el valor de J para el sistema en lazo cerrado ´optimo. Tenemos que J = x(0)T_{P x(0) =} 9

2 r r

2.

4.2. Resolviendo la ARE usando el M´

etodo del Autovector

A continuación presentamos un método para resolver la ARE referido como el método del autovector. Comenzamos representando la ARE de la forma

P −In A −BR−1 BT −Q −AT In P = 0. (6)

La matriz 2n × 2n en la mitad es denominada de matriz Hamiltoniana. usamos el s´ımbolo H para denotar a la matriz Hamiltoniana, esto es,

H = A −BR−1 BT −Q −AT . Entonces, la ARE puede ser representada como

P −In H In P = 0 Si premultiplicamos la ecuaci´on arriba por X−1

y luego postmultiplicamos esta por X, donde X es una matriz no singular n × n, X−1 P −X−1 H X P X = 0. (7)

Observese que si pudieramos encontrar matrices X y P X tal que H X P X = X P X Λ, luego la ecuaci´on (7) resulta en

X−1 P −X−1 X P X Λ = 0.

Luego hemos reducido el problema de resolver la ARE a aquel en el que construimos matrices X y P X apropiadas. Continuando, sea vi el autovector de H y sea si el autovalor correspondiente; entonces

Hvi= sivi.

Si asumimos que H tiene al menos n autovalores reales distintos entre sus 2n autovalores. (Los resultados obtenidos pueden ser generalizados para el cado cuando los autovalores de H son complejos o iguales.) Entonces, podemos escribir

H v1 v2 ... vn = v1 v2 ... vn      s1 0 ... 0 0 s2 ... 0 .. . ... ... 0 0 ... sn      . Sea X P X = v1 v2 ... vn

(5)

y Λ =      s1 0 ... 0 0 s2 ... 0 .. . ... ... 0 0 ... sn      .

La selección de X y P X constituye una posible solución de la ecuación X−1 P −X−1 X P X Λ = 0.

Para construir P , particionamos la matriz de autovectores

v1 v2 ... vn de orden 2n × n en dos

submatrices de orden n × n como sigue v1 v2 ... vn = W Z . Luego, X P X = W Z .

Tomando X = W y P X = Z y asumiendo que W es invertible, obtenemos P = ZW−1

. (8)

Ahora tenemos que elegir que conjunto de n autovalores elegir, dentro de todos los autovalores de H, para poder contruir P . En el caso en que los 2n autovalores de H son diferentes, el n´umero de matrices P generadas con el m´etodo descrito arriba son

(2n)! (n!)2.

Sea Q = CT_{C una factorizaci´}_{on de rango completo de Q. Del Teorema 3 de Kucera (ver referencias al}

final) se concluye que la matriz Hamiltoniana H tiene n autovalores en el semiplano complejo izquierdo y n en el semiplano complejo derecho si y s´olo si el sistema como definido en (1) es estabilizable y detectable. La matriz P que nosotros buscamos corresponde a los autovalores asint´oticamente estables de H. Con P construido como deseado, tenemos el siguiente resultado.

Teorema 2.Los polos del sistema en lazo cerrado ˙x(t) = (A − BR−1

BT_{P )x(t)}

son aquellos autovalores de H que tienen parte real negativa. ⋄

Demostraci´onSiendo que

v1 v2 ... vn = W Z , podemos escribir A −BR−1 BT −Q −AT W Z = W Z Λ. Realizando las multiplicaciones apropiadas de bloques de matrices n × n resulta

AW − BR−1 BT_{Z = W Λ,} o A − BR−1 BTZW−1 = A − BR−1 BTP = W ΛW−1 , dado que P = ZW−1 . Entonces, la matriz A − BR−1

BT_{P es similar a la matriz Λ cuyos autovalores son}

(6)

4.2.1. Ejemplo 1

Considere el siguiente modelo de un sistema din´amico ˙x = 2x + u, asi como el ´ındice de desempe˜no asociado

J = Z ∞ 0 (x2 + ru2 )dt.

Encuentre el valor de r tal que el sistema en lazo cerrado ´optimo tenga un polo en −3.

1. Formamos la matriz Hamiltoniana asociada H = A −BR−1 BT −Q −AT = 2 −1 r −1 −2 . 2. La ecuaci´on caracter´ıstica de H es det(sI2− H) = s 2 − 4 −1_r = 0. Luego, r = 1 5

resulta en el sistema en lazo cerrado ´optimo teniendo su polo localizado en −3.

4.3. Ejemplo 2

Considere un modelo simple de un robot manipulador como mostrado en la Fig. 1. El movimiento del brazo del robot es controlado por un motor DC a través de un engranaje. El motor DC es controlado por armadura y su figura esquemática es presentada en la Fig. 2. Asumimos que el momento de inercia del motor es despreciable en comparación con el del brazo del robot. Modelamos el brazo como una masa puntual m ubicada en el extremo final de la barra (sin masa) de longitud l. Entonces el momento de inercia del brazo Ib = ml2. Asumimos que el tren de engranajes no tiene juego, y que todos los ejes conectores son r´ıgidos.

Como podemos ver de la Fig. 1, la rotación del brazo en sentido contrario a las agujas del reloj es definida como positiva, y la rotación siguiendo las agujas del reloj es considerada como negativa; mientras que la rotación del eje del motor en sentido contrario a las agujas del reloj es definida como negativa, y la rotación del eje siguiendo las agujas del reloj es definida como positiva. El torque entregado por el motor es

Tm= Kmia,

donde Km es la constante del torque del motor, y ia es la corriente de armadura. Sea N la raz´on de los

engranajes. Luego tenemos: θp

θm

= radio del engranaje del motor radio del engranaje del brazo =

n´umero de dientes del engranaje del motor n´umero de dientes del engranaje del brazo =

1 N.

Esto ocurre puesto que los engranajes estan en contacto y luego

θp× radio del engranaje del brazo = θm× radio del engranaje del motor,

y los radios de los engranajes son proporcionales a sus n´umeros de dientes. El trabajo realizado por cada engranaje debe ser igual. Sea Tp que denota el torque aplicado al brazo del robot. Entonces,

Tpθp= Tmθm.

Entonces, el torque aplicado al p´endulo es

(7)

Gear 1: N

Massless rod of length l

␪_p

Mass m

DC motor

Control voltage

⫹ u ⫺

Figura 1: Robot manipulador controlador por un motor DC via un engranaje.

R_a L_a i_f⫽ constant eb⫽ back emf ␪ m⫽ motor shaft position Field circuit Armature circuit ⫹ ⫺ ⫹ u ⫺ i_a

Figura 2: Figura esquem´atica de un motor DC controlado por armadura.

Usando la segunda Ley de Newton para escribir la ecuaci´on que modela la din´amica del brazo, Ib

d2

θp

dt2 = mgl sin θp+ Tp. (9)

Sustituyendo en (9) las expresiones para Ib y Tp y luego rearreglando tenemos

ml2d 2

θp

dt2 = mgl sin θp+ N Kmia (10)

donde g = 9,8m/s2

es la aceleraci´on de la gravedad. Aplicado la Ley de Kirchhoff (voltaje) al circuito de armadura resulta en La dia dt + Raia+ KbN dθp dt = u, donde Kb es la constante emf. Asumiendo que La ≈ 0. Entonces,

u = Raia+ KbN

dθp

dt , (11)

A continuaci´on calculamos ia de (11) y sustituimos el resultado en (10) para obtener

ml2d 2 θp dt2 = mgl sin θp+ N Km u Ra − KbN dθp dt Ra ! . (12)

Ahora podemos construir el modelo de espacio de estados para el robot de un brazo. Escogiendo los siguientes estados y variables de salida:

x1= θp, x2=

dθp

dt = ωp, y y = x1.

Entonces, usando (12), obtenemos el siguiente modelo de espacio de estados simple del robot manipulador: ˙x1 ˙x2 = " x2 g l sin x1−KbKmN 2 ml2Ra x2+ N Km ml2Rau #

(8)

y = x1.

Par´ametros razonables para el robot son: l = 1m, m = 1kg, N = 10, Km = 0,1Nm/A, Kb = 0,1Vsec/rad,

Ra= 1Ω. Usando los valores de los par´ametros el modelo del robot toma la siguiente forma:

˙x1 ˙x2 = x2 9,8 sin x1− x2+ u y = x1.

Respuestas en el tiempo para las trayectorias de estado del sistema no lineal sin control, u = 0, son mostrados en la Fig. 3 para las condiciones iniciales x1(0) = 1 y x2(0) = 0. Un plano de fase del sistema no

lineal sin control es mostrado en la Fig. 4. El modelo linealizado alrededor de x = 0, u = 0 tiene la forma

d dt∆x = 0 1 9,8 −1 ∆x + 0 1 ∆u, ∆y = 1 0 ∆x. (13) 0 2 4 6 8 10 Time (sec) 5 4 3 2 1 0 ⫺1 ⫺2 ⫺3 x1 , x2 x1 x2 Figure 5.13

Figura 3: Gr´aficas de y = x1 y x2 versus tiempo para el sistema no lineal sin control.

10 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺5 0 5 10 ⫺10 ⫺10 x1 x₂

Figura 4: Un plano de fase del sistema no lineal sin control.

En la Fig. 5 son mostradas las gr´aficas de y = x1 y x2 versus tiempo para el sistema lineal sin control.

Un plano de fase del sistema linealizado es mostrado en la Fig. 6. Sea J = Z ∞ 0 (y2 + u2 )dt.

Encontraremos una ley de control lineal por realimentaci´on de estados u = −kx que minimice J sujeto a las ecuaciones dadas por (13). Tenemos

Q = cTc = 1 0 0 0 y R = [1].

(9)

25 20 15 10 5 0 0 0.2 0.4 0.6 0.8 1 x1 , x2 Time (sec) x1 x2

Figura 5: Gr´aficas de y = x1y x2 versus tiempo para el sistema linealizado sin control.

10 x₂ x1 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10

Figura 6: Un plano de fase del sistema linealizado sin control.

Resolviendo la ecuaci´on de Riccati, se define la matriz Hamiltoniana asociada como

H = A −BR−1 BT −Q −AT =     0 1 0 0 9,8 −1 0 −1 −1 0 0 −9,8 0 0 −1 1     ,

y calculando los autovalores y autovectores de H tenemos que

H     −0,3443 −0,0485 0,2604 0,0496 −0,9298 −0,1770 −0,9499 −0,1339 −0,1124 −0,9196 0,1691 0,9555 0,0661 0,3473 0,0364 0,2582     =     −0,3443 −0,0485 0,2604 0,0496 −0,9298 −0,1770 −0,9499 −0,1339 −0,1124 −0,9196 0,1691 0,9555 0,0661 0,3473 0,0364 0,2582         2,7003 0 0 0 0 3,6481 0 0 0 0 −3,6481 0 0 0 0 −2,7003     .

Identificando los autovectores correspondientes a los autovalores con parte real negativa se puede definir W = 0,2604 0,0496 −0,9499 −0,1339 y Z = 0,1691 0,9555 0,0364 0,2582 ,

luego sabiendo que P = ZW−1

se obtiene P = 72,3371 19,6509 19,6509 5,3484 . (14) Entonces k = 19,6509 5,3484 (15)

(10)

y Ac= 0 1 −9,8509 −6,3484 ∆x.

Las gr´aficas de x1 y x2 versus tiempo del sistema en lazo cerrado

˙x = (A − bk)x = Acx

y = x1,

cuando las condiciones iniciales son x1(0) = 1 y x2(0) = 0, son mostradas en la Fig. 7. Un plano de fase del

sistema linealizado en lazo cerrado es mostrado en la Fig. 8. Aplicando el controlador ´optimo al modelo no lineal, las gr´aficas de x1 y x2 versus tiempo para el sistema no lineal en lazo cerrado son mostradas en la

Fig. 9. Un plano de fase del sistema no lineal en lazo cerrado es mostrado en la Fig. 10. Los polos del sistema linealizado en lazo cerrado -esto es, los autovalores de Ac- son λ1= −2,7003 y λ2= −3,6481.

1 0.5 0 0 1 2 Time (sec) x1 , x2 x1 x2 3 4 ⫺0.5 ⫺1 ⫺1.5 5

Figura 7: Gr´aficas de x1y x2 versus tiempo para el sistema linealizado en lazo cerrado.

10 x2 x1 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10

A phase portrait of the linear closed-loop system of Example 5.13.

Figura 8: Un plano de fase del sistema linealizado en lazo cerrado.

x1 , x2 x1 x2 0 1 0.5 ⫺0.5 ⫺1 ⫺1.5 0 1 2 Time (sec) 3 4 5

(11)

x2 x1 10 8 6 4 2 0 ⫺2 ⫺4 ⫺6 ⫺8 ⫺10 ⫺10 ⫺5 0 5 10

Figura 10: Un plano de fase del sistema no lineal en lazo cerrado.

4.3.1. Ejemplo Aeronave de Impulsi´on

Considere la din´amica original de la aeronave de impulsi´on presentada en clases anteriores, escrita en la forma espacio de estados como:

dz dt =         z4 z5 z6 −g sin θ − c mz4 −g cos θ − c mz5 0         +         0 0 0 1 mcos θF1− 1 msin θF2 1 msin θF1+ 1 mcos θF2 r JF1         .

Los par´ametros del sistema son m = 4kg, J = 0,0475kgm2

, r = 0,25m, g = 9,8m/s2

, c = 0,05Ns/m, que corresponde a un modelo escalado del sistema. El punto de equilibrio para el sistema est´a dado por F1= 0,

F2= mg y ze= (xe, ye, 0, 0, 0, 0). Para derivar el sistema linealizado cerca del punto de equilibrio, calculamos

el sistema linealizado: A =         0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 −g −c/m 0 0 0 0 0 0 −c/m 0 0 0 0 0 0 0         , B =         0 0 0 0 0 0 1 m 0 0 1 m r J 0         . C = 1 0 0 0 0 0 0 1 0 0 0 0 , D = 0 0 0 0 . Haciendo z = z − zey v = u − ue, el sistema linealizado est´a dado por:

dz

dt = Az + Bv, y = Cz. Se puede verificar que el sistema es alcanzable.

Para calcular el regulador cuadr´atico lineal para el sistema, escribimos la funci´on costo como: J =

Z ∞ 0

(zTQz + vTRv)dt,

donde z = z − ze y v = u − uerepresentan las coordenadas locales en torno al punto de equilibrio (ze, ue).

Comenzamos con matrices diagonales para los costos del estado y la entrada:

Q =         1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1         , R = 1 0 0 1 .

(12)

CONTROL ´OPTIMO - REGULADOR CUADR ´ATICO LINEAL

Luego la ley de control de la forma v = −Kz ser´a usada para derivar la ley de control en t´erminos de las variables originales:

u = v + ue= −K(z − ze) + ue.

Como especificado en clases anteriores, los puntos de equilibrio corresponden a ue = (0, mg) y ze =

(xe, ye, 0, 0, 0, 0). La respuesta del controlador a un cambio de la función escalón para la posición

desea-da es mostradesea-da en la Fig. 2a. La respuesta puede ser afinadesea-da cambiando los pesos en la funci´on de costo. La Fig. 11b muestra la respuesta en la direcci´on x para diferentes selecciones del peso ρ, siendo que R = ρI6.3. STATE FEEDBACK DESIGN 193 2.

0 2 4 6 8 10 0 0.5 1 Timet[s] Po sit ion x , y [m] x y

(a) Step response in

x

and

y

0 2 4 6 8 10 0 0.5 1 Timet[s] Po sit ion x [m] ρ

(b) Effect of control weight

ρ Figure 6.12:

Step response for a vectored thrust aircraft. The plot in (a) shows the

x

and

y

positions of the aircraft when it is commanded to move 1 m in each direction. In (b) the

x

motion is shown for control weights

1, 10

2

_{, 10}

4

_{. A higher weight of the input term in}

the cost function causes a more sluggish response.

level. Since other processes may be running on the server, the web server must

adjust its parameters in response to changes in the load.

A block diagram for the control system is shown in Figure 6.13. We focus on

the special case where we wish to control only the processor load using both the

and

parameters. We also include a “disturbance” on

themeasuredloadthatrepresentstheuseoftheprocessingcyclesbyotherprocesses

running on the server. The system has the same basic structure as the generic control

system in Figure 6.5, with the variation that the disturbance enters after the process

dynamics.

The dynamics of the system are given by a set of difference equations of the

form

x

[

k

1]

Ax

[

k

]

Bu

[

k

]

ycpu

[

k

]

Ccpux

[

k

]

dcpu

[

k

]

where

x xcpu xmem

isthestate,

u uka umc

istheinput,

dcpu

istheprocessing

load from other processes on the computer and

ycpu

is the total processor load.

We choose our controller to be a state feedback controller of the form

u K _xycpu mem krrcpu

Feedback

rcpu u d y

Precompensation

Controller

kr e C

1 Server

P

Figure 6.13:

Feedback control of a web server. The controller sets the values of the web

server parameters based on the difference between the nominal parameters (determined by

krr

) and the current load

ycpu

. The disturbance

d

represents the load due to other processes

running on the server. Note that the measurement is taken after the disturbance so that we

measure the total load on the server.

Figura 11: Respuesta al escalón de una aeronave de impulsión. La Fig. a muestra las posiciones “x” e “y” de la aeronave cuando se le comanda moverse 1m en cada dirección. En Fig. b se muestra el movimiento x variando los pesos de control ρ = 1, 102

, 104

. Un peso más grande en el término de control de la función costo causa una respuesa más lenta.

4.4. Propiedades de robustez del dise˜

no LQR

Un sistema de control que usa el regulador cuadr´atico lineal presenta las siguientes caracter´ısticas de robustez. Esto es, los margenes de estabilidad de la matriz de funciones de transferencia en lazo abierto L(s) = K(sI − A)−1

B (equivalentemente, las condiciones para que |1 + L(iω)| > 1) est´an dados por:

Margen de ganancia (GM): 1

2 < GM < 1.

Margen de fase (PM): PM > 60o

.

La Fig. 12 presenta el diagrama de Nyquist de la funci´on de transferencia en lazo abierto, L(s), para un modelo simplificado de un sat´elite.

A = 0 1 0 0 , B = 0 1 , C = 1 0 , D = 0. 沖壟筚愕 ͵΄΁͑櫶割柪

΄ΚΞΡΝΚΗΚΖΕ͑ΧΖΣΤΚΠΟ͑ΠΗ͑ͽ΂΃

΄ΚΞΡΝΖ͑ͺΟΧΖΣΥΖΕ͑΁ΖΟΕΦΝΦΞ

Ϋ͑ͮ͑Ϊ͑ΒΟΕ͑גU ͮ͑͢ד ʹΒΤΖ͑͑Î ͼͮΌͤͣͥ͑͑ͣͨͤ͟͟͞͞Ύ

ʹΠΞΡΒΣΚΤΠΟ͑ΓΖΥΨΖΖΟ͑ͽ΂΃͑ΒΟΕ͑ΡΠΝΖ͑ΡΝΒΔΖΞΖΟΥ

ͽ΂΃͑ΡΣΠΧΚΕΖΤ͑ΘΦΒΣΒΟΥΖΖΕ͑ΤΥΒΓΚΝΚΥΪ͑ΞΒΣΘΚΟΤ͑͝ΨΙΚΝΖ͑ΥΙΖ͑ΤΥΒΓΚΝΚΥΪ͑

ΞΒΣΘΚΟΤ͑ΠΗ͑ΤΥΒΥΖ͑ΗΖΖΕΓΒΔΜ͑ΡΠΝΖ͑ΡΝΒΔΖΞΖΟΥ͑ΥΖΔΙΟΚ΢ΦΖ͑ΒΣΖ͑ΟΠΥ͑

ΜΟΠΨΟ

ͤͧͧͩ͑͑ͧͧͨ͢͟͜͟͞͡͡Κ ͤͧͧͩ͑͢͟͞͞ ͧͧͨ͟͡͡Κ ͤͣͤͧ͑͑͑͟͢͞ ͣͨͤͤͦ͟͞ ͢ ͦͧͨ͑͑ͣͦͩ͢͟͜͟͢͞͡͡Κ ͦͧͨ͑͢͟͞͡͞ ͣͦͩ͟͢͡Κ ͣͩͤͣ͑͑͟͢͞ ͣͤͥ͟͢͢͞ ͟͢͡ ͣͣͤͩ͟͞͡ ͪͩͪͥͨ͟͞ ͣͣͦ͑͑͢͟͞͡͡ ͪͩͦ͢͢͟͢͞ ͢͡͡ ͣͥͪͤ͑͑ͥͥͪ͟͜͟͞͡͡͡Κ ͣͥͪͤ͑͟͞͡͞ ͥͥͪ͟͡͡Κ ͨͥͤ͑͑͑͟͢͞͡ ͥͪͩͧ͟͞͡ ͢͡ ͧͣ͑͑ͩͧ͢͟͜͟͞͡͡͡͡͡Κ ͧͣ͑͢͟͞͡͡͞ ͩͧ͟͡͡͡Κ ͣͪͩ͑͟͢͞͡ ͣͣͥ͟͢͞͡ ͟͢͡͡ Տ ͼ Օ 沖壟筚愕 ͵΄΁͑櫶割柪

ͽ΂΃͑͵ΖΤΚΘΟ͑͗͑΃ΠΓΦΤΥΟΖΤΤ

΃ΠΓΦΤΥΟΖΤΤ͑ΠΗ͑ͽ΂΃͑ΕΖΤΚΘΟ͑

΄ΥΒΓΚΝΚΥΪ͑ΞΒΣΘΚΟΤ͑ΠΗ͑ΠΡΖΟ͑ΝΠΠΡ͑ΤΪΤΥΖΞ͑

͸;͑ͫ͑ύ ͭ͑͸;͑ͭ͑

₁

΁;͑ͫ͑΁;͑

_{¸ ͧ͡}

ͿΪ΢ΦΚΤΥ ΡΝΠΥ͑ΠΗ͑ΠΡΖΟ͑ΝΠΠΡ͑ΥΣΒΟΤΗΖΣ͑ΗΦΟΔΥΚΠΟ͑ͽ͙Τ͚

͙΄ΒΥΖΝΝΚΥΖ͑ΡΝΒΟΥ͑ΖΩΒΞΡΝΖ͚

(13)

4.5. Regla de Bryson para selecci´

on de matrices Q y R

Una elecci´on inicial de las matrices diagonales Q y R es la siguiente:

Qii = 1/m´aximo valor aceptable de x2i

Rii= 1/m´aximo valor aceptable de u 2 i

Fuente: Cap´ıtulo 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003. Fuente: Cap´ıtulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. ˚

4. Problema del Regulador Cuadrático Lineal - Horizonte Infinito

CONTROL MODERNO Y ´

OPTIMO (MT 227C)

4.

Problema del Regulador Cuadr´

atico Lineal - Horizonte Infinito

4.1.

Ecuaci´

on de Riccati Algebraica (ARE, por sus siglas en ingl´

es)

4.2.

Resolviendo la ARE usando el M´

etodo del Autovector

4.3.

Ejemplo 2

(a) Step response in

and

(b) Effect of control weight

Step response for a vectored thrust aircraft. The plot in (a) shows the

and

positions of the aircraft when it is commanded to move 1 m in each direction. In (b) the

motion is shown for control weights

1, 10

, 10

. A higher weight of the input term in

the cost function causes a more sluggish response.

level. Since other processes may be running on the server, the web server must

adjust its parameters in response to changes in the load.

A block diagram for the control system is shown in Figure 6.13. We focus on

the special case where we wish to control only the processor load using both the

and

parameters. We also include a “disturbance” on

themeasuredloadthatrepresentstheuseoftheprocessingcyclesbyotherprocesses

running on the server. The system has the same basic structure as the generic control

system in Figure 6.5, with the variation that the disturbance enters after the process

dynamics.

The dynamics of the system are given by a set of difference equations of the

form

[

1]

[

]

[

]

[

]

[

]

[

]

where

isthestate,

istheinput,

istheprocessing

load from other processes on the computer and

is the total processor load.

We choose our controller to be a state feedback controller of the form

Feedback

Precompensation

Controller

1

Server

Feedback control of a web server. The controller sets the values of the web

server parameters based on the difference between the nominal parameters (determined by

) and the current load

. The disturbance

represents the load due to other processes

running on the server. Note that the measurement is taken after the disturbance so that we

measure the total load on the server.

4.4.

Propiedades de robustez del dise˜

no LQR

΄ΚΞΡΝΚΗΚΖΕ͑ΧΖΣΤΚΠΟ͑ΠΗ͑ͽ΂΃



΄ΚΞΡΝΖ͑ͺΟΧΖΣΥΖΕ͑΁ΖΟΕΦΝΦΞ



Ϋ͑ͮ͑Ϊ͑ΒΟΕ͑גU ͮ͑͢ד ʹΒΤΖ͑͑Î ͼͮΌͤͣͥ͑͑ͣͨͤ͟͟͞͞Ύ



ʹΠΞΡΒΣΚΤΠΟ͑ΓΖΥΨΖΖΟ͑ͽ΂΃͑ΒΟΕ͑ΡΠΝΖ͑ΡΝΒΔΖΞΖΟΥ



_{, 10}

_{. A higher weight of the input term in}

₁

_{¸ ͧ͡}