Teor´ıa de Pontryagin - Control ´ Optimo - Teoría de Estabilidad y Control Isaac A. García

9. Control ´ Optimo

9.4. Teor´ıa de Pontryagin

Una gran variedad de procesos f´ısicos pueden ser controlados de múltiples formas, pero sólo una forma es la mejor bajo un cierto criterio. Se trata pues de averiguar cual es el control óptimo del proceso en cuestión. Quizás interese realizar el objetivo del proceso en el menor tiempo posible o bien con el m´ınimo consumo de energ´ıa, etc...

Supondremos que el sistema est´a gobernado por ˙

con x = (x₁, . . . , xn)T las variables de estado o de fase, f = (f1, . . . , fn)T ∈

Rn _{y u = (u}

1, . . . , um)T las variables de control. Adem´as suponemos que f

suficientemente regular de modo que, dado un control u(t) definido para t₀ ≤ t≤ t₁, la soluci´on x(t) de (9.25) existe y es única en el intervalo t₀≤ t ≤ t₁. En particular, supondremos que fiy ∂fi/∂xj son funciones continuas.

Consideremos el funcional J (u, x) =

t₀

F (x, u) dt , (9.26)

de modo que, para cada control dado u(t) definido para t₀ ≤ t ≤ t₁, se tiene J (u, x) bien definido y tomando un valor real fijado.

Fijados el estado inicial x₀ y ﬁnal xf del sistema, supongamos que existen

varios controles u(t) que transﬁeren el sistema desde el estado inicial x(t₀) = x₀ hasta el estado ﬁnal x(t₁) = xf en tiempo t1− t0. Nos preguntamos si, de

entre esos controles, existe uno u∗tal que se minimize el funcional (9.26). Dicho control u∗(t) es llamado control óptimo y la solución x∗(t) de (9.25) asociado al control u∗ una trayectoria óptima.

Notemos que, en el problema planteado, los valores de t₀ y de t₁ no est´an en general ﬁjados. Lo ´unico que se pide es que para tiempo t₀ el sistema se encuentre en el estado x₀ y para tiempo t₁en el estado xf.

Es importante notar que, en los problemas aplicados, muy a menudo se tiene que las variables de control uino pueden tomar valores arbitrarios si no que est´an

acotadas y adem´as pueden ser discontinuas. Entonces, s´olo tiene sentido tomar controles u pertenecientes a un cierto dominioU ⊂ Rm.

As´ı, diremos que el control u(t) es admisible si u(t)∈ U para todo t₀≤ t ≤ t₁ y adem´as es continuo a trozos en dicho intervalo. Dicho de otro modo, pueden existir tiempos si con t0 < s1 < s2 < · · · < sn < t1 que corresponden a

discontinuidades de primera especie de u(t).

Un caso muy habitual de conjunto de controles admisiblesU es el hipercubo deRmsiguiente

U = {u = (u1, . . . , um) : |ui| ≤ umaxi , i = 1, . . . , m} ⊂ Rm . (9.27)

Observemos que, al a¯nadir la condición (9.27) al problema de optimización planteado se tiene un carácter radicalmente diferente del que se ten´ıa con la condición (9.12), es decir, (∇uH)u=u∗ = 0 puesto que ahora el hamiltoniano H

puede ser no derivable respecto de u en todos los puntos ya que u(t) puede tener puntos donde no exista la derivada.

El siguiente resultado fundamental, ver su demostración en [8] por ejemplo, aporta condiciones necesarias que debe verificar un control ´optimo u∗ donde se tiene en cuenta la condición (9.27) sobre la acotación de los controles admisibles . Para conseguirlo, definimos la función de HamiltonH asociada al sistema (9.25) y al funcional (9.26) de la forma

siendo λ(t) = (λ₁(t), . . . , λn(t))T ∈ Rn un vector de multiplicadores de Lagrange

veriﬁcando

˙λi=−∂H

∂xi , i = 1, . . . , n . (9.29) Teorema 83 (Principio del m´aximo de Pontryagin). Sea u∗(t) definido pa- ra t₀ < t < t₁ un control admisible tal que la trayectoria x∗(t) del sistema (9.25) asociada verifica x∗(t₀) = x₀ y x∗(t₁) = xf. Si u∗(t) es óptimo para

el funcional (9.26), entonces existe un vector de multiplicadores de Lagrange λ(t) = (λ₁(t), . . . , λn(t))T ∈ Rn continuo y no nulo, veriﬁcando (9.29). Adem´as,

para cualquier t₀≤ t ≤ t₁, el hamiltonianoH(λ(t), x(t), u) alcanza su m´aximo en u = u∗(t) mirado como una funci´on de los controles admisibles u ∈ U, es decir,

H(λ(t), x∗_{(t), u}∗_{(t)) = sup}

u∈U{H(λ(t), x(t), u)} . (9.30)

Nota 84. Si se trata de un problema de control en tiempo ´optimo, es decir, F (x, u) ≡ 1 en el funcional (9.26), entonces es habitual tomar la funci´on de Hamilton

H(λ, x, u) = λT_{f (x, u) ,} _(9.31)

en la utilizaci´on del Teorema 83.

9.5. Problemas resueltos

1. Minimizar el ´ındice de actuaci´on J (u, x) =

(x(t)2+ u2(t)) dt ,

sabiendo que ˙x = −ax + u(t) con x(0) = x₀. Tomar a y T constantes positivas.

Soluci´on. Utilizaremos el Teorema 75 para la resoluci´on del problema. La funci´on Hamiltoniana H asociada al funcional J (u, x) y al sistema

x =−ax + u(t) viene dado, seg´un (9.11), por

H(x, u, t) = λ(−ax + u) − (x2+ u2) ,

donde el multiplicador de Lagrange λ(t) veriﬁca, teniendo en cuenta (9.10), la ecuaci´on ˙λ =−∂H/∂x, es decir,

˙λ = 2x∗_{+ aλ ,} _(9.32)

donde se ha denotado por x∗(t) a la trayectoria ´optima. Adem´as, si u∗ es el control ´optimo, la condici´on (9.12), es decir, (∂H/∂u)_u=u∗ = 0 impone

en nuestro caso la restricci´on

Introduciendo esta condici´on en el sistema ˙x∗=−ax∗+ u∗se obtiene ˙

x∗=−ax∗+1

2λ . (9.34)

Teniendo en cuenta que el punto final x(T ) no est´a fijado se tiene la condición de transversalidad (9.14), es decir,

λ(T ) = 0 .

Observar que, el sistema formado por las ecuaciones (9.32) y (9.34) es un sistema lineal y puede, por lo tanto, ser resuelto con los métodos ya estudiados anteriormente. En concreto, es fácil demostrar que, la solución general del sistema (9.32) y (9.34) es

x∗(t) = C₁cosh(1 + a2t)− 1 2√1 + a2(2aC1+ C2) sinh( 1 + a2t) , λ(t) = C₂cosh(1 + a2t) +√ 1 1 + a2(−2C1+ aC2) sinh( 1 + a2t) , siendo C₁ y C₂ constantes arbitrarias que se determinan con las condi- ciones de contorno x∗(0) = x₀ y λ(T ) = 0. En concreto se obtiene

C₁= x₀ , C₂= 2x0

a +√1 + a2coth(√1 + a2T ) .

En deﬁnitiva, el control ´optimo u∗ es, seg´un (9.33), u∗(t) = −λ(t)/2, es decir, u∗(t) = x0 sinh[ √ 1 + a2(t− T )] √ 1 + a2cosh[√1 + a2T ] + a sinh[√1 + a2T ] .

2. Una part´ıcula realiza un movimiento rectil´ıneo sujeta a la acci´on de una fuerza por unidad de masa u(t). Supongamos que el esfuerzo realizado cuando la part´ıcula evoluciona desde tiempo cero hasta tiempo τ viene medido por

J (u) = τ

u2(t) dt .

Averiguar la expresión de u(t) de modo que la part´ıcula sea transferida desde el reposo en el origen de coordenadas (x = 0) hacia el reposo en x = 1 en 1 unidad de tiempo y minimizando el esfuerzo realizado. Dar también la posición óptima en función del tiempo.

Solución. Utilizaremos el Teorema 75 para la resoluci´on del problema. Sea x(t) la posici´on de la part´ıcula en función del tiempo. Según las leyes de la mecánica clásica se tiene ¨x = u(t), o de forma equivalente,

donde se ha deﬁnido y(t) como la velocidad de la part´ıcula.

La funci´on Hamiltoniana H asociada al sistema (9.35) y al funcional J (u) dado por J (u) = ₁ 0 u2(t) dt , es, seg´un (9.11), H(x, u, t) = λ₁y + λ₂u− u2 ,

donde los multiplicador de Lagrange λi(t) veriﬁcan, teniendo en cuenta

(9.10), el sistema ˙λ₁=−∂H/∂x, ˙λ₂=−∂H/∂y, es decir,

˙λ₁= 0 , ˙λ₂=−λ₁ . (9.36)

La soluci´on del sistema (9.36) es

λ₁(t) =−c₁ , λ₂(t) = c₁t + c₂ , siendo ci constantes reales.

Si u∗ es el control ´optimo, la condici´on (9.12), es decir, (∂H/∂u)_u=u∗ = 0

da lugar a

−2u∗_{+ λ}

2= 0 . (9.37)

De este modo, el control ´optimo es u∗(t) = λ2(t)

2 =

c₁t + c₂

2 .

Introduciendo este control en la segunda ecuaci´on (9.35) e integrando se tiene y∗(t) = u∗(t) dt = 1 2 $_c 1 2t 2_{+ c} 2t % + c₃ .

con c₃ constante. Puesto que la part´ıcula se encuentra para tiempo 0 y 1 en reposo se tienen las condiciones y∗(0) = y∗(1) = 0, de donde obtenemos c₃= 0 y c₁=−2c₂. En deﬁnitiva

y∗(t) = c2 2 ,

t− t2- .

Integrando ahora la primera ecuaci´on de (9.35) se tiene x∗(t) = y∗(t) dt =c2 2 t2 2 − t3 3 + c₄ ,

con c₄ constante. Puesto que la part´ıcula se en cuentra para tiempo 0 y 1 en posiciones 0 y 1 respectivamente, es decir, x∗(0) = 0 y x∗(1) = 1 obtenemos c₄= 0 y c₂= 12. Entonces, la trayectoria ´optima es

(x∗(t), y∗(t)) = 6t2 1 2− t 3 , 6t[1− t] , y el control ´optimo u∗(t) = 6(1− 2t) .

3. Hallar un control u(t) por realimentaci´on lineal que haga m´ınimo el fun- cional ∞ 0 y2+ 1 10u 2 _{dt ,}

sujeto a ˙x =−x + u(t), ˙y = x.

Soluci´on. Utilizaremos la Proposici´on 82 para solucionar el problema planteado. El sistema lineal viene deﬁnido por

˙ x ˙ y = A x y + bu , siendo A = −1 0 1 0 , B = 1 0 . El funcional a minimizar se puede escribir de la forma

_∞ 0 (x, y)Q x y + uTRu dt , con las matrices sim´etricas

Q = 0 0 0 1 , R = 1 10 .

Utilizando la Proposición 82, el control óptimo por realimentación lineal es u∗(t) =−R−1BTP x y , siendo la matriz simétrica

P = p₁₁ p₁₂ p₁₂ p₂₂ , soluci´on de la ecuaci´on matricial algebraica de Riccati

P BR−1BTP− ATP− P A − Q = 0 . Es f´acil comprobar que dicha ecuaci´on es

2[p₁₁+ 5p2₁₁− p₁₂] p₁₂+ 10p₁₁p₁₂− p₂₂ p₁₂+ 10p₁₁p₁₂− p₂₂ −1 + 10p2₁₂ = 0 0 0 0 , dando lugar a la soluci´on

P = ⎛ ⎜ ⎝ 1 10 −1 + 1 + 2√10 ! 1 √ 10 1 √ 10 & 1 10+ . 2 5 ⎞ ⎟ ⎠ . En definitiva, el control óptimo por realimentación lineal es

u∗(t) = 1− . 1 + 2√10 x−√10y .

4. Considerar un sistema regido por la ecuación ¨x = u(t), con |u(t)| ≤ 1. Calcular la expresión de u(t) que minimiza el tiempo T que tarda el sistema en llegar al estado (x(T ), ˙x(T )) = (0, 0) y su interpretación geométrica dependiendo de las condiciones iniciales x(0) y ˙x(0).

Soluci´on. Pasamos la ecuaci´on de segundo orden ¨x = u(t) a un sistema de primer orden con el cambio habitual, es decir,

x = y , ˙y = u(t) . (9.38)

Como se tiene un problema de tiempo ´optimo, para aplicar el Principio del m´aximo de Pontryagin tomaremos el Hamiltoniano (9.31) dado por

H = λ1y + λ2u , (9.39)

donde λi veriﬁcan las ecuaciones (9.29), es decir, ˙λ1 = −∂H/∂x, ˙λ2 =

−∂H/∂y. En nuestro caso se tiene

˙λ₁= 0 , ˙λ₂=−λ₁ , (9.40)

de modo que, integrando estas ecuaciones respecto del tiempo se obtiene λ₁(t) = c₁, λ₂(t) = c₂− c₁t ,

siendo ci constantes reales.

Teniendo en cuenta que |u(t)| ≤ 1, el control óptimo u∗(t) que verifica la condición (9.30) de maximizar el Hamiltoniano (9.39) viene dado por la función continua a trozos

u∗(t) = sign λ₂(t) =

−1 si λ2< 0 ,

1 si λ₂> 0 . (9.41) Este tipo de controles u∗(t) se conocen en la literatura como bang–bang por motivos obvios. Como u∗(t) = sign(c₂− c₁t) es el signo de una fun- ción lineal del tiempo, está claro que como mucho el control ´optimo u∗ tendrá una discontinuidad en el intervalo 0≤ t ≤ T .

Estudiemos las trayectorias en el plano x−y de las fases o de estados para el sistema (9.38) dependiendo del control utilizado.

Si u(t) = 1, el sistema (9.38) es ˙x = y, ˙y = 1. Eliminando el tiempo se tiene dx/dy = y que es una ecuaci´on de variables separables. Se tiene en deﬁnitiva que las trayectorias del sistema vienen dadas por las par´abolas

x = y2/2 + α , (9.42)

con α una constante arbitraria. Adem´as, como ˙y = 1 > 0 est´a claro que y(t) es una funci´on creciente y por lo tanto se sabe c´omo se recorre la par´abola (9.42), ver Figura 9.1.

Figura 9.1: Trayectorias parab´olicas con control u(t) = 1.

Si u(t) =−1, el sistema (9.38) es ˙x = y, ˙y = −1 o, equivalentemente dx/dy =−y. Integrando esta ecuaci´on se halla que las trayectorias del sistema vienen dadas por las par´abolas

x =−y2/2 + β , (9.43)

con β una constante arbitraria. Adem´as, como ˙y =−1 < 0 se tiene que y(t) es una funci´on decreciente y, en consecuencia queda claro el sentido en que se recorre la par´abola (9.43), ver Figura 9.2.

Se tienen pues las siguientes posibilidades en la secuencia de control a aplicar dependiendo de las condiciones iniciales (x(0), y(0)) = (x₀, y₀) ∈ R2 _{del sistema.}

Si el control ´optimo u∗(t) tiene la secuencia temporal

u∗(t) =

1 si 0≤ t ≤ t₁< T , −1 si t1< t≤ T ,

la trayectoria ´optima (x∗(t), y∗(t)) ∈ R2 con 0 ≤ t ≤ T que sigue el sistema (9.38) viene dada por una porción de la parábola (9.42) que pase por el punto inicial (x₀, y₀) seguido de otra porción de la parábola (9.43) que pase por el origen de coordenadas, ver Figura 9.3.

Figura 9.3: Trayectorias parab´olicas con control bang–bang inicial u(t) = 1 y posterior u(t) = −1. La trayectoria óptima con condición inicial (x₀, y₀) está doblemente marcada.

Si el control ´optimo u∗(t) tiene la secuencia temporal

u∗(t) =

−1 si 0 ≤ t ≤ t1< T ,

1 si t₁< t≤ T ,

la trayectoria ´optima (x∗(t), y∗(t)) ∈ R2 con 0 ≤ t ≤ T que sigue el sistema (9.38) viene dada por una porción de la parábola (9.43) que pase por el punto inicial (x₀, y₀) seguido de otra porción de la parábola (9.42) que pase por el origen de coordenadas, ver Figura 9.4.

Figura 9.4: Trayectorias parab´olicas con control bang–bang inicial u(t) = −1 y posterior u(t) = 1. La trayectoria ´optima con condici´on inicial (x₀, y₀) est´a doblemente marcada.

Si el control ´optimo no tiene discontinuidades y es u∗(t) = 1 sig- nifica que se ha dado la casualidad de que el punto inicial (x₀, y₀) está incluido en la semi–parábola (9.42) que pasa por el origen de coordenadas cuando el tiempo evoluciona, ver Figura 9.5.

Figura 9.5: Trayectoria parab´olica con control u(t) = 1.

Si el control ´optimo es de la forma u∗(t) =−1 significa que el punto inicial (x₀, y₀) está contenido en la semi–parábola (9.43) que pasa por el origen de coordenadas cuando avanza el tiempo, ver Figura 9.6.

Figura 9.6: Trayectoria parab´olica con control u(t) =−1.

5. Consideremos un oscilador armónico de frecuencia natural w₀= 1 sobre el que actúa una fuerza u(t) con |u(t)| ≤ 1. Calcular la fuerza u(t) que hay que aplicar de modo que el oscilador sea transferido al estado final de

posición y velocidad nula en el m´ınimo tiempo posible. Interpretar geomé- tricamente el resultado en función de la posición y velocidad inicial del oscilador.

Soluci´on. Sea x(t) la posici´on en función del tiempo del oscilador. Se sabe que el sistema está regido por la ecuación de segundo orden ¨x+w₀2x = u(t). Tomando w₀= 1 y pasando con el cambio habitual al plano de las fases se tiene

x = y , ˙y =−x + u(t) . (9.44) Como se tiene un problema de tiempo óptimo, el Principio del máximo de Pontryagin será aplicado con el Hamiltoniano (9.31) dado por

H = λ1y + λ2(−x + u) , (9.45)

donde λi veriﬁcan las ecuaciones ˙λ1=−∂H/∂x, ˙λ2=−∂H/∂y. En nues-

tro caso se tiene

˙λ₁= λ₂ , ˙λ₂=−λ₁ , (9.46)

de modo que las variables auxiliares λiveriﬁcan la ecuaci´on de un oscilador

arm´onico. Se tiene pues que

λ₂(t) = A sin(t− φ) ,

siendo A > 0 y φ constantes reales (la amplitud y la fase respectivamente). Teniendo en cuenta que|u(t)| ≤ 1, el control ´optimo u∗(t) que maximiza el Hamiltoniano (9.45) viene dado por la funci´on continua a trozos

u∗(t) = sign [λ₂(t)] = sign [sin(t− φ)] , o de forma equivalente u∗(t) = −1 si (2k + 1)π ≤ t − φ ≤ (2k + 2)π , k ∈ N ∪ {0} , 1 si 2kπ≤ t − φ ≤ (2k + 1)π , k ∈ N ∪ {0} . (9.47) Se tiene pues un control u∗(t) de tipo bang–bang donde las discontinuidades tienen lugar cada intervalo de tiempo π.

Estudiemos las trayectorias en el plano x−y de las fases o de estados para el sistema (9.44) dependiendo del control u(t) = u∗(t) utilizado.

Si u(t) = 1, el sistema (9.44) es ˙x = y, ˙y = −x + 1. Eliminando el tiempo se tiene dx/dy = y/(−x + 1) que es una ecuaci´on de vari- ables separables. Se tiene en deﬁnitiva que las trayectorias del sistema vienen dadas por

(x− 1)2+ y2= R2 , (9.48)

con R una constante arbitraria. Dicho de otro modo, las trayecto- rias ´optimas son circunferencias de radio R centradas en el punto

0.5 1 1.5 2 X -1 -0.5 0.5 1 Y

Figura 9.7: Trayectorias circulares (x− 1)2+ y2= R2con control u(t) = 1.

(x, y) = (1, 0). Adem´as, es f´acil ver que las circunferencias (9.48) son recorridas (seg´un avanza el tiempo) en el sentido de las agujas del reloj con un periodo de 2π. En particular, una semicircunferencia se recorre en el tiempo π, ver Figura 9.7.

De forma totalmente an´aloga al caso anterior, si u(t) =−1, el sistema (9.44) es ˙x = y, ˙y =−x + −1, es decir, dx/dy = y/(−x − 1) de modo que las trayectorias del sistema vienen dadas por

(x + 1)2+ y2= R2 , (9.49)

con R una constante arbitraria. As´ı, las trayectorias ´optimas son circunferencias de radio R centradas en el punto (x, y) = (−1, 0). Adem´as, al igual que en el caso anterior, las circunferencias (9.49) son recorridas en el sentido de las agujas del reloj, donde una semi- circunferencia es recorrida en tiempo π, ver Figura 9.8.

-2 -1.5 -1 -0.5 X -1 -0.5 0.5 1 Y

Veamos cómo son las trayectorias óptimas de este problema dependien- do de las condiciones iniciales (x(0), y(0)) = (x₀, y₀) ∈ R2 del sistema. Tomaremos el tiempo t₁de modo que el sistema se encuentre en el estado final, en nuestro caso (x(t₁), y(t₁)) = (0, 0).

Supongamos que el último tramo del control ´optimo u∗ corresponde al valor u∗ = 1. Geométricamente, durante este último intervalo de tiempo, el sistema evoluciona hacia el origen por la circunferencia (9.48) de radio R = 1 partiendo de un punto que denotaremos por A y está localizado en el IV cuadrante. Por supuesto, como es el tramo final y por lo tanto u∗ ya no vuelve a cambiar, el sistema llega sobre esa circunferencia al origen habiendo recorrido un arco inferior a la semicircunferencia.

El sistema habr´a llegado al punto A desplaz´andose, durante un inter- valo de tiempo π y bajo la acción del control u∗=−1, por la semi- circunferencia (9.49) de extremo final A. Llamemos B al extremo inicial de dicha semicircunferencia que, obviamente, estará en el II cuadrante. Notar que, el punto B es el simétrico de A respecto del punto (−1, 0).

De forma an´aloga, la porci´on de trayectoria ´optima anterior a la BA, llam´emosla CB, consiste en la semicircunferencia (9.48) que pasa por el punto B y el sistema evoluciona en ella durante un tiempo π. Por supuesto, el punto C estar´a situado en el IV cuadrante y es el sim´etrico de B respecto del punto (1, 0).

Esta construcción geométrica continua hasta que la trayectoria ópti- ma pase por el punto inicial (x₀, y₀), ver Figura 9.9.

-3 -2 -1 1 2 X -4 -3 -2 -1 1 2 Y

Figura 9.9: Una trayectoria ´optima con el control ﬁnal u = 1, compuesta de tres arcos de circunferencias

Supongamos ahora que el último tramo del control ´optimo u∗ cor- responde al valor u∗ = −1. Geométricamente, durante este último intervalo de tiempo, el sistema evoluciona hacia el origen por la cir- cunferencia (9.49) de radio R = 1 partiendo de un punto que deno- taremos por A y está localizado en el II cuadrante. Por supuesto, como es el tramo final y por lo tanto u∗ ya no vuelve a cambiar, el sistema llega sobre esa circunferencia al origen habiendo recorrido un arco inferior a la semicircunferencia.

El sistema habr´a llegado al punto A desplazándose, durante un in- tervalo de tiempo π y bajo la acción del control u∗= 1, por la semi- circunferencia (9.48) de extremo final A. Llamemos B al extremo inicial de dicha semicircunferencia que, obviamente, estará en el IV cuadrante. Notar que, el punto B es el sim´etrico de A respecto del punto (1, 0).

De forma análoga, la porción de trayectoria ´optima anterior a la BA, llam´emosla CB, consiste en la semicircunferencia (9.49) que pasa por el punto B y el sistema evoluciona en ella durante un tiempo π. Por supuesto, el punto C estará situado en el II cuadrante y es el sim´etrico de B respecto del punto (−1, 0).

Esta construcción geométrica continua hasta que la trayectoria ópti- ma pase por el punto inicial (x₀, y₀), ver Figura 9.10.

-1 1 2 3 X -2 -1 1 2 3 Y

Figura 9.10: Una trayectoria ´optima con el control ﬁnal u =−1, compuesta de tres arcos de circunferencias

Pr´acticas

Este cap´ıtulo est´a compuesto de varias pr´acticas propuestas donde se aplica la teor´ıa introducida a lo largo del libro a problemas de diferente naturaleza.

10.1. Control de la temperatura de una c´amara

Consideremos el problema de controlar la temperatura Tcen una c´amara. El

objetivo consiste en analizar un controlador que regule, mediante una válvula, la cantidad de calor que se debe introducir en la cámara conociendo la temperatura de esta mediante un termómetro de mercurio (Hg) introducido en la cámara y contenido en un tubo de cristal de vidrio. Por supuesto, la temperatura de la cámara est´a influenciada por la temperatura ambiente Ta del entorno.

Supongamos adem´as que la variable que puede ser medida es la altura h de la columna de Hg.

Deﬁnamos los siguientes ﬂujos de calor:

qa es el ﬂujo de calor de la c´amara al ambiente.

qcr es el flujo de calor de la cámara al crital del termómetro.

qHg es el ﬂujo de calor del cristal hacia el mercurio.

Definamos también las siguientes temperaturas: Tc es la temperatura de la cámara.

Ta es la temperatura ambiente.

Tcr es la temperatura del cristal del term´ometro.

THg es la temperatura del mercurio del term´ometro.

Consideremos las siguientes magnitudes geom´etricas: 115

Acres el ´area interna del cristal del term´ometro.

Vcr es el volumen del cristal del term´ometro.

VHg es el volumen del mercurio.

Supongamos que la v´alvula puede ser regulada mediante un control u(t) de modo que, la cantidad de calor q(t) que se introduce en la c´amara viene dada por

q(t) = a₀u(t) .

Supongamos v´alidas las siguientes ecuaciones de transferencia de calor q_a = a₁(T_a− T_c) , q_cr= a₂(T_c− T_cr) , q_Hg = a₃(T_cr− T_Hg) , dTc dt = b1(qa+ q) , dTcr dt = b2(qcr− qHg) , dTHg dt = b3qHg ,

y las siguientes relaciones de proporcionalidad debidas a las dilataciones por las temperaturas

Acr= c1Tcr2 , Vcr= c2Tcr3 , VHg = c3THg3 .

La altura h de la columna de mercurio viene dada por h = VHg− Vcr

Acr .

Se supone que los par´ametros ai, bj y cj con i = 0, 1, 2, 3 y j = 1, 2, 3

son constantes positivas que dependen de la geometr´ıa y las propiedades de los materiales. Además, en un buen termómetro se verificar´a c₂> c₃.

10.1.1. Realizaci´on de la pr´actica

1. Hallar las ecuaciones del sistema tomando como variables de estado Tc−Ta,

Tcr− Ta y THg − Ta, siendo la variable de control u y Ta un par´ametro

constante.

2. Demostrar que si no se ejerce ningún control sobre el sistema (es decir u = 0), entonces el único punto de equilibrio x∗ del sistema corresponde al equilibrio termodin´amico Tc= Tcr= THg = Ta y además es asintótica-

mente estable en concordancia con el principio cero de la termodin´amica. 3. ¿Es el sistema completamente controlable para todo valor de ai, bi?

4. Hallar el control u(t) de modo que el sistema evolucione desde el estado inicial (Tc(0), Tcr(0), THg(0)) = (10, 25, 15) hasta un estado ﬁnal dado por

(Tc(10), Tcr(10), THg(10)) = (20, 25, 25) minimizando la cantidad de calor

introducida en la c´amara, es decir, minimizando₀10u2(t) dt.

In document Teoría de Estabilidad y Control Isaac A. García (página 111-127)