• No se han encontrado resultados

Teor´ıa de Pontryagin

9. Control ´ Optimo

9.4. Teor´ıa de Pontryagin

Una gran variedad de procesos f´ısicos pueden ser controlados de m´ultiples formas, pero s´olo una forma es la mejor bajo un cierto criterio. Se trata pues de averiguar cual es el control ´optimo del proceso en cuesti´on. Quiz´as interese realizar el objetivo del proceso en el menor tiempo posible o bien con el m´ınimo consumo de energ´ıa, etc...

Supondremos que el sistema est´a gobernado por ˙

con x = (x1, . . . , xn)T las variables de estado o de fase, f = (f1, . . . , fn)T

Rn y u = (u

1, . . . , um)T las variables de control. Adem´as suponemos que f

suficientemente regular de modo que, dado un control u(t) definido para t0 t≤ t1, la soluci´on x(t) de (9.25) existe y es ´unica en el intervalo t0≤ t ≤ t1. En particular, supondremos que fiy ∂fi/∂xj son funciones continuas.

Consideremos el funcional J (u, x) =

 t1

t0

F (x, u) dt , (9.26)

de modo que, para cada control dado u(t) definido para t0 ≤ t ≤ t1, se tiene J (u, x) bien definido y tomando un valor real fijado.

Fijados el estado inicial x0 y final xf del sistema, supongamos que existen

varios controles u(t) que transfieren el sistema desde el estado inicial x(t0) = x0 hasta el estado final x(t1) = xf en tiempo t1− t0. Nos preguntamos si, de

entre esos controles, existe uno u∗tal que se minimize el funcional (9.26). Dicho control u∗(t) es llamado control ´optimo y la soluci´on x∗(t) de (9.25) asociado al control u∗ una trayectoria ´optima.

Notemos que, en el problema planteado, los valores de t0 y de t1 no est´an en general fijados. Lo ´unico que se pide es que para tiempo t0 el sistema se encuentre en el estado x0 y para tiempo t1en el estado xf.

Es importante notar que, en los problemas aplicados, muy a menudo se tiene que las variables de control uino pueden tomar valores arbitrarios si no que est´an

acotadas y adem´as pueden ser discontinuas. Entonces, s´olo tiene sentido tomar controles u pertenecientes a un cierto dominioU ⊂ Rm.

As´ı, diremos que el control u(t) es admisible si u(t)∈ U para todo t0≤ t ≤ t1 y adem´as es continuo a trozos en dicho intervalo. Dicho de otro modo, pueden existir tiempos si con t0 < s1 < s2 < · · · < sn < t1 que corresponden a

discontinuidades de primera especie de u(t).

Un caso muy habitual de conjunto de controles admisiblesU es el hipercubo deRmsiguiente

U = {u = (u1, . . . , um) : |ui| ≤ umaxi , i = 1, . . . , m} ⊂ Rm . (9.27)

Observemos que, al a¯nadir la condici´on (9.27) al problema de optimizaci´on planteado se tiene un car´acter radicalmente diferente del que se ten´ıa con la condici´on (9.12), es decir, (∇uH)u=u∗ = 0 puesto que ahora el hamiltoniano H

puede ser no derivable respecto de u en todos los puntos ya que u(t) puede tener puntos donde no exista la derivada.

El siguiente resultado fundamental, ver su demostraci´on en [8] por ejemplo, aporta condiciones necesarias que debe verificar un control ´optimo u∗ donde se tiene en cuenta la condici´on (9.27) sobre la acotaci´on de los controles admisibles . Para conseguirlo, definimos la funci´on de HamiltonH asociada al sistema (9.25) y al funcional (9.26) de la forma

siendo λ(t) = (λ1(t), . . . , λn(t))T ∈ Rn un vector de multiplicadores de Lagrange

verificando

˙λi=−∂H

∂xi , i = 1, . . . , n . (9.29) Teorema 83 (Principio del m´aximo de Pontryagin). Sea u∗(t) definido pa- ra t0 < t < t1 un control admisible tal que la trayectoria x∗(t) del sistema (9.25) asociada verifica x∗(t0) = x0 y x∗(t1) = xf. Si u∗(t) es ´optimo para

el funcional (9.26), entonces existe un vector de multiplicadores de Lagrange λ(t) = (λ1(t), . . . , λn(t))T ∈ Rn continuo y no nulo, verificando (9.29). Adem´as,

para cualquier t0≤ t ≤ t1, el hamiltonianoH(λ(t), x(t), u) alcanza su m´aximo en u = u∗(t) mirado como una funci´on de los controles admisibles u ∈ U, es decir,

H(λ(t), x∗(t), u(t)) = sup

u∈U{H(λ(t), x(t), u)} . (9.30)

Nota 84. Si se trata de un problema de control en tiempo ´optimo, es decir, F (x, u) ≡ 1 en el funcional (9.26), entonces es habitual tomar la funci´on de Hamilton

H(λ, x, u) = λTf (x, u) , (9.31)

en la utilizaci´on del Teorema 83.

9.5.

Problemas resueltos

1. Minimizar el ´ındice de actuaci´on J (u, x) =

 T

0

(x(t)2+ u2(t)) dt ,

sabiendo que ˙x = −ax + u(t) con x(0) = x0. Tomar a y T constantes positivas.

Soluci´on. Utilizaremos el Teorema 75 para la resoluci´on del problema. La funci´on Hamiltoniana H asociada al funcional J (u, x) y al sistema

˙

x =−ax + u(t) viene dado, seg´un (9.11), por

H(x, u, t) = λ(−ax + u) − (x2+ u2) ,

donde el multiplicador de Lagrange λ(t) verifica, teniendo en cuenta (9.10), la ecuaci´on ˙λ =−∂H/∂x, es decir,

˙λ = 2x∗+ aλ , (9.32)

donde se ha denotado por x∗(t) a la trayectoria ´optima. Adem´as, si u∗ es el control ´optimo, la condici´on (9.12), es decir, (∂H/∂u)u=u = 0 impone

en nuestro caso la restricci´on

Introduciendo esta condici´on en el sistema ˙x∗=−ax∗+ u∗se obtiene ˙

x∗=−ax∗+1

2λ . (9.34)

Teniendo en cuenta que el punto final x(T ) no est´a fijado se tiene la condici´on de transversalidad (9.14), es decir,

λ(T ) = 0 .

Observar que, el sistema formado por las ecuaciones (9.32) y (9.34) es un sistema lineal y puede, por lo tanto, ser resuelto con los m´etodos ya estudiados anteriormente. En concreto, es f´acil demostrar que, la soluci´on general del sistema (9.32) y (9.34) es

x∗(t) = C1cosh(1 + a2t)− 1 2√1 + a2(2aC1+ C2) sinh(  1 + a2t) , λ(t) = C2cosh(1 + a2t) +√ 1 1 + a2(−2C1+ aC2) sinh(  1 + a2t) , siendo C1 y C2 constantes arbitrarias que se determinan con las condi- ciones de contorno x∗(0) = x0 y λ(T ) = 0. En concreto se obtiene

C1= x0 , C2= 2x0

a +√1 + a2coth(√1 + a2T ) .

En definitiva, el control ´optimo u∗ es, seg´un (9.33), u∗(t) = −λ(t)/2, es decir, u∗(t) = x0 sinh[ 1 + a2(t− T )] 1 + a2cosh[√1 + a2T ] + a sinh[√1 + a2T ] .

2. Una part´ıcula realiza un movimiento rectil´ıneo sujeta a la acci´on de una fuerza por unidad de masa u(t). Supongamos que el esfuerzo realizado cuando la part´ıcula evoluciona desde tiempo cero hasta tiempo τ viene medido por

J (u) =  τ

0

u2(t) dt .

Averiguar la expresi´on de u(t) de modo que la part´ıcula sea transferida desde el reposo en el origen de coordenadas (x = 0) hacia el reposo en x = 1 en 1 unidad de tiempo y minimizando el esfuerzo realizado. Dar tambi´en la posici´on ´optima en funci´on del tiempo.

Soluci´on. Utilizaremos el Teorema 75 para la resoluci´on del problema. Sea x(t) la posici´on de la part´ıcula en funci´on del tiempo. Seg´un las leyes de la mec´anica cl´asica se tiene ¨x = u(t), o de forma equivalente,

˙

donde se ha definido y(t) como la velocidad de la part´ıcula.

La funci´on Hamiltoniana H asociada al sistema (9.35) y al funcional J (u) dado por J (u) =  1 0 u2(t) dt , es, seg´un (9.11), H(x, u, t) = λ1y + λ2u− u2 ,

donde los multiplicador de Lagrange λi(t) verifican, teniendo en cuenta

(9.10), el sistema ˙λ1=−∂H/∂x, ˙λ2=−∂H/∂y, es decir,

˙λ1= 0 , ˙λ2=−λ1 . (9.36)

La soluci´on del sistema (9.36) es

λ1(t) =−c1 , λ2(t) = c1t + c2 , siendo ci constantes reales.

Si u∗ es el control ´optimo, la condici´on (9.12), es decir, (∂H/∂u)u=u = 0

da lugar a

−2u∗+ λ

2= 0 . (9.37)

De este modo, el control ´optimo es u∗(t) = λ2(t)

2 =

c1t + c2

2 .

Introduciendo este control en la segunda ecuaci´on (9.35) e integrando se tiene y∗(t) =  u∗(t) dt = 1 2 $c 1 2t 2+ c 2t % + c3 .

con c3 constante. Puesto que la part´ıcula se encuentra para tiempo 0 y 1 en reposo se tienen las condiciones y∗(0) = y∗(1) = 0, de donde obtenemos c3= 0 y c1=−2c2. En definitiva

y∗(t) = c2 2 ,

t− t2- .

Integrando ahora la primera ecuaci´on de (9.35) se tiene x∗(t) =  y∗(t) dt =c2 2  t2 2 t3 3  + c4 ,

con c4 constante. Puesto que la part´ıcula se en cuentra para tiempo 0 y 1 en posiciones 0 y 1 respectivamente, es decir, x∗(0) = 0 y x∗(1) = 1 obtenemos c4= 0 y c2= 12. Entonces, la trayectoria ´optima es

(x∗(t), y∗(t)) =  6t2 1 2 t 3  , 6t[1− t]  , y el control ´optimo u∗(t) = 6(1− 2t) .

3. Hallar un control u(t) por realimentaci´on lineal que haga m´ınimo el fun- cional  0  y2+ 1 10u 2 dt ,

sujeto a ˙x =−x + u(t), ˙y = x.

Soluci´on. Utilizaremos la Proposici´on 82 para solucionar el problema planteado. El sistema lineal viene definido por

 ˙ x ˙ y  = A  x y  + bu , siendo A =  −1 0 1 0  , B =  1 0  . El funcional a minimizar se puede escribir de la forma

 0 (x, y)Q  x y  + uTRu  dt , con las matrices sim´etricas

Q =  0 0 0 1  , R = 1 10 .

Utilizando la Proposici´on 82, el control ´optimo por realimentaci´on lineal es u∗(t) =−R−1BTP  x y  , siendo la matriz sim´etrica

P =  p11 p12 p12 p22  , soluci´on de la ecuaci´on matricial algebraica de Riccati

P BR−1BTP− ATP− P A − Q = 0 . Es f´acil comprobar que dicha ecuaci´on es

 2[p11+ 5p211− p12] p12+ 10p11p12− p22 p12+ 10p11p12− p22 −1 + 10p212  =  0 0 0 0  , dando lugar a la soluci´on

P = ⎛ ⎜ ⎝ 1 10 −1 +  1 + 210 ! 1 10 1 10 & 1 10+ . 2 5 ⎞ ⎟ ⎠ . En definitiva, el control ´optimo por realimentaci´on lineal es

u∗(t) = 1 . 1 + 210  x−√10y .

4. Considerar un sistema regido por la ecuaci´on ¨x = u(t), con |u(t)| ≤ 1. Calcular la expresi´on de u(t) que minimiza el tiempo T que tarda el sistema en llegar al estado (x(T ), ˙x(T )) = (0, 0) y su interpretaci´on geom´etrica dependiendo de las condiciones iniciales x(0) y ˙x(0).

Soluci´on. Pasamos la ecuaci´on de segundo orden ¨x = u(t) a un sistema de primer orden con el cambio habitual, es decir,

˙

x = y , ˙y = u(t) . (9.38)

Como se tiene un problema de tiempo ´optimo, para aplicar el Principio del m´aximo de Pontryagin tomaremos el Hamiltoniano (9.31) dado por

H = λ1y + λ2u , (9.39)

donde λi verifican las ecuaciones (9.29), es decir, ˙λ1 = −∂H/∂x, ˙λ2 =

−∂H/∂y. En nuestro caso se tiene

˙λ1= 0 , ˙λ2=−λ1 , (9.40)

de modo que, integrando estas ecuaciones respecto del tiempo se obtiene λ1(t) = c1, λ2(t) = c2− c1t ,

siendo ci constantes reales.

Teniendo en cuenta que |u(t)| ≤ 1, el control ´optimo u∗(t) que verifica la condici´on (9.30) de maximizar el Hamiltoniano (9.39) viene dado por la funci´on continua a trozos

u∗(t) = sign λ2(t) = 

−1 si λ2< 0 ,

1 si λ2> 0 . (9.41) Este tipo de controles u∗(t) se conocen en la literatura como bang–bang por motivos obvios. Como u∗(t) = sign(c2− c1t) es el signo de una fun- ci´on lineal del tiempo, est´a claro que como mucho el control ´optimo u∗ tendr´a una discontinuidad en el intervalo 0≤ t ≤ T .

Estudiemos las trayectorias en el plano x−y de las fases o de estados para el sistema (9.38) dependiendo del control utilizado.

Si u(t) = 1, el sistema (9.38) es ˙x = y, ˙y = 1. Eliminando el tiempo se tiene dx/dy = y que es una ecuaci´on de variables separables. Se tiene en definitiva que las trayectorias del sistema vienen dadas por las par´abolas

x = y2/2 + α , (9.42)

con α una constante arbitraria. Adem´as, como ˙y = 1 > 0 est´a claro que y(t) es una funci´on creciente y por lo tanto se sabe c´omo se recorre la par´abola (9.42), ver Figura 9.1.

Figura 9.1: Trayectorias parab´olicas con control u(t) = 1.

Si u(t) =−1, el sistema (9.38) es ˙x = y, ˙y = −1 o, equivalentemente dx/dy =−y. Integrando esta ecuaci´on se halla que las trayectorias del sistema vienen dadas por las par´abolas

x =−y2/2 + β , (9.43)

con β una constante arbitraria. Adem´as, como ˙y =−1 < 0 se tiene que y(t) es una funci´on decreciente y, en consecuencia queda claro el sentido en que se recorre la par´abola (9.43), ver Figura 9.2.

Se tienen pues las siguientes posibilidades en la secuencia de control a aplicar dependiendo de las condiciones iniciales (x(0), y(0)) = (x0, y0) R2 del sistema.

Si el control ´optimo u∗(t) tiene la secuencia temporal

u∗(t) = 

1 si 0≤ t ≤ t1< T , −1 si t1< t≤ T ,

la trayectoria ´optima (x∗(t), y∗(t)) ∈ R2 con 0 ≤ t ≤ T que sigue el sistema (9.38) viene dada por una porci´on de la par´abola (9.42) que pase por el punto inicial (x0, y0) seguido de otra porci´on de la par´abola (9.43) que pase por el origen de coordenadas, ver Figura 9.3.

Figura 9.3: Trayectorias parab´olicas con control bang–bang inicial u(t) = 1 y posterior u(t) = −1. La trayectoria ´optima con condici´on inicial (x0, y0) est´a doblemente marcada.

Si el control ´optimo u∗(t) tiene la secuencia temporal

u∗(t) = 

−1 si 0 ≤ t ≤ t1< T ,

1 si t1< t≤ T ,

la trayectoria ´optima (x∗(t), y∗(t)) ∈ R2 con 0 ≤ t ≤ T que sigue el sistema (9.38) viene dada por una porci´on de la par´abola (9.43) que pase por el punto inicial (x0, y0) seguido de otra porci´on de la par´abola (9.42) que pase por el origen de coordenadas, ver Figura 9.4.

Figura 9.4: Trayectorias parab´olicas con control bang–bang inicial u(t) = −1 y posterior u(t) = 1. La trayectoria ´optima con condici´on inicial (x0, y0) est´a doblemente marcada.

Si el control ´optimo no tiene discontinuidades y es u∗(t) = 1 sig- nifica que se ha dado la casualidad de que el punto inicial (x0, y0) est´a incluido en la semi–par´abola (9.42) que pasa por el origen de coordenadas cuando el tiempo evoluciona, ver Figura 9.5.

Figura 9.5: Trayectoria parab´olica con control u(t) = 1.

Si el control ´optimo es de la forma u∗(t) =−1 significa que el punto inicial (x0, y0) est´a contenido en la semi–par´abola (9.43) que pasa por el origen de coordenadas cuando avanza el tiempo, ver Figura 9.6.

Figura 9.6: Trayectoria parab´olica con control u(t) =−1.

5. Consideremos un oscilador arm´onico de frecuencia natural w0= 1 sobre el que act´ua una fuerza u(t) con |u(t)| ≤ 1. Calcular la fuerza u(t) que hay que aplicar de modo que el oscilador sea transferido al estado final de

posici´on y velocidad nula en el m´ınimo tiempo posible. Interpretar geom´e- tricamente el resultado en funci´on de la posici´on y velocidad inicial del oscilador.

Soluci´on. Sea x(t) la posici´on en funci´on del tiempo del oscilador. Se sabe que el sistema est´a regido por la ecuaci´on de segundo orden ¨x+w02x = u(t). Tomando w0= 1 y pasando con el cambio habitual al plano de las fases se tiene

˙

x = y , ˙y =−x + u(t) . (9.44) Como se tiene un problema de tiempo ´optimo, el Principio del m´aximo de Pontryagin ser´a aplicado con el Hamiltoniano (9.31) dado por

H = λ1y + λ2(−x + u) , (9.45)

donde λi verifican las ecuaciones ˙λ1=−∂H/∂x, ˙λ2=−∂H/∂y. En nues-

tro caso se tiene

˙λ1= λ2 , ˙λ2=−λ1 , (9.46)

de modo que las variables auxiliares λiverifican la ecuaci´on de un oscilador

arm´onico. Se tiene pues que

λ2(t) = A sin(t− φ) ,

siendo A > 0 y φ constantes reales (la amplitud y la fase respectivamente). Teniendo en cuenta que|u(t)| ≤ 1, el control ´optimo u∗(t) que maximiza el Hamiltoniano (9.45) viene dado por la funci´on continua a trozos

u∗(t) = sign [λ2(t)] = sign [sin(t− φ)] , o de forma equivalente u∗(t) =  −1 si (2k + 1)π ≤ t − φ ≤ (2k + 2)π , k ∈ N ∪ {0} , 1 si 2kπ≤ t − φ ≤ (2k + 1)π , k ∈ N ∪ {0} . (9.47) Se tiene pues un control u∗(t) de tipo bang–bang donde las discontinuidades tienen lugar cada intervalo de tiempo π.

Estudiemos las trayectorias en el plano x−y de las fases o de estados para el sistema (9.44) dependiendo del control u(t) = u∗(t) utilizado.

Si u(t) = 1, el sistema (9.44) es ˙x = y, ˙y = −x + 1. Eliminando el tiempo se tiene dx/dy = y/(−x + 1) que es una ecuaci´on de vari- ables separables. Se tiene en definitiva que las trayectorias del sistema vienen dadas por

(x− 1)2+ y2= R2 , (9.48)

con R una constante arbitraria. Dicho de otro modo, las trayecto- rias ´optimas son circunferencias de radio R centradas en el punto

0.5 1 1.5 2 X -1 -0.5 0.5 1 Y

Figura 9.7: Trayectorias circulares (x− 1)2+ y2= R2con control u(t) = 1.

(x, y) = (1, 0). Adem´as, es f´acil ver que las circunferencias (9.48) son recorridas (seg´un avanza el tiempo) en el sentido de las agujas del reloj con un periodo de 2π. En particular, una semicircunferencia se recorre en el tiempo π, ver Figura 9.7.

De forma totalmente an´aloga al caso anterior, si u(t) =−1, el sistema (9.44) es ˙x = y, ˙y =−x + −1, es decir, dx/dy = y/(−x − 1) de modo que las trayectorias del sistema vienen dadas por

(x + 1)2+ y2= R2 , (9.49)

con R una constante arbitraria. As´ı, las trayectorias ´optimas son circunferencias de radio R centradas en el punto (x, y) = (−1, 0). Adem´as, al igual que en el caso anterior, las circunferencias (9.49) son recorridas en el sentido de las agujas del reloj, donde una semi- circunferencia es recorrida en tiempo π, ver Figura 9.8.

-2 -1.5 -1 -0.5 X -1 -0.5 0.5 1 Y

Veamos c´omo son las trayectorias ´optimas de este problema dependien- do de las condiciones iniciales (x(0), y(0)) = (x0, y0) ∈ R2 del sistema. Tomaremos el tiempo t1de modo que el sistema se encuentre en el estado final, en nuestro caso (x(t1), y(t1)) = (0, 0).

Supongamos que el ´ultimo tramo del control ´optimo u∗ corresponde al valor u∗ = 1. Geom´etricamente, durante este ´ultimo intervalo de tiempo, el sistema evoluciona hacia el origen por la circunferencia (9.48) de radio R = 1 partiendo de un punto que denotaremos por A y est´a localizado en el IV cuadrante. Por supuesto, como es el tramo final y por lo tanto u∗ ya no vuelve a cambiar, el sistema llega sobre esa circunferencia al origen habiendo recorrido un arco inferior a la semicircunferencia.

El sistema habr´a llegado al punto A desplaz´andose, durante un inter- valo de tiempo π y bajo la acci´on del control u∗=−1, por la semi- circunferencia (9.49) de extremo final A. Llamemos B al extremo inicial de dicha semicircunferencia que, obviamente, estar´a en el II cuadrante. Notar que, el punto B es el sim´etrico de A respecto del punto (−1, 0).

De forma an´aloga, la porci´on de trayectoria ´optima anterior a la BA, llam´emosla CB, consiste en la semicircunferencia (9.48) que pasa por el punto B y el sistema evoluciona en ella durante un tiempo π. Por supuesto, el punto C estar´a situado en el IV cuadrante y es el sim´etrico de B respecto del punto (1, 0).

Esta construcci´on geom´etrica continua hasta que la trayectoria ´opti- ma pase por el punto inicial (x0, y0), ver Figura 9.9.

-3 -2 -1 1 2 X -4 -3 -2 -1 1 2 Y

Figura 9.9: Una trayectoria ´optima con el control final u = 1, compuesta de tres arcos de circunferencias

Supongamos ahora que el ´ultimo tramo del control ´optimo u∗ cor- responde al valor u∗ = −1. Geom´etricamente, durante este ´ultimo intervalo de tiempo, el sistema evoluciona hacia el origen por la cir- cunferencia (9.49) de radio R = 1 partiendo de un punto que deno- taremos por A y est´a localizado en el II cuadrante. Por supuesto, como es el tramo final y por lo tanto u∗ ya no vuelve a cambiar, el sistema llega sobre esa circunferencia al origen habiendo recorrido un arco inferior a la semicircunferencia.

El sistema habr´a llegado al punto A desplaz´andose, durante un in- tervalo de tiempo π y bajo la acci´on del control u∗= 1, por la semi- circunferencia (9.48) de extremo final A. Llamemos B al extremo inicial de dicha semicircunferencia que, obviamente, estar´a en el IV cuadrante. Notar que, el punto B es el sim´etrico de A respecto del punto (1, 0).

De forma an´aloga, la porci´on de trayectoria ´optima anterior a la BA, llam´emosla CB, consiste en la semicircunferencia (9.49) que pasa por el punto B y el sistema evoluciona en ella durante un tiempo π. Por supuesto, el punto C estar´a situado en el II cuadrante y es el sim´etrico de B respecto del punto (−1, 0).

Esta construcci´on geom´etrica continua hasta que la trayectoria ´opti- ma pase por el punto inicial (x0, y0), ver Figura 9.10.

-1 1 2 3 X -2 -1 1 2 3 Y

Figura 9.10: Una trayectoria ´optima con el control final u =−1, compuesta de tres arcos de circunferencias

Pr´acticas

Este cap´ıtulo est´a compuesto de varias pr´acticas propuestas donde se aplica la teor´ıa introducida a lo largo del libro a problemas de diferente naturaleza.

10.1.

Control de la temperatura de una c´amara

Consideremos el problema de controlar la temperatura Tcen una c´amara. El

objetivo consiste en analizar un controlador que regule, mediante una v´alvula, la cantidad de calor que se debe introducir en la c´amara conociendo la tem- peratura de esta mediante un term´ometro de mercurio (Hg) introducido en la c´amara y contenido en un tubo de cristal de vidrio. Por supuesto, la temperatu- ra de la c´amara est´a influenciada por la temperatura ambiente Ta del entorno.

Supongamos adem´as que la variable que puede ser medida es la altura h de la columna de Hg.

Definamos los siguientes flujos de calor:

qa es el flujo de calor de la c´amara al ambiente.

qcr es el flujo de calor de la c´amara al crital del term´ometro.

qHg es el flujo de calor del cristal hacia el mercurio.

Definamos tambi´en las siguientes temperaturas: Tc es la temperatura de la c´amara.

Ta es la temperatura ambiente.

Tcr es la temperatura del cristal del term´ometro.

THg es la temperatura del mercurio del term´ometro.

Consideremos las siguientes magnitudes geom´etricas: 115

Acres el ´area interna del cristal del term´ometro.

Vcr es el volumen del cristal del term´ometro.

VHg es el volumen del mercurio.

Supongamos que la v´alvula puede ser regulada mediante un control u(t) de modo que, la cantidad de calor q(t) que se introduce en la c´amara viene dada por

q(t) = a0u(t) .

Supongamos v´alidas las siguientes ecuaciones de transferencia de calor qa = a1(Ta− Tc) , qcr= a2(Tc− Tcr) , qHg = a3(Tcr− THg) , dTc dt = b1(qa+ q) , dTcr dt = b2(qcr− qHg) , dTHg dt = b3qHg ,

y las siguientes relaciones de proporcionalidad debidas a las dilataciones por las temperaturas

Acr= c1Tcr2 , Vcr= c2Tcr3 , VHg = c3THg3 .

La altura h de la columna de mercurio viene dada por h = VHg− Vcr

Acr .

Se supone que los par´ametros ai, bj y cj con i = 0, 1, 2, 3 y j = 1, 2, 3

son constantes positivas que dependen de la geometr´ıa y las propiedades de los materiales. Adem´as, en un buen term´ometro se verificar´a c2> c3.

10.1.1.

Realizaci´on de la pr´actica

1. Hallar las ecuaciones del sistema tomando como variables de estado Tc−Ta,

Tcr− Ta y THg − Ta, siendo la variable de control u y Ta un par´ametro

constante.

2. Demostrar que si no se ejerce ning´un control sobre el sistema (es decir u = 0), entonces el ´unico punto de equilibrio x∗ del sistema corresponde al equilibrio termodin´amico Tc= Tcr= THg = Ta y adem´as es asint´otica-

mente estable en concordancia con el principio cero de la termodin´amica. 3. ¿Es el sistema completamente controlable para todo valor de ai, bi?

4. Hallar el control u(t) de modo que el sistema evolucione desde el estado inicial (Tc(0), Tcr(0), THg(0)) = (10, 25, 15) hasta un estado final dado por

(Tc(10), Tcr(10), THg(10)) = (20, 25, 25) minimizando la cantidad de calor

introducida en la c´amara, es decir, minimizando010u2(t) dt.

Documento similar