Problema lineal de control ´ optimo con funcional objetivo cuadr´ atico y con
par´ ametros.
U.A. Sosa Aguirre Departamento de Matem´ aticas
Universidad del Valle
Resumen
Dentro de la Teor´ıa de Control ´Optimo, pretendemos estudiar proble- mas cuya din´amica es descrita por un sistema lineal de ecuaciones difer- enciales ordinarias y cuyo ´ındice de rendimiento es un funcional objetivo convexo (o cuadr´atico). Utilizando la Condici´on de M´aximo de Pontrya- gin sobre el Hamiltoniano del sistema, candidatizaremos controles ´optimos e implementaremos un algoritmo para calcularlos. Tambi´en mostraremos para el caso lineal convexo, que la condici´on de m´aximo es suficiente y necesaria para optimalidad, incluso perturbando los par´ametros tanto del sistema, como del funcional.
Palabras Claves: Sistema de control, control ´optimo, principio del m´aximo.
INTRODUCCION
El control ´optimo nace por las necesidades de la ingenier´ıa de control en la d´ecada de 1950, las cuales estimularon la formulaci´on e investigaci´on de una nueva clase de importantes problemas que requer´ıan la optimizaci´on de fun- cionales. En realidad, sus ra´ıces datan de 1696 a partir de la generalizaci´on del problema de la braquistocrona, enunciado por Johann Bernoulli como un reto para sus contempor´aneos1 y de otros problemas que hab´ıan sido estudia- dos inicialmente en los siglos XVII y XVIII los cuales cimentaron las bases del denominado C´alculo Variacional. El problema b´asico del c´alculo variacional se formula como sigue. Sea x = x(·) ∈ Cn1(T ), T = [t0, t1], una curva admisible, esto es,
x(t0) = x0, x(t1) = x1, (1)
1La soluci´on fue publicada junto a la de otros grandes matem´aticos un a˜no despu´es en su art´ıculo “Acta Eruditorum”
x0 y x1 dados. Sea adem´as el conjunto funcional
X = {x(·) ∈ Cn1(T ) : x(t0) = x0, x(t1) = x1}, y definamos el funcional
J = J (x) = Z t1
t0
F (x, ˙x, t)dt,
sobre X, donde F (x, ˙x, t) est´a definida y es continua respecto a cada uno de sus argumentos, junto con sus derivadas parciales respecto a (x, ˙x, t). El problema es entonces obtener x∗(·) ∈ X tal que:
x∗: J (x) → m´ın (2)
en cuyo caso x∗ es una minimal, en el sentido que minimiza al funcional J . La idea central para resolver el problema b´asico del c´alculo variacional es dar una condici´on necesaria para las funciones candidatas a ser extremales del funcional J , denominada condici´on de Euler-Lagrange, y que afirma lo sigu- iente: todo m´ınimo d´ebil del problema b´asico de c´alculo variacional satisface la ecuaci´on de Euler-Lagrange
∂F (x, ˙x, t)
∂x − d
dt
F (x, ˙x, t)
∂ ˙x = 0.
Ahora bien si x(·) ∈ Cn1(T ), la funci´on escalar F (x, ˙x, t) tiene derivadas parciales continuas en sus variables hasta de segundo orden y asumimos adicionalmente que dichas funciones est´an acotadas por las restricciones
gi(x, ˙x, t) = 0 i = 1, 2, ..., m, m < n, (3) con gi(x, ˙x, t) con derivadas parciales continuas en sus variables hasta de segundo orden, entonces (1) - (3) es un problema restringido de c´alculo variacional o problema Lagrangiano. Finalmente introducimos el Lagrangiano
L(λ(t), x(t), ˙x(t), t) = F (x(t), ˙x(t), t) + hλ(t), g(x(t), ˙x(t), t)i (4) donde λ = (λ1, λ2, ..., λm) son funcionales denominados multiplicadores de La- grange, λ(·) ∈ Cm1(T ), h· , ·i denota producto escalar y el funcional Lagrangiano
L(λ, x) = Z t1
t0
L(λ, x, ˙x, t)dt est´a definido sobre el conjunto funcional
Y = {x(·) ∈ Cn1(T ), λ(·) ∈ Cm1(T ) : x(t0) = x0, x(t1) = x1}, y formulamos el problema
L(λ, x) → m´ın, (λ, x) ∈ Y. (5)
Obviamente si la soluci´on (λ∗, x∗) de (5) existe, satisface
∂L(x, ˙x, t)
∂x −d
dt
L(x, ˙x, t)
∂ ˙x = 0, ∂L(x, ˙x, t)
∂λi
= gi= 0, ∂L(x, ˙x, t)
∂ ˙λi
= 0, i = 1, ..., m.
Tomando este conjunto de ecuaciones se puede implementar un m´etodo pr´actico de resolver el problema restringido del c´alculo variacional (1) -(3), y estamos interesados en un caso particular que conlleva al problema a exponer en el presente trabajo, el problema b´asico de control ´optimo.
1. Introducci´ on a la Teor´ıa de Control Optimo
La teor´ıa de control ´optimo refleja el estado actual del desarrollo del c´alculo variacional, al enfrentar problemas de tipo variacional pero que no encajaban enteramente en los problemas cl´asicos variacionales. Considere el sistema
˙
x = f (x, u, t), x(t0) = x0 (6)
donde x(t) ∈ Rnes el estado del sistema en el tiempo t ∈ T = [t0, t1], u(t) ∈ U ⊆ Rm, t ∈ T , es la funci´on de control y ˙x = dxdt . El par (u(t), x(t)) es denominado Proceso de Control y cuando obtenemos el “mejor”proceso (u∗(t), x∗(t)), en un sentido por definir, diremos que el proceso es ´optimo. Ahora bien, un problema de control se caracteriza por:
1. La din´amica del objeto controlado es un sistema de ecuaciones diferenciales ordinarias (6).
2. Un funcional J = J (u) = Rt1
t0 F (x, u, t)dt, llamado a veces ´ındice de rendimiento del sistema que est´a por minimizarse. .
As´ı, resolver el problema de control ´optimo significa hallar una funci´on de control u∗(t), t ∈ T que minimice el ´ındice de rendimiento J .
Ahora bien, en el caso que u(t) ∈ U = Rm, x(·) ∈ Cn1(T ) podemos resolver este problema como uno de c´alculo variacional acotado. Definiendo λ(t) = ψ(t), ψ(·) ∈ Cn1(T ) e introduciendo la funci´on hamiltoniana
H(ψ, x, u, t) = hψ(t), f (x, u, t)i − F (x, u, t).
podemos escribir el lagrangiano en la forma
L(ψ, x, ˙x, u, t) = hψ(t), ˙xi − F (x, u, t), las ecuaciones de Euler se escriben entonces como
˙
x = f (x, u, t), ψ = −˙ ∂H(ψ, x, u, t)
∂x , ∂H(ψ, x, u, t)
∂u = 0, t ∈ T,
y la soluci´on pertenece a la clase de controles u = u(t) continuos y estados suaves x = x(t). Por otro lado, sea U ⊂ Rm un conjunto cerrado y acotado.
Una funci´on u = u(t) que toma valores en U para t ∈ [t0, t1] es un control admisible. El control admisible u(t) y su correspondiente trayectoria x(t), t ∈ T que satisface (6) forman un par o proceso admisible para el problema de control
´
optimo. Considerando entonces el funcional J (u) = ϕ(x(t1)) +
Z t1
t0
F (x, u, t)dt → m´ın, (7) tenemos que (6) y (7) conforman el problema de control ´optimo, donde ϕ(x) y F (x, u, t) son continuamente diferenciables respecto a x. As´ı pues, las diferencias entre los problemas de c´alculo variacional y los problemas de control ´optimo son esencialmente el tipo de funci´on de control y las restricciones sobre el mismo, pues es usual requerir del control que u(·) ∈ P Cm0(T ), ya que este espacio es mas adecuado para modelar sistemas autom´aticos de control. Por lo anterior, tenemos que con
u(·) ∈ P Cm0(T ), u(t) ∈ U ⊆ Rm, (8) el problema deja de ser variacional y por tanto el algoritmo lagrangiano derivado de las ecuaciones de Euler-Lagrange no aplica, esencialmente puesto que dado el car´acter discontinuo de u sobre T no tiene sentido implementar
∂H(ψ, x, u, t)
∂u = 0, t ∈ T,
en su lugar se escribe la Condici´on de M´aximo de Pontryagin para el Hamilto- niano H(ψ, x, u, t) del sistema con respecto al control u(t) ∈ U . Para este tipo de problemas L.S. Pontryagin en 19532 formul´o el denominado Principio del M´aximo, como condici´on necesaria de m´ınimo para el funcional J . Este resul- tado ha sido fundamental en el desarrollo de la teor´ıa de control ´optimo y el elegido para nuestro trabajo en el estudio de la mejor forma de controlar un objeto cuya din´amica obedece al sistema lineal en x y en u.
˙
x = f (x, u, t) = A(t)x(t) + B(t)u(t) + h(t)
2. PRINCIPIO DEL MAXIMO
Hemos formulado realmente en (6) - (8) el denominado problema de control
´
optimo con restricciones directas sobre el control, ´o problema b´asico de control
´
optimo. Ahora damos condiciones bajo las cu´ales el principio del m´aximo de Pontryagin aplica. Estas condiciones se denominan P-condiciones, y son:
f es continua respecto a cada uno de sus argumentos (x, u, t) y satisface una condici´on tipo Lipschitz para alguna constante L
||f (x + ∆x, u, t) − f (x, u, t)|| ≤ L||∆x||
respecto a x para todo u(t) ∈ U y t ∈ T .
2Aunque fue dado a conocer a la comunidad internacional en un congreso en el a˜no de 1956, tres a˜nos despu´es.
Las funciones ϕ, F son continuas respecto a sus argumentos junto con
∂F (x,u,t)
∂x y ∂ϕ(x(t∂x(t1))
1) .
Es de anotar que, de la teor´ıa fundamental de las ecuaciones diferenciales or- dinarias, bajo las P-condiciones el Problema de Cauchy (6) tiene una ´unica soluci´on definida sobre T , perteneciente a la clase de funciones P Cm1(T ), para cualquier control admisible u = u(t).
2.1. Formulaci´ on general.
El principio del m´aximo para dominios acotados se formula como sigue:
Teorema 2.1 (Principio del M´aximo de Pontryagin.) Suponga que en el problema b´asico de control ´optimo las P-condiciones son v´alidas y el proceso ad- misible (u∗(t), x∗(t)) es ´optimo. Entonces para todo t ∈ T ´este proceso satisface la condici´on de M´aximo de Pontryagin
H(ψ∗(t), x∗(t), u∗(t), t) = m´ax
˜
u∈UH(ψ∗(t), x∗(t), ˜u(t), t), c.p.t. t ∈ [t0, t1] (9) donde ψ∗(t) es soluci´on del sistema conjugado:
ψ = −˙ ∂H(ψ, x, u, t)
∂x , ψ(t1) = −∂ϕ(x(t1))
∂x(t1) (10)
Demostraci´on. La demostraci´on est´a basada en la f´ormula de incremento del funcional objetivo, definida abajo, y en el uso de las denominadas varia- ciones aculeiformes, de donde a partir del t´ermino dominante del incremento del funcional J se obtiene la condici´on de m´aximo como condici´on necesaria de optimalidad.
2.2. F´ ormula para el incremento diferencial del funcional objetivo.
Considere los procesos admisibles (u, x) y (˜u = u + ∆u, ˜x = x + ∆x), es claro que ∆x satisface
∆ ˙x = ∆f (x, u, t), ∆x(t0) = 0
donde ∆f (x, u, t) = f (˜x, ˜u, t) − f (x, u, t) y para el funcional J tenemos,
∆J (u) = ∆ϕ(x(t1)) + Z t1
t0
∆F (x, u, t) dt + Z t1
t0
hψ(t), ∆ ˙x − ∆f (x, u, t)i dt,
donde por el momento ψ(t) ∈ Rn es una funci´on arbitraria no trivial para todo t ∈ T . Introduciendo el Hamiltoniano (´o Funci´on de Pontryagin),
H(ψ, x, u, t) = hψ(t), f (x, u, t)i − F (x, u, t)
se puede mostrar que al definir ψ = ψ(t) como soluci´on del problema conjugado (10) la f´ormula de incremento del funcional de costo est´a dada por
∆J (u) = − Z t1
t0
∆u˜H(ψ, x, u, t) + ηu˜
donde
ηu˜= oϕ(||∆x(t1)||) − Z t1
t0
oH(||∆x(t)||)dt − Z t1
t0
h∆u˜
∂H(ψ, x, u, t)
∂x , ∆x(t)idt.
y el termino dominante −Rt1
t0 ∆u˜H(ψ, x, u, t) dt determina la condici´on necesaria de optimalidad.
2.3. El principio del m´ aximo y los sistemas lineales.
Considere el problema de controlar objetos cuya din´amica es descrita por un sistema lineal de ecuaciones diferenciales ordinarias y restricciones sobre el control
˙
x = A(t)x + B(t)u + h(t), x(t0) = x0, u(t) ∈ U, t ∈ T = [t0, t1] (11) con funcional objetivo cuadr´atico
J (u) = hc, x(t1)i +1 2
Z t1
t0
[hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i] dt → m´ın, (12)
donde A(t)n×n, B(t)n×m, h(t)n×1, son funciones matriciales cn×1 una matriz constante, P (t) es una matriz sim´etrica n × n definida no negativa y Q(t) es una matriz sim´etrica m × m definida positiva, todas continuas en [t0, t1] y tomamos U ⊆ Rm. Ahora bien, debido a la convexidad tanto de la parte terminal como de la parte integral, podemos mostrar que para el problema (11 - 12), denominado de ahora en adelante problema lineal convexo de control ´optimo, el Principio del M´aximo de Pontryagin provee una condici´on necesaria y suficiente de opti- malidad.
Teorema 2.2 (Principio del M´aximo para sistemas lineales.) Es claro que las P-condiciones se satisfacen para el problema lineal de control ´optimo. En- tonces la condici´on de m´aximo (9) para cierta funci´on ψ∗= ψ∗(t) que satisface el sistema conjugado es condici´on necesaria y suficiente de optimalidad del pro- ceso admisible (u∗(t), x∗(t)), para casi todo t ∈ [t0, t1].
Demostraci´on. Necesidad se sigue del teorema (2.1). Probaremos suficiencia.
Nuestro Hamiltoniano para el problema lineal convexo o cuadr´atico de control
´
optimo toma la forma
H(x(t), ψ(t), u(t), t) = hψ(t), A(t)x + B(t)u + h(t)i − F (x(t), u(t), t),
donde
F (x, u, t) =1
2(hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i)
y denotando F1(x, t) = hx(t), P (t) x(t)i y F2(u, t) = hu(t), Q(t) u(t)i podemos mostrar que
∆u¯
∂H
∂x, ∆x(t)
= 0, y
oH(||∆(x)||) = −oF1(||∆(x)||), puesto que
∂H(x(t), ψ(t), u(t), t)
∂x = AT(t) ψ(t) − PT(t) x(t).
Por otra parte la convexidad de F1(x, t) y la linealidad de ϕ(x(t1)) = hc, x(t1)i implican
oF1(||∆(x)||) ≥ 0, ∀t ∈ T, oϕ(||∆x(t1)||) = 0, de donde
∆J (u) = − Z t1
t0
∆u˜H(ψ, x, u, t)dt + Z t1
t0
oF1(||∆x(t)||)dt.
As´ı, para alg´un proceso admisible (u∗(t), x∗(t)) que satisfaga la condici´on de m´aximo
∆u˜H(ψ∗, x∗, u∗, t) ≤ 0 tenemos que
∆J (u∗) = − Z t1
t0
∆u˜H(ψ∗, x∗, u∗, t)dt + Z t1
t0
oF1(||∆x(t)||)dt ≥ 0, y por tanto
∆J (u∗) = J (˜u) − J (u∗) ≥ 0,
la desigualdad anterior confirma la optimalidad del proceso (u∗(t), x∗(t)). Ahora bien en direcci´on a solucionar el problema lineal convexo de control
´
optimo, tenemos que hacer uso de la condici´on de M´aximo de Pontryagin para candidatizar controles admisibles como controles ´optimos; dado que hemos visto que con u(t) ∈ U, t ∈ T un conjunto compacto convexo, en general u(·) ∈ P Cm0(T ) y entonces no es permitido utilizar
∂H(ψ∗, x∗, u∗, t)
∂u = 0
para candidatizar extremos del funcional H(ψ∗, x∗, u∗, t). Por tanto recurrimos nuevamente a los incrementos parciales
∆u˜H(ψ∗, x∗, u∗, t) = H(ψ∗, x∗, u∗+ ∆u, t) − H(ψ∗, x∗, u∗, t),
= hB(t) ψ(t) − Q(t)u∗, ∆ui − 1
2hQ(t)∆u , ∆ui siendo Q(t) sim´etrica definida positiva
∆u˜H(ψ∗, x∗, u∗, t) ≤ hB(t) ψ(t) − Q(t)u∗, ∆ui
y as´ı como U es un conjunto convexo, se puede mostrar como condici´on necesaria para que u∗ sea maximal la desigualdad
hB(t) ψ(t) − Q(t)u∗, ∆ui ≤ 0.
Luego la condici´on necesaria y suficiente de optimalidad en nuestro caso es hallar u∗: hW (t), ¯ui → m´ax, ∀¯u ∈ U, t ∈ T,
donde W (t) = B(t) ψ(t) − Q(t)u∗.
3. M´ etodo de soluci´ on del problema lineal con- vexo de control ´ optimo.
Consideremos el problema de minimizaci´on del funcional objetivo J (u) = hc, x(t1)i +1
2hx(t1), Q x(t1)i + (13)
1 2
Z t1
t0
[2hg(t), x(t)i + 2hd(t), u(t)i + hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i] dt → m´ın, sujeto al sistema de ecuaciones diferenciales ordinarias
˙
x = A(t)x + B(t)u + C(t)p + h(t), x(t0) = q, t ∈ T = [t0, t1] (14) donde las matrices A, B, P y Q son como antes, Qn×n es una matriz con- stante, c = (c1, c2, ..., cn), p = (p1, p2, ..., pn) y q = (q1, q2, ..., qn) son los par´ametros. El control ´optimo u∗ del problema (13) - (14) satisface el prin- cipio de M´aximo de Pontryagin para cualquier valor fijo de los par´ametros α = (c, p, q), el cual es establecido mediante incrementos parciales como
u∗(t) = Q−1(t)BT(t)ψ(t) − Q−1(t)d(t),
posteriormente determinamos las soluciones del problema de Cauchy (14) y del sistema conjugado
ψ = −A˙ T(t)ψ(t) − PT(t)x, (15) utilizando el denominado algoritmo de s´ıntesis [1] para la regi´on de control U = Rm.
A saber, el problema de valor inicial (14) y su sistema adjunto (15) se ree- scribe
˙
x = A(t)x + B(t)Q−1(t)BT(t)ψ − B(t)Q−1(t)d(t) + C(t)p + h(t), x(t0) = q, ψ = −A˙ T(t)ψ + PT(t)x + g(t), ψ(t1) = −c. (16) Para simplificar introducimos la siguiente notaci´on
z(t) = (x(t), ψ(t)) ∈ R2n, A(t) =¯ A(t) B(t)¯
P (t) −AT(t)
∈ R2n×2n, C(t) =¯ C(t) 0
0 0
∈ R2n×2m, B = B(t)Q¯ −1(t)BT(t) ∈ Rn×n, p = (p, 0) ∈ R¯ 2n, b = (q, −c) ∈ R2n,
ˆh(t) = h(t) − B(t)Q−1(t)d(t) ∈ Rn, f (t) = (ˆh(t), g(t)) ∈ R2n, L0= In×n 0
0 0
∈ R2n×2n, L1= 0 0 0 In×n
∈ R2n×2n. El problema de valor inicial (16) se puede escribir como
˙
z = ¯A(t)z + ¯C(t)¯p + f (t) (17) L0z(t0) + L1z(t1) − b = 0
Para representar la soluci´on de (17) en forma anal´ıtica podemos usar el an´alogo de la f´ormula de Cauchy [2], y en ese caso digamos que Z(t) = Z11(t) Z12(t)
Z21(t) Z22(t)
, es la matriz fundamental de soluciones del sistema homog´eneo correspondiente a (17), donde las Zij(t), (i, j = 1, 2.) son submatrices de dimensi´on n × n.
As´ı mismo sean Zij∗(t) submatrices de dimensi´on n × n de la matriz Z−1(t), entonces la soluci´on del problema de valor inicial
˙
z = ¯A(t)z + ¯C(t)¯p + f (t), z(t0) = z0 con z0arbitrario puede presentarse como
z(t) = Z(t)z0+ Z t
t0
Z(t)Z∗(τ ) ¯C(t)¯p + f (τ ) dτ (18)
seg´un la f´ormula de Cauchy. Para resolver el problema de valor inicial (17) debe- mos encontrar la soluci´on ¯z0del sistema no homog´eneo de ecuaciones algebr´aicas
¯
z0: L0z0+ L1z(t1) − b = 0. (19) La existencia de la soluci´on del sistema (19) y en consecuencia la condici´on de solubilidad del problema (17) tendr´a la forma
det[L0+ L1z(t1)] 6= 0.
De (18) y (19) se sigue que
¯
z0= (Λ)−1
b − L1Z(t1) Z t
t0
Z∗(τ ) ¯C(t)¯p + f (τ ) dτ
,
donde Λ = L0+ L1z(t1). Reemplazando este valor en la f´ormula de Cauchy (18) llegamos al an´alogo de la f´ormula de Cauchy
z(t) = Z(t)(Λ)−1b − Z(t)(Λ)−1L1Z(t1) Z t1
t0
Z∗(t) ¯C(t)¯p + f (t) dt (20)
+Z(t) Z t
t0
Z∗(τ ) ¯C(t)¯p + f (τ ) dτ
Despu´es de verificar la condici´on de solubilidad del problema, se puede mostrar que el subvector ψ(t) de la soluci´on z(t) del problema (16) representado seg´un (20) toma la forma
ψ(t) = [Z21(t) − Z22(t)Θ1]q − Z22(t)Z21∗ (t1)c (21)
−Z21(t)Z22(t)Z22∗(t1) Z t1
t0
Z11∗ (t)C(t)p dt + Z21(t) Z t
t0
Z11∗(τ )C(τ )p dτ
−Z22(t) Z t1
t0
Z21∗ (t)C(t)p dt + Z22(t) Z t
t0
Z21∗(τ )C(τ )p dτ + N (t) donde N (t) es un t´ermino que depende de Zij(t) y f (t).
Al sustituir ψ = ψ(t) calculado seg´un (21) en la ley de control ´optimo u∗(t) = Q−1(t)BT(t)ψ(t) − Q−1(t)d(t),
obtenemos la f´ormula expl´ıcita de s´ıntesis param´etrica,
u∗(t) = M (t)q + N (t)c + P (t)p + η(t) (22) donde
M (t) = Q−1(t)BT(t)[Z21(t) − Z22(t)Θ1], N (t) = −Q−1(t)BT(t)Z22(t)Θ, P (t) = Q−1(t)BT(t)
Z21(t)
Z t t0
Z11∗ (τ )C(τ ) dτ
+Z22(t)[−Z22∗ (t1)Z21(t1) Z t1
t0
Z11∗ (t)C(t) dt
− Z t1
t0
Z21∗ (t)C(t) dt + Z t
t0
Z21∗ (τ )C(τ ) dτ ] + N (t), η(t) = Q−1(t)BT(t)h
Z21(t)y(1)(t) + Z22(t)[y(2)(t) − Θ1y(1)(t1) − y(2)(t1)]i . Aqu´ı y(1)(t) y y(2)(t) son soluci´on de los problemas vectoriales de valor inicial
˙
y(1)(t) = Z11∗(t)ˆh(t) + Z12∗(t)g(t), y(1)(t0) = 0
˙
y(2)(t) = Z21∗(t)ˆh(t) + Z22∗(t)g(t), y(2)(t0) = 0
Ahora bien, aunque (22) determina el control ´optimo de forma compleja, existe un caso particular del problema que conlleva una forma del control mas simple, dicho problema se denominar´a problema lineal convexo de control ´opti- mo con par´ametros,
˙
x = A(t)x + B(t)u + C(t)p, x(t0) = q, t ∈ T = [t0, t1] (23)
u(t) ∈ Rm, (24)
y con funcional objetivo cuadr´atico
J (u) = hc, x(t1)i +1 2
Z t1 t0
hu(t), Q(t) u(t)i dt → m´ın, (25)
es claro que el problema (23) - (25) es obtenido de (13) - (14) haciendo que h(t) = g(t) = d(t) ≡ 0 y Q = P (t) = 0. Por lo tanto en este caso
M (t) ≡ 0, P (t) ≡ 0, η(t) ≡ 0 y de aqu´ı tenemos la ley de control Robusto,
u∗(t) = N (t)c
en el sentido que solo depende del par´ametro c, para todo q = x(t0) y todo p.
Algoritmo de s´ıntesis para el problema (23) - (25) simplifi- cado.
En primer lugar utilizaremos el algoritmo de s´ıntesis y el principio del m´axi- mo para el problema lineal convexo de control ´optimo simplificado
˙
x = B(t)u + C(t)p, x(t0) = q, t ∈ T = [t0, t1] (26) donde A(t) es la matriz nula y el funcional cuadr´atico es
J (u) = hc, x(t1)i +1 2
Z t1
t0
[hu(t), Q(t) u(t)i] dt → m´ın, (27)
Entonces
H(ψ, x, u, t) = hψ(t), B(t)u + C(t)pi −1
2hu(t), Q(t) u(t)i (28) y es claro que
u∗(t) = Q−1(t)BT(t)ψ(t).
Por otro lado del sistema conjugado
ψ(t) = 0,˙ ψ(t1) = −c
tenemos
ψ ≡ −c, t ∈ T y entonces
u∗(t) = −Q−1(t)BT(t) c.
Ahora verificamos que u∗ satisface la condici´on de m´aximo de Pontryagin. En efecto, se tiene que,
H(ψ∗, x∗, u∗, t) = −hψ(t), B(t)u∗(t) + C(t)pi −1
2hu∗(t), Q u∗(t)i
=1
2c, B(t) (−Q−1(t)BT(t) c) − hc, C(t)pi y similarmente para ˜u = u∗+ ∆u,
H(ψ∗, x∗, u∗+∆u, t) = hψ(t), B(t)u∗+B(t)∆ui+hψ(t), C(t)pi−1
2hu∗+∆u, Q(t) (u∗+∆u)i H(ψ∗, x∗, ˜u, t) = 1
2c, B(t) (−Q−1(t)BT(t) c) − hc, C(t)pi −1
2h∆u, Q(t)∆u)i se comprueba finalmente que
∆u˜H(ψ∗, x∗, u∗, t) = H(˜u, t)−H(u∗, t) = −1
2h∆u, Q(t)∆ui ≤ 0, c.p.t t ∈ T, ∀˜u ∈ Rm. Ahora resta verificar que el proceso (x∗, u∗) es ´optimo. Para ello note que, del
sistema (26) y el Hamiltoniano (28) tenemos que
˙ x = ∂H
∂ψ = −B(t) (−Q−1(t)BT(t) c) + C(t)p de donde
x(t1) = − Z t1
t0
B(t) (−Q−1(t)BT(t) c) + C(t)p dt + q
luego el funcional de rendimiento es dado por J (u∗) = hc, x(t1)i +1
2 Z t1
t0
hu∗(t), Q(t) u∗(t)i dt
=
c ,
Z t1 t0
B(t) (−Q−1(t)BT(t) c) + C(t)p dt + q
+1
2 Z t1
t0
hQ−1(t)BT(t) c, BT(t)ci dt y as´ı
J (u∗) = −1 2hc ,
Z t1 t0
B(t) (−Q−1(t)BT(t))c dti + hc , Z t1
t0
C(t)p dti + hc , qi.
Por otro lado J (u∗+∆u) = −hc,
Z t1
t0
B(t) (−Q−1(t)BT(t)) c dti+hc , Z t1
t0
B(t)∆u+C(t) p dt+qi
−hc , Z t1
t0
B(t)∆u dti +1 2
Z t1
t0
h∆u, Q(t)∆ui dt.
As´ı pues,
∆J (u∗) = J (u∗+ ∆u) − J (u∗) = 1 2
Z t1
t0
h∆u, Q(t)∆ui dt ≥ 0, ∀˜u ∈ U
puesto que Q(t) es una matriz sim´etrica definida positiva en T , y de esta manera hemos mostrado que el proceso (u∗, x∗) es el mejor en el sentido que minimiza el funcional J y satisface la condici´on de m´aximo de Pontryagin.
En segundo lugar, para el caso en que la regi´on de controles admisibles U es elegida compacta convexa, como por ejemplo el paralelep´ıpedo m-dimensional definido por,
U = {u(t) ∈ Rm: |ui(t)| ≤ `i, t ∈ T, i = 1, 2, 3, ...m., ` > 0}, (29) mostraremos que el proceso (u∗, x∗) sigue siendo ´optimo para nuestro proble- ma lineal convexo simplificado (26) - (27), para ello verificamos como antes la condici´on de m´aximo y la minimizaci´on del funcional J , nuevamente utilizando el resultado obtenido con el algoritmo de s´ıntesis y teniendo en cuenta que la restricci´on impuesta equivale a tener
|(−Q−1(t)BT(t) c)i| ≤ `i, i = 1, ..., m, ` = (`i, ..., `m).
As´ı pues note que si u(t) = ` entonces
H(ψ∗, x∗, `, t) = −hc, B(t) ` + C(t)pi −1
2h` , Q(t)`i y
H(ψ∗, x∗, `+∆u, t) = −hc, B(t) `+B(t)∆u+C(t)pi−h` , Q(t)∆ui−1
2h∆u , Q(t)∆ui de donde obtenemos
∆u˜H(ψ∗, x∗, `, t) = H(˜u, t)−H(`, t) = −hBT(t)c+Q(t) ` , ∆ui−1
2h∆u , Q(t)∆ui (30) y observamos que ∆u˜H(ψ∗, x∗, `, t) ≤ 0 dependiendo de sign hBT(t)c+Q(t) ` , ∆ui.
Ahora bien analizando nuestro funcional J , J (`) =
c ,
Z t1
t0
[B(t) ` + C(t) p ] dt + q
+1
2 Z t1
t0
h` , Q(t)`i dt
y su incremento J (`+∆u) =
c ,
Z t1
t0
[B(t) ` + C(t) p ] dt + q
+hc ,
Z t1
t0
B(t)∆u dti+1 2
Z t1
t0
h` , Q(t)`i dt
+ Z t1
t0
h∆u , Q(t) `i dt +1 2
Z t1 t0
h∆u, Q(t)∆ui dt note que
∆J (`) = J (` + ∆u) − J (`) = hBT(t)c + Q(t) ` , ∆ui +1
2h∆u , Q(t)∆ui (31) lo cual implica que como en (30), ∆J (`) ≥ 0 depende de sign hBT(t)c + Q(t) ` , ∆ui, lo cual sugiere que apartir de (30) - (31) podemos definir nue- stro control ´optimo u∗(t) = (u∗i(t), ..., u∗m(t)), donde cada u∗i(t) es dado por
u∗(t) =
(−Q−1(t)BT(t) c)i, si |(−Q−1(t)BT(t) c)i| ≤ `i, t ∈ T, sign(−Q−1(t)BT(t) c)i`i, si |(−Q−1(t)BT(t) c)i| > `i, t ∈ T.
(32) Finalmente se analizar´a si una vez obtenido un par ´optimo (x∗(t), u∗(t)) para nuestro sistema (23) y funcional (25), ´este continuar´a siendo ´optimo una vez se ha perturbado mediante α = (c, p, q), es decir, nos preguntamos si
u∗= v(t, α)
sigue siendo un control ´optimo para nuestro problema lineal convexo perturbado y con restricciones directas sobre el control, como las formuladas en (28), o mas generales. M´as a´un, deseamos verificar si sobre T , podemos definir el control
´
optimo como un h´ıbrido entre control bang-bang y nuestro control (32) obtenido del algoritmo de s´ıntesis.
Referencias
[1] E.A. Lutkovskaya, A method for contructing a parametric synthesis for a linear-quadratic optimal control problem, Sizv. Vyssh. Uchebn. Zaved.
Mat. 1999, No. 12, 71-73; translation in Russian Math. (Iz. VUZ), No. 12, 67-69(2000).
[2] O.O. Vasilieva, Two parameter algorithm for optimal control problems with boundary conditions, Saitama Mathematical Journal, Vol. 20 (2002), 45-62.
[3] O.V. Vasiliev,Optimization Methods, Advanced series in mathematical science and engineering WFP, 1996.
[4] L.D. Berkovitz, Optimal Control Theory, Springer-Verlag, 1974.
[5] V.G. Boltyanskii, Mathematical methods of optimal control, Holt, Rine- hart and Winston, Inc. 1971.
[6] R. Gabasov, F. Kirillova, Methods of optimization, Optimization Soft- ware, Inc., 1988.
[7] V.I. Arnold, Ordinary Differential Equations, MIT Press. E.U.A., 1978.