Problema lineal de control óptimo con funcional objetivo cuadrático y con parámetros.

(1)

Problema lineal de control ´ optimo con funcional objetivo cuadr´ atico y con

par´ ametros.

U.A. Sosa Aguirre Departamento de Matem´ aticas

Universidad del Valle

Resumen

Dentro de la Teor´ıa de Control Óptimo, pretendemos estudiar problemas cuya dinámica es descrita por un sistema lineal de ecuaciones diferenciales ordinarias y cuyo ´ındice de rendimiento es un funcional objetivo convexo (o cuadrático). Utilizando la Condición de Máximo de Pontrya- gin sobre el Hamiltoniano del sistema, candidatizaremos controles óptimos e implementaremos un algoritmo para calcularlos. También mostraremos para el caso lineal convexo, que la condición de máximo es suficiente y necesaria para optimalidad, incluso perturbando los parámetros tanto del sistema, como del funcional.

Palabras Claves: Sistema de control, control ´optimo, principio del m´aximo.

INTRODUCCION

El control óptimo nace por las necesidades de la ingenier´ıa de control en la década de 1950, las cuales estimularon la formulación e investigación de una nueva clase de importantes problemas que requer´ıan la optimización de funcionales. En realidad, sus ra´ıces datan de 1696 a partir de la generalización del problema de la braquistocrona, enunciado por Johann Bernoulli como un reto para sus contemporáneos¹ y de otros problemas que hab´ıan sido estudia- dos inicialmente en los siglos XVII y XVIII los cuales cimentaron las bases del denominado Cálculo Variacional. El problema básico del cálculo variacional se formula como sigue. Sea x = x(·) ∈ C_n¹(T ), T = [t0, t1], una curva admisible, esto es,

x(t₀) = x⁰, x(t₁) = x¹, (1)

1La solución fue publicada junto a la de otros grandes matemáticos un año después en su art´ıculo “Acta Eruditorum”

(2)

x⁰ y x¹ dados. Sea adem´as el conjunto funcional

X = {x(·) ∈ C_n¹(T ) : x(t0) = x⁰, x(t1) = x¹}, y definamos el funcional

J = J (x) = Z t₁

t0

F (x, ˙x, t)dt,

sobre X, donde F (x, ˙x, t) est´a definida y es continua respecto a cada uno de sus argumentos, junto con sus derivadas parciales respecto a (x, ˙x, t). El problema es entonces obtener x^∗(·) ∈ X tal que:

x^∗: J (x) → m´ın (2)

en cuyo caso x^∗ es una minimal, en el sentido que minimiza al funcional J . La idea central para resolver el problema básico del cálculo variacional es dar una condición necesaria para las funciones candidatas a ser extremales del funcional J , denominada condición de Euler-Lagrange, y que afirma lo siguiente: todo m´ınimo débil del problema básico de cálculo variacional satisface la ecuación de Euler-Lagrange

∂F (x, ˙x, t)

∂x − d

dt

F (x, ˙x, t)

∂ ˙x = 0.

Ahora bien si x(·) ∈ C_n¹(T ), la funci´on escalar F (x, ˙x, t) tiene derivadas parciales continuas en sus variables hasta de segundo orden y asumimos adicionalmente que dichas funciones est´an acotadas por las restricciones

gi(x, ˙x, t) = 0 i = 1, 2, ..., m, m < n, (3) con gi(x, ˙x, t) con derivadas parciales continuas en sus variables hasta de segundo orden, entonces (1) - (3) es un problema restringido de c´alculo variacional o problema Lagrangiano. Finalmente introducimos el Lagrangiano

L(λ(t), x(t), ˙x(t), t) = F (x(t), ˙x(t), t) + hλ(t), g(x(t), ˙x(t), t)i (4) donde λ = (λ₁, λ₂, ..., λ_m) son funcionales denominados multiplicadores de La- grange, λ(·) ∈ C_m¹(T ), h· , ·i denota producto escalar y el funcional Lagrangiano

L(λ, x) = Z t₁

t0

L(λ, x, ˙x, t)dt est´a definido sobre el conjunto funcional

Y = {x(·) ∈ C_n¹(T ), λ(·) ∈ C_m¹(T ) : x(t₀) = x⁰, x(t₁) = x¹}, y formulamos el problema

L(λ, x) → m´ın, (λ, x) ∈ Y. (5)

(3)

Obviamente si la soluci´on (λ^∗, x^∗) de (5) existe, satisface

∂L(x, ˙x, t)

∂x −d

dt

L(x, ˙x, t)

∂ ˙x = 0, ∂L(x, ˙x, t)

∂λi

= gi= 0, ∂L(x, ˙x, t)

∂ ˙λi

= 0, i = 1, ..., m.

Tomando este conjunto de ecuaciones se puede implementar un método práctico de resolver el problema restringido del cálculo variacional (1) -(3), y estamos interesados en un caso particular que conlleva al problema a exponer en el presente trabajo, el problema básico de control óptimo.

1. Introducci´ on a la Teor´ıa de Control Optimo

La teor´ıa de control óptimo refleja el estado actual del desarrollo del cálculo variacional, al enfrentar problemas de tipo variacional pero que no encajaban enteramente en los problemas clásicos variacionales. Considere el sistema

˙

x = f (x, u, t), x(t0) = x⁰ (6)

donde x(t) ∈ Rⁿes el estado del sistema en el tiempo t ∈ T = [t0, t1], u(t) ∈ U ⊆ R^m, t ∈ T , es la funci´on de control y ˙x = ^dx_dt . El par (u(t), x(t)) es denominado Proceso de Control y cuando obtenemos el “mejor”proceso (u^∗(t), x^∗(t)), en un sentido por definir, diremos que el proceso es ´optimo. Ahora bien, un problema de control se caracteriza por:

1. La din´amica del objeto controlado es un sistema de ecuaciones diferenciales ordinarias (6).

2. Un funcional J = J (u) = Rt₁

t₀ F (x, u, t)dt, llamado a veces ´ındice de rendimiento del sistema que est´a por minimizarse. .

As´ı, resolver el problema de control ´optimo significa hallar una funci´on de control u^∗(t), t ∈ T que minimice el ´ındice de rendimiento J .

Ahora bien, en el caso que u(t) ∈ U = R^m, x(·) ∈ C_n¹(T ) podemos resolver este problema como uno de c´alculo variacional acotado. Definiendo λ(t) = ψ(t), ψ(·) ∈ C_n¹(T ) e introduciendo la funci´on hamiltoniana

H(ψ, x, u, t) = hψ(t), f (x, u, t)i − F (x, u, t).

podemos escribir el lagrangiano en la forma

L(ψ, x, ˙x, u, t) = hψ(t), ˙xi − F (x, u, t), las ecuaciones de Euler se escriben entonces como

˙

x = f (x, u, t), ψ = −˙ ∂H(ψ, x, u, t)

∂x , ∂H(ψ, x, u, t)

∂u = 0, t ∈ T,

y la soluci´on pertenece a la clase de controles u = u(t) continuos y estados suaves x = x(t). Por otro lado, sea U ⊂ R^m un conjunto cerrado y acotado.

(4)

Una funci´on u = u(t) que toma valores en U para t ∈ [t0, t1] es un control admisible. El control admisible u(t) y su correspondiente trayectoria x(t), t ∈ T que satisface (6) forman un par o proceso admisible para el problema de control

´

optimo. Considerando entonces el funcional J (u) = ϕ(x(t1)) +

Z t1

t0

F (x, u, t)dt → m´ın, (7) tenemos que (6) y (7) conforman el problema de control óptimo, donde ϕ(x) y F (x, u, t) son continuamente diferenciables respecto a x. As´ı pues, las diferencias entre los problemas de cálculo variacional y los problemas de control óptimo son esencialmente el tipo de función de control y las restricciones sobre el mismo, pues es usual requerir del control que u(·) ∈ P C_m⁰(T ), ya que este espacio es mas adecuado para modelar sistemas automáticos de control. Por lo anterior, tenemos que con

u(·) ∈ P C_m⁰(T ), u(t) ∈ U ⊆ R^m, (8) el problema deja de ser variacional y por tanto el algoritmo lagrangiano derivado de las ecuaciones de Euler-Lagrange no aplica, esencialmente puesto que dado el car´acter discontinuo de u sobre T no tiene sentido implementar

∂H(ψ, x, u, t)

∂u = 0, t ∈ T,

en su lugar se escribe la Condición de Máximo de Pontryagin para el Hamilto- niano H(ψ, x, u, t) del sistema con respecto al control u(t) ∈ U . Para este tipo de problemas L.S. Pontryagin en 1953² formuló el denominado Principio del Máximo, como condición necesaria de m´ınimo para el funcional J . Este resultado ha sido fundamental en el desarrollo de la teor´ıa de control óptimo y el elegido para nuestro trabajo en el estudio de la mejor forma de controlar un objeto cuya dinámica obedece al sistema lineal en x y en u.

˙

x = f (x, u, t) = A(t)x(t) + B(t)u(t) + h(t)

2. PRINCIPIO DEL MAXIMO

Hemos formulado realmente en (6) - (8) el denominado problema de control

´

optimo con restricciones directas sobre el control, ´o problema b´asico de control

´

optimo. Ahora damos condiciones bajo las cu´ales el principio del m´aximo de Pontryagin aplica. Estas condiciones se denominan P-condiciones, y son:

f es continua respecto a cada uno de sus argumentos (x, u, t) y satisface una condici´on tipo Lipschitz para alguna constante L

||f (x + ∆x, u, t) − f (x, u, t)|| ≤ L||∆x||

respecto a x para todo u(t) ∈ U y t ∈ T .

2Aunque fue dado a conocer a la comunidad internacional en un congreso en el año de 1956, tres años después.

(5)

Las funciones ϕ, F son continuas respecto a sus argumentos junto con

∂F (x,u,t)

∂x y ^∂ϕ(x(t_∂x(t¹⁾⁾

1) .

Es de anotar que, de la teor´ıa fundamental de las ecuaciones diferenciales ordinarias, bajo las P-condiciones el Problema de Cauchy (6) tiene una ´unica soluci´on definida sobre T , perteneciente a la clase de funciones P C_m¹(T ), para cualquier control admisible u = u(t).

2.1. Formulaci´ on general.

El principio del m´aximo para dominios acotados se formula como sigue:

Teorema 2.1 (Principio del Máximo de Pontryagin.) Suponga que en el problema básico de control óptimo las P-condiciones son válidas y el proceso admisible (u^∗(t), x^∗(t)) es óptimo. Entonces para todo t ∈ T éste proceso satisface la condición de Máximo de Pontryagin

H(ψ^∗(t), x^∗(t), u^∗(t), t) = m´ax

˜

u∈UH(ψ^∗(t), x^∗(t), ˜u(t), t), c.p.t. t ∈ [t0, t1] (9) donde ψ^∗(t) es soluci´on del sistema conjugado:

ψ = −˙ ∂H(ψ, x, u, t)

∂x , ψ(t1) = −∂ϕ(x(t1))

∂x(t1) (10)

Demostración. La demostración está basada en la fórmula de incremento del funcional objetivo, definida abajo, y en el uso de las denominadas varia- ciones aculeiformes, de donde a partir del término dominante del incremento del funcional J se obtiene la condición de máximo como condición necesaria de optimalidad.

2.2. F´ ormula para el incremento diferencial del funcional objetivo.

Considere los procesos admisibles (u, x) y (˜u = u + ∆u, ˜x = x + ∆x), es claro que ∆x satisface

∆ ˙x = ∆f (x, u, t), ∆x(t₀) = 0

donde ∆f (x, u, t) = f (˜x, ˜u, t) − f (x, u, t) y para el funcional J tenemos,

∆J (u) = ∆ϕ(x(t1)) + Z t₁

t₀

∆F (x, u, t) dt + Z t₁

t₀

hψ(t), ∆ ˙x − ∆f (x, u, t)i dt,

donde por el momento ψ(t) ∈ Rⁿ es una función arbitraria no trivial para todo t ∈ T . Introduciendo el Hamiltoniano (ó Función de Pontryagin),

H(ψ, x, u, t) = hψ(t), f (x, u, t)i − F (x, u, t)

(6)

se puede mostrar que al definir ψ = ψ(t) como solución del problema conjugado (10) la fórmula de incremento del funcional de costo está dada por

∆J (u) = − Z t₁

t0

∆u˜H(ψ, x, u, t) + ηu˜

donde

η_u_˜= o_ϕ(||∆x(t₁)||) − Z t1

t₀

o_H(||∆x(t)||)dt − Z t1

t₀

h∆u˜

∂H(ψ, x, u, t)

∂x , ∆x(t)idt.

y el termino dominante −Rt1

t₀ ∆u˜H(ψ, x, u, t) dt determina la condici´on necesaria de optimalidad.

2.3. El principio del m´ aximo y los sistemas lineales.

Considere el problema de controlar objetos cuya din´amica es descrita por un sistema lineal de ecuaciones diferenciales ordinarias y restricciones sobre el control

˙

x = A(t)x + B(t)u + h(t), x(t0) = x0, u(t) ∈ U, t ∈ T = [t0, t1] (11) con funcional objetivo cuadr´atico

J (u) = hc, x(t1)i +1 2

Z t1

t0

[hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i] dt → m´ın, (12)

donde A(t)n×n, B(t)n×m, h(t)n×1, son funciones matriciales cn×1 una matriz constante, P (t) es una matriz simétrica n × n definida no negativa y Q(t) es una matriz simétrica m × m definida positiva, todas continuas en [t0, t1] y tomamos U ⊆ R^m. Ahora bien, debido a la convexidad tanto de la parte terminal como de la parte integral, podemos mostrar que para el problema (11 - 12), denominado de ahora en adelante problema lineal convexo de control óptimo, el Principio del Máximo de Pontryagin provee una condición necesaria y suficiente de optimalidad.

Teorema 2.2 (Principio del Máximo para sistemas lineales.) Es claro que las P-condiciones se satisfacen para el problema lineal de control óptimo. En- tonces la condición de máximo (9) para cierta función ψ^∗= ψ^∗(t) que satisface el sistema conjugado es condición necesaria y suficiente de optimalidad del proceso admisible (u^∗(t), x^∗(t)), para casi todo t ∈ [t0, t1].

Demostraci´on. Necesidad se sigue del teorema (2.1). Probaremos suficiencia.

Nuestro Hamiltoniano para el problema lineal convexo o cuadr´atico de control

´

optimo toma la forma

H(x(t), ψ(t), u(t), t) = hψ(t), A(t)x + B(t)u + h(t)i − F (x(t), u(t), t),

(7)

donde

F (x, u, t) =1

2(hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i)

y denotando F1(x, t) = hx(t), P (t) x(t)i y F2(u, t) = hu(t), Q(t) u(t)i podemos mostrar que

∆u¯

∂H

∂x, ∆x(t)

= 0, y

oH(||∆(x)||) = −oF₁(||∆(x)||), puesto que

∂H(x(t), ψ(t), u(t), t)

∂x = A^T(t) ψ(t) − P^T(t) x(t).

Por otra parte la convexidad de F1(x, t) y la linealidad de ϕ(x(t1)) = hc, x(t1)i implican

o_F₁(||∆(x)||) ≥ 0, ∀t ∈ T, o_ϕ(||∆x(t₁)||) = 0, de donde

∆J (u) = − Z t1

t0

∆_u_˜H(ψ, x, u, t)dt + Z t1

t0

o_F₁(||∆x(t)||)dt.

As´ı, para algún proceso admisible (u^∗(t), x^∗(t)) que satisfaga la condición de máximo

∆u˜H(ψ^∗, x^∗, u^∗, t) ≤ 0 tenemos que

∆J (u^∗) = − Z t₁

t₀

∆u˜H(ψ^∗, x^∗, u^∗, t)dt + Z t₁

t₀

oF1(||∆x(t)||)dt ≥ 0, y por tanto

∆J (u^∗) = J (˜u) − J (u^∗) ≥ 0,

la desigualdad anterior confirma la optimalidad del proceso (u^∗(t), x^∗(t)). Ahora bien en direcci´on a solucionar el problema lineal convexo de control

´

optimo, tenemos que hacer uso de la condición de Máximo de Pontryagin para candidatizar controles admisibles como controles óptimos; dado que hemos visto que con u(t) ∈ U, t ∈ T un conjunto compacto convexo, en general u(·) ∈ P C_m⁰(T ) y entonces no es permitido utilizar

∂H(ψ^∗, x^∗, u^∗, t)

∂u = 0

para candidatizar extremos del funcional H(ψ^∗, x^∗, u^∗, t). Por tanto recurrimos nuevamente a los incrementos parciales

(8)

∆u˜H(ψ^∗, x^∗, u^∗, t) = H(ψ^∗, x^∗, u^∗+ ∆u, t) − H(ψ^∗, x^∗, u^∗, t),

= hB(t) ψ(t) − Q(t)u^∗, ∆ui − 1

2hQ(t)∆u , ∆ui siendo Q(t) sim´etrica definida positiva

∆_u_˜H(ψ^∗, x^∗, u^∗, t) ≤ hB(t) ψ(t) − Q(t)u^∗, ∆ui

y as´ı como U es un conjunto convexo, se puede mostrar como condici´on necesaria para que u^∗ sea maximal la desigualdad

hB(t) ψ(t) − Q(t)u^∗, ∆ui ≤ 0.

Luego la condici´on necesaria y suficiente de optimalidad en nuestro caso es hallar u^∗: hW (t), ¯ui → m´ax, ∀¯u ∈ U, t ∈ T,

donde W (t) = B(t) ψ(t) − Q(t)u^∗.

3. M´ etodo de soluci´ on del problema lineal con- vexo de control ´ optimo.

Consideremos el problema de minimizaci´on del funcional objetivo J (u) = hc, x(t1)i +1

2hx(t1), Q x(t1)i + (13)

1 2

Z t1

t₀

[2hg(t), x(t)i + 2hd(t), u(t)i + hx(t), P (t) x(t)i + hu(t), Q(t) u(t)i] dt → m´ın, sujeto al sistema de ecuaciones diferenciales ordinarias

˙

x = A(t)x + B(t)u + C(t)p + h(t), x(t0) = q, t ∈ T = [t0, t1] (14) donde las matrices A, B, P y Q son como antes, Qn×n es una matriz constante, c = (c1, c2, ..., cn), p = (p1, p2, ..., pn) y q = (q1, q2, ..., qn) son los parámetros. El control óptimo u^∗ del problema (13) - (14) satisface el principio de Máximo de Pontryagin para cualquier valor fijo de los parámetros α = (c, p, q), el cual es establecido mediante incrementos parciales como

u^∗(t) = Q⁻¹(t)B^T(t)ψ(t) − Q⁻¹(t)d(t),

posteriormente determinamos las soluciones del problema de Cauchy (14) y del sistema conjugado

ψ = −A˙ ^T(t)ψ(t) − P^T(t)x, (15) utilizando el denominado algoritmo de s´ıntesis [1] para la regi´on de control U = R^m.

(9)

A saber, el problema de valor inicial (14) y su sistema adjunto (15) se ree- scribe

˙

x = A(t)x + B(t)Q⁻¹(t)B^T(t)ψ − B(t)Q⁻¹(t)d(t) + C(t)p + h(t), x(t0) = q, ψ = −A˙ ^T(t)ψ + P^T(t)x + g(t), ψ(t1) = −c. (16) Para simplificar introducimos la siguiente notaci´on

z(t) = (x(t), ψ(t)) ∈ R²ⁿ, A(t) =¯ A(t) B(t)¯

P (t) −A^T(t)

∈ R^2n×2n, C(t) =¯ C(t) 0

0 0

∈ R^2n×2m, B = B(t)Q¯ ⁻¹(t)B^T(t) ∈ R^n×n, p = (p, 0) ∈ R¯ ²ⁿ, b = (q, −c) ∈ R²ⁿ,

ˆh(t) = h(t) − B(t)Q⁻¹(t)d(t) ∈ Rⁿ, f (t) = (ˆh(t), g(t)) ∈ R²ⁿ, L0= In×n 0

0 0

∈ R^2n×2n, L1= 0 0 0 In×n

∈ R^2n×2n. El problema de valor inicial (16) se puede escribir como

˙

z = ¯A(t)z + ¯C(t)¯p + f (t) (17) L0z(t0) + L1z(t1) − b = 0

Para representar la solución de (17) en forma anal´ıtica podemos usar el análogo de la fórmula de Cauchy [2], y en ese caso digamos que Z(t) = Z11(t) Z12(t)

Z21(t) Z22(t)

, es la matriz fundamental de soluciones del sistema homog´eneo correspondiente a (17), donde las Zij(t), (i, j = 1, 2.) son submatrices de dimensi´on n × n.

As´ı mismo sean Z_ij^∗(t) submatrices de dimensi´on n × n de la matriz Z⁻¹(t), entonces la soluci´on del problema de valor inicial

˙

z = ¯A(t)z + ¯C(t)¯p + f (t), z(t0) = z⁰ con z⁰arbitrario puede presentarse como

z(t) = Z(t)z⁰+ Z t

t0

Z(t)Z^∗(τ ) ¯C(t)¯p + f (τ ) dτ (18)

según la fórmula de Cauchy. Para resolver el problema de valor inicial (17) debe- mos encontrar la solución ¯z⁰del sistema no homogéneo de ecuaciones algebráicas

¯

z⁰: L0z⁰+ L1z(t1) − b = 0. (19) La existencia de la solución del sistema (19) y en consecuencia la condición de solubilidad del problema (17) tendrá la forma

det[L₀+ L₁z(t₁)] 6= 0.

(10)

De (18) y (19) se sigue que

¯

z⁰= (Λ)⁻¹

b − L1Z(t1) Z t

t₀

Z^∗(τ ) ¯C(t)¯p + f (τ ) dτ

,

donde Λ = L0+ L1z(t1). Reemplazando este valor en la fórmula de Cauchy (18) llegamos al análogo de la fórmula de Cauchy

z(t) = Z(t)(Λ)⁻¹b − Z(t)(Λ)⁻¹L1Z(t1) Z t₁

t₀

Z^∗(t) ¯C(t)¯p + f (t) dt (20)

+Z(t) Z t

t0

Z^∗(τ ) ¯C(t)¯p + f (τ ) dτ

Después de verificar la condición de solubilidad del problema, se puede mostrar que el subvector ψ(t) de la solución z(t) del problema (16) representado según (20) toma la forma

ψ(t) = [Z21(t) − Z22(t)Θ1]q − Z22(t)Z₂₁^∗ (t1)c (21)

−Z₂₁(t)Z₂₂(t)Z₂₂^∗(t₁) Z t1

t₀

Z₁₁^∗ (t)C(t)p dt + Z₂₁(t) Z t

t₀

Z₁₁^∗(τ )C(τ )p dτ

−Z22(t) Z t1

t₀

Z₂₁^∗ (t)C(t)p dt + Z₂₂(t) Z t

t₀

Z₂₁^∗(τ )C(τ )p dτ + N (t) donde N (t) es un t´ermino que depende de Zij(t) y f (t).

Al sustituir ψ = ψ(t) calculado seg´un (21) en la ley de control ´optimo u^∗(t) = Q⁻¹(t)B^T(t)ψ(t) − Q⁻¹(t)d(t),

obtenemos la f´ormula expl´ıcita de s´ıntesis param´etrica,

u^∗(t) = M (t)q + N (t)c + P (t)p + η(t) (22) donde

M (t) = Q⁻¹(t)B^T(t)[Z₂₁(t) − Z₂₂(t)Θ₁], N (t) = −Q⁻¹(t)B^T(t)Z22(t)Θ, P (t) = Q⁻¹(t)B^T(t)

Z₂₁(t)

Z t t₀

Z₁₁^∗ (τ )C(τ ) dτ

+Z₂₂(t)[−Z₂₂^∗ (t₁)Z₂₁(t₁) Z t1

t₀

Z₁₁^∗ (t)C(t) dt

− Z t₁

t₀

Z₂₁^∗ (t)C(t) dt + Z t

t₀

Z₂₁^∗ (τ )C(τ ) dτ ] + N (t), η(t) = Q⁻¹(t)B^T(t)h

Z21(t)y⁽¹⁾(t) + Z22(t)[y⁽²⁾(t) − Θ1y⁽¹⁾(t1) − y⁽²⁾(t1)]i . Aqu´ı y⁽¹⁾(t) y y⁽²⁾(t) son soluci´on de los problemas vectoriales de valor inicial

˙

y⁽¹⁾(t) = Z₁₁^∗(t)ˆh(t) + Z₁₂^∗(t)g(t), y⁽¹⁾(t0) = 0

˙

y⁽²⁾(t) = Z₂₁^∗(t)ˆh(t) + Z₂₂^∗(t)g(t), y⁽²⁾(t0) = 0

(11)

Ahora bien, aunque (22) determina el control óptimo de forma compleja, existe un caso particular del problema que conlleva una forma del control mas simple, dicho problema se denominará problema lineal convexo de control ópti- mo con parámetros,

˙

x = A(t)x + B(t)u + C(t)p, x(t₀) = q, t ∈ T = [t₀, t₁] (23)

u(t) ∈ R^m, (24)

y con funcional objetivo cuadr´atico

J (u) = hc, x(t1)i +1 2

Z t₁ t₀

hu(t), Q(t) u(t)i dt → m´ın, (25)

es claro que el problema (23) - (25) es obtenido de (13) - (14) haciendo que h(t) = g(t) = d(t) ≡ 0 y Q = P (t) = 0. Por lo tanto en este caso

M (t) ≡ 0, P (t) ≡ 0, η(t) ≡ 0 y de aqu´ı tenemos la ley de control Robusto,

u^∗(t) = N (t)c

en el sentido que solo depende del par´ametro c, para todo q = x(t0) y todo p.

Algoritmo de s´ıntesis para el problema (23) - (25) simplifi- cado.

En primer lugar utilizaremos el algoritmo de s´ıntesis y el principio del m´aximo para el problema lineal convexo de control ´optimo simplificado

˙

x = B(t)u + C(t)p, x(t0) = q, t ∈ T = [t0, t1] (26) donde A(t) es la matriz nula y el funcional cuadr´atico es

J (u) = hc, x(t1)i +1 2

Z t1

t0

[hu(t), Q(t) u(t)i] dt → m´ın, (27)

Entonces

H(ψ, x, u, t) = hψ(t), B(t)u + C(t)pi −1

2hu(t), Q(t) u(t)i (28) y es claro que

u^∗(t) = Q⁻¹(t)B^T(t)ψ(t).

Por otro lado del sistema conjugado

ψ(t) = 0,˙ ψ(t1) = −c

(12)

tenemos

ψ ≡ −c, t ∈ T y entonces

u^∗(t) = −Q⁻¹(t)B^T(t) c.

Ahora verificamos que u^∗ satisface la condici´on de m´aximo de Pontryagin. En efecto, se tiene que,

H(ψ^∗, x^∗, u^∗, t) = −hψ(t), B(t)u^∗(t) + C(t)pi −1

2hu^∗(t), Q u^∗(t)i

=1

2c, B(t) (−Q⁻¹(t)B^T(t) c) − hc, C(t)pi y similarmente para ˜u = u^∗+ ∆u,

H(ψ^∗, x^∗, u^∗+∆u, t) = hψ(t), B(t)u^∗+B(t)∆ui+hψ(t), C(t)pi−1

2hu^∗+∆u, Q(t) (u^∗+∆u)i H(ψ^∗, x^∗, ˜u, t) = 1

2c, B(t) (−Q⁻¹(t)B^T(t) c) − hc, C(t)pi −1

2h∆u, Q(t)∆u)i se comprueba finalmente que

∆u˜H(ψ^∗, x^∗, u^∗, t) = H(˜u, t)−H(u^∗, t) = −1

2h∆u, Q(t)∆ui ≤ 0, c.p.t t ∈ T, ∀˜u ∈ R^m. Ahora resta verificar que el proceso (x^∗, u^∗) es ´optimo. Para ello note que, del

sistema (26) y el Hamiltoniano (28) tenemos que

˙ x = ∂H

∂ψ = −B(t) (−Q⁻¹(t)B^T(t) c) + C(t)p de donde

x(t1) = − Z t₁

t₀

B(t) (−Q⁻¹(t)B^T(t) c) + C(t)p dt + q

luego el funcional de rendimiento es dado por J (u^∗) = hc, x(t1)i +1

2 Z t₁

t0

hu^∗(t), Q(t) u^∗(t)i dt

=

c ,

Z t₁ t₀

B(t) (−Q⁻¹(t)B^T(t) c) + C(t)p dt + q

+1

2 Z t₁

t₀

hQ⁻¹(t)B^T(t) c, B^T(t)ci dt y as´ı

J (u^∗) = −1 2hc ,

Z t₁ t0

B(t) (−Q⁻¹(t)B^T(t))c dti + hc , Z t₁

t0

C(t)p dti + hc , qi.

(13)

Por otro lado J (u^∗+∆u) = −hc,

Z t1

t0

B(t) (−Q⁻¹(t)B^T(t)) c dti+hc , Z t1

t0

B(t)∆u+C(t) p dt+qi

−hc , Z t1

t₀

B(t)∆u dti +1 2

Z t1

t₀

h∆u, Q(t)∆ui dt.

As´ı pues,

∆J (u^∗) = J (u^∗+ ∆u) − J (u^∗) = 1 2

Z t1

t₀

h∆u, Q(t)∆ui dt ≥ 0, ∀˜u ∈ U

puesto que Q(t) es una matriz simétrica definida positiva en T , y de esta manera hemos mostrado que el proceso (u^∗, x^∗) es el mejor en el sentido que minimiza el funcional J y satisface la condición de máximo de Pontryagin.

En segundo lugar, para el caso en que la regi´on de controles admisibles U es elegida compacta convexa, como por ejemplo el paralelep´ıpedo m-dimensional definido por,

U = {u(t) ∈ R^m: |ui(t)| ≤ ì, t ∈ T, i = 1, 2, 3, ...m., ` > 0}, (29) mostraremos que el proceso (u^∗, x^∗) sigue siendo óptimo para nuestro problema lineal convexo simplificado (26) - (27), para ello verificamos como antes la condición de máximo y la minimización del funcional J , nuevamente utilizando el resultado obtenido con el algoritmo de s´ıntesis y teniendo en cuenta que la restricción impuesta equivale a tener

|(−Q⁻¹(t)B^T(t) c)i| ≤ `i, i = 1, ..., m, ` = (`i, ..., `m).

As´ı pues note que si u(t) = ` entonces

H(ψ^∗, x^∗, `, t) = −hc, B(t) ` + C(t)pi −1

2h` , Q(t)`i y

H(ψ^∗, x^∗, `+∆u, t) = −hc, B(t) `+B(t)∆u+C(t)pi−h` , Q(t)∆ui−1

2h∆u , Q(t)∆ui de donde obtenemos

∆u˜H(ψ^∗, x^∗, `, t) = H(˜u, t)−H(`, t) = −hB^T(t)c+Q(t) ` , ∆ui−1

2h∆u , Q(t)∆ui (30) y observamos que ∆u˜H(ψ^∗, x^∗, `, t) ≤ 0 dependiendo de sign hB^T(t)c+Q(t) ` , ∆ui.

Ahora bien analizando nuestro funcional J , J (`) =

c ,

Z t1

t0

[B(t) ` + C(t) p ] dt + q

+1

2 Z t1

t0

h` , Q(t)`i dt

(14)

y su incremento J (`+∆u) =

c ,

Z t1

t0

[B(t) ` + C(t) p ] dt + q

+hc ,

Z t1

t0

B(t)∆u dti+1 2

Z t1

t0

h` , Q(t)`i dt

+ Z t₁

t0

h∆u , Q(t) `i dt +1 2

Z t₁ t0

h∆u, Q(t)∆ui dt note que

∆J (`) = J (` + ∆u) − J (`) = hB^T(t)c + Q(t) ` , ∆ui +1

2h∆u , Q(t)∆ui (31) lo cual implica que como en (30), ∆J (`) ≥ 0 depende de sign hB^T(t)c + Q(t) ` , ∆ui, lo cual sugiere que apartir de (30) - (31) podemos definir nuestro control ´optimo u^∗(t) = (u^∗_i(t), ..., u^∗_m(t)), donde cada u^∗_i(t) es dado por

u^∗(t) =

(−Q⁻¹(t)B^T(t) c)i, si |(−Q⁻¹(t)B^T(t) c)i| ≤ ì, t ∈ T, sign(−Q⁻¹(t)B^T(t) c)iì, si |(−Q⁻¹(t)B^T(t) c)i| > ì, t ∈ T.

(32) Finalmente se analizará si una vez obtenido un par óptimo (x^∗(t), u^∗(t)) para nuestro sistema (23) y funcional (25), éste continuará siendo óptimo una vez se ha perturbado mediante α = (c, p, q), es decir, nos preguntamos si

u^∗= v(t, α)

sigue siendo un control óptimo para nuestro problema lineal convexo perturbado y con restricciones directas sobre el control, como las formuladas en (28), o mas generales. Más aún, deseamos verificar si sobre T , podemos definir el control

´

optimo como un h´ıbrido entre control bang-bang y nuestro control (32) obtenido del algoritmo de s´ıntesis.

Referencias

[1] E.A. Lutkovskaya, A method for contructing a parametric synthesis for a linear-quadratic optimal control problem, Sizv. Vyssh. Uchebn. Zaved.

Mat. 1999, No. 12, 71-73; translation in Russian Math. (Iz. VUZ), No. 12, 67-69(2000).

[2] O.O. Vasilieva, Two parameter algorithm for optimal control problems with boundary conditions, Saitama Mathematical Journal, Vol. 20 (2002), 45-62.

[3] O.V. Vasiliev,Optimization Methods, Advanced series in mathematical science and engineering WFP, 1996.

[4] L.D. Berkovitz, Optimal Control Theory, Springer-Verlag, 1974.

(15)

[5] V.G. Boltyanskii, Mathematical methods of optimal control, Holt, Rine- hart and Winston, Inc. 1971.

[6] R. Gabasov, F. Kirillova, Methods of optimization, Optimization Soft- ware, Inc., 1988.

[7] V.I. Arnold, Ordinary Differential Equations, MIT Press. E.U.A., 1978.