2
1. Repaso de Conceptos Conocidos 5
1.1. Introducci´ on. Planteamiento del problema . . . . 5
1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos . . . . 6
1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil . . . . 9
1.4. Minimizaci´ on de funcionales . . . . 11
1.5. C´ alculo diferencial . . . . 13
1.6. Aplicaciones . . . . 22
1.6.1. Primera Aplicaci´ on: Minimizaci´ on de un funcional cuadr´ atico . . . . 23
1.6.2. Segunda Aplicaci´ on: Teorema de la Proyecci´ on . . . . 24
2. M´ etodos de Tipo Gradiente Para Problemas sin Restricciones 27 2.1. Funcionales el´ıpticos . . . . 27
2.2. M´ etodos del gradiente para problemas de m´ınimo sin restricciones . . . . 31
2.2.1. Algoritmo del Gradiente con Paso ´ Optimo (AGPO) . . . . 32
2.2.2. Algoritmos del Gradiente con Paso Fijo (AGPF) y Variable (AGPV) . . . . . 34
2.3. M´ etodos del gradiente conjugado para problemas sin restricciones . . . . 37
2.3.1. El algoritmo del gradiente conjugado para un funcional cuadr´ atico el´ıptico en R
N. . . . 38
2.3.2. Algoritmo del Gradiente Conjugado Gen´ erico (AGCG) . . . . 41
3. M´ etodos Para Problemas de Optimizaci´ on con Restricciones 47 3.1. M´ etodo del Gradiente con Proyecci´ on . . . . 47
3.2. M´ etodos de Penalizaci´ on . . . . 50
3.3. M´ etodos de dualidad. M´ etodo de Uzawa . . . . 53
3.3.1. Relaciones de Kuhn-Tucker . . . . 53
3.3.2. Lagrangianos y puntos de silla. Introducci´ on a la dualidad . . . . 56
3.3.3. M´ etodo de Uzawa para un funcional el´ıptico . . . . 58
4. Control ´ optimo de sistemas lineales 63 4.1. Planteamiento de un problema de control ´ optimo . . . . 63
4.2. Control ´ optimo de e.d.o. . . . . 64
4.3. Control ´ optimo de EDP el´ıpticas . . . . 68
4 ´INDICE GENERAL
Introducci´ on. Repaso de Conceptos Conocidos
1.1. Introducci´ on. Planteamiento del problema
En esta asignatura trataremos dos aspectos importantes dentro de la Matem´ atica Aplicada:
el An´ alisis Num´ erico y su relaci´ on con la Optimizaci´ on. En concreto trataremos problemas de Optimizaci´ on desde el punto de vista del An´ alisis Num´ erico. De manera general un problema de optimizaci´ on puede ser descrito de la siguiente forma: Supongamos que tenemos un sistema sobre el que podemos actuar mediante una variable v (el control) que vive en un cierto conjunto U (el conjunto de controles admisibles). Supongamos tambi´en que tenemos a nuestra disposici´on una funci´ on J (funcional coste) que depende de v y, posiblemente, de la soluci´ on del sistema.
Pretendemos calcular un control u ∈ U tal que J(u) ≤ J(v) para cualquier v ∈ U.
En t´ erminos matem´ aticos el problema puede ser escrito del siguiente modo: Supongamos que V es un espacio normado (en general de dimensi´ on infinita). Dados U ⊂ V un conjunto y J : U 7→ R un funcional, planteamos el problema
(P )
( Hallar u ∈ U tal que J (u) ≤ J (v) ∀v ∈ U.
El objetivo de de la Optimizaci´ on es tanto el estudio te´ orico del problema (P ) como proporcionar algoritmos que permitan aproximar la o las soluciones del problema.
Diremos que (P ) es un problema de optimizaci´ on sin restricciones si U ≡ V . Si U 6= V , entonces hablaremos de un problema de m´ ınimos con restricciones.
En este curso, estamos interesados por la optimizaci´ on continua en dimensi´ on finita o infinita.
Abordaremos fundamentalmente, y en este orden, las siguientes cuestiones:
Resultados de existencia y unicidad de soluci´ on del problema (P ).
Caracterizaci´ on de la(s) soluci´ on(es), es decir, condiciones necesarias, y en algunos casos, suficientes de soluci´ on del problema (P ). Las condiciones necesarias hacen intervenir, gene- ralmente, la derivada primera (en cierto sentido) del funcional J , mientras que las condiciones suficientes hacen intervenir las derivadas segundas (en cierto sentido) de J .
Construcci´ on efectiva de algoritmos que permitan aproximar la o las soluciones de (P ). Es
decir, construcci´ on de una sucesi´ on {u
k}
k≥0de elementos de U que converja (en un sentido
adecuado) hacia la o una soluci´ on del problema (P ).
6 1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos
Para los problemas sin restricciones (Tema 2), estudiaremos los algoritmos de tipo gradien- te (paso ´ optimo, paso fijo, paso variable) y gradiente conjugado (gen´ erico, Fletcher-Reeves, Polak-Riviere). Para los problemas con restricciones (Tema 3), estudiaremos el algoritmo del gradiente con proyecci´ on, cuya aplicaci´ on se restringe a conjuntos U muy particulares. Los problemas con restricciones generales son m´ as dif´ıciles de tratar y se intenta su resoluci´ on reemplaz´ andolos por otros problemas sin restricciones, ´ esta es la idea para los m´ etodos de dualidad (Uzawa).
El Tema 4 se dedica al Control ´ Optimo que consiste en un problema de minimizaci´ on donde adem´ as, la soluci´ on buscada depende de otra variable dada a trav´ es de una ecuaci´ on diferencial ordinaria o en derivadas parciales.
Dedicaremos este primer Tema a repasar ciertos conceptos que aparecer´ an a lo largo del curso y que han sido vistos anteriormente en las asignaturas en “Ecuaciones en Derivadas Parciales y An´ alisis Funcional” y “An´ alisis Funcional y Optimizaci´ on” del cuarto curso de la Licenciatura en Matem´ aticas.
1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos
A lo largo de esta secci´ on X representa un espacio normado con norma que ser´ a denotada por k · k. Recordemos que, dados una sucesi´ on {x
n}
n≥1⊂ X y un elemento x ∈ X, se tiene que x
nconverge hacia x en X (que denotaremos x
n→ x en X) si la sucesi´ on real kx
n− xk converge hacia cero. En algunas ocasiones diremos que x
nconverge en norma o fuertemente hacia x. Adem´ as de este concepto de convergencia tambi´ en introduciremos los siguientes:
Definici´ on 1.1. 1. Sean {x
n}
n≥1⊂ X una sucesi´ on y x ∈ X un elemento de X. Diremos que x
nconverge d´ ebilmente hacia x (y escribiremos x
n* x) si para cualquier x
0∈ X
0se tiene
hx
0, x
ni
X0,X→ hx
0, xi
X0,X.
En esta definici´ on h·, ·i
X0,Xrepresenta el producto de dualidad entre el espacio normado X y su dual X
0.
2. Sean {x
0n}
n≥1⊂ X
0una sucesi´ on y x
0∈ X
0un elemento de X
0. Diremos que x
0nconverge
∗-d´ ebilmente hacia x
0(y escribiremos x
n* x) si
∗hx
0n, xi
X0,X→ hx
0, xi
X0,X∀x ∈ X.
Observaci´ on 1.1. Los conceptos de convergencia d´ ebil y ∗-d´ ebil son lineales. Por ejemplo, si {x
n}
n≥1e {y
n}
n≥1son dos sucesiones en X y x e y son dos elementos de X tales que x
n* x e y
n* y, entonces se tiene
αx
n+ βy
n* αx + βy, ∀α, β ∈ R.
Es f´ acil comprobar la relaci´ on que existe entre los anteriores conceptos de convergencia d´ ebil y
∗-d´ ebil y el concepto de convergencia fuerte. En concreto, se tiene:
Proposici´ on 1.2. Sean {x
n}
n≥1⊂ X una sucesi´ on y x ∈ X un elemento de X (resp., {x
0n}
n≥1⊂ X
0una sucesi´ on y x
0∈ X
0) tales que x
n→ x en X (resp., x
0n→ x
0en X
0). Entonces, x
n* x (resp., x
0n* x
∗ 0).
Pasemos a continuaci´ on a analizar estos conceptos en algunos ejemplos interesantes:
Ejemplo 1.1. Consideremos el caso de un espacio de Hilbert H, con producto escalar que denota- remos por (·, ·). Recordemos que, gracias al Teorema de Riesz, el espacio H puede ser identificado con su dual H
0mediante el producto escalar (·, ·). Efectivamente, introduzcamos la aplicaci´ on R : H → H
0definida por
h Rx, yi
H0,H= (x, y), ∀ x, y ∈ H.
Entonces, R est´a bien definida y es un isomorfismo isom´etrico entre H y H
0, es decir es lineal, biyectiva y verifica
k Rxk
H0= kxk
H, ∀ x ∈ H.
En particular, tanto R como R
−1son continuas. Este resultado permite identificar H con H
0. Esta identificaci´ on tambi´ en nos permite reescribir de manera equivalente el concepto de conver- gencia d´ ebil en el espacio de Hilbert H. Efectivamente, dados {x
n}
n≥1⊂ H y x ∈ H, se tiene que x
n* x si y s´ olo si
(x
n, y) → (x, y), ∀y ∈ H.
Ejemplo 1.2. Sea Ω un abierto no vac´ıo de R
N. Recordemos que f : R
N−→ R
Nes una funci´ on medible si el conjunto
{x ∈ R
N: f (x) < a}
es medible (respecto de la medida de Lebesgue en R
N) para cualquier valor a de R. Como es habitual, identificaremos funciones que son iguales salvo un conjunto de medida (Lebesgue) nula (iguales casi por doquier). Para la integral de Lebesgue usaremos la notaci´ on
Z
Ω
f = Z
Ω
f (x) dx.
Recordemos tambi´ en que, para p ∈ [1, ∞), L
p(Ω) (abreviatura de L
p(Ω, µ), cuando µ es la medida de Lebesgue en R
N) es el espacio de (clases de) funciones u, medibles en Ω y que son p-integrables en Ω, es decir,
Z
Ω
|u|
p< ∞.
En el caso p = ∞, se tiene que L
∞(Ω) es el espacio de (clases de) funciones u, medibles en Ω que est´ an esencialmente acotadas en Ω, es decir, tales que existe M > 0 y N ⊂ Ω con medida nula verificando |u(x)| ≤ M para cada x ∈ Ω \ N.
Los espacios vectoriales anteriores son normados para las normas:
||u||
p;Ω= ||u||
Lp(Ω)=
Z
Ω
|u|
p 1/ppara p ∈ [1, ∞),
||u||
∞;Ω= ||u||
L∞(Ω)= sup
Ω
es |u| = ´ınf {M > 0 : |u(x)| ≤ M p.c.t. x ∈ Ω} para p = ∞.
Es conocido que (L
p(Ω), || · ||
p;Ω) es un espacio de Banach para cualquier valor de p ∈ [1, ∞]. En el caso particular de p = 2, es decir, (L
2(Ω), || · ||
2;Ω) es un espacio de Hilbert.
Al igual que en el caso de los espacios de Hilbert, es posible identificar el dual de los espacios L
p(Ω). Efectivamente, si p ∈ [1, ∞), Ω ⊂ R
Nes un abierto y p
0∈ (1, ∞] es el exponente conjugado de p,
1 p + 1
p
0= 1,
podemos introducir el operador R
p: L
p0(Ω) → [L
p(Ω)]
0definido por h R
pf, gi
[Lp(Ω)]0,Lp(Ω)=
Z
Ω
f (x)g(x) dx, ∀g ∈ L
p(Ω).
8 1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos
De nuevo, R
pest´ a bien definido, es un isomorfismo isom´ etrico entre L
p0(Ω) y [L
p(Ω)]
0y permite identificar L
p0(Ω) con [L
p(Ω)]
0.
En el caso p = ∞, tambi´ en podemos introducir el operador R
∞: L
1(Ω) → [L
∞(Ω)]
0y se tiene tambi´ en que R
∞es lineal e isom´ etrico (y por tanto inyectivo) pero no es sobreyectivo. Deducimos que L
1(Ω) no se puede identificar con [L
∞(Ω)]
0.
En el caso p ∈ [1, ∞) y usando la anterior identificaci´ on, es posible reescribir el concepto de convergencia d´ ebil en L
p(Ω). Dados {f
n}
n≥1⊂ L
p(Ω) y f ∈ L
p(Ω), es f´ acil comprobar que f
n* f en L
p(Ω) si y s´ olo si
Z
Ω
f
n(x)g(x) dx → Z
Ω
f (x)g(x) dx, ∀g ∈ L
p0(Ω).
Por ´ ultimo, teniendo en cuenta que L
∞(Ω) ≡ [L
1(Ω)]
0, tambi´ en podemos identificar la conver- gencia d´ ebil-* en L
∞(Ω): Dados {f
n}
n≥1⊂ L
∞(Ω) y f ∈ L
∞(Ω), es f´ acil comprobar que f
n* f
∗en L
∞(Ω) si y s´ olo si
Z
Ω
f
n(x)g(x) dx → Z
Ω
f (x)g(x) dx, ∀g ∈ L
1(Ω).
Veamos algunas propiedades sobre la convergencia d´ ebil:
Proposici´ on 1.3. Sean X e Y dos espacios normados. Se tiene:
1. Sean A ∈ L(X, Y ), {x
n}
n≥1⊂ X y x ∈ X tales que x
n* x en X. Entonces, Ax
n* Ax en Y .
2. Si x
n* x d´ ebil en X, entonces {x
n}
n≥1es una sucesi´ on acotada en X y kxk
X≤ l´ım inf kx
nk
X. 3. Si x
0n* x
∗ 0d´ ebil-∗ en X
0, entonces {x
0n}
n≥1es una sucesi´ on acotada en X
0y kx
0k
X0≤
l´ım inf kx
nk
X0.
Observaci´ on 1.2. Si A no es lineal, aunque sea continua, el primer punto de la Proposici´ on 1.3 es, en general falso. Un ejemplo viene dado por la aplicaci´ on norma en un espacio de Banach X (la cual es, evidentemente, una aplicaci´ on continua pero no lineal). Es posible construir ejemplos de sucesiones {x
n}
n≥1⊂ X tales que kx
nk = 1 y satisfacen x
n* 0. Evidentemente, x
n6→ 0 en X.
Pasemos a continuaci´ on a recordar el concepto de reflexividad. Dado X un espacio normado, se define la aplicaci´ on J : X −→ X
00por
h J(x), x
0i
X00,X0= hx
0, xi
X0,X, ∀x ∈ X, x
0∈ X
0llamada inyecci´ on can´ onica de X en X
00. Se tiene:
Proposici´ on 1.4. La aplicaci´ on J est´a bien definida, es lineal, isom´etrica e inyectiva. Por tanto permite identificar X con el subespacio J(X) de X
00.
Gracias a este resultado podemos definir:
Definici´ on 1.5. Sea X un espacio normado. Se dice que X es un espacio reflexivo si la aplicaci´ on J es sobreyectiva.
Obs´ ervese que, en particular, si X es reflexivo entonces X se identifica con X
00(que es un espacio de Banach al ser el dual de X
0). Deducimos que tambi´ en X es un espacio de Banach.
Veamos algunas propiedades de los espacios reflexivos. Se tiene:
Proposici´ on 1.6. Sea X un espacio normado. Entonces,
1. X es un espacio reflexivo si y s´ olo si X
0es un espacio reflexivo.
2. Si X es un espacio reflexivo y C ⊆ X es un subespacio vectorial cerrado, entonces (C, k · k) es tambi´ en un espacio reflexivo.
Pasemos a continuaci´ on a analizar otros conceptos relacionados con la convergencia d´ ebil en espacios normados:
Definici´ on 1.7. Sean X un espacio normado y C ⊆ X un subconjunto. Se dice que C es secuen- cialmente d´ ebilmente cerrado si para cualesquiera sucesi´ on {x
n}
n≥1⊂ X y x ∈ X tales que x
n* x se tiene que x ∈ C.
A diferencia de lo que podr´ıa pensarse, obs´ ervese que si C ⊆ X es un conjunto secuencialmente d´ ebilmente cerrado, entonces C es cerrado. La implicaci´ on contraria es, en general, falsa. Si embargo, como consecuencia del Teorema de Hanh-Banach o, m´ as concretamente, como consecuencia de los Teoremas de separaci´ on de conjuntos convexos, se tiene:
Teorema 1.8. Sea X un espacio normado y C ⊆ X un subconjunto convexo. Entonces, C es cerrado si y s´ olo si C es secuencialmente d´ ebilmente cerrado.
Pasemos a continuaci´ on a recordar el concepto de conjunto compacto en un espacio normado.
Es bien conocido que si X es un espacio normado, el concepto de compacidad puede ser reescrito en t´ erminos de convergencia. En concreto, dado K ⊂ X, K es compacto si y s´olo K satisface la siguiente propiedad:
“Fijada {x
n}
n≥1⊂ K, existe una subsucesi´on {x
nk}
k≥1de {x
n}
n≥1y x ∈ K tal que x
nk→ x.”
La propiedad anterior en particular implica la propiedad bien conocida: “Sea K ⊂ X un compac- to (con X un espacio normado), entonces K es cerrado y acotado”. Recu´erdese que la implicaci´on contraria s´ olo es v´ alida si X es un espacio de dimensi´ on finita. Sin embargo en los espacios nor- mados de dimensi´ on infinita tambi´ en es posible obtener informaci´ on de las sucesiones acotadas. Se tiene:
Teorema 1.9. 1. Sea X un e.n. separable y {x
0n}
n≥1⊂ X
0una sucesi´ on acotada. Entonces existe una subsucesi´ on {x
0nk
}
k≥1de {x
0n}
n≥1y x
0∈ X
0tal que x
0nk
* x
∗ 0.
2. Sea X un espacio de Banach reflexivo y {x
n}
n≥1⊂ X una sucesi´ on acotada. Entonces existe una subsucesi´ on {x
nk}
k≥1de {x
n}
n≥1y x ∈ X tal que x
nk* x.
1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil
Pasemos seguidamente a recordar los conceptos de semicontinuidad inferior y semicontinuidad inferior d´ ebil de funcionales definidos en espacios normados. As´ı, definimos:
Definici´ on 1.10. Sea X un espacio normado y f : U → R un funcional, con U ⊂ X. Diremos que f es semicontinuo inferiormente, y se escribir´ a f es s.c.i., en un punto x ∈ U si para toda sucesi´on {x
n}
n≥1⊂ U con x
n→ x, se tiene
f (x) ≤ l´ım inf f (x
n).
Diremos que f es semicontinua inferiormente en U si lo es en todo punto x de U.
10 1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil
An´ alogamente, podemos definir:
Definici´ on 1.11. Sea X un espacio normado y f : U → R un funcional, con U ⊂ X. Diremos que f es secuencialmente d´ ebilmente semicontinuo inferiormente, y se escribir´ a f es s.d.s.c.i., en un punto x ∈ U si para toda sucesi´on {x
n}
n≥1⊂ U tal que x
n* x, se tiene
f (x) ≤ l´ım inf f (x
n).
Diremos que f es secuencialmente d´ ebilmente semicontinua inferiormente en U si lo es en todo punto x de U.
De nuevo y a diferencia de lo que podr´ıa suponerse, el concepto de semicontinuidad inferior secuencial d´ ebil es m´ as fuerte que el concepto de semicontinuidad inferior: Es f´ acil comprobar que si f : U → R un funcional, con U ⊂ X, es s.d.s.c.i. en el punto x ∈ U, entonces f es s.c.i. en x.
Es posible caracterizar ambos conceptos del siguiente modo:
Proposici´ on 1.12. Sean X un espacio normado, U ⊂ X un subconjunto y f : U −→ R un funcional. Se tiene:
1. Supongamos que U es cerrado. Entonces, f es s.c.i. en U si y s´olo si el conjunto E
λ= {x ∈ U : f(x) ≤ λ}
es un conjunto cerrado de X para todo λ ∈ R.
2. Supongamos que U es secuencialmente d´ebilmente cerrado. Entonces, f es s.d.s.c.i. en U si y s´ olo si el conjunto E
λes un conjunto d´ ebilmente cerrado de X para todo λ ∈ R.
Dado un espacio vectorial X y un subconjunto U ⊆ X, recordemos que U es convexo si para cualesquiera x, y ∈ U se tiene [x, y] ⊆ U, donde
[x, y] = {θx + (1 − θ)y : θ ∈ [0, 1]}.
As´ı:
Definici´ on 1.13. Sean X un espacio vectorial, U ⊆ X un subconjunto convexo y f : U → X una funci´ on. Se dice que f es convexa en U si
f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y), ∀x, y ∈ U, ∀θ ∈ [0, 1].
Se dice que f es estrictamente convexa en U si
f (θx + (1 − θ)y) < θf (x) + (1 − θ)f (y), ∀x, y ∈ U con x 6= y, ∀θ ∈ (0, 1).
Gracias a la caracterizaci´ on de la s.c.i. y de la s.c.i. secuencial d´ ebil, no es dif´ıcil comprobar la siguiente propiedad:
Proposici´ on 1.14. Dados X un espacio normado, U ⊆ X un subconjunto convexo cerrado no
vac´ıo y f : U → R un funcional convexo. Entonces, se tiene que f es s.c.i. en U si y s´olo si f es
s.d.s.c.i. en U.
Prueba. La demostraci´ on del resultado es una f´ acil consecuencia de la Proposici´ on 1.12. Obs´ ervese en primer lugar que ´ esta puede ser aplicada pues U es un convexo cerrado no vac´ıo y, por tanto, U es secuencialmente d´ ebilmente cerrado.
Aplicando la Proposici´ on 1.12, f es s.c.i. en U si y s´olo si el conjunto E
λes un cerrado de X para cualquier λ de R. Como el funcional f y el conjunto U son convexos, es f´acil comprobar que E
λes tambi´ en un conjunto convexo para todo λ ∈ R. Por tanto, E
λes cerrado si y s´ olo si E
λes secuencialmente d´ ebilmente cerrado, es decir, si y s´ olo si f es s.d.s.c.i. en el conjunto U. Esto finaliza la prueba.
Ejemplo 1.3. Dado (X, k · k) un espacio normado, es posible aplicar este resultado a la funci´ on norma obteniendo de nuevo la propiedad 2 de la Proposici´ on 1.3. Efectivamente, considerando U ≡ X y f(x) = kxk, se tiene que f es un funcional convexo definido en el convexo cerrado X.
Como f es continuo en X, en particular es s.c.i. en X. Aplicando directamente la propiedad anterior deducimos que f ≡ k · k es s.d.s.c.i. en X y, por tanto, la propiedad 2 de la Proposici´ on 1.3.
1.4. Minimizaci´ on de funcionales
En esta secci´ on recordaremos algunos resultados conocidos sobre minimizaci´ on de funcionales.
Recordemos que estamos interesados en el estudio de la existencia de soluci´ on de problemas de Optimizaci´ on que pueden ser escritos de la forma
´ınf
v∈UJ (v)
con U un subconjunto de un espacio X (en general un espacio normado) y J : U → R un funcional.
Como sabemos, U es el conjunto de las restricciones o conjunto admisible y J es el funcional coste o funcional objetivo. Recordemos tambi´ en los siguientes conceptos:
Definici´ on 1.15. Dados X un espacio normado, U ⊆ X un subconjunto y J : U −→ R un funcional. Se dice que u es un m´ınimo local (o m´ınimo relativo) de J en el conjunto U si u ∈ U y existe ε > 0 tal que
J (u) ≤ J (v) ∀v ∈ U ∩ B(u; ε).
Se dice que u es un m´ınimo global (o m´ınimo absoluto) de J en el conjunto U si u ∈ U y se satisface J (u) ≤ J (v), ∀v ∈ U.
De forma an´ aloga se pueden definir los conceptos de m´ aximo local (o relativo) y m´ aximo global (o absoluto) de un funcional J en un conjunto U. En general, utilizaremos la palabra extremo para designar indistintamente un m´ aximo o m´ınimo de J .
El primer resultado de existencia de m´ınimos que veremos es debido a Weierstrass:
Teorema 1.16. (Teorema de Weierstrass) Supongamos que U es un espacio m´etrico no vac´ıo y compacto y J : U → R es un funcional s.c.i. en U. Entonces, J admite un m´ınimo global en U.
Prueba: Aplicaremos el llamado m´ etodo directo del C´ alculo de Variaciones: Tomaremos una su- cesi´ on minimizante {u
n}
n≥1y probaremos que admite una subsucesi´ on convergente a un m´ınimo global de f en U. Usaremos la compacidad de U para poder extraer una subsucesi´on convergente y la s.c.i. de J en U para probar que el l´ımite es un m´ınimo global de J en U.
Si llamamos α = ´ınf
v∈UJ (v) ∈ [−∞, ∞), entonces, existe una sucesi´ on {u
n}
n≥1⊂ U (sucesi´on minimizante) tal que
l´ım J (u
n) = α.
12 1.4. Minimizaci´ on de funcionales
Como U es compacto, existen u ∈ b U y una subsucesi´on {u
nk}
k≥1de {u
n}
n≥1tales que u
nk→ u en b U. Al ser J un funcional s.c.i. en U, se tiene
J ( u) ≤ l´ım inf J (u b
nk) = l´ım J (u
n) = α.
Deducimos de este modo que α ∈ R y J( u) = α = ´ınf b
u∈UJ (u). Esto finaliza la demostraci´ on.
Recordemos tambi´ en
Definici´ on 1.17. Sea X un espacio normado, U ⊆ X un subconjunto no acotado y J : U → R un funcional. Se dice que J es coercitivo en U si
kuk→+∞
l´ım J (u) = +∞.
Es posible la generalizaci´ on del resultado anterior a un marco m´ as abstracto. As´ı, usaremos el pr´ oximo resultado para deducir la existencia de soluci´ on de problemas de minimizaci´ on planteados en un espacio normado:
Teorema 1.18. Sean X un espacio de Banach reflexivo, U ⊆ X un subconjunto secuencialmente d´ ebilmente cerrado no vac´ıo y J : U → R un funcional s.d.s.c.i. Adem´as, si U es no acotado, supongamos que J es coercitiva en U. Entonces, J admite, al menos, un m´ınimo global en U.
Prueba: Seguimos el mismo razonamiento del Teorema 1.16 y seleccionamos una sucesi´ on mini- mizante {u
n}
n≥1⊂ U tal que
l´ım J (u
n) = α = ´ınf
u∈U
J (u)(∈ [−∞, ∞)).
Si U es un subconjunto acotado, est´a claro que la sucesi´on {u
n}
n≥1est´ a acotada. Si U es un no acotado, no es dif´ıcil comprobar (gracias a la hip´ otesis de coercitividad de J ) que tambi´ en {u
n}
n≥1est´ a acotada. Efectivamente, basta razonar por reducci´ on al absurdo para deducir la acotaci´ on de {u
n}
n≥1.
Al ser X un espacio reflexivo, U un subconjunto s.d. cerrado y {u
n}
n≥1una sucesi´ on acota- da, deducimos que existe una subsucesi´ on de {u
n}
n≥1(que seguiremos denotando {u
n}
n≥1) y un elemento u ∈ b U tal que
u
n* u d´ b ebil en X.
Como J es s.d.s.c.i., entonces
J ( b u) ≤ l´ım inf J (u
n) = l´ım J (u
n) = α.
Esta ´ ultima desigualdad prueba el resultado.
Como una consecuencia inmediata del Teorema 1.18, tenemos:
Corolario 1.19. Sean X un espacio de Banach reflexivo, U ⊆ X un subconjunto convexo cerrado no vac´ıo y J : U → R un funcional convexo y s.c.i. Adem´as, si U es no acotado, supongamos que J es coercitiva en U. Entonces, J admite, al menos, un m´ınimo global en U.
Respecto a la unicidad de soluci´ on para el problema de minimizaci´ on planteado, se tiene:
Proposici´ on 1.20. Sea X un espacio vectorial sobre R, U ⊆ X un subconjunto convexo y J : U →
R un funcional estrictamente convexo. Entonces, J admite a lo m´ as un m´ınimo global en U.
Prueba: Supongamos que b u
1, b u
2∈ U satisfacen u b
16= b u
2y J ( u b
1) = J ( b u
2) = ´ınf
u∈U
J (u).
Al ser U convexo, b u =
12( b u
1+ u b
2) ∈ U y J ( u) < b 1
2 (J ( b u
1) + J ( u b
2)) = ´ınf
u∈U
J (u).
Evidentemente, esta ´ ultima desigualdad es absurda.
La convexidad de J permite liberarnos del car´ acter local de los m´ınimos relativos. Se tiene:
Proposici´ on 1.21. Sea X un espacio normado, U ⊆ X un subconjunto convexo de X y J : U → R un funcional convexo. Si J admite un m´ınimo relativo b u en U, entonces ese m´ınimo es un m´ınimo global en U, es decir,
J ( b u) = ´ınf
u∈U
J (u).
Prueba: Al ser u ∈ b U un m´ınimo relativo de J en U deducimos la existencia de ε > 0 tal que J ( u) ≤ J (u), b ∀u ∈ U ∩ B(b u; ε).
Sea ahora v ∈ U arbitrario y veamos que J(b u) ≤ J (v). Esta desigualdad es evidente si v ∈ B( b u; ε).
Supongamos entonces que kv − uk > ε y consideremos b u = b u + ε
2kv − b uk (v − b u)
que, evidentemente, satisface u ∈ U ∩ B(b u; ε) (el conjunto U es convexo). De este modo, al ser J convexa,
J ( u) ≤ J (u) ≤ J ( b b u) + ε
2kv − uk b (J (v) − J ( u)) , b de donde se deduce que J ( u) ≤ J (v). Esto finaliza la prueba. b
1.5. C´ alculo diferencial
En esta secci´ on vamos a hacer un breve recordatorio de la teor´ıa de derivaci´ on en espacios normados.
Definici´ on 1.22. Sean X e Y dos espacios normados, U ⊆ X un subconjunto abierto, F : U → Y un operador, x
0∈ U y h ∈ X. Se dice que F es diferenciable en el sentido de Gˆateaux (o G- diferenciable) en x
0y en la direcci´ on h si existe el l´ımite en Y
ε→0
l´ım
F (x
0+ εh) − F (x
0)
ε = δF (x
0; h) ∈ Y.
Al elemento δF (x
0; h) ∈ Y definido por el anterior l´ımite se le denomina G-diferencial de F en el punto x
0y en la direcci´ on h.
Si existe δF (x
0; h) para toda h ∈ X, diremos que F es G-diferenciable en x
0, y a la aplicaci´ on δF (x
0) definida por
δF (x
0) : h ∈ X 7−→ δF (x
0; h) ∈ Y
la denominaremos la G-diferencial (o diferencial Gˆ ateaux) de F en el punto x
0.
14 1.5. C´ alculo diferencial
Observaci´ on 1.3. No es dif´ıcil demostrar que si F es G-diferenciable en x
0y en la direcci´ on h ∈ X, entonces tambi´ en lo es en la direcci´ on αh, con α ∈ R, y
δF (x
0; αh) = αδF (x
0; h), ∀α ∈ R, ∀ h ∈ X.
Por otro lado, si introducimos la funci´ on de variable real g(t) = F (x
0+ th) (definida en un entorno de t = 0), entonces, se tiene que F es G-diferenciable en el punto x
0y en la direcci´ on h si y s´ olo si g es derivable en 0. En este caso, g
0(0) = δF (x
0; h).
Siguiendo con las definiciones, pasemos a la siguiente:
Definici´ on 1.23. Sean X e Y dos espacios normados, U ⊆ X un subconjunto abierto, x
0∈ U y F : U → Y un operador G-diferenciable en x
0. Si la aplicaci´ on δF (x
0) es un operador lineal y continuo de X en Y , es decir, si δF (x
0) ∈ L(X, Y ), entonces se dice que F es G-derivable en x
0y a la aplicaci´ on δF (x
0) se la denomina la derivada Gˆ ateaux (G-derivada) de F en x
0.
Ejemplo 1.4. 1. Sean X e Y dos espacios normados, y
0∈ Y y A ∈ L(X, Y ) un operador lineal y continuo. Consideremos F : x ∈ X 7→ F (x) = Ax + y
0∈ Y . Entonces, no es dif´ıcil comprobar que F es G-derivable en X y δF (x) = A, para cualquier x ∈ X. Si A fuera solo un operador lineal, entonces F es G-diferenciable en x
0y δF (x
0) = A, para cualquier x
0∈ X.
2. Consideremos ahora B ∈ L
2(X, Y ), es decir, B : X ×X → Y , un operador bilineal y continuo.
Definamos la aplicaci´ on F : x ∈ X 7→ F (x) = B(x, x) ∈ Y . Entonces, se tiene que F es G- derivable en X y δF (x) = B(x, ·) + B(·, x), para cualquier x ∈ X. Si B es sim´ etrico, entonces, δF (x) = 2B(x, ·). En el caso en el que B solo es bilineal, se tiene que F es G-diferenciable en x
0con δF (x
0) = B(x
0, ·) + B(·, x
0), para cualquier x ∈ X
0.
3. Como aplicaci´ on del punto anterior podemos obtener lo siguiente: Sea H en espacio de Hilbert (con producto escalar (·, ·)) e introduzcamos el funcional
F : x ∈ H 7−→ F (x) = kxk
2∈ R, ∀x ∈ H.
Este funcional puede ser escrito F (x) = (x, x) y as´ı, aplicando el punto anterior, deducimos que F es G-derivable en todos los puntos de H y
δF (x
0; h) = 2(x
0, h), ∀x
0∈ H, ∀h ∈ H.
Las definiciones precedentes generalizan el concepto de derivada direccional para aplicaciones de R
Nen R. Un concepto m´as restrictivo lo constituye la noci´on de derivada en el sentido de M.
Fr´ echet.
Definici´ on 1.24. Sean X, Y dos espacios normados, U ⊆ X un subconjunto abierto, F : U → Y un operador y x
0∈ U . Diremos que F es derivable en x
0en el sentido de Fr´ echet (o F-derivable en x
0), si existe ε
0> 0 y A(x
0) ∈ L(X, Y ) tal que
(1.1) F (x
0+ h) = F (x
0) + A(x
0)h + o(h), ∀h ∈ X con khk
X≤ ε
0, con o(h) ∈ Y satisfaciendo
(1.2) l´ım
khk→0
ko(h)k
Ykhk
X= 0.
En tal caso el operador A(x
0) es ´ unico (ver la Proposici´ on 1.25), lo denotaremos por F
0(x
0) y lo
denominaremos la derivada Fr´ echet (o F-derivada) de F en x
0.
La anterior definici´ on nos proporciona un nuevo concepto de derivada en los espacios de Banach que, evidentemente est´ a relacionado con la derivada en el sentido de Gˆ ateaux. Se tiene:
Proposici´ on 1.25. Sean X e Y dos espacios normados y F : U ⊆ X → Y un operador definido en U ⊆ X un abierto. Si F es F-derivable en x
0∈ U, entonces F es continua y G-derivable en x
0. Adem´ as, δF (x
0) ∈ L(X, Y ) y F
0(x
0) = δF (x
0).
Prueba: Sea h ∈ X \{0} y consideremos ε
0> 0 y A(x
0) ∈ L(X, Y ) satisfaciendo la condici´on ( 1.1).
Entonces, para ε 6= 0 y ε ≤ ε
0/khk
Xse tiene F (x
0+ εh) − F (x
0)
ε = A(x
0)h + o(εh) ε .
Usando la propiedad (1.2), podemos pasar al l´ımite cuando ε → 0 en la desigualdad precedente para probar
ε→0
l´ım
F (x
0+ εh) − F (x
0)
ε = A(x
0)h + l´ım
ε→0
o(εh)
ε = A(x
0)h + l´ım
ε→0
khk
Xko(εh)k
Ykεhk
X= A(x
0)h, de donde se deduce que F es derivable Gˆ ateaux en x
0y δF (x
0) = A(x
0). En particular, esto prueba la unicidad de A(x
0) mencionada anteriormente.
La continuidad de F en x
0es una simple consecuencia de la f´ ormulas (1.1) y (1.2). Esto acaba la prueba.
Ejemplo 1.5. En los tres ejemplos anteriores es f´ acil comprobar que las aplicaciones son F- derivables en cada punto x
0∈ X y, evidentemente, la F-derivada coincide con la G-derivada.
Efectivamente,
1. En este primer caso, F puede ser escrita
F (x
0+ h) = F (x
0) + Ah, ∀x
0, h ∈ X.
Al ser A ∈ L(X, Y ), deducimos que F satisface ( 1.1) para A(x
0) ≡ A y o(h) ≡ 0. As´ı, F es F-derivable en X y F
0(x
0) = A, para todo x
0∈ X.
2. En este caso, F puede ser escrita de la forma
F (x
0+ h) = F (x
0) + A(x
0)h + B(h, h), ∀x
0, h ∈ X
con A(x
0)h = B(x
0, h) + B(h, x
0). Si hacemos o(h) ≡ B(h, h) entonces, utilizando que B ∈ L
2(X, Y ), deducimos que F satisface (1.1) y (1.2), es decir, F es F-derivable en cualquier punto x
0∈ X y F
0(x
0) ≡ B(x
0, ·) + B(·, x
0).
3. Este ejemplo es un caso particular del anterior para X = H un espacio de Hilbert, Y = R y B(·, ·) = (·, ·).
Observaci´ on 1.4. Todas las nociones de diferencial y derivada que se han introducido poseen car´ acter lineal en F .
Por otro lado, el concepto de derivada Gˆ ateaux de un operador F definido entre los espacios normados X e Y es realmente m´ as d´ ebil que el concepto de derivada en el sentido Fr´ echet. Esto es cierto incluso en el caso de espacios de dimensi´ on finita. Veamos un ejemplo: Consideremos X = R
2, Y = R y F el funcional dado por
F (x, y) = x
6(y − x
2)
2+ x
8si (x, y) 6= (0, 0), F (0, 0) = 0.
Es f´ acil comprobar que F es G-diferenciable en el punto (0, 0), con G-derivada dada por δF (0, 0) =
(0, 0), pero no es continua en (0, 0). Por tanto, F no es derivable en el sentido de Fr´ echet.
16 1.5. C´ alculo diferencial
Pasemos seguidamente a recordar (sin demostraci´ on) un resultado cl´ asico de derivabilidad de funciones compuestas. Se tiene:
Teorema 1.26. (Regla de la cadena) Sean X, Y , Z tres espacios normados, U ⊆ X y V ⊆ Y dos abiertos y x
0∈ U. Consideremos dos aplicaciones ϕ : U → V y ψ : V → Z, y denotemos y
0= ϕ(x
0) y F = ψ ◦ ϕ. As´ı, si ψ es F-derivable en y
0y ϕ es F-derivable (respectivamente, G- derivable, G-diferenciable, G-diferenciable en la direcci´ on h de X) en x
0, entonces F es F-derivable (respectivamente, G-derivable, G-diferenciable o G-diferenciable en la direcci´ on h de X) en x
0, y se satisface
F
0(x
0) = ψ
0(y
0) ◦ ϕ
0(x
0),
(respectivamente, δF (x
0) = ψ
0(y
0) ◦ δϕ(x
0), δF (x
0, h) = ψ
0(y
0) (δϕ(x
0, h))).
Para una prueba del anterior resultado, cons´ ultense los apuntes de la asignatura An´ alisis Fun- cional y Optimizaci´ on.
Es posible generalizar el Teorema del valor medio en el marco de los operadores que son G- diferenciables en un espacio de Banach. Se tiene:
Teorema 1.27. (Valor medio) Sean X un espacio normado, U ⊆ X un abierto y x
1, x
2dos puntos de U tales que [x
1, x
2] ⊂ U. Se tiene
1. Si F : U → R es G-diferenciable en todos los puntos de [x
1, x
2] en la direcci´ on x
2− x
1, entonces existe ξ ∈ (x
1, x
2) tal que
F (x
2) − F (x
1) = δF (ξ, x
2− x
1).
2. Si Y es un e.n. y F : U → Y es G-diferenciable en todos los puntos de [x
1, x
2] en la direcci´ on x
2− x
1, entonces existe ξ ∈ (x
1, x
2) tal que
kF (x
2) − F (x
1)k
Y≤ kδF (ξ, x
2− x
1)k
Y. Prueba: 1. Consideramos la funci´ on real de variable real
ϕ : t ∈ [0, 1] 7→ ϕ(t) = F (x
1+ t(x
2− x
1)) ∈ R.
Es f´ acil comprobar directamente que ϕ ∈ C
1([0, 1]) y, as´ı, el resultado se obtiene como consecuencia del teorema del valor medio de funciones reales de variable real.
2. Como consecuencia del Teorema de Hahn-Banach, dado F (x
2) − F (x
1) ∈ Y , existe y
∗∈ Y
0, con ky
∗k
Y0= 1, tal que
hy
∗, F (x
2) − F (x
1)i
Y0,Y= kF (x
2) − F (x
1)k
Y.
El resultado se obtiene sin m´ as que aplicar el teorema del valor medio a la funci´ on real de variable real ϕ(t) = hy
∗, F (x
1+ t(x
2− x
1)i
Y0,Ydefinida en [0, 1].
Como consecuencia de este resultado podemos obtener un criterio de derivabilidad en el sentido de Fr´ echet:
Proposici´ on 1.28. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un
operador. Supongamos que F es G-derivable en U y la aplicaci´on x ∈ U → δF (x) ∈ L(X, Y ) es
continua en U. Entonces, F es derivable Fr´echet en U.
Prueba: Fijemos x
0∈ U y probemos que F es F-derivable en x
0. Para ello, consideremos ε
0> 0 tal que B(x
0, ε
0) ⊂ U .
En primer lugar, obs´ ervese que el operador F puede ser escrito:
F (x
0+ h) = F (x
0) + δF (x
0)h + o(h), ∀h ∈ B
0≡ B(0, ε
0) con
o(h) = F (x
0+ h) − F (x
0) − δF (x
0)h.
Veamos que o(h) satisface (1.2). Como δF (x) es continua en U, fijado ε > 0, existe δ ∈ (0, ε
0) tal que
kδF (x
0+ h) − δF (x
0)k
L(X,Y )≤ ε ∀h ∈ X con khk ≤ δ.
Si h ∈ X y khk ≤ δ, entonces el segmento [x
0, x
0+ h] ⊂ B(x
0, ε
0) ⊂ U y podemos aplicar el Teorema 1.27 a la aplicaci´ on F (·) − δF (x
0)(·), deduciendo la existencia de ξ ∈ (x
0, x
0+ h) tal que
kF (x
0+ h) − F (x
0) − δF (x
0)(h)k
Y≡ ko(h)k
Y≤ kδF (ξ) − δF (x
0)kkhk ≤ εkhk.
De esta desigualdad obtenemos que F es derivable Fr´ echet en x
0. Esto prueba el resultado.
Pasemos a definir el concepto de derivada segunda de una aplicaci´ on:
Definici´ on 1.29. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un operador.
Dados x
0∈ U y h ∈ X, se dice que F es dos veces G-diferenciable en x
0en la direcci´ on h, si existe ε
0> 0 tal que F es G-diferenciable en el intervalo abierto (x
0− ε
0h, x
0+ ε
0h) ⊂ U y en la direcci´on h, y existe el l´ımite
δ
2F (x
0, h, h) = l´ım
ε→0
δF (x
0+ εh, h) − δF (x
0, h)
ε .
Al elemento δF
2(x
0, h, h) ∈ Y as´ı definido lo denominaremos la G-diferencial segunda de F en el punto x
0en la direcci´ on h.
Ejemplo 1.6. Sean X e Y dos espacios normados y B : X × X → Y una aplicaci´ on bilineal y continua. Consideremos F (x) = B(x, x); entonces, se tiene que F es dos veces G-diferenciable en X en cualquier direcci´ on h ∈ X y se tiene:
δ
2F (x
0; h, h) = 2B(h, h).
Observaci´ on 1.5. No es dif´ıcil comprobar que si F : U → Y , con U ⊂ X un abierto y X e Y dos espacios normados, es dos veces G-diferenciable en x
0∈ U en la direcci´on h ∈ X, entonces, tambi´en es dos veces G-diferenciable en x
0y en la direcci´ on αh ∈ X para cualquier α ∈ R. Adem´as
δ
2F (x
0; αh, αh) = α
2δ
2F (x
0; h, h).
Es posible dar un resultado m´ as general que el Teorema 1.27. Con ayuda del concepto de G-diferencial segunda de un operador F , se tiene:
Teorema 1.30. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un operador.
Dados x
1, x
2∈ U tales que [x
1, x
2] ⊂ U, supongamos que F es dos veces G-diferenciable en todo punto de [x
1, x
2] en la direcci´ on x
2− x
1. Entonces,
1. Si Y = R, existe ξ ∈ (x
1, x
2) tal que
F (x
2) = F (x
1) + δF (x
1, x
2− x
1) + 1
2 δ
2F (ξ, x
2− x
1, x
2− x
1).
18 1.5. C´ alculo diferencial
2. En el caso general (Y un e.n. cualquiera), existe ξ ∈ (x
1, x
2) tal que kF (x
2) − F (x
1) − δF (x
1, x
2− x
1)k
Y≤ 1
2 kδ
2F (ξ, x
2− x
1, x
2− x
1)k
Y. Ejercicio 1.1. Prueba el Teorema 1.30.
Vamos a continuaci´ on a caracterizar el car´ acter convexo de un funcional J definido en un abierto de un espacio de Banach. En esa caracterizaci´ on vamos a utilizar los conceptos de G- diferenciabilidad del funcional J . En este sentido, generalizaremos resultados bien conocidos en el caso en el que X = R
N. Se tiene:
Proposici´ on 1.31. Sean X un espacio normado, Ω ⊆ X un abierto, U ⊆ Ω un subconjunto convexo no vac´ıo y J : Ω → R un funcional. Supongamos que J es G-diferenciable en Ω. Entonces,
1. J es convexo en U si y s´olo si se verifica
(1.3) J (x
2) − J (x
1) ≥ δJ (x
1, x
2− x
1) ∀x
1, x
2∈ U.
2. Del mismo modo, J es estrictamente convexo en U si y s´olo si
(1.4) J (x
2) − J (x
1) > δJ (x
1, x
2− x
1) ∀x
1, x
2∈ U, x
16= x
2.
Prueba: 1. Fijemos x
1, x
2∈ U. Si J es convexo en U, entonces, dado ε ∈ (0, 1), se tiene J (x
1+ ε(x
2− x
1)) − J (x
1)
ε ≤ εJ (x
2) + (1 − ε)J (x
1) − J (x
1)
ε = J (x
2) − J (x
1).
Tomando l´ımite cuando ε → 0
+obtenemos la desigualdad (1.3)
Rec´ıprocamente, supongamos que (1.3) es cierta. Veamos que J es convexo en U. Sean x
1, x
2∈ U y α ∈ [0, 1], entonces, se tiene:
( J (x
1) ≥ J (x
2+ α(x
1− x
2)) + δJ (x
2+ α(x
1− x
2), (1 − α)(x
1− x
2)) y J (x
2) ≥ J (x
2+ α(x
1− x
2)) + δJ (x
2+ α(x
1− x
2), −α(x
2− x
1)).
Multiplicando las desigualdades anteriores respectivamente por α y 1 − α y utilizando las propie- dades de la G-diferencial (car´ acter homog´ eneo respecto de la direcci´ on h), se prueba
J (αx
1+ (1 − α)x
2) ≤ αJ (x
1) + (1 − α)J (x
2) y por tanto F es convexa en U.
2. El razonamiento anterior sirve para probar que (1.4) implica la convexidad estricta del fun- cional J en U.
Veamos el rec´ıproco. Supongamos J es estrictamente convexa en U. En particular, J satisfa- ce (1.3). As´ı, si x
1, x
2∈ U con x
16= x
2y α ∈ (0, 1), entonces, se tiene
J (x
2) − J (x
1) > J (x
1+ α(x
2− x
1)) − J (x
1) α
(1.3)
≥ δJ (x
1, α(x
2− x
1))
α = δJ (x
1, x
2− x
1).
Tenemos as´ı la prueba del resultado.
Hay otra manera de caracterizar los funcionales convexos en un convexo mediante la G-diferencial.
En concreto, se tiene:
Proposici´ on 1.32. En las hip´ otesis de la Proposici´ on 1.31, J es convexa en U si y s´olo si (1.5) δJ (x
2, x
2− x
1) − δJ (x
1, x
2− x
1) ≥ 0, ∀x
1, x
2∈ U.
Prueba: Supongamos que J es convexa en U y sean x
1, x
2∈ U. Aplicando (1.3) sucesivamente a (x
1, x
2) y a (x
2, x
1), se tiene
( J (x
2) − J (x
1) ≥ δJ (x
1, x
2− x
1) y J (x
1) − J (x
2) ≥ δJ (x
2, x
1− x
2).
Sumando estas desigualdades y teniendo en cuenta la homogeneidad de la G-diferencial respecto de la direcci´ on, se obtiene (1.5).
Supongamos ahora que se tiene (1.5) y sean x
1, x
2∈ U y α ∈ [0, 1]. Consideremos la funci´on real de variable real ϕ : t ∈ [0, 1] 7→ ϕ(t) = J (x
1+ t(x
2− x
1)). No es dif´ıcil comprobar que ϕ ∈ C
1([0, 1]) y ϕ
0(t) = δJ (x
1+ t(x
2− x
1), x
2− x
1), para cada t ∈ [0, 1]. Usando (1.5) es tambi´ en sencillo deducir que la funci´ on ϕ
0es creciente en [0, 1] (es decir, si 0 ≤ s < t ≤ 1, entonces ϕ
0(s) ≤ ϕ
0(t)).
Deducimos por tanto que ϕ es convexa en el intervalo [0, 1] y as´ı, ϕ(α) ≤ αϕ(1) + (1 − α)ϕ(0) i.e., J ((1 − α)x
1+ αx
2) ≤ (1 − α)J (x
1) + αJ (x
2). Tenemos as´ı acabada la prueba.
Veamos por ´ ultimo que podemos caracterizar la convexidad de un funcional utilizando la G- diferencial segunda del funcional. Se tiene:
Proposici´ on 1.33. Sean X un espacio normado, Ω ⊆ X un abierto, U ⊆ Ω un subconjunto convexo y J : Ω → R un funcional. Supongamos que J es dos veces G-diferenciable en Ω. Entonces,
1. J es convexa en U si y s´olo si se satisface
(1.6) δ
2J (x
1, x
2− x
1, x
2− x
1) ≥ 0, ∀x
1, x
2∈ U.
2. Si se tiene
(1.7) δ
2J (x
1, x
2− x
1, x
2− x
1) > 0, ∀x
1, x
2∈ U con x
16= x
2, entonces F es estrictamente convexa en U.
Prueba: Supongamos que J satisface (1.6) (resp., J satisface (1.7)) y veamos que J es convexa (resp., estrictamente convexa en U). Sean x
1, x
2∈ U (resp., x
1, x
2∈ U, con x
16= x
2). Si aplicamos el Teorema 1.30 obtenemos la existencia de ξ ∈ (x
1, x
2) tal que se tiene
J (x
2) − J (x
1) − δJ (x
1, x
2− x
1) = 1
2 δ
2J (ξ, x
2− x
1, x
2− x
1).
Obs´ ervese que ξ = x
1+ β(x
2− x
1), con β ∈ (0, 1). As´ı, δ
2J (ξ, x
2− x
1, x
2− x
1) = δ
2J (ξ, − 1
β (x
1− ξ), − 1
β (x
1− ξ)) = 1
β
2δ
2J (ξ, x
1− ξ, x
1− ξ), que junto a la Proposici´ on 1.31 demuestra que J es convexa (resp., estrictamente convexa) en U.
Veamos ahora que si J es convexa en U, entonces se tiene ( 1.6). Sean x
1, x
2∈ U y as´ı, δ
2J (x
1, x
2− x
1, x
2− x
1) = l´ım
ε→0+
δJ (x
1+ ε(x
2− x
1), x
2− x
1) − δJ (x
1, x
2− x
1) ε
= l´ım
ε→0+
δJ (x
1+ ε(x
2− x
1), ε(x
2− x
1)) − δJ (x
1, ε(x
2− x
1))
ε
2≥ 0.
Esta ´ ultima desigualdad prueba el resultado.
20 1.5. C´ alculo diferencial
Observaci´ on 1.6. Obs´ ervese que la condici´ on (1.7) no es una condici´ on necesaria para que J sea estrictamente convexa en U. Basta considerar el funcional (funci´on) definida en X = R dada por J (t) = t
4que es, evidentemente, estrictamente convexa en R y no satisface ( 1.7).
Ejemplo 1.7. Consideremos X un espacio normado y una forma bilineal a : X × X → R. Si definimos el funcional J : X → R dado por J(x) = a(x, x), podemos utilizar el resultado anterior (pues J es dos veces G-diferenciable en X) y deducir que J es convexa en X si y s´ olo si la forma bilineal es semidefinida positiva en X, es decir, si y s´ olo si
a(x, x) ≥ 0, ∀x ∈ X.
Si a es definida positiva en X, es decir, a(x, x) > 0, para cualquier x 6= 0, entonces J es estrictamente convexa en X.
De hecho en este caso, se tiene que J es estrictamente convexa si y s´ olo si a es definida positiva en X. Efectivamente, la equivalencia es f´ acil de establecer si se tiene en cuenta la Proposici´ on 1.31 y la igualdad
J (x
2) − J (x
1) − δJ (x
1, x
2− x
1) = a(x
2− x
1, x
2− x
1), v´ alida para cualesquiera x
1, x
2∈ X.
Pasamos a continuaci´ on a dar un bloque de resultados que relacionan la diferenciabilidad de un funcional con la existencia de m´ınimos de ese funcional. Vamos a cambiar ligeramente la notaci´ on y vamos a utilizar V en lugar de X para designar un espacio normado con norma k · k. El primero de los resultados da una condici´ on necesaria de m´ınimo relativo de un funcional:
Teorema 1.34 (Condici´ on necesaria de extremo relativo). Sea V un espacio normado, Ω ⊆ V un subconjunto y J : Ω → R un funcional. Supongamos que J alcanza un m´ınimo relativo en u ∈ int Ω y que J es G-diferenciable en u. Entonces
(1.8) δJ (u, h) = 0, ∀h ∈ V (Ecuaci´ on de Euler).
Prueba: Como u ∈ int Ω y J alcanza en u un m´ınimo relativo, deducimos que existe ε
0> 0 tal que B(u; ε
0) ⊂ Ω y J (u) ≤ J (v), para cualquier v ∈ B(u; ε
0). Sea h ∈ V con h 6= 0 y supongamos que ε ∈ (0, ε
0). Entonces,
δJ (u, h/khk) = l´ım
ε→0+
J (u + εh/khk) − J (u)
ε ≥ 0
δJ (u, h/khk) = l´ım
ε→0+
J (u − εh/khk) − J (u)
−ε ≤ 0.
En consecuencia, δJ (u; h/khk) = 0 para cualquier h ∈ V con h 6= 0. Utilizando una vez m´ as que la G-diferencial es homog´ enea respecto de h deducimos el resultado.
Observaci´ on 1.7. El resultado anterior deja de ser cierto si no imponemos la hip´ otesis u ∈ int Ω.
Efectivamente, basta considerar el funcional J (x) = x definido en Ω = [0, 1] ⊂ V ≡ R.
En el caso de tener un conjunto convexo, la condici´ on necesaria de extremo relativo cambia ligeramente:
Teorema 1.35 (Condici´ on necesaria y suficiente de m´ ınimo relativo en convexos). Sea
V un espacio normado, Ω ⊆ V un abierto, U ⊆ Ω un subconjunto convexo no vac´ıo y J : Ω → R
un funcional. Supongamos que J es G-diferenciable en u ∈ U. Se tiene:
1. Si u es un m´ınimo relativo de J en U entonces,
(1.9) δJ (u, v − u) ≥ 0 ∀v ∈ U.
2. Supongamos que J es convexo en U y que u ∈ U satisface ( 1.9). Entonces, u es un m´ınimo global de J en U.
Prueba:
1. Como u es un m´ınimo relativo de J en U, existe ε
0> 0 tal que J (u) ≤ J (v), ∀v ∈ U ∩ B(u; ε
0).
Por otro lado, fijado v ∈ U, existe ε
1∈ (0, 1) tal que u + ε(v − u) ∈ B(u; ε
0), para ε ∈ (0, ε
1).
Evidentemente, al ser U un conjunto convexo, u + ε(v − u) ∈ U y podemos escribir δJ (u, v − u) = l´ım
ε→0+
J (u + ε(v − u)) − J (u)
ε ≥ 0.
2. Supongamos ahora que J es convexo en U y que se tiene ( 1.9) para u ∈ U. Veamos que u es un m´ınimo global de J en U. Efectivamente, sea v ∈ U; como J es convexo en U se tiene (ver ( 1.3))
J (v) ≥ J (u) + δJ (u, v − u) que junto a (1.9) proporciona que u es un m´ınimo global de J en U.
Es posible generalizar el resultado anterior al caso en el que J no es G-diferenciable en U, pero J es la suma de un funcional G-diferenciable y de otro que no lo es:
Ejercicio 1.2. Sean V un espacio normado, Ω ⊂ V un abierto, U ⊂ Ω un convexo no vac´ıo y J
1, J
2: Ω → R dos funcionales convexos en U. Supongamos que J
1es G-diferenciable en Ω.
Pru´ ebese que u ∈ U es un m´ınimo de J
1+ J
2en U si y s´olo si
δJ
1(u, v − u) + J
2(v) − J
2(u) ≥ 0, ∀v ∈ U.
Observaci´ on 1.8. La condici´ on (1.9) puede ser reescrita de forma equivalente en determinados casos particulares. As´ı,
1. Si u ∈ int U, entonces la condici´on ( 1.9) equivale a la ecuaci´ on de Euler (1.8).
2. Si U ⊆ V es una variedad af´ın, es decir, si U = u
0+ W con u
0∈ V y W ⊆ V un subespacio vectorial, entonces (1.9) equivale a la condici´ on
δJ (u, w) = 0, ∀w ∈ W.
3. En el caso particular en el que U ≡ W es un subespacio vectorial, no es dif´ıcil comprobar que (1.9) equivale a
δJ (u, v) = 0, ∀v ∈ W.
Si W = V volvemos a obtener la ecuaci´ on de Euler (1.8).
4. Supongamos que U es un cono convexo de V , es decir, U es un convexo que satisface la propiedad: si v ∈ U y λ ∈ [0, ∞), entonces λv ∈ U. Supongamos tambi´en que J es G- derivable en u ∈ U. En este caso tambi´en es f´acil comprobar que la condici´on ( 1.9) equivale a:
δJ (u, u) = 0 y δJ (u, w) ≥ 0, ∀w ∈ U.
22 1.6. Aplicaciones
5. Veamos qu´ e igualdad obtenemos en los casos 2 y 3 cuando J es G-derivable en u y el subespacio W viene dado como la intersecci´ on de hiperplanos, es decir,
W = {v ∈ V : ha
i, vi
V0,V= 0, ∀i : 1 ≤ i ≤ M } ≡
⊥Z, donde a
i∈ V
0(1 ≤ i ≤ M ) y Z = span {a
i: 1 ≤ i ≤ M } ⊂ V
0.
Supongamos por comodidad que V es un espacio de Banach reflexivo. Obs´ ervese que tanto en los casos 2 y 3, podemos escribir
u ∈ U y δJ(u) ∈ W
⊥≡
⊥
Z
⊥≡ Z ≡ Z.
que, teniendo en cuenta la expresi´ on de W , se traduce en:
u ∈ U y δJ(u) +
M
X
i=1
λ
ia
i= 0,
con λ
i∈ R, con 1 ≤ i ≤ M. Los n´umeros reales λ
ison los denominados multiplicadores de Lagrange.
Estudiaremos m´ as adelante problemas de m´ınimos con restricciones, donde la restricci´ on viene dada por condiciones de igualdad y desigualdad. En estos casos obtendremos condiciones necesarias de m´ınimo del mismo tipo de las obtenidas anteriormente.
Como resumen de todos los conceptos anteriores, se tiene:
OPTIMIZACI ´ ON CONVEXA: Supongamos que V es un espacio normado, U ⊆ V es un subconjunto convexo no vac´ıo y J : U → R es un funcional convexo. Planteemos el problema de m´ınimos:
(1.10)
( Minimizar J (v), Sujeto a v ∈ U.
Entonces,
1. Existencia: Supongamos adem´ as que V es un espacio de Banach reflexivo, U es cerrado, J es s.c.i. en U y que J es coercitivo cuando U es no acotado. Entonces, existe u ∈ U soluci´on del problema de m´ınimos (1.10), es decir, J tiene un m´ınimo global u en U.
2. Unicidad: Si J es estrictamente convexo en U, el problema de m´ınimos ( 1.10) a lo m´ as tiene una soluci´ on.
3. Caracterizaci´ on: Supongamos adem´ as que J es G-diferenciable en Ω ⊂ V , con Ω un abierto tal que U ⊂ Ω. Entonces, u ∈ U es soluci´on del problema de m´ınimos ( 1.10) si y s´ olo si
δJ (u, v − u) ≥ 0, ∀v ∈ U.
En este caso, J es convexo en U si y s´olo si
J (v) ≥ J (w) + δJ (w, v − w), ∀w, v ∈ U.
1.6. Aplicaciones
Analicemos en esta secci´ on dos sencillas aplicaciones de los anteriores conceptos. En ellas ob-
tendremos resultados sobre problemas de m´ınimo ya conocidos.
1.6.1. Primera Aplicaci´ on: Minimizaci´ on de un funcional cuadr´ atico
En primer lugar estudiaremos el problema de m´ınimo asociado a un funcional cuadr´ atico. Para ello consideremos un espacio de Hilbert V e introduzcamos el funcional (funcional cuadr´ atico) J : V → R dado por
(1.11) J (v) = 1
2 a(v, v) − hL, vi, ∀v ∈ V,
donde a(·, ·) : V × V → R es una forma bilineal, continua y sim´etrica y L : V → R es una forma lineal y continua en V , es decir, L ∈ V
0. Evidentemente, existen constantes C
1, C
2> 0 (de hecho C
2= kLk
V0) tales que
( |a(v, w)| ≤ C
1kvkkwk, ∀v, w ∈ V,
|hL, vi| ≤ C
2kvk, ∀v ∈ V.
Supongamos que la forma bilineal a(·, ·) es coercitiva en V , i.e., existe α > 0 tal que
(1.12) a(v, v) ≥ αkvk
2, ∀v ∈ V.
Aplicando los resultados anteriores, obtenemos
El funcional J es F-derivable en V (ver Ejemplos 1.4 y 1.5) y en este caso J
0(v) ∈ L(V, R) = V
0est´ a dada por
hJ
0(v), wi
V0,V= a(v, w) − hL, wi, ∀u, w ∈ V, (hJ
0(v), wi
V0,V= 1
2 (a(v, w) + a(w, v)) − hL, wi, ∀u, w ∈ V
si a(·, ·) no es sim´ etrica). Del Ejemplo 1.6 deducimos tambi´ en que J es dos veces G-diferenciable en V en cualquier direcci´ on h (de hecho, J es dos veces F-derivable en V ) y
δ
2J (v; h, h) = a(h, h), ∀v, h ∈ V.
De la Proposici´ on 1.33 (ver tambi´ en el Ejemplo 1.7) y de la condici´ on (1.12) obtenemos que J es estrictamente convexo en V . Efectivamente, se tiene a(v, v) > 0 para cualquier v ∈ V con v 6= 0.
Adem´ as el funcional J es coercitivo en V . Efectivamente, podemos acotar
J (v) = 1
2 a(v, v) − hL, vi ≥ α
2 kvk
2− kLk
V0kvk ≥ α
2 kvk
2− 1
α kLk
2V0− α 4 kvk
2= α
4 kvk
2− 1 α kLk
2V0. De aqu´ı obtenemos la propiedad.
Fijemos ahora U ⊆ V un subconjunto cerrado convexo no vac´ıo y consideremos el problema de m´ınimos
(1.13)
Minimizar J (v) = 1
2 a(v, v) − hL, vi Sujeto a v ∈ U.
Del Corolario 1.19, la Proposici´ on 1.20 y el Teorema 1.35, deducimos el resultado
24 1.6. Aplicaciones
Teorema 1.36. En las condiciones anteriores, existe un ´ unico u ∈ U soluci´on del problema ( 1.13).
Adem´ as u ∈ U es soluci´on de ( 1.13) si y s´ olo si
a(u, v − u) − hL, v − ui
V0,V≥ 0, ∀v ∈ U.
Observaci´ on 1.9. En el caso en el que U ≡ V , la condici´on necesaria y suficiente de m´ınimo para el problema (1.13) es
a(u, v) = hL, vi, ∀v ∈ V.
Obs´ ervese que en este caso, el Teorema 1.36 es el Teorema de Lax-Milgram.
Ejemplo 1.8. Consideremos el caso finito-dimensional. Sea V ≡ R
N, con N ≥ 1, y denotemos (·, ·) el producto escalar eucl´ıdeo en R
N. Consideremos tambi´ en A ∈ L(R
N), una matriz sim´ etrica y definida positiva, y b ∈ R
N. Con estos datos, hagamos
a(v, w) = (Av, w) = v
TAw y hL, vi = (b, v), ∀v, w ∈ R
N.
En este caso es f´ acil comprobar que la forma bilineal a(·, ·) y la forma lineal L son continuas y, adem´ as, a satisface (1.12). Aplicando el Teorema 1.36 deducimos que el problema de m´ınimos (1.13) (planteado en un conjunto cerrado, convexo no vac´ıo U ⊆ R
N) admite una ´ unica soluci´ on u ∈ R
Ny ´ esta est´ a caracterizada por
(Au − b, v − u) ≥ 0, ∀v ∈ U.
Cuando U ≡ R
N, la caracterizaci´ on de u se reescribe (ver Observaci´ on 1.9) Au = b,
es decir, el problema de m´ınimos (1.13) equivale a la resoluci´ on de un sistema lineal con matriz de coeficientes A y segundo miembro b.
1.6.2. Segunda Aplicaci´ on: Teorema de la Proyecci´ on
Como segunda aplicaci´ on de los conceptos recordados en este cap´ıtulo, consideremos el problema de la proyecci´ on de un elemento u
0de un espacio de Hilbert V (con producto escalar denotado por (·, ·)) sobre un conjunto U ⊆ V cerrado, convexo y no vac´ıo. Para ello, consideremos el problema
(1.14)
( Hallar e u ∈ U tal que k u − u e
0k = ´ınf
v∈U