Análisis Numérico y Optimización

(1)

(2)

2

(3)

1. Repaso de Conceptos Conocidos 5

1.1. Introducci´ on. Planteamiento del problema . . . . 5

1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos . . . . 6

1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil . . . . 9

1.4. Minimizaci´ on de funcionales . . . . 11

1.5. C´ alculo diferencial . . . . 13

1.6. Aplicaciones . . . . 22

1.6.1. Primera Aplicaci´ on: Minimizaci´ on de un funcional cuadr´ atico . . . . 23

1.6.2. Segunda Aplicaci´ on: Teorema de la Proyecci´ on . . . . 24

2. M´ etodos de Tipo Gradiente Para Problemas sin Restricciones 27 2.1. Funcionales el´ıpticos . . . . 27

2.2. M´ etodos del gradiente para problemas de m´ınimo sin restricciones . . . . 31

2.2.1. Algoritmo del Gradiente con Paso ´ Optimo (AGPO) . . . . 32

2.2.2. Algoritmos del Gradiente con Paso Fijo (AGPF) y Variable (AGPV) . . . . . 34

2.3. M´ etodos del gradiente conjugado para problemas sin restricciones . . . . 37

2.3.1. El algoritmo del gradiente conjugado para un funcional cuadr´ atico el´ıptico en R

^N

. . . . 38

2.3.2. Algoritmo del Gradiente Conjugado Gen´ erico (AGCG) . . . . 41

3. M´ etodos Para Problemas de Optimizaci´ on con Restricciones 47 3.1. M´ etodo del Gradiente con Proyecci´ on . . . . 47

3.2. M´ etodos de Penalizaci´ on . . . . 50

3.3. M´ etodos de dualidad. M´ etodo de Uzawa . . . . 53

3.3.1. Relaciones de Kuhn-Tucker . . . . 53

3.3.2. Lagrangianos y puntos de silla. Introducci´ on a la dualidad . . . . 56

3.3.3. M´ etodo de Uzawa para un funcional el´ıptico . . . . 58

4. Control ´ optimo de sistemas lineales 63 4.1. Planteamiento de un problema de control ´ optimo . . . . 63

4.2. Control ´ optimo de e.d.o. . . . . 64

4.3. Control ´ optimo de EDP el´ıpticas . . . . 68

(4)

4 ´INDICE GENERAL

(5)

Introducci´ on. Repaso de Conceptos Conocidos

1.1. Introducci´ on. Planteamiento del problema

En esta asignatura trataremos dos aspectos importantes dentro de la Matem´ atica Aplicada:

el An´ alisis Num´ erico y su relaci´ on con la Optimizaci´ on. En concreto trataremos problemas de Optimizaci´ on desde el punto de vista del An´ alisis Num´ erico. De manera general un problema de optimizaci´ on puede ser descrito de la siguiente forma: Supongamos que tenemos un sistema sobre el que podemos actuar mediante una variable v (el control) que vive en un cierto conjunto U (el conjunto de controles admisibles). Supongamos tambi´en que tenemos a nuestra disposici´on una funci´ on J (funcional coste) que depende de v y, posiblemente, de la soluci´ on del sistema.

Pretendemos calcular un control u ∈ U tal que J(u) ≤ J(v) para cualquier v ∈ U.

En t´ erminos matem´ aticos el problema puede ser escrito del siguiente modo: Supongamos que V es un espacio normado (en general de dimensi´ on infinita). Dados U ⊂ V un conjunto y J : U 7→ R un funcional, planteamos el problema

(P )

( Hallar u ∈ U tal que J (u) ≤ J (v) ∀v ∈ U.

El objetivo de de la Optimizaci´ on es tanto el estudio te´ orico del problema (P ) como proporcionar algoritmos que permitan aproximar la o las soluciones del problema.

Diremos que (P ) es un problema de optimizaci´ on sin restricciones si U ≡ V . Si U 6= V , entonces hablaremos de un problema de m´ ınimos con restricciones.

En este curso, estamos interesados por la optimizaci´ on continua en dimensi´ on finita o infinita.

Abordaremos fundamentalmente, y en este orden, las siguientes cuestiones:

Resultados de existencia y unicidad de soluci´ on del problema (P ).

Caracterizaci´ on de la(s) soluci´ on(es), es decir, condiciones necesarias, y en algunos casos, suficientes de soluci´ on del problema (P ). Las condiciones necesarias hacen intervenir, gene- ralmente, la derivada primera (en cierto sentido) del funcional J , mientras que las condiciones suficientes hacen intervenir las derivadas segundas (en cierto sentido) de J .

Construcci´ on efectiva de algoritmos que permitan aproximar la o las soluciones de (P ). Es

decir, construcci´ on de una sucesi´ on {u

_k

}

_k≥0

de elementos de U que converja (en un sentido

adecuado) hacia la o una soluci´ on del problema (P ).

(6)

6 1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos

Para los problemas sin restricciones (Tema 2), estudiaremos los algoritmos de tipo gradiente (paso ´ optimo, paso fijo, paso variable) y gradiente conjugado (gen´ erico, Fletcher-Reeves, Polak-Riviere). Para los problemas con restricciones (Tema 3), estudiaremos el algoritmo del gradiente con proyecci´ on, cuya aplicaci´ on se restringe a conjuntos U muy particulares. Los problemas con restricciones generales son m´ as dif´ıciles de tratar y se intenta su resoluci´ on reemplaz´ andolos por otros problemas sin restricciones, ´ esta es la idea para los m´ etodos de dualidad (Uzawa).

El Tema 4 se dedica al Control ´ Optimo que consiste en un problema de minimizaci´ on donde adem´ as, la soluci´ on buscada depende de otra variable dada a trav´ es de una ecuaci´ on diferencial ordinaria o en derivadas parciales.

Dedicaremos este primer Tema a repasar ciertos conceptos que aparecer´ an a lo largo del curso y que han sido vistos anteriormente en las asignaturas en “Ecuaciones en Derivadas Parciales y An´ alisis Funcional” y “An´ alisis Funcional y Optimizaci´ on” del cuarto curso de la Licenciatura en Matem´ aticas.

1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos

A lo largo de esta secci´ on X representa un espacio normado con norma que ser´ a denotada por k · k. Recordemos que, dados una sucesi´ on {x

_n

}

_n≥1

⊂ X y un elemento x ∈ X, se tiene que x

_n

converge hacia x en X (que denotaremos x

_n

→ x en X) si la sucesi´ on real kx

_n

− xk converge hacia cero. En algunas ocasiones diremos que x

n

converge en norma o fuertemente hacia x. Adem´ as de este concepto de convergencia tambi´ en introduciremos los siguientes:

Definici´ on 1.1. 1. Sean {x

_n

}

_n≥1

⊂ X una sucesi´ on y x ∈ X un elemento de X. Diremos que x

n

converge d´ ebilmente hacia x (y escribiremos x

n

* x) si para cualquier x

⁰

∈ X

⁰

se tiene

hx

⁰

, x

n

i

_X⁰_,X

→ hx

⁰

, xi

_X⁰_,X

.

En esta definici´ on h·, ·i

_X⁰_,X

representa el producto de dualidad entre el espacio normado X y su dual X

⁰

.

2. Sean {x

⁰_n

}

_n≥1

⊂ X

⁰

una sucesi´ on y x

⁰

∈ X

⁰

un elemento de X

⁰

. Diremos que x

⁰_n

converge

∗-d´ ebilmente hacia x

⁰

(y escribiremos x

_n

* x) si

^∗

hx

⁰_n

, xi

_X⁰_,X

→ hx

⁰

, xi

_X⁰_,X

∀x ∈ X.

Observaci´ on 1.1. Los conceptos de convergencia d´ ebil y ∗-d´ ebil son lineales. Por ejemplo, si {x

_n

}

_n≥1

e {y

n

}

_n≥1

son dos sucesiones en X y x e y son dos elementos de X tales que x

n

* x e y

n

* y, entonces se tiene

αx

_n

+ βy

_n

* αx + βy, ∀α, β ∈ R.

Es f´ acil comprobar la relaci´ on que existe entre los anteriores conceptos de convergencia d´ ebil y

∗-d´ ebil y el concepto de convergencia fuerte. En concreto, se tiene:

Proposici´ on 1.2. Sean {x

_n

}

_n≥1

⊂ X una sucesi´ on y x ∈ X un elemento de X (resp., {x

⁰_n

}

_n≥1

⊂ X

⁰

una sucesi´ on y x

⁰

∈ X

⁰

) tales que x

_n

→ x en X (resp., x

⁰_n

→ x

⁰

en X

⁰

). Entonces, x

_n

* x (resp., x

⁰_n

* x

^∗ ⁰

).

Pasemos a continuaci´ on a analizar estos conceptos en algunos ejemplos interesantes:

(7)

Ejemplo 1.1. Consideremos el caso de un espacio de Hilbert H, con producto escalar que denotaremos por (·, ·). Recordemos que, gracias al Teorema de Riesz, el espacio H puede ser identificado con su dual H

⁰

mediante el producto escalar (·, ·). Efectivamente, introduzcamos la aplicaci´ on R : H → H

⁰

definida por

h Rx, yi

H⁰,H

= (x, y), ∀ x, y ∈ H.

Entonces, R est´a bien definida y es un isomorfismo isom´etrico entre H y H

⁰

, es decir es lineal, biyectiva y verifica

k Rxk

H⁰

= kxk

_H

, ∀ x ∈ H.

En particular, tanto R como R

⁻¹

son continuas. Este resultado permite identificar H con H

⁰

. Esta identificaci´ on tambi´ en nos permite reescribir de manera equivalente el concepto de convergencia d´ ebil en el espacio de Hilbert H. Efectivamente, dados {x

n

}

_n≥1

⊂ H y x ∈ H, se tiene que x

n

* x si y s´ olo si

(x

_n

, y) → (x, y), ∀y ∈ H.

Ejemplo 1.2. Sea Ω un abierto no vac´ıo de R

^N

. Recordemos que f : R

^N

−→ R

^N

es una funci´ on medible si el conjunto

{x ∈ R

^N

: f (x) < a}

es medible (respecto de la medida de Lebesgue en R

^N

) para cualquier valor a de R. Como es habitual, identificaremos funciones que son iguales salvo un conjunto de medida (Lebesgue) nula (iguales casi por doquier). Para la integral de Lebesgue usaremos la notaci´ on

Z

Ω

f = Z

Ω

f (x) dx.

Recordemos tambi´ en que, para p ∈ [1, ∞), L

^p

(Ω) (abreviatura de L

^p

(Ω, µ), cuando µ es la medida de Lebesgue en R

^N

) es el espacio de (clases de) funciones u, medibles en Ω y que son p-integrables en Ω, es decir,

Z

Ω

|u|

^p

< ∞.

En el caso p = ∞, se tiene que L

^∞

(Ω) es el espacio de (clases de) funciones u, medibles en Ω que est´ an esencialmente acotadas en Ω, es decir, tales que existe M > 0 y N ⊂ Ω con medida nula verificando |u(x)| ≤ M para cada x ∈ Ω \ N.

Los espacios vectoriales anteriores son normados para las normas:

||u||

_p;Ω

= ||u||

_L^p_(Ω)

=

Z

Ω

|u|

^p

1/p

para p ∈ [1, ∞),

||u||

_∞;Ω

= ||u||

_L^∞_(Ω)

= sup

Ω

es |u| = ´ınf {M > 0 : |u(x)| ≤ M p.c.t. x ∈ Ω} para p = ∞.

Es conocido que (L

^p

(Ω), || · ||

_p;Ω

) es un espacio de Banach para cualquier valor de p ∈ [1, ∞]. En el caso particular de p = 2, es decir, (L

²

(Ω), || · ||

_2;Ω

) es un espacio de Hilbert.

Al igual que en el caso de los espacios de Hilbert, es posible identificar el dual de los espacios L

^p

(Ω). Efectivamente, si p ∈ [1, ∞), Ω ⊂ R

^N

es un abierto y p

⁰

∈ (1, ∞] es el exponente conjugado de p,

1 p + 1

p

⁰

= 1,

podemos introducir el operador R

p

: L

^p⁰

(Ω) → [L

^p

(Ω)]

⁰

definido por h R

p

f, gi

_[L^p_(Ω)]⁰_,L^p_(Ω)

=

Z

Ω

f (x)g(x) dx, ∀g ∈ L

^p

(Ω).

(8)

8 1.2. Convergencia d´ ebil y d´ ebil-∗. Espacios reflexivos

De nuevo, R

p

est´ a bien definido, es un isomorfismo isom´ etrico entre L

^p⁰

(Ω) y [L

^p

(Ω)]

⁰

y permite identificar L

^p⁰

(Ω) con [L

^p

(Ω)]

⁰

.

En el caso p = ∞, tambi´ en podemos introducir el operador R

∞

: L

¹

(Ω) → [L

^∞

(Ω)]

⁰

y se tiene tambi´ en que R

∞

es lineal e isom´ etrico (y por tanto inyectivo) pero no es sobreyectivo. Deducimos que L

¹

(Ω) no se puede identificar con [L

^∞

(Ω)]

⁰

.

En el caso p ∈ [1, ∞) y usando la anterior identificaci´ on, es posible reescribir el concepto de convergencia d´ ebil en L

^p

(Ω). Dados {f

_n

}

_n≥1

⊂ L

^p

(Ω) y f ∈ L

^p

(Ω), es f´ acil comprobar que f

_n

* f en L

^p

(Ω) si y s´ olo si

Z

Ω

f

_n

(x)g(x) dx → Z

Ω

f (x)g(x) dx, ∀g ∈ L

^p⁰

(Ω).

Por ´ ultimo, teniendo en cuenta que L

^∞

(Ω) ≡ [L

¹

(Ω)]

⁰

, tambi´ en podemos identificar la convergencia d´ ebil-* en L

^∞

(Ω): Dados {f

_n

}

_n≥1

⊂ L

^∞

(Ω) y f ∈ L

^∞

(Ω), es f´ acil comprobar que f

_n

* f

^∗

en L

^∞

(Ω) si y s´ olo si

Z

Ω

f

n

(x)g(x) dx → Z

Ω

f (x)g(x) dx, ∀g ∈ L

¹

(Ω).

Veamos algunas propiedades sobre la convergencia d´ ebil:

Proposici´ on 1.3. Sean X e Y dos espacios normados. Se tiene:

1. Sean A ∈ L(X, Y ), {x

n

}

_n≥1

⊂ X y x ∈ X tales que x

_n

* x en X. Entonces, Ax

_n

* Ax en Y .

2. Si x

_n

* x d´ ebil en X, entonces {x

_n

}

_n≥1

es una sucesi´ on acotada en X y kxk

_X

≤ l´ım inf kx

_n

k

_X

. 3. Si x

⁰_n

* x

^∗ ⁰

d´ ebil-∗ en X

⁰

, entonces {x

⁰_n

}

_n≥1

es una sucesi´ on acotada en X

⁰

y kx

⁰

k

_X⁰

≤

l´ım inf kx

n

k

_X⁰

.

Observaci´ on 1.2. Si A no es lineal, aunque sea continua, el primer punto de la Proposici´ on 1.3 es, en general falso. Un ejemplo viene dado por la aplicaci´ on norma en un espacio de Banach X (la cual es, evidentemente, una aplicaci´ on continua pero no lineal). Es posible construir ejemplos de sucesiones {x

_n

}

_n≥1

⊂ X tales que kx

_n

k = 1 y satisfacen x

_n

* 0. Evidentemente, x

_n

6→ 0 en X.

Pasemos a continuaci´ on a recordar el concepto de reflexividad. Dado X un espacio normado, se define la aplicaci´ on J : X −→ X

⁰⁰

por

h J(x), x

⁰

i

_X⁰⁰_,X⁰

= hx

⁰

, xi

X⁰,X

, ∀x ∈ X, x

⁰

∈ X

⁰

llamada inyecci´ on can´ onica de X en X

⁰⁰

. Se tiene:

Proposici´ on 1.4. La aplicaci´ on J est´a bien definida, es lineal, isom´etrica e inyectiva. Por tanto permite identificar X con el subespacio J(X) de X

⁰⁰

.

Gracias a este resultado podemos definir:

Definici´ on 1.5. Sea X un espacio normado. Se dice que X es un espacio reflexivo si la aplicaci´ on J es sobreyectiva.

Obs´ ervese que, en particular, si X es reflexivo entonces X se identifica con X

⁰⁰

(que es un espacio de Banach al ser el dual de X

⁰

). Deducimos que tambi´ en X es un espacio de Banach.

Veamos algunas propiedades de los espacios reflexivos. Se tiene:

(9)

Proposici´ on 1.6. Sea X un espacio normado. Entonces,

1. X es un espacio reflexivo si y s´ olo si X

⁰

es un espacio reflexivo.

2. Si X es un espacio reflexivo y C ⊆ X es un subespacio vectorial cerrado, entonces (C, k · k) es tambi´ en un espacio reflexivo.

Pasemos a continuaci´ on a analizar otros conceptos relacionados con la convergencia d´ ebil en espacios normados:

Definici´ on 1.7. Sean X un espacio normado y C ⊆ X un subconjunto. Se dice que C es secuencialmente d´ ebilmente cerrado si para cualesquiera sucesi´ on {x

n

}

_n≥1

⊂ X y x ∈ X tales que x

_n

* x se tiene que x ∈ C.

A diferencia de lo que podr´ıa pensarse, obs´ ervese que si C ⊆ X es un conjunto secuencialmente d´ ebilmente cerrado, entonces C es cerrado. La implicaci´ on contraria es, en general, falsa. Si embargo, como consecuencia del Teorema de Hanh-Banach o, m´ as concretamente, como consecuencia de los Teoremas de separaci´ on de conjuntos convexos, se tiene:

Teorema 1.8. Sea X un espacio normado y C ⊆ X un subconjunto convexo. Entonces, C es cerrado si y s´ olo si C es secuencialmente d´ ebilmente cerrado.

Pasemos a continuaci´ on a recordar el concepto de conjunto compacto en un espacio normado.

Es bien conocido que si X es un espacio normado, el concepto de compacidad puede ser reescrito en t´ erminos de convergencia. En concreto, dado K ⊂ X, K es compacto si y s´olo K satisface la siguiente propiedad:

“Fijada {x

_n

}

_n≥1

⊂ K, existe una subsucesi´on {x

nk

}

_k≥1

de {x

_n

}

_n≥1

y x ∈ K tal que x

nk

→ x.”

La propiedad anterior en particular implica la propiedad bien conocida: “Sea K ⊂ X un compac- to (con X un espacio normado), entonces K es cerrado y acotado”. Recu´erdese que la implicaci´on contraria s´ olo es v´ alida si X es un espacio de dimensi´ on finita. Sin embargo en los espacios normados de dimensi´ on infinita tambi´ en es posible obtener informaci´ on de las sucesiones acotadas. Se tiene:

Teorema 1.9. 1. Sea X un e.n. separable y {x

⁰_n

}

_n≥1

⊂ X

⁰

una sucesi´ on acotada. Entonces existe una subsucesi´ on {x

⁰_n

k

}

_k≥1

de {x

⁰_n

}

_n≥1

y x

⁰

∈ X

⁰

tal que x

⁰_n

k

* x

∗ ⁰

.

2. Sea X un espacio de Banach reflexivo y {x

n

}

_n≥1

⊂ X una sucesi´ on acotada. Entonces existe una subsucesi´ on {x

_n_k

}

_k≥1

de {x

_n

}

_n≥1

y x ∈ X tal que x

_n_k

* x.

1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil

Pasemos seguidamente a recordar los conceptos de semicontinuidad inferior y semicontinuidad inferior d´ ebil de funcionales definidos en espacios normados. As´ı, definimos:

Definici´ on 1.10. Sea X un espacio normado y f : U → R un funcional, con U ⊂ X. Diremos que f es semicontinuo inferiormente, y se escribir´ a f es s.c.i., en un punto x ∈ U si para toda sucesi´on {x

_n

}

_n≥1

⊂ U con x

n

→ x, se tiene

f (x) ≤ l´ım inf f (x

_n

).

Diremos que f es semicontinua inferiormente en U si lo es en todo punto x de U.

(10)

10 1.3. Semicontinuidad y semicontinuidad secuencial d´ ebil

An´ alogamente, podemos definir:

Definici´ on 1.11. Sea X un espacio normado y f : U → R un funcional, con U ⊂ X. Diremos que f es secuencialmente d´ ebilmente semicontinuo inferiormente, y se escribir´ a f es s.d.s.c.i., en un punto x ∈ U si para toda sucesi´on {x

n

}

_n≥1

⊂ U tal que x

n

* x, se tiene

f (x) ≤ l´ım inf f (x

n

).

Diremos que f es secuencialmente d´ ebilmente semicontinua inferiormente en U si lo es en todo punto x de U.

De nuevo y a diferencia de lo que podr´ıa suponerse, el concepto de semicontinuidad inferior secuencial d´ ebil es m´ as fuerte que el concepto de semicontinuidad inferior: Es f´ acil comprobar que si f : U → R un funcional, con U ⊂ X, es s.d.s.c.i. en el punto x ∈ U, entonces f es s.c.i. en x.

Es posible caracterizar ambos conceptos del siguiente modo:

Proposici´ on 1.12. Sean X un espacio normado, U ⊂ X un subconjunto y f : U −→ R un funcional. Se tiene:

1. Supongamos que U es cerrado. Entonces, f es s.c.i. en U si y s´olo si el conjunto E

λ

= {x ∈ U : f(x) ≤ λ}

es un conjunto cerrado de X para todo λ ∈ R.

2. Supongamos que U es secuencialmente d´ebilmente cerrado. Entonces, f es s.d.s.c.i. en U si y s´ olo si el conjunto E

_λ

es un conjunto d´ ebilmente cerrado de X para todo λ ∈ R.

Dado un espacio vectorial X y un subconjunto U ⊆ X, recordemos que U es convexo si para cualesquiera x, y ∈ U se tiene [x, y] ⊆ U, donde

[x, y] = {θx + (1 − θ)y : θ ∈ [0, 1]}.

As´ı:

Definici´ on 1.13. Sean X un espacio vectorial, U ⊆ X un subconjunto convexo y f : U → X una funci´ on. Se dice que f es convexa en U si

f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y), ∀x, y ∈ U, ∀θ ∈ [0, 1].

Se dice que f es estrictamente convexa en U si

f (θx + (1 − θ)y) < θf (x) + (1 − θ)f (y), ∀x, y ∈ U con x 6= y, ∀θ ∈ (0, 1).

Gracias a la caracterizaci´ on de la s.c.i. y de la s.c.i. secuencial d´ ebil, no es dif´ıcil comprobar la siguiente propiedad:

Proposici´ on 1.14. Dados X un espacio normado, U ⊆ X un subconjunto convexo cerrado no

vac´ıo y f : U → R un funcional convexo. Entonces, se tiene que f es s.c.i. en U si y s´olo si f es

s.d.s.c.i. en U.

(11)

Prueba. La demostraci´ on del resultado es una f´ acil consecuencia de la Proposici´ on 1.12. Obs´ ervese en primer lugar que ´ esta puede ser aplicada pues U es un convexo cerrado no vac´ıo y, por tanto, U es secuencialmente d´ ebilmente cerrado.

Aplicando la Proposici´ on 1.12, f es s.c.i. en U si y s´olo si el conjunto E

λ

es un cerrado de X para cualquier λ de R. Como el funcional f y el conjunto U son convexos, es f´acil comprobar que E

λ

es tambi´ en un conjunto convexo para todo λ ∈ R. Por tanto, E

λ

es cerrado si y s´ olo si E

λ

es secuencialmente d´ ebilmente cerrado, es decir, si y s´ olo si f es s.d.s.c.i. en el conjunto U. Esto finaliza la prueba.

Ejemplo 1.3. Dado (X, k · k) un espacio normado, es posible aplicar este resultado a la funci´ on norma obteniendo de nuevo la propiedad 2 de la Proposici´ on 1.3. Efectivamente, considerando U ≡ X y f(x) = kxk, se tiene que f es un funcional convexo definido en el convexo cerrado X.

Como f es continuo en X, en particular es s.c.i. en X. Aplicando directamente la propiedad anterior deducimos que f ≡ k · k es s.d.s.c.i. en X y, por tanto, la propiedad 2 de la Proposici´ on 1.3.

1.4. Minimizaci´ on de funcionales

En esta secci´ on recordaremos algunos resultados conocidos sobre minimizaci´ on de funcionales.

Recordemos que estamos interesados en el estudio de la existencia de soluci´ on de problemas de Optimizaci´ on que pueden ser escritos de la forma

´ınf

v∈U

J (v)

con U un subconjunto de un espacio X (en general un espacio normado) y J : U → R un funcional.

Como sabemos, U es el conjunto de las restricciones o conjunto admisible y J es el funcional coste o funcional objetivo. Recordemos tambi´ en los siguientes conceptos:

Definici´ on 1.15. Dados X un espacio normado, U ⊆ X un subconjunto y J : U −→ R un funcional. Se dice que u es un m´ınimo local (o m´ınimo relativo) de J en el conjunto U si u ∈ U y existe ε > 0 tal que

J (u) ≤ J (v) ∀v ∈ U ∩ B(u; ε).

Se dice que u es un m´ınimo global (o m´ınimo absoluto) de J en el conjunto U si u ∈ U y se satisface J (u) ≤ J (v), ∀v ∈ U.

De forma an´ aloga se pueden definir los conceptos de m´ aximo local (o relativo) y m´ aximo global (o absoluto) de un funcional J en un conjunto U. En general, utilizaremos la palabra extremo para designar indistintamente un m´ aximo o m´ınimo de J .

El primer resultado de existencia de m´ınimos que veremos es debido a Weierstrass:

Teorema 1.16. (Teorema de Weierstrass) Supongamos que U es un espacio m´etrico no vac´ıo y compacto y J : U → R es un funcional s.c.i. en U. Entonces, J admite un m´ınimo global en U.

Prueba: Aplicaremos el llamado m´ etodo directo del C´ alculo de Variaciones: Tomaremos una sucesi´ on minimizante {u

_n

}

_n≥1

y probaremos que admite una subsucesi´ on convergente a un m´ınimo global de f en U. Usaremos la compacidad de U para poder extraer una subsucesi´on convergente y la s.c.i. de J en U para probar que el l´ımite es un m´ınimo global de J en U.

Si llamamos α = ´ınf

_v∈_U

J (v) ∈ [−∞, ∞), entonces, existe una sucesi´ on {u

n

}

_n≥1

⊂ U (sucesi´on minimizante) tal que

l´ım J (u

n

) = α.

(12)

12 1.4. Minimizaci´ on de funcionales

Como U es compacto, existen u ∈ b U y una subsucesi´on {u

nk

}

_k≥1

de {u

_n

}

_n≥1

tales que u

_n_k

→ u en b U. Al ser J un funcional s.c.i. en U, se tiene

J ( u) ≤ l´ım inf J (u b

n_k

) = l´ım J (u

n

) = α.

Deducimos de este modo que α ∈ R y J( u) = α = ´ınf b

_u∈_U

J (u). Esto finaliza la demostraci´ on.

Recordemos tambi´ en

Definici´ on 1.17. Sea X un espacio normado, U ⊆ X un subconjunto no acotado y J : U → R un funcional. Se dice que J es coercitivo en U si

kuk→+∞

l´ım J (u) = +∞.

Es posible la generalizaci´ on del resultado anterior a un marco m´ as abstracto. As´ı, usaremos el pr´ oximo resultado para deducir la existencia de soluci´ on de problemas de minimizaci´ on planteados en un espacio normado:

Teorema 1.18. Sean X un espacio de Banach reflexivo, U ⊆ X un subconjunto secuencialmente d´ ebilmente cerrado no vac´ıo y J : U → R un funcional s.d.s.c.i. Adem´as, si U es no acotado, supongamos que J es coercitiva en U. Entonces, J admite, al menos, un m´ınimo global en U.

Prueba: Seguimos el mismo razonamiento del Teorema 1.16 y seleccionamos una sucesi´ on minimizante {u

n

}

_n≥1

⊂ U tal que

l´ım J (u

_n

) = α = ´ınf

u∈U

J (u)(∈ [−∞, ∞)).

Si U es un subconjunto acotado, est´a claro que la sucesi´on {u

n

}

_n≥1

est´ a acotada. Si U es un no acotado, no es dif´ıcil comprobar (gracias a la hip´ otesis de coercitividad de J ) que tambi´ en {u

n

}

_n≥1

est´ a acotada. Efectivamente, basta razonar por reducci´ on al absurdo para deducir la acotaci´ on de {u

_n

}

_n≥1

.

Al ser X un espacio reflexivo, U un subconjunto s.d. cerrado y {u

n

}

_n≥1

una sucesi´ on acotada, deducimos que existe una subsucesi´ on de {u

_n

}

_n≥1

(que seguiremos denotando {u

_n

}

_n≥1

) y un elemento u ∈ b U tal que

u

n

* u d´ b ebil en X.

Como J es s.d.s.c.i., entonces

J ( b u) ≤ l´ım inf J (u

_n

) = l´ım J (u

_n

) = α.

Esta ´ ultima desigualdad prueba el resultado.

Como una consecuencia inmediata del Teorema 1.18, tenemos:

Corolario 1.19. Sean X un espacio de Banach reflexivo, U ⊆ X un subconjunto convexo cerrado no vac´ıo y J : U → R un funcional convexo y s.c.i. Adem´as, si U es no acotado, supongamos que J es coercitiva en U. Entonces, J admite, al menos, un m´ınimo global en U.

Respecto a la unicidad de soluci´ on para el problema de minimizaci´ on planteado, se tiene:

Proposici´ on 1.20. Sea X un espacio vectorial sobre R, U ⊆ X un subconjunto convexo y J : U →

R un funcional estrictamente convexo. Entonces, J admite a lo m´ as un m´ınimo global en U.

(13)

Prueba: Supongamos que b u

₁

, b u

₂

∈ U satisfacen u b

₁

6= b u

₂

y J ( u b

1

) = J ( b u

2

) = ´ınf

u∈U

J (u).

Al ser U convexo, b u =

¹₂

( b u

1

+ u b

2

) ∈ U y J ( u) < b 1

2 (J ( b u

1

) + J ( u b

2

)) = ´ınf

u∈U

J (u).

Evidentemente, esta ´ ultima desigualdad es absurda.

La convexidad de J permite liberarnos del car´ acter local de los m´ınimos relativos. Se tiene:

Proposici´ on 1.21. Sea X un espacio normado, U ⊆ X un subconjunto convexo de X y J : U → R un funcional convexo. Si J admite un m´ınimo relativo b u en U, entonces ese m´ınimo es un m´ınimo global en U, es decir,

J ( b u) = ´ınf

u∈U

J (u).

Prueba: Al ser u ∈ b U un m´ınimo relativo de J en U deducimos la existencia de ε > 0 tal que J ( u) ≤ J (u), b ∀u ∈ U ∩ B(b u; ε).

Sea ahora v ∈ U arbitrario y veamos que J(b u) ≤ J (v). Esta desigualdad es evidente si v ∈ B( b u; ε).

Supongamos entonces que kv − uk > ε y consideremos b u = b u + ε

2kv − b uk (v − b u)

que, evidentemente, satisface u ∈ U ∩ B(b u; ε) (el conjunto U es convexo). De este modo, al ser J convexa,

J ( u) ≤ J (u) ≤ J ( b b u) + ε

2kv − uk b (J (v) − J ( u)) , b de donde se deduce que J ( u) ≤ J (v). Esto finaliza la prueba. b

1.5. C´ alculo diferencial

En esta secci´ on vamos a hacer un breve recordatorio de la teor´ıa de derivaci´ on en espacios normados.

Definici´ on 1.22. Sean X e Y dos espacios normados, U ⊆ X un subconjunto abierto, F : U → Y un operador, x

0

∈ U y h ∈ X. Se dice que F es diferenciable en el sentido de Gˆateaux (o G- diferenciable) en x

0

y en la direcci´ on h si existe el l´ımite en Y

ε→0

l´ım

F (x

0

+ εh) − F (x

0

)

ε = δF (x

₀

; h) ∈ Y.

Al elemento δF (x

0

; h) ∈ Y definido por el anterior l´ımite se le denomina G-diferencial de F en el punto x

₀

y en la direcci´ on h.

Si existe δF (x

0

; h) para toda h ∈ X, diremos que F es G-diferenciable en x

0

, y a la aplicaci´ on δF (x

0

) definida por

δF (x

₀

) : h ∈ X 7−→ δF (x

₀

; h) ∈ Y

la denominaremos la G-diferencial (o diferencial Gˆ ateaux) de F en el punto x

0

.

(14)

14 1.5. C´ alculo diferencial

Observaci´ on 1.3. No es dif´ıcil demostrar que si F es G-diferenciable en x

₀

y en la direcci´ on h ∈ X, entonces tambi´ en lo es en la direcci´ on αh, con α ∈ R, y

δF (x

0

; αh) = αδF (x

0

; h), ∀α ∈ R, ∀ h ∈ X.

Por otro lado, si introducimos la funci´ on de variable real g(t) = F (x

₀

+ th) (definida en un entorno de t = 0), entonces, se tiene que F es G-diferenciable en el punto x

₀

y en la direcci´ on h si y s´ olo si g es derivable en 0. En este caso, g

⁰

(0) = δF (x

0

; h).

Siguiendo con las definiciones, pasemos a la siguiente:

Definici´ on 1.23. Sean X e Y dos espacios normados, U ⊆ X un subconjunto abierto, x

0

∈ U y F : U → Y un operador G-diferenciable en x

0

. Si la aplicaci´ on δF (x

0

) es un operador lineal y continuo de X en Y , es decir, si δF (x

₀

) ∈ L(X, Y ), entonces se dice que F es G-derivable en x

0

y a la aplicaci´ on δF (x

₀

) se la denomina la derivada Gˆ ateaux (G-derivada) de F en x

₀

.

Ejemplo 1.4. 1. Sean X e Y dos espacios normados, y

0

∈ Y y A ∈ L(X, Y ) un operador lineal y continuo. Consideremos F : x ∈ X 7→ F (x) = Ax + y

₀

∈ Y . Entonces, no es dif´ıcil comprobar que F es G-derivable en X y δF (x) = A, para cualquier x ∈ X. Si A fuera solo un operador lineal, entonces F es G-diferenciable en x

0

y δF (x

0

) = A, para cualquier x

0

∈ X.

2. Consideremos ahora B ∈ L

2

(X, Y ), es decir, B : X ×X → Y , un operador bilineal y continuo.

Definamos la aplicaci´ on F : x ∈ X 7→ F (x) = B(x, x) ∈ Y . Entonces, se tiene que F es G- derivable en X y δF (x) = B(x, ·) + B(·, x), para cualquier x ∈ X. Si B es sim´ etrico, entonces, δF (x) = 2B(x, ·). En el caso en el que B solo es bilineal, se tiene que F es G-diferenciable en x

0

con δF (x

0

) = B(x

0

, ·) + B(·, x

0

), para cualquier x ∈ X

0

.

3. Como aplicaci´ on del punto anterior podemos obtener lo siguiente: Sea H en espacio de Hilbert (con producto escalar (·, ·)) e introduzcamos el funcional

F : x ∈ H 7−→ F (x) = kxk

²

∈ R, ∀x ∈ H.

Este funcional puede ser escrito F (x) = (x, x) y as´ı, aplicando el punto anterior, deducimos que F es G-derivable en todos los puntos de H y

δF (x

0

; h) = 2(x

0

, h), ∀x

₀

∈ H, ∀h ∈ H.

Las definiciones precedentes generalizan el concepto de derivada direccional para aplicaciones de R

^N

en R. Un concepto m´as restrictivo lo constituye la noci´on de derivada en el sentido de M.

Fr´ echet.

Definici´ on 1.24. Sean X, Y dos espacios normados, U ⊆ X un subconjunto abierto, F : U → Y un operador y x

₀

∈ U . Diremos que F es derivable en x

₀

en el sentido de Fr´ echet (o F-derivable en x

₀

), si existe ε

₀

> 0 y A(x

₀

) ∈ L(X, Y ) tal que

(1.1) F (x

0

+ h) = F (x

0

) + A(x

0

)h + o(h), ∀h ∈ X con khk

_X

≤ ε

₀

, con o(h) ∈ Y satisfaciendo

(1.2) l´ım

khk→0

ko(h)k

_Y

khk

_X

= 0.

En tal caso el operador A(x

₀

) es ´ unico (ver la Proposici´ on 1.25), lo denotaremos por F

⁰

(x

₀

) y lo

denominaremos la derivada Fr´ echet (o F-derivada) de F en x

0

.

(15)

La anterior definici´ on nos proporciona un nuevo concepto de derivada en los espacios de Banach que, evidentemente est´ a relacionado con la derivada en el sentido de Gˆ ateaux. Se tiene:

Proposici´ on 1.25. Sean X e Y dos espacios normados y F : U ⊆ X → Y un operador definido en U ⊆ X un abierto. Si F es F-derivable en x

0

∈ U, entonces F es continua y G-derivable en x

0

. Adem´ as, δF (x

₀

) ∈ L(X, Y ) y F

⁰

(x

₀

) = δF (x

₀

).

Prueba: Sea h ∈ X \{0} y consideremos ε

0

> 0 y A(x

0

) ∈ L(X, Y ) satisfaciendo la condici´on ( 1.1).

Entonces, para ε 6= 0 y ε ≤ ε

₀

/khk

_X

se tiene F (x

0

+ εh) − F (x

0

)

ε = A(x

0

)h + o(εh) ε .

Usando la propiedad (1.2), podemos pasar al l´ımite cuando ε → 0 en la desigualdad precedente para probar

ε→0

l´ım

F (x

₀

+ εh) − F (x

₀

)

ε = A(x

₀

)h + l´ım

ε→0

o(εh)

ε = A(x

₀

)h + l´ım

ε→0

khk

_X

ko(εh)k

_Y

kεhk

_X

= A(x

₀

)h, de donde se deduce que F es derivable Gˆ ateaux en x

₀

y δF (x

₀

) = A(x

₀

). En particular, esto prueba la unicidad de A(x

0

) mencionada anteriormente.

La continuidad de F en x

0

es una simple consecuencia de la f´ ormulas (1.1) y (1.2). Esto acaba la prueba.

Ejemplo 1.5. En los tres ejemplos anteriores es f´ acil comprobar que las aplicaciones son F- derivables en cada punto x

0

∈ X y, evidentemente, la F-derivada coincide con la G-derivada.

Efectivamente,

1. En este primer caso, F puede ser escrita

F (x

0

+ h) = F (x

0

) + Ah, ∀x

₀

, h ∈ X.

Al ser A ∈ L(X, Y ), deducimos que F satisface ( 1.1) para A(x

₀

) ≡ A y o(h) ≡ 0. As´ı, F es F-derivable en X y F

⁰

(x

₀

) = A, para todo x

₀

∈ X.

2. En este caso, F puede ser escrita de la forma

F (x

₀

+ h) = F (x

₀

) + A(x

₀

)h + B(h, h), ∀x

₀

, h ∈ X

con A(x

₀

)h = B(x

₀

, h) + B(h, x

₀

). Si hacemos o(h) ≡ B(h, h) entonces, utilizando que B ∈ L

2

(X, Y ), deducimos que F satisface (1.1) y (1.2), es decir, F es F-derivable en cualquier punto x

₀

∈ X y F

⁰

(x

₀

) ≡ B(x

₀

, ·) + B(·, x

₀

).

3. Este ejemplo es un caso particular del anterior para X = H un espacio de Hilbert, Y = R y B(·, ·) = (·, ·).

Observaci´ on 1.4. Todas las nociones de diferencial y derivada que se han introducido poseen car´ acter lineal en F .

Por otro lado, el concepto de derivada Gˆ ateaux de un operador F definido entre los espacios normados X e Y es realmente m´ as d´ ebil que el concepto de derivada en el sentido Fr´ echet. Esto es cierto incluso en el caso de espacios de dimensi´ on finita. Veamos un ejemplo: Consideremos X = R

²

, Y = R y F el funcional dado por

F (x, y) = x

⁶

(y − x

²

)

²

+ x

⁸

si (x, y) 6= (0, 0), F (0, 0) = 0.

Es f´ acil comprobar que F es G-diferenciable en el punto (0, 0), con G-derivada dada por δF (0, 0) =

(0, 0), pero no es continua en (0, 0). Por tanto, F no es derivable en el sentido de Fr´ echet.

(16)

16 1.5. C´ alculo diferencial

Pasemos seguidamente a recordar (sin demostraci´ on) un resultado cl´ asico de derivabilidad de funciones compuestas. Se tiene:

Teorema 1.26. (Regla de la cadena) Sean X, Y , Z tres espacios normados, U ⊆ X y V ⊆ Y dos abiertos y x

0

∈ U. Consideremos dos aplicaciones ϕ : U → V y ψ : V → Z, y denotemos y

₀

= ϕ(x

₀

) y F = ψ ◦ ϕ. As´ı, si ψ es F-derivable en y

₀

y ϕ es F-derivable (respectivamente, G- derivable, G-diferenciable, G-diferenciable en la direcci´ on h de X) en x

0

, entonces F es F-derivable (respectivamente, G-derivable, G-diferenciable o G-diferenciable en la direcci´ on h de X) en x

0

, y se satisface

F

⁰

(x

0

) = ψ

⁰

(y

0

) ◦ ϕ

⁰

(x

0

),

(respectivamente, δF (x

₀

) = ψ

⁰

(y

₀

) ◦ δϕ(x

₀

), δF (x

₀

, h) = ψ

⁰

(y

₀

) (δϕ(x

₀

, h))).

Para una prueba del anterior resultado, cons´ ultense los apuntes de la asignatura An´ alisis Fun- cional y Optimizaci´ on.

Es posible generalizar el Teorema del valor medio en el marco de los operadores que son G- diferenciables en un espacio de Banach. Se tiene:

Teorema 1.27. (Valor medio) Sean X un espacio normado, U ⊆ X un abierto y x

1

, x

₂

dos puntos de U tales que [x

1

, x

₂

] ⊂ U. Se tiene

1. Si F : U → R es G-diferenciable en todos los puntos de [x

1

, x

2

] en la direcci´ on x

2

− x

₁

, entonces existe ξ ∈ (x

1

, x

2

) tal que

F (x

2

) − F (x

1

) = δF (ξ, x

2

− x

₁

).

2. Si Y es un e.n. y F : U → Y es G-diferenciable en todos los puntos de [x

1

, x

2

] en la direcci´ on x

₂

− x

₁

, entonces existe ξ ∈ (x

₁

, x

₂

) tal que

kF (x

₂

) − F (x

₁

)k

_Y

≤ kδF (ξ, x

₂

− x

₁

)k

_Y

. Prueba: 1. Consideramos la funci´ on real de variable real

ϕ : t ∈ [0, 1] 7→ ϕ(t) = F (x

₁

+ t(x

₂

− x

₁

)) ∈ R.

Es f´ acil comprobar directamente que ϕ ∈ C

¹

([0, 1]) y, as´ı, el resultado se obtiene como consecuencia del teorema del valor medio de funciones reales de variable real.

2. Como consecuencia del Teorema de Hahn-Banach, dado F (x

₂

) − F (x

₁

) ∈ Y , existe y

^∗

∈ Y

⁰

, con ky

^∗

k

_Y⁰

= 1, tal que

hy

^∗

, F (x

₂

) − F (x

₁

)i

_Y⁰_,Y

= kF (x

₂

) − F (x

₁

)k

_Y

.

El resultado se obtiene sin m´ as que aplicar el teorema del valor medio a la funci´ on real de variable real ϕ(t) = hy

^∗

, F (x

1

+ t(x

2

− x

₁

)i

_Y⁰_,Y

definida en [0, 1].

Como consecuencia de este resultado podemos obtener un criterio de derivabilidad en el sentido de Fr´ echet:

Proposici´ on 1.28. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un

operador. Supongamos que F es G-derivable en U y la aplicaci´on x ∈ U → δF (x) ∈ L(X, Y ) es

continua en U. Entonces, F es derivable Fr´echet en U.

(17)

Prueba: Fijemos x

₀

∈ U y probemos que F es F-derivable en x

0

. Para ello, consideremos ε

₀

> 0 tal que B(x

₀

, ε

₀

) ⊂ U .

En primer lugar, obs´ ervese que el operador F puede ser escrito:

F (x

0

+ h) = F (x

0

) + δF (x

0

)h + o(h), ∀h ∈ B

₀

≡ B(0, ε

₀

) con

o(h) = F (x

₀

+ h) − F (x

₀

) − δF (x

₀

)h.

Veamos que o(h) satisface (1.2). Como δF (x) es continua en U, fijado ε > 0, existe δ ∈ (0, ε

0

) tal que

kδF (x

₀

+ h) − δF (x

0

)k

_{L(X,Y )}

≤ ε ∀h ∈ X con khk ≤ δ.

Si h ∈ X y khk ≤ δ, entonces el segmento [x

0

, x

0

+ h] ⊂ B(x

0

, ε

0

) ⊂ U y podemos aplicar el Teorema 1.27 a la aplicaci´ on F (·) − δF (x

0

)(·), deduciendo la existencia de ξ ∈ (x

0

, x

0

+ h) tal que

kF (x

₀

+ h) − F (x

₀

) − δF (x

₀

)(h)k

_Y

≡ ko(h)k

_Y

≤ kδF (ξ) − δF (x

₀

)kkhk ≤ εkhk.

De esta desigualdad obtenemos que F es derivable Fr´ echet en x

₀

. Esto prueba el resultado.

Pasemos a definir el concepto de derivada segunda de una aplicaci´ on:

Definici´ on 1.29. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un operador.

Dados x

0

∈ U y h ∈ X, se dice que F es dos veces G-diferenciable en x

0

en la direcci´ on h, si existe ε

₀

> 0 tal que F es G-diferenciable en el intervalo abierto (x

₀

− ε

₀

h, x

₀

+ ε

₀

h) ⊂ U y en la direcci´on h, y existe el l´ımite

δ

²

F (x

0

, h, h) = l´ım

ε→0

δF (x

₀

+ εh, h) − δF (x

₀

, h)

ε .

Al elemento δF

²

(x

₀

, h, h) ∈ Y as´ı definido lo denominaremos la G-diferencial segunda de F en el punto x

₀

en la direcci´ on h.

Ejemplo 1.6. Sean X e Y dos espacios normados y B : X × X → Y una aplicaci´ on bilineal y continua. Consideremos F (x) = B(x, x); entonces, se tiene que F es dos veces G-diferenciable en X en cualquier direcci´ on h ∈ X y se tiene:

δ

²

F (x

0

; h, h) = 2B(h, h).

Observaci´ on 1.5. No es dif´ıcil comprobar que si F : U → Y , con U ⊂ X un abierto y X e Y dos espacios normados, es dos veces G-diferenciable en x

₀

∈ U en la direcci´on h ∈ X, entonces, tambi´en es dos veces G-diferenciable en x

0

y en la direcci´ on αh ∈ X para cualquier α ∈ R. Adem´as

δ

²

F (x

0

; αh, αh) = α

²

δ

²

F (x

0

; h, h).

Es posible dar un resultado m´ as general que el Teorema 1.27. Con ayuda del concepto de G-diferencial segunda de un operador F , se tiene:

Teorema 1.30. Sean X e Y dos espacios normados, U ⊆ X un abierto y F : U → Y un operador.

Dados x

₁

, x

₂

∈ U tales que [x

1

, x

₂

] ⊂ U, supongamos que F es dos veces G-diferenciable en todo punto de [x

1

, x

2

] en la direcci´ on x

2

− x

₁

. Entonces,

1. Si Y = R, existe ξ ∈ (x

1

, x

₂

) tal que

F (x

₂

) = F (x

₁

) + δF (x

₁

, x

₂

− x

₁

) + 1

2 δ

²

F (ξ, x

₂

− x

₁

, x

₂

− x

₁

).

(18)

18 1.5. C´ alculo diferencial

2. En el caso general (Y un e.n. cualquiera), existe ξ ∈ (x

₁

, x

₂

) tal que kF (x

₂

) − F (x

₁

) − δF (x

₁

, x

₂

− x

₁

)k

_Y

≤ 1

2 kδ

²

F (ξ, x

₂

− x

₁

, x

₂

− x

₁

)k

_Y

. Ejercicio 1.1. Prueba el Teorema 1.30.

Vamos a continuaci´ on a caracterizar el car´ acter convexo de un funcional J definido en un abierto de un espacio de Banach. En esa caracterizaci´ on vamos a utilizar los conceptos de G- diferenciabilidad del funcional J . En este sentido, generalizaremos resultados bien conocidos en el caso en el que X = R

^N

. Se tiene:

Proposici´ on 1.31. Sean X un espacio normado, Ω ⊆ X un abierto, U ⊆ Ω un subconjunto convexo no vac´ıo y J : Ω → R un funcional. Supongamos que J es G-diferenciable en Ω. Entonces,

1. J es convexo en U si y s´olo si se verifica

(1.3) J (x

₂

) − J (x

₁

) ≥ δJ (x

₁

, x

₂

− x

₁

) ∀x

₁

, x

₂

∈ U.

2. Del mismo modo, J es estrictamente convexo en U si y s´olo si

(1.4) J (x

₂

) − J (x

₁

) > δJ (x

₁

, x

₂

− x

₁

) ∀x

₁

, x

₂

∈ U, x

1

6= x

₂

.

Prueba: 1. Fijemos x

₁

, x

₂

∈ U. Si J es convexo en U, entonces, dado ε ∈ (0, 1), se tiene J (x

₁

+ ε(x

₂

− x

₁

)) − J (x

₁

)

ε ≤ εJ (x

₂

) + (1 − ε)J (x

₁

) − J (x

₁

)

ε = J (x

₂

) − J (x

₁

).

Tomando l´ımite cuando ε → 0

⁺

obtenemos la desigualdad (1.3)

Rec´ıprocamente, supongamos que (1.3) es cierta. Veamos que J es convexo en U. Sean x

1

, x

2

∈ U y α ∈ [0, 1], entonces, se tiene:

( J (x

₁

) ≥ J (x

₂

+ α(x

₁

− x

₂

)) + δJ (x

₂

+ α(x

₁

− x

₂

), (1 − α)(x

₁

− x

₂

)) y J (x

2

) ≥ J (x

2

+ α(x

1

− x

₂

)) + δJ (x

2

+ α(x

1

− x

₂

), −α(x

2

− x

₁

)).

Multiplicando las desigualdades anteriores respectivamente por α y 1 − α y utilizando las propiedades de la G-diferencial (car´ acter homog´ eneo respecto de la direcci´ on h), se prueba

J (αx

1

+ (1 − α)x

2

) ≤ αJ (x

1

) + (1 − α)J (x

2

) y por tanto F es convexa en U.

2. El razonamiento anterior sirve para probar que (1.4) implica la convexidad estricta del funcional J en U.

Veamos el rec´ıproco. Supongamos J es estrictamente convexa en U. En particular, J satisface (1.3). As´ı, si x

1

, x

2

∈ U con x

1

6= x

₂

y α ∈ (0, 1), entonces, se tiene

J (x

2

) − J (x

1

) > J (x

₁

+ α(x

₂

− x

₁

)) − J (x

₁

) α

(1.3)

≥ δJ (x

₁

, α(x

₂

− x

₁

))

α = δJ (x

1

, x

2

− x

₁

).

Tenemos as´ı la prueba del resultado.

Hay otra manera de caracterizar los funcionales convexos en un convexo mediante la G-diferencial.

En concreto, se tiene:

(19)

Proposici´ on 1.32. En las hip´ otesis de la Proposici´ on 1.31, J es convexa en U si y s´olo si (1.5) δJ (x

₂

, x

₂

− x

₁

) − δJ (x

₁

, x

₂

− x

₁

) ≥ 0, ∀x

₁

, x

₂

∈ U.

Prueba: Supongamos que J es convexa en U y sean x

1

, x

2

∈ U. Aplicando (1.3) sucesivamente a (x

1

, x

2

) y a (x

2

, x

1

), se tiene

( J (x

2

) − J (x

1

) ≥ δJ (x

1

, x

2

− x

₁

) y J (x

₁

) − J (x

₂

) ≥ δJ (x

₂

, x

₁

− x

₂

).

Sumando estas desigualdades y teniendo en cuenta la homogeneidad de la G-diferencial respecto de la direcci´ on, se obtiene (1.5).

Supongamos ahora que se tiene (1.5) y sean x

1

, x

2

∈ U y α ∈ [0, 1]. Consideremos la funci´on real de variable real ϕ : t ∈ [0, 1] 7→ ϕ(t) = J (x

₁

+ t(x

₂

− x

₁

)). No es dif´ıcil comprobar que ϕ ∈ C

¹

([0, 1]) y ϕ

⁰

(t) = δJ (x

1

+ t(x

2

− x

₁

), x

2

− x

₁

), para cada t ∈ [0, 1]. Usando (1.5) es tambi´ en sencillo deducir que la funci´ on ϕ

⁰

es creciente en [0, 1] (es decir, si 0 ≤ s < t ≤ 1, entonces ϕ

⁰

(s) ≤ ϕ

⁰

(t)).

Deducimos por tanto que ϕ es convexa en el intervalo [0, 1] y as´ı, ϕ(α) ≤ αϕ(1) + (1 − α)ϕ(0) i.e., J ((1 − α)x

1

+ αx

2

) ≤ (1 − α)J (x

1

) + αJ (x

2

). Tenemos as´ı acabada la prueba.

Veamos por ´ ultimo que podemos caracterizar la convexidad de un funcional utilizando la G- diferencial segunda del funcional. Se tiene:

Proposici´ on 1.33. Sean X un espacio normado, Ω ⊆ X un abierto, U ⊆ Ω un subconjunto convexo y J : Ω → R un funcional. Supongamos que J es dos veces G-diferenciable en Ω. Entonces,

1. J es convexa en U si y s´olo si se satisface

(1.6) δ

²

J (x

₁

, x

₂

− x

₁

, x

₂

− x

₁

) ≥ 0, ∀x

₁

, x

₂

∈ U.

2. Si se tiene

(1.7) δ

²

J (x

1

, x

2

− x

₁

, x

2

− x

₁

) > 0, ∀x

₁

, x

2

∈ U con x

1

6= x

₂

, entonces F es estrictamente convexa en U.

Prueba: Supongamos que J satisface (1.6) (resp., J satisface (1.7)) y veamos que J es convexa (resp., estrictamente convexa en U). Sean x

1

, x

₂

∈ U (resp., x

1

, x

₂

∈ U, con x

1

6= x

₂

). Si aplicamos el Teorema 1.30 obtenemos la existencia de ξ ∈ (x

1

, x

2

) tal que se tiene

J (x

2

) − J (x

1

) − δJ (x

1

, x

2

− x

₁

) = 1

2 δ

²

J (ξ, x

2

− x

₁

, x

2

− x

₁

).

Obs´ ervese que ξ = x

1

+ β(x

2

− x

₁

), con β ∈ (0, 1). As´ı, δ

²

J (ξ, x

2

− x

₁

, x

2

− x

₁

) = δ

²

J (ξ, − 1

β (x

1

− ξ), − 1

β (x

1

− ξ)) = 1

β

²

δ

²

J (ξ, x

1

− ξ, x

₁

− ξ), que junto a la Proposici´ on 1.31 demuestra que J es convexa (resp., estrictamente convexa) en U.

Veamos ahora que si J es convexa en U, entonces se tiene ( 1.6). Sean x

₁

, x

₂

∈ U y as´ı, δ

²

J (x

₁

, x

₂

− x

₁

, x

₂

− x

₁

) = l´ım

ε→0⁺

δJ (x

1

+ ε(x

2

− x

₁

), x

2

− x

₁

) − δJ (x

1

, x

2

− x

₁

) ε

= l´ım

ε→0⁺

δJ (x

₁

+ ε(x

₂

− x

₁

), ε(x

₂

− x

₁

)) − δJ (x

₁

, ε(x

₂

− x

₁

))

ε

²

≥ 0.

Esta ´ ultima desigualdad prueba el resultado.

(20)

20 1.5. C´ alculo diferencial

Observaci´ on 1.6. Obs´ ervese que la condici´ on (1.7) no es una condici´ on necesaria para que J sea estrictamente convexa en U. Basta considerar el funcional (funci´on) definida en X = R dada por J (t) = t

⁴

que es, evidentemente, estrictamente convexa en R y no satisface ( 1.7).

Ejemplo 1.7. Consideremos X un espacio normado y una forma bilineal a : X × X → R. Si definimos el funcional J : X → R dado por J(x) = a(x, x), podemos utilizar el resultado anterior (pues J es dos veces G-diferenciable en X) y deducir que J es convexa en X si y s´ olo si la forma bilineal es semidefinida positiva en X, es decir, si y s´ olo si

a(x, x) ≥ 0, ∀x ∈ X.

Si a es definida positiva en X, es decir, a(x, x) > 0, para cualquier x 6= 0, entonces J es estrictamente convexa en X.

De hecho en este caso, se tiene que J es estrictamente convexa si y s´ olo si a es definida positiva en X. Efectivamente, la equivalencia es f´ acil de establecer si se tiene en cuenta la Proposici´ on 1.31 y la igualdad

J (x

2

) − J (x

1

) − δJ (x

1

, x

2

− x

₁

) = a(x

2

− x

₁

, x

2

− x

₁

), v´ alida para cualesquiera x

₁

, x

₂

∈ X.

Pasamos a continuaci´ on a dar un bloque de resultados que relacionan la diferenciabilidad de un funcional con la existencia de m´ınimos de ese funcional. Vamos a cambiar ligeramente la notaci´ on y vamos a utilizar V en lugar de X para designar un espacio normado con norma k · k. El primero de los resultados da una condici´ on necesaria de m´ınimo relativo de un funcional:

Teorema 1.34 (Condici´ on necesaria de extremo relativo). Sea V un espacio normado, Ω ⊆ V un subconjunto y J : Ω → R un funcional. Supongamos que J alcanza un m´ınimo relativo en u ∈ int Ω y que J es G-diferenciable en u. Entonces

(1.8) δJ (u, h) = 0, ∀h ∈ V (Ecuaci´ on de Euler).

Prueba: Como u ∈ int Ω y J alcanza en u un m´ınimo relativo, deducimos que existe ε

0

> 0 tal que B(u; ε

₀

) ⊂ Ω y J (u) ≤ J (v), para cualquier v ∈ B(u; ε

₀

). Sea h ∈ V con h 6= 0 y supongamos que ε ∈ (0, ε

0

). Entonces,



 



 



δJ (u, h/khk) = l´ım

ε→0⁺

J (u + εh/khk) − J (u)

ε ≥ 0

δJ (u, h/khk) = l´ım

ε→0⁺

J (u − εh/khk) − J (u)

−ε ≤ 0.

En consecuencia, δJ (u; h/khk) = 0 para cualquier h ∈ V con h 6= 0. Utilizando una vez m´ as que la G-diferencial es homog´ enea respecto de h deducimos el resultado.

Observaci´ on 1.7. El resultado anterior deja de ser cierto si no imponemos la hip´ otesis u ∈ int Ω.

Efectivamente, basta considerar el funcional J (x) = x definido en Ω = [0, 1] ⊂ V ≡ R.

En el caso de tener un conjunto convexo, la condici´ on necesaria de extremo relativo cambia ligeramente:

Teorema 1.35 (Condici´ on necesaria y suficiente de m´ ınimo relativo en convexos). Sea

V un espacio normado, Ω ⊆ V un abierto, U ⊆ Ω un subconjunto convexo no vac´ıo y J : Ω → R

un funcional. Supongamos que J es G-diferenciable en u ∈ U. Se tiene:

(21)

1. Si u es un m´ınimo relativo de J en U entonces,

(1.9) δJ (u, v − u) ≥ 0 ∀v ∈ U.

2. Supongamos que J es convexo en U y que u ∈ U satisface ( 1.9). Entonces, u es un m´ınimo global de J en U.

Prueba:

1. Como u es un m´ınimo relativo de J en U, existe ε

0

> 0 tal que J (u) ≤ J (v), ∀v ∈ U ∩ B(u; ε

0

).

Por otro lado, fijado v ∈ U, existe ε

1

∈ (0, 1) tal que u + ε(v − u) ∈ B(u; ε

₀

), para ε ∈ (0, ε

₁

).

Evidentemente, al ser U un conjunto convexo, u + ε(v − u) ∈ U y podemos escribir δJ (u, v − u) = l´ım

ε→0⁺

J (u + ε(v − u)) − J (u)

ε ≥ 0.

2. Supongamos ahora que J es convexo en U y que se tiene ( 1.9) para u ∈ U. Veamos que u es un m´ınimo global de J en U. Efectivamente, sea v ∈ U; como J es convexo en U se tiene (ver ( 1.3))

J (v) ≥ J (u) + δJ (u, v − u) que junto a (1.9) proporciona que u es un m´ınimo global de J en U.

Es posible generalizar el resultado anterior al caso en el que J no es G-diferenciable en U, pero J es la suma de un funcional G-diferenciable y de otro que no lo es:

Ejercicio 1.2. Sean V un espacio normado, Ω ⊂ V un abierto, U ⊂ Ω un convexo no vac´ıo y J

1

, J

2

: Ω → R dos funcionales convexos en U. Supongamos que J

1

es G-diferenciable en Ω.

Pru´ ebese que u ∈ U es un m´ınimo de J

1

+ J

₂

en U si y s´olo si

δJ

₁

(u, v − u) + J

₂

(v) − J

₂

(u) ≥ 0, ∀v ∈ U.

Observaci´ on 1.8. La condici´ on (1.9) puede ser reescrita de forma equivalente en determinados casos particulares. As´ı,

1. Si u ∈ int U, entonces la condici´on ( 1.9) equivale a la ecuaci´ on de Euler (1.8).

2. Si U ⊆ V es una variedad af´ın, es decir, si U = u

0

+ W con u

0

∈ V y W ⊆ V un subespacio vectorial, entonces (1.9) equivale a la condici´ on

δJ (u, w) = 0, ∀w ∈ W.

3. En el caso particular en el que U ≡ W es un subespacio vectorial, no es dif´ıcil comprobar que (1.9) equivale a

δJ (u, v) = 0, ∀v ∈ W.

Si W = V volvemos a obtener la ecuaci´ on de Euler (1.8).

4. Supongamos que U es un cono convexo de V , es decir, U es un convexo que satisface la propiedad: si v ∈ U y λ ∈ [0, ∞), entonces λv ∈ U. Supongamos también que J es G- derivable en u ∈ U. En este caso también es fácil comprobar que la condición ( 1.9) equivale a:

δJ (u, u) = 0 y δJ (u, w) ≥ 0, ∀w ∈ U.

(22)

22 1.6. Aplicaciones

5. Veamos qu´ e igualdad obtenemos en los casos 2 y 3 cuando J es G-derivable en u y el subespacio W viene dado como la intersecci´ on de hiperplanos, es decir,

W = {v ∈ V : ha

_i

, vi

_V⁰_,V

= 0, ∀i : 1 ≤ i ≤ M } ≡

^⊥

Z, donde a

i

∈ V

⁰

(1 ≤ i ≤ M ) y Z = span {a

i

: 1 ≤ i ≤ M } ⊂ V

⁰

.

Supongamos por comodidad que V es un espacio de Banach reflexivo. Obs´ ervese que tanto en los casos 2 y 3, podemos escribir

u ∈ U y δJ(u) ∈ W

^⊥

≡

⊥

Z

⊥

≡ Z ≡ Z.

que, teniendo en cuenta la expresi´ on de W , se traduce en:

u ∈ U y δJ(u) +

M

X

i=1

λ

i

a

i

= 0,

con λ

_i

∈ R, con 1 ≤ i ≤ M. Los n´umeros reales λ

i

son los denominados multiplicadores de Lagrange.

Estudiaremos m´ as adelante problemas de m´ınimos con restricciones, donde la restricci´ on viene dada por condiciones de igualdad y desigualdad. En estos casos obtendremos condiciones necesarias de m´ınimo del mismo tipo de las obtenidas anteriormente.

Como resumen de todos los conceptos anteriores, se tiene:

OPTIMIZACI ´ ON CONVEXA: Supongamos que V es un espacio normado, U ⊆ V es un subconjunto convexo no vac´ıo y J : U → R es un funcional convexo. Planteemos el problema de m´ınimos:

(1.10)

( Minimizar J (v), Sujeto a v ∈ U.

Entonces,

1. Existencia: Supongamos adem´ as que V es un espacio de Banach reflexivo, U es cerrado, J es s.c.i. en U y que J es coercitivo cuando U es no acotado. Entonces, existe u ∈ U soluci´on del problema de m´ınimos (1.10), es decir, J tiene un m´ınimo global u en U.

2. Unicidad: Si J es estrictamente convexo en U, el problema de m´ınimos ( 1.10) a lo m´ as tiene una soluci´ on.

3. Caracterizaci´ on: Supongamos adem´ as que J es G-diferenciable en Ω ⊂ V , con Ω un abierto tal que U ⊂ Ω. Entonces, u ∈ U es soluci´on del problema de m´ınimos ( 1.10) si y s´ olo si

δJ (u, v − u) ≥ 0, ∀v ∈ U.

En este caso, J es convexo en U si y s´olo si

J (v) ≥ J (w) + δJ (w, v − w), ∀w, v ∈ U.

1.6. Aplicaciones

Analicemos en esta secci´ on dos sencillas aplicaciones de los anteriores conceptos. En ellas ob-

tendremos resultados sobre problemas de m´ınimo ya conocidos.

(23)

1.6.1. Primera Aplicaci´ on: Minimizaci´ on de un funcional cuadr´ atico

En primer lugar estudiaremos el problema de m´ınimo asociado a un funcional cuadr´ atico. Para ello consideremos un espacio de Hilbert V e introduzcamos el funcional (funcional cuadr´ atico) J : V → R dado por

(1.11) J (v) = 1

2 a(v, v) − hL, vi, ∀v ∈ V,

donde a(·, ·) : V × V → R es una forma bilineal, continua y sim´etrica y L : V → R es una forma lineal y continua en V , es decir, L ∈ V

⁰

. Evidentemente, existen constantes C

₁

, C

₂

> 0 (de hecho C

₂

= kLk

_V⁰

) tales que

( |a(v, w)| ≤ C

₁

kvkkwk, ∀v, w ∈ V,

|hL, vi| ≤ C

₂

kvk, ∀v ∈ V.

Supongamos que la forma bilineal a(·, ·) es coercitiva en V , i.e., existe α > 0 tal que

(1.12) a(v, v) ≥ αkvk

²

, ∀v ∈ V.

Aplicando los resultados anteriores, obtenemos

El funcional J es F-derivable en V (ver Ejemplos 1.4 y 1.5) y en este caso J

⁰

(v) ∈ L(V, R) = V

⁰

est´ a dada por

hJ

⁰

(v), wi

_V⁰_,V

= a(v, w) − hL, wi, ∀u, w ∈ V, (hJ

⁰

(v), wi

_V⁰_,V

= 1

2 (a(v, w) + a(w, v)) − hL, wi, ∀u, w ∈ V

si a(·, ·) no es sim´ etrica). Del Ejemplo 1.6 deducimos tambi´ en que J es dos veces G-diferenciable en V en cualquier direcci´ on h (de hecho, J es dos veces F-derivable en V ) y

δ

²

J (v; h, h) = a(h, h), ∀v, h ∈ V.

De la Proposici´ on 1.33 (ver tambi´ en el Ejemplo 1.7) y de la condici´ on (1.12) obtenemos que J es estrictamente convexo en V . Efectivamente, se tiene a(v, v) > 0 para cualquier v ∈ V con v 6= 0.

Adem´ as el funcional J es coercitivo en V . Efectivamente, podemos acotar



 

 

J (v) = 1

2 a(v, v) − hL, vi ≥ α

2 kvk

²

− kLk

_V⁰

kvk ≥ α

2 kvk

²

− 1

α kLk

²_V0

− α 4 kvk

²

= α

4 kvk

²

− 1 α kLk

²_V0

. De aqu´ı obtenemos la propiedad.

Fijemos ahora U ⊆ V un subconjunto cerrado convexo no vac´ıo y consideremos el problema de m´ınimos

(1.13)







Minimizar J (v) = 1

2 a(v, v) − hL, vi Sujeto a v ∈ U.

Del Corolario 1.19, la Proposici´ on 1.20 y el Teorema 1.35, deducimos el resultado

(24)

24 1.6. Aplicaciones

Teorema 1.36. En las condiciones anteriores, existe un ´ unico u ∈ U soluci´on del problema ( 1.13).

Adem´ as u ∈ U es soluci´on de ( 1.13) si y s´ olo si

a(u, v − u) − hL, v − ui

_V⁰_,V

≥ 0, ∀v ∈ U.

Observaci´ on 1.9. En el caso en el que U ≡ V , la condici´on necesaria y suficiente de m´ınimo para el problema (1.13) es

a(u, v) = hL, vi, ∀v ∈ V.

Obs´ ervese que en este caso, el Teorema 1.36 es el Teorema de Lax-Milgram.

Ejemplo 1.8. Consideremos el caso finito-dimensional. Sea V ≡ R

^N

, con N ≥ 1, y denotemos (·, ·) el producto escalar eucl´ıdeo en R

^N

. Consideremos tambi´ en A ∈ L(R

^N

), una matriz sim´ etrica y definida positiva, y b ∈ R

^N

. Con estos datos, hagamos

a(v, w) = (Av, w) = v

^T

Aw y hL, vi = (b, v), ∀v, w ∈ R

^N

.

En este caso es f´ acil comprobar que la forma bilineal a(·, ·) y la forma lineal L son continuas y, adem´ as, a satisface (1.12). Aplicando el Teorema 1.36 deducimos que el problema de m´ınimos (1.13) (planteado en un conjunto cerrado, convexo no vac´ıo U ⊆ R

^N

) admite una ´ unica soluci´ on u ∈ R

^N

y ´ esta est´ a caracterizada por

(Au − b, v − u) ≥ 0, ∀v ∈ U.

Cuando U ≡ R

^N

, la caracterizaci´ on de u se reescribe (ver Observaci´ on 1.9) Au = b,

es decir, el problema de m´ınimos (1.13) equivale a la resoluci´ on de un sistema lineal con matriz de coeficientes A y segundo miembro b.

1.6.2. Segunda Aplicaci´ on: Teorema de la Proyecci´ on

Como segunda aplicaci´ on de los conceptos recordados en este cap´ıtulo, consideremos el problema de la proyecci´ on de un elemento u

0

de un espacio de Hilbert V (con producto escalar denotado por (·, ·)) sobre un conjunto U ⊆ V cerrado, convexo y no vac´ıo. Para ello, consideremos el problema

(1.14)

( Hallar e u ∈ U tal que k u − u e

₀

k = ´ınf

v∈U

kv − u

₀

k.

Obs´ ervese que este problema puede ser reescrito como







Minimizar J (v) = 1

2 kv − u

₀

k

²

Sujeto a v ∈ U.

El funcional J puede tambi´ en escribirse como J (v) = e J (v) +

¹₂

ku

₀

k

²

, donde el nuevo funcional J est´ e a dado por (1.11) con

a(v, w) = (v, w) y hL, vi = (u

₀

, v), ∀v ∈ V.

Es f´ acil comprobar que a y L satisfacen las condiciones de la Secci´ on 1.6.1. En particular, a(·, ·)

es una forma bilineal, continua y coercitiva en U (satisface ( 1.12) para α = 1). Podemos aplicar

por tanto el Teorema 1.36 y deducir: