• No se han encontrado resultados

T027_10324686_T.pdf

N/A
N/A
Protected

Academic year: 2020

Share "T027_10324686_T.pdf"

Copied!
70
0
0

Texto completo

(1)

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE CIENCIAS NATURALES Y MATEM ´ATICA

DEPARTAMENTO ACAD ´EMICO DE MATEM ´ATICA

ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL

SUBDIFERENCIAL DE CLARKE

Tesis para obtar el T´ıtulo Profesional de Licenciado en

Matem´

atica

Miguel Angel Cano Lengua

(2)

M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE

Miguel Angel Cano Lengua

Tesis presentada a consideraci´on del Cuerpo Docente, de la Facultad de Ciencias Naturales y Matem´atica de la Universidad Nacional del Callao, como parte de los requisitos para obtener el T´ıtulo Profesional de Licenciado en Matem´atica.

Aprobada por :

Prof. Ruth Medina Aparcana, Lic. Presidente

Prof. Prof. Elmer Le´on Z´arate, Lic. Secretario

Prof. Erik Alex Papa Quiroz, DSc. Asesor

(3)

FICHA CATALOGR ´AFICA

CANO LENGUA MIGUEL ANGEL

M´etodo del punto proximal para minimizar funciones cuasi-convexas u-sando el subdiferencial de Clarke, Callao [2010].

ix, 71p., 29.7 cm. (UNAC, Licenciado en Matem´atica, 2010).

Tesis, Ciencias Naturales y Matem´atica. I. Matem´atica.

(4)
(5)

Agradecimientos

Al concluir con este trabajo, que presento para optar el T´ıtulo Profesional de Li-cenciado en Matem´aticas Pura, deseo manifestar mi gratitud a las siguientes personas:

• Al Doctor Erik Alex Papa Quiroz, por su amistad y confianza. Por haberme sugerido el tema, por su orientaci´on segura y constante durante la realizaci´on del presente trabajo.

• A la Licenciada Elsa Marisa Quispe C´ardenas, por su amistad, por su apoyo y sugerencia en la elaboraci´on y presentaci´on de la tesis.

• A los profesores de la facultad de Ciencias Naturales y Matem´atica de la Uni-versidad Nacional del Callao por ser parte de mi formaci´on profesional.

• A mis amigos de la facultad de Ciencias Naturales y Matem´atica de la Univer-sidad Nacional del Callao en especial a: Pascual, Isidro y Lenin.

• A mi madre y hermanos por su cari˜no, confianza y apoyo.

(6)

RESUMEN

M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE

Miguel Angel Cano Lengua Diciembre - 2010

Asesor: DSc. Erik Alex Papa Quiroz

Titulo Obtenido: Licenciado en Matem´atica

En este trabajo proponemos una extensi´on del m´etodo del punto proximal para mi-nimizar funciones cuasi-convexas sin restricciones usando el subdiferencial de Clarke. Resolveremos problemas de optimizaci´on que tiene la forma:

(P) min{f(x) :x∈IRn}

dondef :IRn→IR ∪ {+∞} es una funci´on propia semicontinua inferior.

Dado una sucesi´on {λk} de par´ametros positivos, el m´etodo genera una sucesi´on de puntos nxko, a partir de un punto inicial x0 IRn

, usando la siguiente regla:

Para cadak= 1,2,3, ...., Si 0∈∂fˆ (xk−1), donde ˆ∂f(x) es el subdiferencial de Clarke,

entonces para. De otro modo, buscamos unxk IRn

tal que:

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk).

Asumiendo que f es una funci´on lipchitziana, cuasi-convexa y no diferenciable pro-baremos que nxko converge a un punto candidato a soluci´on. Adem´as, daremos

algunos ejemplos de funciones que cumplan con las condiciones mencionadas y luego realizaremos algunos experimentos computacionales.

Palabras Claves:

(7)

ABSTRACT

PROXIMAL POINT METHOD TO MINIMIZE QUASICONVEX FUNCTIONS USING THE CLARKE SUBDIFFERENTIAL

Miguel Angel Cano Lengua December - 2010

Adviser: DSc. Erik Alex Papa Quiroz. Obtained Degree: Mathematician.

We propose an extension of the proximal point method for minimizing unconstrained quasiconvex functions using Clarke’s subdifferential.

We solve optimization problems of the form:

(P) min{f(x) :x∈IRn}

wheref :IRnIR ∪ {+∞} is a lower semicontinuous proper function.

Given a sequence {λk} of positive parameters, the method generates a sequence of points nxko, from an initial point x0 IRn, using the following rule: For each

k = 1,2,3, ...., If 0 ∈ ∂fˆ (xk−1), where ˆ∂f is Clarke’s subdifferential, then stop.

Otherwise, find xkIRn such that

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk).

Assuming thatf is a quasiconvex, lipchitzian and nondifferentiable function, we prove thatnxkoconverges to a candidate of the solution point of (P).Furthermore, we give

some examples and some numerical examples.

Keywords:

(8)

´

Indice

Introducci´on 1

1 Preliminares 5

1.1 S´ımbolos y Notaciones . . . 5 1.2 Definiciones B´asicas . . . 7 1.3 Subdiferenciabilidad . . . 11

2 Subdiferencial de Clarke 19

2.1 Generalizaci´on de la derivada . . . 19 2.2 Propiedades B´asicas . . . 19

3 El M´etodo de Punto Proximal 40

3.1 Resultados de convergencia Fej´er . . . 41 3.2 Resultados de convergencia . . . 44

4 Implementaciones y Aplicaciones 50

Bibliograf´ıa 60

(9)

Introducci´

on

En la actualidad existen diversas ´areas que dan soluci´on a problemas vinculados a las ciencias e ingenier´ıa, una de ellas es la Optimizaci´on Matem´atica que estudia la forma de encontrar la mejor soluci´on a un problema dado dentro de todas las posibles alternativas. El modelo general de optimizaci´on est´a dado por:

(P)

         

        

Opt. f(x) s.a:

gi(x)≤0, i= 1, . . . , m

hj(x) = 0, j = 1, . . . , p

donde f : IRn → IR es una funci´on dada, Opt. f(x) significa minimizar o maximizar la funci´onf, gi :IRn→IR y hj :IRn→IR son funciones dadas.

Una clase particular y bien amplia del modelo (P) es la optimizaci´on cuasi-convexa (problemas donde la funci´on objetivo f es cuasi-convexa, esto es

f(λx+ (1−λ)y)≤max{f(x), f(y)}, para todoλ ∈[0,1], para todox, y ∈IRn,y las funciones que definen las restriccionesgi yhj son cuasi-convexas). Este problema fue

estudiado en el a˜no de 1951 por Arrow y Enthoven [2] motivados por las aplicaciones de las preferencias y utilidades en la teor´ıa del consumidor y posteriormente por di-versos investigadores, por ejemplo Kannai [13], Diewert, Avriel y Zang [8], Avriel, Diewert, Schaible y Zang [3], Tanaka [22], Mangasarian [16], Fenchel [10], Hiriart -Urruty [12], Lemar´echal [14], entre otros.

(10)

donde las funciones involucradas no son diferenciables, han estudiado la generalizaci´on de las propiedades del gradiente para funciones no diferenciables. En este contexto se estudiaron el subgradiente y subdiferencial de funciones convexas (una funci´on f : IRn → IR es convexa si f(λx + (1−λ)y) ≤ λf(x) + (1− λ)f(y), para todo λ ∈ [0,1], para todo x, y ∈ IRn), y subgradiente y subdiferencial generalizado para

el caso no convexo, ver por ejemplo [6], donde aparecieron diversas generalizaciones dentro de ellos el subdiferencial de Clarke, [6] y [7]. Tambi´en se desarrollaron diversos m´etodos para resolver problemas de optimizaci´on, dentro los cuales destac´o el m´etodo del punto proximal, introducido por Martinet [18] y que consiste esencialmente en un m´etodo iterativo que resuelve en cada iteraci´on un problema m´as simple de tal manera que paso a paso, las iteraciones se aproximan a la soluci´on. Propiedades de conver-gencia del m´etodo proximal fueron probados para una clase bien amplia de funciones, llamadas funciones convexas quedando como una cuesti´on en abierto el problema de optimizaci´on cuasi-convexo.

Esta tesis est´a destinada a extender las propiedades de convergencia del punto proximal para resolver el siguiente problema de optimizaci´on

(P I)

            

min f(x) s.a:

x∈IRn

dondef :IRn→IR∪ {+∞} es una funci´on real no diferenciable y no convexa. El m´etodo del punto proximal para funciones convexas fue introducido por Martinet [18] en 1978 y fue muy estudiada por Rockafellar, [20] y [21], para resolver problemas m´as generales de encontrar ceros de operadores mon´otonos maximales. Este m´etodo, para el problema (P I) y para el caso donde f es convexa, genera una sucesi´on de puntos {xk}, a partir de un punto dado x0, tal que:

Dado k = 1,2, . . .. Si 0 ∈ ∂fˆ (xk−1), entonces para el algoritmo. De otro modo

buscamos unxk IRn tal que

xkargmin (

f(·) + λk 2

!

|| · −xk−1||2

)

(0.1) Fue demostrado que sif es convexa, propia y que la sucesi´on {λk} satisface:

(11)

entonces la sucesi´on nf(xk)o converge al ´ınfimo de f y si adem´as el conjunto de

soluciones ´optimas X∗ 6=, entonces nxko converge para una soluci´on del problema.

Esta tesis est´a motivada a resolver el problema (P I) cuandof es cuasi-convexa usando el m´etodo proximal. Para ello, debemos observar que debido a la no convexidad de f, el problema (0.1) no es necesariamente convexo, m´as a´un, no es necesariamente cuasi-convexo. Es por eso, que iteraci´on (0.1) puede ser m´as dif´ıcil de resolver que el problema original (P I). Para superar esta gran dificultad, proponemos la iteraci´on:

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk) (0.2)

lo que es m´as razonable de resolver desde el punto de vista te´orico y pr´actico ya que en vez de encontrar el puntoxkque minimize la funci´onf(·)+λk

2

||·−xk−1||2, s´olo

nece-sitamos encontrar un punto cr´ıtico generalizado del mismo. En este trabajo probamos la convergencia del m´etodo proximal usando la iteraci´on (0.2) bajo la hip´otesis que la funci´onf localmente de Lipschitz, cuasi-convexa y no diferenciable.

La organizaci´on de la tesis es la siguiente. En el Cap´ıtulo 1, presentamos las he-rramientas necesarias para el desarrollo de este trabajo, entre otros veremos algunos resultados del an´alisis convexo, definici´on de subdiferenciabilidad, teor´ıa de an´alisis funcional. En el Cap´ıtulo 2, presentamos la teor´ıa del subdiferencial de Clarke, gene-ralizaci´on de la derivada y las propiedades b´asicas. En el Cap´ıtulo 3, parte central de la tesis, presentamos el m´etodo propuesto y sus resultados de convergencia, En el Cap´ıtulo 4, presentamos la implementaci´on del m´etodo para algunas funciones y finalmente damos la bibliograf´ıa como fuente de informaci´on.

Este trabajo ha sido expuesto en :

• ”V Congreso Internacional de Matem´atica Aplicada y Computacional” realizado en la Universidad Nacional San Antonio de Abad del Cusco, Agosto del 2010.

• ”IV Seminario de Matem´atica Aplicada a la Ingenier´ıa” realizado en la Univer-sidad Ricardo Palma, facultad de Ingenier´ıa, Junio del 2008.

(12)
(13)

Cap´ıtulo 1

Preliminares

En este cap´ıtulo daremos los conceptos b´asicos que se necesitan para el mejor en-tendimiento y desarrollo de esta tesis.

1.1

S´ımbolos y Notaciones

f0(x, v) : Derivada direccional generalizada.

ˆ

∂f(x): Subdiferencial de Clarke.

∂cf(x) : Subdiferencial convexof enx. ||.|| : Norma Euclideana.

IRn+: El conjunto de las n-uplas cuyas componentes son no negativas. IRn

++: El conjunto de los n-uplas cuyas componentes son positivos.

B(x, ǫ): Bola abierta con centro x y radio ǫ

∇f: El gradiente de f lim inf: L´ımite inferior. lim sup: L´ımite superior.

max{a;b}: M´aximo entrea y b. xkx denota lim

k→+∞ xk =x.

DadoX ⊂IRn int(X) es el interior de X.

Sea Ω⊂IRnun abierto deIRn;Ck(Ω) ={f :U IR;f es k veces diferenciable en U}

P(IRn) : Conjunto de partes.

(14)

lim

y→x t↓0

supf(y+tv)−f(y)

t = infδ>0 kysupxk+t<δ

(15)

1.2

Definiciones B´

asicas

Definici´on 1.2.1 Una funci´on f : IRn → IR∪ {+∞} es llamada convexa en IRn si para todo x, y ∈IRn y para todo λ[0,1] se cumple que:

f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y).

Definici´on 1.2.2 Una funci´on f : IRn IR∪ {+∞} es llamada cuasi-convexa en

IRn si para todo x, y ∈IRn y para todo λ∈[0,1] se cumple que:

f(λx+ (1−λ)y)≤max{f(x), f(y)}.

Observaci´on:

Toda funci´on convexa es cuasi-convexa, pero el rec´ıproco no siempre se cumple. Por ejemplo considere la funci´onf(x, y) =−e−x2y2

es cuasi-covexa pero no es convexa.

Definici´on 1.2.3 Sea f : IRn IR una funci´on diferenciable en IRn. f es llamada

funci´on pseudoconvexa si para todo x, y ∈IRn tal que

h∇f(y);x−yi ≥0,

se tiene que f(y)≤f(x).

Definici´on 1.2.4 Sea f : IRn → IR es llamada semicontinua superior ensi para toda sucesi´on nxℓo

convergente a, tenemos: lim supl→∞f(xℓ)≤f(¯x).

f es llamada semicontinua inferior ensi para toda sucesi´on nxℓo convergente a x¯

se tiene que f(¯x)≤lim infl→∞f(xℓ).

Definici´on 1.2.5 Una funci´onf :IRn →IRes localmente lipschitziana con constante k en x∈IRn si existe alg´un ǫ0 tal que

|f(y)−f(z)| ≤kky−zk para todo z, y ∈B(x, ǫ).

Definici´on 1.2.6 Sea la funci´on f :IRnIR es llamada subaditiva si:

f(x+y)≤ f(x) +f(y), para todo x, y ∈IRn .

(16)

f(λ.x) =λ.f(x), para todo λ≥0.

Definici´on 1.2.8 Sea la funci´on f :IRn IR∪ {+∞} es llamada funci´on propia si

(a)domf 6=∅.

(b) ∀x∈domf,tenemos que f(x)>−∞.

Definici´on 1.2.9 (Operadores acotados en un espacio de Hilbert) Sean E y F es-pacios normados (sobre el mismo cuerpo). Se dice que un operador T : E → F, es acotado si T es lineal y

Supkxk=1{kT xk}<∞.

Que el operador lineal T : E → F sea acotado significa, que existe una constante M >0 tal que kT xk ≤M, para todo x∈E, con kxk= 1.

Teorema 1.2.1 Un operador lineal entre espacios normados es continuo si, y s´olo si, este es acotado.

Demostraci´on: Ver Nieto [19], Teorema 9.1 pp:94.

Teorema 1.2.2 (Teorema de representaci´on de Fr´echet-Riesz) Sea H un espacio de Hilbert. Si f es una aplicaci´on lineal acotada de H, entonces existe un vector y∈H, y uno solo, tal que

f(x) =hx;yi,para todo x∈H

Adem´as, kyk=kfk.

Demostraci´on: Ver Nieto [19], Teorema 9.11 pp:103.

Teorema 1.2.3 Sea f : IRn → IR∪ {+∞} una funci´on propia. Entonces, f es cuasi-convexa si, y s´olo si, el conjunto {x∈IRn:f(x)c} es convexo, para cada

(17)

Demostraci´on: Ver Bazaraa [5], Teorema 3.5.2. pp:108. Para el caso diferenciable usamos el siguiente resultado.

Teorema 1.2.4 Sea f : IRn IR una funci´on diferenciable. entonces, f es

cuasi-convexa si, y s´olo si, ∀x, y ∈IRn tal que f(x)≤f(y), se tiene que

h∇f(x);x−yi ≤0.

Demostraci´on: Ver Bazaraa [5], Teorema 3.5.4. pp:109.

Teorema 1.2.5 (Hahn-Banach) Sea X un espacio vectorial lineal real , Y un sub-espacio de X. Si p:X →IRes un funcional positivamente homog´eneo,subaditiva y f : Y → IR, un funcional lineal tal que f(y) ≤ p(y) para todo y ∈ Y. Entonces, existe un funcional F :X →IR tal que ;

F(y) =f(y), para todo y∈Y. F(x)≤p(x), para todo x∈X.

Demostraci´on: Ver Friedman [11], Teorema 2.1.6. pp:14.

Teorema 1.2.6 (Teorema del valor medio) Sea f : [a, b]→IR una funci´on tal que. (i) f es continua en el intervalo [a, b] ;

(ii) f es diferenciable en el intervalo abierto (a, b).

Entonces, existe un n´umero c en el intervalo abierto (a, b) tal que

f(c) = f(b)−f(a) b−a

Demostraci´on: Ver Leithold [15], Teorema 4.3.2. pp:306-307.

Teorema 1.2.7 (Teorema del valor medio para funciones de varias variables) Sea Ω ⊆ IRn un conjunto abierto y sea f : Ω → IRn. suponga quecontiene a los puntos a, b y al segmento de l´ınea S que une a estos puntos y que f es diferenciable en todo punto de S. Entonces existe un punto cen S tal que;

kf(b)−f(a)k ≤ kDf(c)(b−a))k

(18)

Definici´on 1.2.10 (Conjunto acotado)

Se dice que un conjunto S ⊂ IRn est´a acotado si est´a contenido totalmente en una n-bola B(a, r) para alg´un r >0 y alg´un a∈IRn.

Definici´on 1.2.11 Un conjunto S ⊂IRn es cerrado si su complemento denotado por

¯

S es un conjunto abierto.

Teorema 1.2.8 Un conjunto Z es cerrado, si y s´olo si, para todo nzlo Z tal que

zlz¯ entonces z¯Z.

Demostraci´on: Ver Elon L. [9], pp:38-39.

Teorema 1.2.9 (Heine-Borel)

SeaF un recubrimiento abierto de un conjuntoAdeIRn,cerrado y acotado. Entonces existe una subcolecci´on finita de F que tambi´en recubre a A.

Demostraci´on: Ver Apostol T.M. [1], pp:70-71.

Definici´on 1.2.12 (Conjunto Compacto)

Un conjuntoS ⊂IRnse llama compacto, si y s´olo si, cada recubrimiento deS contiene

un subcubrimiento finito; esto es, una subcolecci´on finita tambi´en recubra a S. El teorema de Heine-Borel establece que todo conjunto de IRn, es compacto si y solo

(19)

1.3

Subdiferenciabilidad

Definici´on 1.3.1 Se define la derivada direccional de f enx en la direcci´on v ∈IRn como:

f′(x, v) =limt↓0

f(x+tv)−f(x)

t .

Si f es diferenciable en x, entonces la derivada direccional existe en toda direcci´on v ∈IRn, f′

(x;v) es una funci´on lineal de v tenemos la siguiente relaci´on:

f′(x, v) =h∇f(x);vi

Teorema 1.3.1 Sea f :IRn →IR una funci´on convexa. Entonces para cadax∈IRn, tenemos:

(i) f′(x, v) = max{hǫ;vi;ǫ∈∂cf(x)} ∀v ∈IRn

(ii) ∂cf(x) = n

ǫ ∈IRn :f

(x, v)≥ hǫ;vi,∀v ∈IRno

(iii) ∂cf(x) 6= φ es un conjunto convexo y compacto, tal que kǫk ≤ k para todo

ǫ∈∂cf(x), donde k es una constante de Lipchitz para fen x;

(iv) El conjunto de las aplicaciones∂cf :IRn →IR es semicontinua superior, es decir,

si yℓ x y ǫ

cf(yℓ) para cada, entonces cada punto de acumulaci´on ǫ de (ǫℓ)

est´a en ∂cf(x).

Demostraci´on:Ver Makela [17], pp:151.

Definici´on 1.3.2 Sea f :IRn →IRuna funci´on, dado x∈IRn es un subgradiente de f en x si:

f(y)≥f(x) +hs;y−xi,∀y∈IRn.

El conjunto de todos los subgradientes es llamado subdiferencial convexo de f en x y es denotado por ∂cf(x), esto es,

∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}.

Proposici´on 1.3.1 Seaf :IRn IR∪{+∞} una funci´on convexa yx¯int(domf).

(20)

∂cf(¯x) ={∇f(¯x)}.

Demostraci´on: Ver Makela [17], Teorema 2.1.6. pp:14.

Teorema 1.3.2 Sea f : IRn IR una funci´on convexa con constante de Lipschitz

k >0, entonces se cumple:

(i) La derivada direccional en cada direcci´on v ∈IRn existe y satisface

f′(x, v) =inft>0

f(x+tv)−f(x)

t ;

(ii) La funci´on v →f′(x, v) es positivamente homog´enea y subaditiva sobre IRn con

f

(x, v)

≤kkvk,

(iii) f′

(x, v) es una funci´on semicontinua superior en (x;v) y es una funci´on de Lip-chitz con constante k sobre IRn,

(iv) −f′

(x, v)≤f′

(x, v).

Demostraci´on:Ver Makela [17], pp:9-12.

Ejemplo 1.3.1

Sea la funci´on f(x) = |x|veamos como es su subdiferencial convexo. Se sabe que:

|x|=

  

 

x, x≥0

−x, x <0

(i) Si x= 0, tenemos

∂cf(0) ={ξ∈IR :|y| ≥ |0|+ξ.y,∀y∈IR}.

Vemos que:

Si; y= 0 entonces ξ∈IR.

(21)

cuya gr´afica es:

Si; y <0 entonces −y ≥ξ.y ; luego −1≤ξ. Interceptando los conjuntos tenemos:

ξ ∈[−1,1].

Asi,

∂f(0) = [−1,1]. (ii) Si x >0; tenemos:

∂cf(x) = {ξ∈IR :|y| ≥ |x|+ξ.(y−0),∀y∈IR}

∂cf(x) = {ξ∈IR :|y| ≥x+ξ.(y−0),∀y∈IR}

Vemos que, si y= 0 entonces:

0≥x−ξ.x, que es equivalente a

0≥x(1−ξ), lo que implica que

(22)

Ahora si y >0; consideramos y 6=x, tenemos: y−x >0∨y−x <0 Siy−x <0 tenemos lo siguiente:

y≥x+ξ(y−x)

y−x≥ξ(y−x) lo que implica que

ξ ≥1

Si y−x >0 tenemos lo siguiente:

y≥x+ξ(y−x)

y−x≥ξ(y−x) lo que implica que

ξ≤1. Ahora si y >0; consideramos y=xtenemos

y≥x+ξ(y−x)

y−x≥ξ(y−x) ξ ∈IR

Interceptando los conjuntos tenemos que: ξ= 1

∂cf(x) = 1, ∀x >0.

(iii) Si x <0 tenemos

∂cf(x) = {ξ∈IR :|y| ≥ −x+ξ.(y−0),∀y∈IR}.

Se analiza en forma an´aloga para los casos cuando y = 0; y > 0, y < 0 entonces se obtiene que:

ξ=−1, y por lo tanto

(23)

De (i),(ii) y (iii) se concluye que:

∂cf(x) =       

     

1; x >0

−1; x <0 [−1,1] ; x= 0 Ejemplo 1.3.2

Sea f :IR→IRdefinida como :

f(x) =

  

 

1−x; x <1 x2 1, x1

Verificar su subdiferenciabilidad.

cuya gr´afica es:

Sabemos que:

∂cf(x) = {s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}

(24)

(a) Siy <1 entonces f(y) = 1−y, reemplazando en la definici´on;

1−y ≥1−x+s(y−x), lo que es equivalente a;−(y−x)≥s(y−x)...(i) veamos los siguientes casos:

• Si (y−x)>0 simplificando en (i); se tiene:

−1≥s,entonces s∈ h−∞,−1].

• Si (y−x)<0; simplificando en (i); se tiene:

−1≤s,entonces s∈[−1,∞i.

• Si y=x simplificando en (i); se tiene: 0≥s.0, se cumple; ∀s∈IR

Iterceptando los conjuntos tenemos: s=−1

(b) Siy = 1 entonces f(y) = 0,reemplazando en la definici´on; 0≥1−x+s(y−x),lo que es equivalente a;−s(1−x)≥(1−x) como (1−x)>0,entonces −s ≥1;s∈ h−∞,−1]

de s= -1 ∧ s∈ h−∞,−1] se tiene : s= -1

(c) Siy >1 entonces f(y) = y21, reemplazando en la definici´on;

y211x+s(yx), tomando s =1 se tiene;

(y−1)(y+ 1)≥1−x+ (−1)(y−x) lo que equivale a; (y−1)(y+ 1)≥1−x−y+x simplificando se tiene: y≥ −2 (lo cual es verdadero)

Luego de (a),(b) y (c) tenemos: ∂cf(x) = −1.

2. Si, x= 1 entonces; f(x) = 0 (a) Siy <1 entonces f(y) = 1−y,

(25)

(b) Siy ≥1 entoncesf(y) =y21

f(y)≥f(x) +s(y−x), lo que equivale a;

y210 +s(y1) se tiene (y1)(y+ 1)s(y1)

lo equivale a (y+ 1)≥s tomando limy→1f(y),

obtenemos s≤2 luego s∈ h−∞,2] de (a) y (b) se tiene: ∂cf(x) = [−1,2]

3. Si, x >1, entonces x∈ h1,∞i; f(x) = x21

se tiene los siguientes casos:

(a) Siy ≥1 entoncesf(y) =y21, tenemos de la definici´on;

∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}

se tiene: (y−x)2 0, desarrollando el binomio tenemos

y2+x2 2xy, lo que es equivalente a: y21≥ −1x2+ 2xy

y21x21 + 2xy2x2, lo que equivale a: y21x21 + 2x(yx)

f(y)≥f(x) +s(y−x), obtenemos: s= 2x (b) Siy <1 entonces f(y) = 1−y,

se tiene: 1−y ≥(x21) + 2x(yx), x >1; y <1

lo que equivale a: 1−y≥ −x21 + 2xy

lo que equivale a: 0≥ −x22 +y(1 + 2x)...(∆)

tenemos los siguientes casos:

• Si y ≤0 remplazando en (∆) es verdadero

• Si 0< y < 1 y x >1 tenemos lo siguiente:

y(1 + 2x)<(1 + 2x)lo que equivale a: −x22 +y(1 + 2x)<x21 + 2x

lo que equivale a: −x22 +y(1 + 2x)<(x22x+ 1)

lo que equivale a: −x22 +y(1 + 2x)<(x1)2 <0 es verdadero

de (a) y (b) tenemos: ∂cf(x) = 2x

(26)

∂Ff(x) =       

     

(27)

Cap´ıtulo 2

Subdiferencial de Clarke

2.1

Generalizaci´

on de la derivada

Definici´on 2.1.1 Dado f : IRn → IR localmente lipschitziana en el punto x ∈ IRn. La derivada direccional generalizada de f enx,en la direcci´on de v ∈IRn,es definida

por

f0(x, v) = limyx

t↓0

supf(y+tv)−f(y) t

Debemos notar quef◦

siempre existe gracias a la condici´on de localmente lipschitz de

la funci´on f.

2.2

Propiedades B´

asicas

Teorema 2.2.1 Sea f localmente lipschitziana en x con constante k >0 entonces: (i) La funci´on v 7→f0(x, v) es positivamente homog´enea y subaditiva en IRn

con

|f0(x, v)| ≤k||v||.

(ii) f0(x, .) es una funci´on semicontinua superior y lipschitziana con constante k sobre IRn.

(28)

Demostraci´on.

(i) de la Definici´on 2.1.1

f0(x, v) = limyx

t↓0

supf(y+tv)−f(y)

t .

Tomando valor absoluto y aplicando una propiedad de l´ımite superior se tiene:

|f0(x, v)| ≤ ylimx

t↓0

sup

f(y+tv)−f(y) t

De la condici´on de localmente lipschitziana se tiene (Definici´on.1.2.5):

|f0(x, v)| ≤ lim

y→x t↓0

supk.||(y+tv)−(y)|| t

As´ı

|f0(x, v)| ≤ylim

→xkt ||v||

t =k||v||, y por lo tanto,|f0(x, v)| ≤k||v||.

Ahora mostraremos que la derivada es positivamente hom´ogenea, dondeλ >0:

f0(x, λv) = lim

y→x t↓0

supf(y+tλv)−f(y) t

= limyx

t↓0

supλ

(

f(y+tλv)−f(y) λt

)

= λylimx

t↓0

sup

(

f(y+tλv)−f(y) λt

)

= λf0(x, v)

Demostraremos la sub-aditividad. Seanv, w∈IRnarbitrarios, tomaremos valor absoluto y aplicaremos la propiedad de l´ımite superior

f0(x, v+w) = limyx

t↓0

supf(y+t(v+w))−f(y) t

= limyx

t↓0

(29)

ylimx

t↓0

supf((y+tw) +tv)−f(y+tw) t + limy→x

t↓0

supf(y+tw)−f(y) t

≤ f0(x, v) +f0(x, w)

As´ı,v 7→f0(x, v) es subaditiva.

(ii) Sean nxℓo

,nvℓo

⊂ IRn dos sucesiones tales que xℓ x y v v, por la

definici´on de l´ımite superior

f0(x, vℓ) = inf

δ>0 (y,t)supB((x,0))

f(y+tvℓ)f(y)

t

!

≤ sup

||(y,t)−(x,0)||<δ

f(y+tvℓ)f(y)

t , ∀δ > 0 = sup

||y−x||+t<δ

f(y+tvℓ)f(y)

t , ∀δ >0 Sea δ= 1 → ∃{yℓ},{t}>0 tal que:

f0(x, vℓ)< f(yℓ+tℓvℓ)−f(yℓ)

tℓ +

1 ℓ,

||yℓ−x||+tℓ < 1

ℓ, ∀ℓ∈IN tenemos as´ı,

f0(x, v) 1

ℓ = ylim→xℓ

t↓0

supf(y+t

v)f(y)

t −

1 ℓ

≤ f(y

+tv)f(y)

tℓ

= f(y

+tv)f(y)

tℓ +

f(yℓ+tv)f(y+tv)

tℓ

y por la condici´on de lipschitzianidad

|f(yℓ+tv)f(y+tv)|

t ≤k

||tℓvtv||

tℓ =k||v

v|| →0

Mientras ℓ→ ∞ probamos yℓ+tv, y+tv B(x, ǫ) obtenemos:

lim

ℓ→∞supf

0(x, v) lim ℓ→∞sup

f(yℓ+tv)f(y)

tℓ ≤f

(30)

luego limℓ→∞supf0(xℓ, vℓ)≤f0(x, v),

lo que establece la semicontinuidad superior.

Se mostrar´a la condici´on de Lipschitz. Sean v, w∈IRn, si y+tv y y+tw ∈B(x, ǫ) entonces

f(y+tv)−f(y+tw)≤kt||v−w||.

Ordenando,

f(y+tv)−f(y) +f(y)−f(y+tw)≤kt||v−w||

tomando l´ımite superior se tiene:

lim

y→x t↓0

supf(y+tv)−f(y)

t ≤ ylim→x t↓0

f(y+tw)−f(y)

t +k||v−w|| lo que es equivalente a:

f0(x, v)−f0(x, w) ≤ k||v−w||

(iii)

f0(x,−v) = limyx

t↓0

supf(y−tv)−f(y) t

= limyx

t↓0

supf(m+tv−tv)−f(m+tv) t

= limyx

t↓0

supf(m)−f(m+tv) t

= limyx

t↓0

sup(−f)(m+tv)−(−f)(m)] t

= (−f)0(x, v) donde,m =y−tv.

Esto completa la prueba.

Definici´on 2.2.1 Sea f :IRn IR una funci´on localmente lipschitziana en x IRn

entonces el sub-diferencial, en el sentido de Clarke, de f en x es el conjunto

ˆ

(31)

Cada elemento ξ ∈∂fˆ (x) es llamado subgradiente, en el sentido de Clarke, de f enx.

Ejemplo 2.2.1

La funci´on f(x) = x2sen(1

x) es diferenciable excepto en el punto cero, hallaremos el

subdiferencial de Clarke en este punto. Su gr´afica es:

Usando la definici´on de la derivada generalizada tenemos:

f0(x, v) = limyx

t↓0

sup(y+tv)

2sen( 1

y+tv)−y

2sen(1

y)

t

Tomandox= 0 y por definici´on de subdiferencial de Clarke tenemos:

ˆ

∂f(0) = {r∈IR:f0(0, v)r.v, v IR}

= {r∈IR: limy

→x t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

(y+tv)2sen( 1

y+tv)−(y)

2sen(1

y)

(32)

= {r∈IR: lim

t↓0 sup

t2v2.sen( 1

t.v)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

v.sen( 1

t.v)

1

t.v

≥r.v}

= {r∈IR:v ≥r.v}

(i) Si v ≥0 entonces se tiene 1≥r (ii) Si v <0 entonces se tiene 1≥ −r

De (i) y (ii) se tiene r∈[−1,1],luego

ˆ

∂f(0) = [−1,1].

Teorema 2.2.2 Sea f :IRn →IR∪ {+∞} una funci´on propia semicontinua inferior y cuasi-convexa. Si g ∈∂f,ˆ y f(y)≤f(x) entonces

hg;y−xi ≤0

Demostraci´on.

Comog ∈∂fˆ(x) se tiene f0(x, v)≥ hg;vi; para todov IRn

Luego tenemos: f0(x, v) = limyx

t↓0

supf(y+tvt)−f(y) ≥ hg;vi

lo cual es equivalente a: infδ>0 supky−xk+t<δ

f(y+tv)−f(y)

t ≥ hg;vi

en particularv =y−x tenemos supky−xk+t<δ

f(y+t(y−x))−f(y)

t .

Tomandoδ = n1,para todo n∈N, entonces existe {yn},{tn}>0

tal que kynxk+tn 0 luego se tiene:

supky−xk+t<δ

f(y+t(y−x))−f(y)

t <

f(yn+tn(ynx))f(y)

t +

1

n

lo que es equivalente a: hg;y−xi ≤ f(yn+tn(ynt−x))−f(y) + 1

n

efectuando operaciones tenemos:

hg;y−xi ≤ f((−tn)x+(1+ttn)yn)−f(y) + 1

n como f es cuasi-convexa y f(x)≥f(y)

tenemos: hg;y−xi ≤ f(x)−tnf(yn)+

1

(33)

tomando l´ımite obtenemos: hg;y−xi ≤0.

Ejemplo 2.2.2

Dada la siguiente funci´on:

f(x) =

  

 

4, |x| ≥4

|x|, |x|<4 Obtendremos el subdiferencial de Clarke para todox∈IR. De la definici´on:

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IRn}

La gr´afica es

a) Si x <−4 entonces x∈ h−∞,−4i se tiene que f(x) = 4

ˆ

∂f(x) = {r∈IRn/f0(x, v)≥r.v, ∀v ∈IR}

= {r∈IR: limyx

t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

4−4

(34)

= {r∈IR: lim

t↓0

0

t ≥r.v} Luego se obtiene : ˆ∂f(x) = {0}

b) Si x=−4 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales

c) Si −4< x < 0 entoncesx∈ h−4,0i se tiene que f(x) = −x

ˆ

∂f(x) = {r ∈IRn :f0(x, v)r.v, v IR}

= {r ∈IR: limy

→x t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r ∈IR: lim

t↓0 sup

−(y+tv) +y

t ≥r.v} = {r ∈IR: lim

t↓0

−tv

t ≥r.v} = −v ≥r.v

Siv ≥0 entonces, −1≥r Si v <0 entonces, −1≤r

Luego se obtiene : ∂fˆ (x) = {−1}

d) Si x= 0 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales

Veamos cuando y → 0− tenemos f(x) = kxk entonces por el ejemplo 1.3.1 se

tiene;

ˆ

∂f(0) ={r∈IRn/f0(0, v)r.v, v IRn}

ˆ

∂f(0) = [−1,1]. e) Si 0< x < 4 entoncesx∈ h0,4i

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}

= {r∈IR: limyx

t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

(y+tv)−y

t ≥r.v} = {r∈IR: lim

t↓0

tv

(35)

Si v ≥0 entonces, 1≥r Siv <0 entonces, 1≤r

Luego se obtiene : ˆ∂f(x) = {1}.

f) Si x= 4 Aplicando el subdiferencial Clarke

g) Si x >4 entonces x∈ h4,∞i se tiene que f(x) = 4

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}

= {r∈IR: limyx

t↓0

sup f(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

4−4

t ≥r.v} = {r∈IR: lim

t↓0

0

t ≥r.v}

Luego se obtiene : ˆ∂f(x) = {0}.

Luego interceptando de (a),(b),(d),(e),(f), y (g) tenemos:

ˆ

∂f(x) =

                          

0, x >4∨x <−4 φ, x= 4∨x=−4

−1, −4< x <0 [−1; 1], x= 0 1, −0< x <4

Teorema 2.2.3 Sea f una funci´on localmente Lipschitz enx con constante k (i) ˆ∂f(x) es un conjunto no vacio, convexo y compacto tal que ||ξ|| ≤k,

∀ξ∈∂fˆ (x).

(ii) f0(x, v) = max{hξ;vi:ξ∂fˆ (x)}, v IRn

(36)

(iii) La aplicaci´on∂fˆ (·) :IRn P(IRn) es semicontinua superior.

Demostraci´on.

(i) Del Teorema 2.2.1, item 1 la funci´on f0(x,·) : IRn

IR es positivamente homog´enea y subaditiva entonces por el Teorema de Hahn-Banach (Teorema 1.2.5) y el Teorema de representaci´on de Riez, ver Teorema 1.2.2 existe un vectorξ ∈IRn tal que

hξ;vi ≤f0(x, v),∀v ∈IRn

Para probar la convexidad, seanξ, ξ′ ∂fˆ (x) y λ[0,1], entonces

hλξ+ (1−λ)ξ′;vi = hλξ;vi+h(1λ)ξ;vi

= λhξ;vi+ (1−λ)hξ′;vi ≤ λf0(x, v) + (1−λ)f0(x, v) = f0(x, v),

por lo tanto,λξ+ (1−λ)ξ′ ∂fˆ (x) y as´ı ˆ∂f(x) es convexo.

Demostraremos que ˆ∂f(x) es compacto, esto es, ˆ∂f(x) es acotado y cerrado. Probaremos que ˆ∂f(x) es acotado∀x∈IRn.

Por la definici´on de Subdiferencial y el Teorema 2.2.1, item 1, tenemos

||ξ||2 =hξ;ξi ≤ |f0(x, ξ)| ≤k||ξ||, ∀ξ∈∂fˆ (x)

esto es,

||ξ||2 ≤ k||ξ||, ∀ξ∈∂fˆ (x)

esto implica que

||ξ|| ≤ k, ∀ξ∈∂fˆ (x)

entonces, ˆ∂f(x) es acotado.

(37)

Sea nξℓo∂fˆ (x) una sucesi´on tal que ξξ. Probaremos queξ ∂fˆ (x).

Tenemos:

hξ;vi=

lim

l→∞ξ

;v = lim ℓ→∞

D

ξℓ;vE

≤ lim

ℓ→∞f

0(x, v)

≤ f0(x, v), ∀v ∈IRn.

entonces,ξ ∈∂fˆ (x). Por tanto, ˆ∂f(x) es cerrado.

(ii) Por ser ˆ∂f(x) continua y compacto y de la definici´on de la subdiferencial

f0(x, v)≥max{hξ;vi:ξ ∈∂fˆ (x)}, ∀v ∈IRn (2.2)

Probaremos ahora que

f0(x, v)≤max{hξ;vi:ξ∈∂fˆ (x)}, ∀v ∈IRn.

Por contradicci´on, supongamos que existevℓ ∈IRn tal que

f0(x, vℓ)>max{hξ;vℓi:ξ ∈∂f(x)} ≥ hξ;vℓi, ∀ξ∈∂fˆ (x)

⇒f0(x, vℓ)> f0(x, vℓ)(lo que es una contradicci´on con(2.2)).

Luego,

f0(x, v) = max{hξ;vi/ξ ∈∂f(x)}, ∀ ∈IRn.

(iii) Sea nyℓoIRn y (ξ)∂f(y) para cada (ℓ), tal queyx y ξξ,

entonces∀v ∈IRn tenemos

hξ;vi=

lim

ℓ→∞ξ

;v= lim i→∞

D

ξℓ;vE

≤ lim

ℓ→∞supf

0(y, v).

Por el Teorema 2.2.1, ii , f0(x,·) es semicontinua superior entonces,

hξ;vi ≥f0(x, v)

(38)

Teorema 2.2.4 Sea f : IRn IR una funci´on localmente lipschitz en x y

dife-renciable en x, entonces:

∇f(x)∈∂fˆ (x)

Demostraci´on.

Por la definici´on de diferenciabilidad la derivada direccional f′(x, v) existe v IRn

y

f′(x, v) = h∇f(x);vi, ∀v ∈IRn vemos que:

f(y+tv)−f(y)

t ≤(x,t)∈supB((x,0),δ)

f(y+tv)−f(y)

t , ∀(y, t) :||y−x||+t < δ,∀δ >0, en particular,

f(x+tv)−f(x)

t ≤(y,t)∈supB((x,0),δ)

f(y+tv)−f(y)

t , ∀δ >0, ∀t < δ, Luego tomando l´ımite cuando t→0

lim

t→∞

f(y+tv)−f(x)

t ≤f

0(x, v)

f′(x, v)≤f0(x, v) Se sigue que:

f0(x, v)≤ h∇f(x);vi, ∀v ∈IRn.

Por tanto, ∇f(x)∈∂fˆ (x)

Lema 2.2.5 Si f es continuamente diferenciable en x entonces f es localmente lip-schitziana en x.

Prueba.

De la hip´otesis, sea F :IRn →L(IRn, IR) tal que, para cada x∈IRn se tiene F(x) = Fx :IRn→IR definido por Fx(v) =h∇f(x);vi Por demostrar que F

(39)

Sea w∈B(x, γ), (B(x, γ) es la vecindad def, donde es locamente lipschitiziana )

∀ǫ >0,∃ kFy(v)−Fw(v)k>0 :ky−wk< δ ⇒ kFy −Fwk< ǫ kFy −Fwk=Supv6=0

kFy(v)−Fw(v)k

kvk < kky−wk

Tomandoδ tal que δ < ǫ/k, se tiene

kFy −Fwk ≤kky−wk< kδ < ǫ

entonces F es continua en una vecindad de x.

Luego se tiene que: F es acotada en una vecindad de x. por Teorema 1.2.1 Entonces kFxk ≤M

kFx(v)k

kvk ≤Supv6=0

kFx(v)k kvk ≤M

Luego se tiene:

h∇f(x);vi

kvk ≤M,

tomando v =∇f(x) se tiene k∇f(x)k ≤M para todow∈B(x, γ).

Sean y, y′ B(x, ǫ), entonces por el teorema del valor medio, existe z (y, y)

B(x, ǫ) tal que:

f(y)−f(y′) =| h∇f(z), y−y′i | ≤ ||∇f(z)|| ||y−y′||

|f(y)−f(y′)| ≤ ||∇f(z)|| ||y−y′|| |f(y)−f(y′)| ≤ M||y−y′||

por lo tanto, cumple la condici´on de Lipschitziana enx.

Teorema 2.2.6 Si f es continuamente diferenciable en x, entonces ˆ

∂f(x) ={∇f(x)}

Demostraci´on.

(40)

continuidad diferenciable, si xi →x, entonces el ∇f(xℓ) converge a ∇f(x), tenemos

que∀v ∈IRn

lim

xℓxf

(x

, v) = lim

xℓxlimt↓0

f(xℓ+tv)f(x)

t = lim

xℓx

D

∇f(xℓ), vE

= h∇f(x);vi

= f′(x, v)

para todov ∈IRn se tiene,

f′(x, v) = lim

xℓxf

(x, v) = lim xℓx

t↓0

f(xℓ+tv)f(x i)

t

= lim

xℓx

t↓0

supf(x

+tv)f(x)

t

= f0(x, v)

As´ı tenemos quef0(x, v) = h∇f(x), vi,v IRn

. Supongamos que se tieneξ∈∂fˆ (x), para alg´un ξ6=∇f(x) entonces existe v0 ∈IRn tal que

h∇f(x);v0i=f(x, v0)>hξ;v0i

ahora,

h∇f(x);−v0i=f(x, v0)≥ hξ;−v0i

es equivalente

h∇f(x);v0i ≥ − hξ;v0i

h∇f(x);v0i ≤ hξ;v0i

lo cual es una contradicci´on con la hip´otesis. Entonces,∇f(x) es el ´unico subgra-diente def enx.

Teorema 2.2.7 Si la funci´on f : IRn IR es convexa y localmente lipschitz en

(41)

(a) f′(x, v) = f0(x, v),v IRn.

(b) ∂cf(x) = ˆ∂f(x)

Demostraci´on.

Si (a) es verdadero, entonces (b) se sigue de la definici´on del subdiferencial en el sentido de Clarke (Definici´on 2.1.1) y del Teorema 1.3.1-ii. As´ı es suficiente probar la parte (a).

Por la definici´on de la derivada direccional generalizada, se tiene f0(x, v)≥f′(x, v), v ∈IRn.

Por otro lado siδ > 0 fijo, entonces f0(x, v) = lim

x′x

t↓0

supf(x

+tv)f(x)

t

= lim

ǫ↓0 ||x′supx||

supf(x

+ǫv)f(x)

t de la prueba del Teorema 1.3.2 tenemos la funci´on

φ(t) = (1/t)(f(x′+tv)−f(x′)) es no decreciente, se puede escribir

f0(x;v) = lim

ǫ↓0 ||xsupx||<ǫδ

f(x′+ǫv)f(x)

ǫ

Por la condici´on de Lipschitz para alg´un x′ B(x;ǫδ) tenemos

f(x′+ǫv)f(x)

ǫ −

f(x+ǫv)−f(x) ǫ ≤

f(x′+ǫv)f(x+ǫv)

ǫ +

f(x)−f(x′)

ǫ ≤ k

ǫ||x

x||+k

ǫ||x

x||

≤ 2k

ǫ ||x

x||

≤ 2k

ǫ (ǫδ)

≤ 2kδ.

f0(x, v)≤lim

ǫ↓0

f(x+ǫv)−f(x)

ǫ + 2δk=f

(x, v) + 2δk

(42)

Definici´on 2.2.2 La funci´on f : IRn IR es regular en x IRn, si v IRn la

derivada direccional f′(x, v) existe y

f′(x, v) = f0(x, v).

Algunas condiciones para que f sea regular.

Teorema 2.2.8 Sea f lipschitz enx si se cumple: (a) f es continuamente diferenciable en x.

(b) f es convexo.

(c) f =Pm

i=1λifi, dondeλi >0yfi es regular enxpara cada i= 1, ..., m, entonces

f es regular en x.

Prueba.

(a) Si f es continuamente diferenciable, entonces la derivada direccional f′(x, v)

existe para todov ∈IRn y por la prueba del Teorema 2.2.6

f0(x, v) = f′(x, v), ∀v ∈IRn.

(b) Dado (a) la prueba de (b) se sigue de el Teorema 1.3.1-ii y el Teorema 2.2.7

(c) Es suficiente la prueba para m= 2. Por inducci´on, si f es regular en xy λ >0 entonces

(λf)0(x, v) =λf0(x, v) =λ′f(x, v) = (λf)′(x, v), ∀v ∈IRn.

es evidente que (f1+f2)′ siempre existe y (f1+f2)′ =f1′ +f2′, por la definici´on

de la generalizaci´on de la derivada

(f +f2)≥(f1 +f2)′

tenemos

(f1+f2)0(x, v) = limyx

t↓0

(43)

= lim

t↓0 sup

f1(y+tv) +f2(y+tv)−f1(y)−f2(y)

t

ylimx

t↓0

supf1(y+tv)−f1(y) t + limy→x

t↓0

supf2(y+tv)−f2(y) t

= f10(x, v) +f20(x, v).

As´ı que

(f1+f2)′ =f1′ +f2′ =f10+f20 ≥(f1+f2)0

tambi´en

(f1+f2)′ = (f1+f2)0

esto completa la prueba.

Corolario 2.2.1 Si f es diferenciable, regular y localmente lipschitziana en x, en-tonces

ˆ

∂f(x) = {∇f(x)}.

Prueba.

∇f(x)∈∂fˆ (x) es diferenciable y lipschitziana entonces {∇f(x)} ⊂∂f(x).ˆ Por otro lado, sea ξ ∈∂fˆ (x); supongamos que ξ6=∇f(x)

f0(x, v) ≤ hξ;vi, ∀v ∈IRn

f′(x, v) = f0(x, v) = h∇f(x);vi h∇f(x);vi ≤ hξ;vi ∀v

v = − h∇f(x)−ξ;vi ≥0 ∀v v = (∇f(x)−ξ)

0 < ||∇f(x)−ξ||0 ≤0

lo cu´al es una contradicci´on, luego ˆ∂f(x)⊂ {∇f(x)}. Por lo tanto, ˆ

∂f(x) = {∇f(x)}.

Corolario 2.2.2 Sif es localmente de Lipschitziana enx, entonces para todo λ∈IR, ˆ

(44)

Prueba.

Comof es de Lipschitz, λf tambi´en es de lipschitz en x. Si λ≥0, entonces

(λf)0 =h f0, tambi´en ˆ∂(λ f)(x) = λ∂fˆ (x), para todoλ 0, se prueba para h =1,

ξ∈∂(ˆ −f)(x) ⇔ (−f)0(x, v)≥ hξ;vi ∀v ∈IRn

⇔ f0(x,−v)≥ hξ;vi ∀v ∈IRn

⇔ f0(x,−v)≥ h−ξ;−vi ∀ −v ∈IRn

⇔ −ξ∈∂fˆ (x)

⇔ ξ∈ −∂fˆ (x)

Por lo tanto, ˆ∂(λf)(x) =λ∂f(x).ˆ

Teorema 2.2.9 Si f es localmente lipschitz en x y tiene un extremo en x, entonces

0∈∂fˆ (x)

Demostraci´on.

Suponemos primero que f alcanza un m´ınimo local en x, entonces existe ǫ, tal que f(x+tv)−f(x)≥0 para todo 0< t < ǫ y v ∈IRn, se tiene:

f0(x, v) = lim

y→x t↓0

supf(y+tv)−f(y)

t ≥limt↓0 sup

f(x+tv)−f(x)

t ≥0

y tambi´en

f0(x, v)≥0 =h0, vi ∀v ∈IRn

por la definici´on de subdiferencial 0∈∂fˆ (x).

Suponemos que f alcanza un m´aximo local en x entonces −f alcanza un m´ınimo enx y por el Teorema 2.2.9, 0∈∂(ˆ −f)(x)

Lema 2.2.10 La funci´on g : [0,1]→IR definida por

(45)

es Lipschitziana en (0,1)

ˆ

∂g(t)⊂D∂fˆ (x+t(y−x);y−x)E

Prueba.

|g(t)−g(t′)| = |f(xt)−f(x′t)| ≤k||xt−x′t||

= k||x+t(y−x)−(x+t′(y−x))|| ≤ k||x+ty−tx−x−t′y+t′x|| ≤ k||t(y−x)−t′(y−x)||

≤ ||(y−x)(t−t′)|| ≤ k||y−x|| |t−t′|

entonces,|g(t)−g(t′)| ≤˜k|tt|, t, t(0,1); donde ˜k =k||yx||.

Por el Teorema 2.2.3 se tiene el conjunto ˆ∂g(t) y D∂fˆ (xt);y−x E

son compactos y convexos puesto que corresponden aIR. Se tiene el intervalo enIR, es suficiente probar para v =±1, tenemos

max{∂g(t)vˆ } ≤max{D∂f(xˆ t);y−x E

v}

por el Teorema 2.2.3 tenemos

max{∂g(t)ˆ v}=g0(t, v)

y,

max{∂g(t)ˆ v} = limsy

λ↓0

supg(s+λ v)−g(s) λ

≤ lim

y′xt

λ↓0

supf(x+ [s+λv](y−x))−f(x+s(y−x)) λ

≤ lim

y′x

t

λ↓0

supf(x+s(y−x)−λv(y−x))−f(y

)

λ

= f0(xt;v(y−x))

Adem´as, se sigue del Teorema 2.2.3,

f0(xt;v(y−x)) = max{ D

ˆ

∂f(xt);y−x E

(46)

y as´ı,

max{∂g(t)ˆ v} ≤max{D∂fˆ (xt);y−x E

v}

Por lo tanto, ˆ∂g(t)⊂D∂fˆ (x+t(y−x));y−xE

Teorema 2.2.11 Si las funciones fi : IRn → IR son localmente lipschitz en x para

i= 1, ..., m entonces para escalares λi ∈IR

m X

i=1

λifi !

(x)⊂ m X

i=1

λi∂fi(x)

y se tiene la igualdad, en la suma, cada fi es regular en x y cada λi >0.

Demostraci´on.

Es suficiente la prueba param = 2 el caso se generaliza por inducci´on. Del Teorema 2.2.8 observamos que

(f1+f2)0(x, v)≤f10(x, v) +f20(x, v)

por la definici´on de subdiferenciabilidad ˆ

∂(f1+f2)(x, v)⊂∂fˆ 1(x) +∂f2(x).

Luego, del Corolario 2.2.2 tenemos ˆ

∂(λ1f1+λ2f2)(x)⊂∂ˆ(λ1f1)(x) + ˆ∂(λ2f2)(x) = λ1∂fˆ 1(x) +λ2∂fˆ 2(x)

consideremos lo siguiente, fi es regular en x y λi >0, para i= 1,2; por el Teorema

2.2.8 la funci´onλ1f1+λ2f2 es regular enx, entonces

(λ1f1+λ2f2)0 = (λ1f1 +λ2f2)′ =λ1f1′ +λ2f2′ =λ1f10+λ2f20

y luego se sigue:

ˆ

∂(λ1f1+λ2f2)(x) =λ1∂fˆ 1(x) +λ2∂fˆ 2(x)

Esto completa la prueba.

Teorema 2.2.12 (Teorema del valor medio) Sea x, y ∈ IRn y sea la funci´on f

Lip-schitziana en un conjunto abierto U ⊂ IRn tal que el segmento de l´ınea [x, y] ⊂ U, entonces existe un punt u∈(x, y) tal que

(47)

Demostraci´on.

Se define la funci´onθ : [0,1]→IRtal que

θ(t) =f(xt) +t[f(x)−f(y)]

entonces θ es continua y,

θ(0) = f(x0) = f(x)

θ(1) = f(x1) +f(x)−f(y) =f(x)

entonces existe t0 ∈ (0,1) tal que se obtiene un extremo local t0 y por el Teorema

2.2.9, 0∈∂θ(t0) y por el Teorema 2.2.11 se tiene

ˆ

∂θ(t) = ˆ∂[f(xt) +t(f(x)−f(y))]⊂∂fˆ (xt) + [f(x)−f(y)] ˆ∂t

y adem´as por el Lema 2.2.10 se tiene

0∈D∂fˆ (xt);y−x E

+ [f(x)−f(y)].∂ˆ(t)

entonces, de ˆ∂(t) = 1 se sigue que

f(y)−f(x)∈D∂fˆ (µ);y−xE

de donde µ=xt∈(x, y), con ello se concluye el teorema.

Definici´on 2.2.3 (Subdiferencial de funciones no convexas)

Sea f : IRn IR∪ {+∞} una funci´on propia, el conjunto de subgradientes

genera-lizados (tambi´en llamado limite subdiferencial ) de f en x∈IRn denotado por ∂f(x) es definido como:

(48)

Cap´ıtulo 3

El M´

etodo de Punto Proximal

Consideremos el problema:

(P)              minf(x) s.a: x∈IRn

donde f :IRn →IR∪ {+∞} es una funci´on propia, semicontinua inferior y IRn es el espacio euclidiano con norma || · ||. El M´etodo de Punto Proximal cl´asico genera una sucesi´on{xk} dado porx0 IRn

(un punto arbitrario) y

xk ∈arg min{f(x) + λk

2 ||x−x

k−1||2 : xIRn}

,

donde λk es un par´ametro positivo. Para resolver (P) introducimos el siguiente

m´etodo:

Dado una sucesi´on de par´ametros positivos {λk} y un punto inicial

x0 ∈IRn. (3.1)

Para cada k = 1,2, . . .. Si 0∈ ∂fˆ (xk−1), entonces el m´etodo finaliza. De otro modo

buscamos unxk IRn tal que

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk) (3.2)

Observaci´on 3.0.1 Este m´etodo es una extensi´on del m´etodo del punto proximal para funciones no convexas, en efecto si f es convexa entonces (3.2) se convierte en

xk = arg min

(

f(x) + λk

2 ||x−x

(49)

Observaci´on 3.0.2 Como estamos interesados en resolver (P) donde f es no con-vexa, es importante observar que el m´etodo (3.1) y (3.2) solamente necesita encontrar

un punto estacionario (no necesariamente un m´ınimo global) de la funci´on

regula-rizada f(·) + (λk

2 )|| · −x

k−1||2.

Probaremos bajo las hip´otesis quef es propia, acotado inferiormente y semicontinua inferior, las iteraciones nxko son bien definidas y si f es cuasi-convexa, nf(xk)o es

no creciente y convergente.

Luego, definimos un conjunto en el cu´al est´e conteniendo el ´optimo del conjunto

problema. Podemos obtener que:

lim

k→+∞f(x

k) = inf x∈IRn

f(x).

Si el conjunto es vac´ıo y de la convergencia de nxko se generaliza un punto cr´ıtico,

si {λk} es limitado y f es continua sobre su dominio.

Adem´as, si cada xk es un m´ınimo global de la funci´on regularizada dada en

f(·) + (λk

2 )|| · −x

k−1||2 y λ

k → 0 probamos que n

xko converge a un punto m´ınimo

del problema (P). Como caso particular, obtenemos la convergencia del m´etodo a un punto m´ınimo global para funciones pseudoconvexas y convexas.

3.1

Resultados de convergencia Fej´

er

Definici´on 3.1.1 Una sucesi´on nykoIRn

, es llamado Fej´er convergente a un con-junto U ⊆IRn, con respecto a la norma euclidiana si:

y

k+1u ≤ y k u

;∀u∈U,∀k ≥0 (3.3)

Teorema 3.1.1 Si la sucesi´on nyko es Fej´er convergente en un conjunto U 6= ,

entonces nyko es acotada. Si un punto de acumulaci´on y¯ de nyko pertenece a U,

entonces

limk→+∞yk = ¯y

Demostraci´on.

(50)

y k u ≤ y

0 u

;∀k≥0;

lo cual quiere decir que la sucesi´onnykoest´a contenida en la bola de centrouy radio ky0uk, por lo tanto es acotada.

Sea x ∈ U un punto de acumulaci´on de nyko, como nyko es acotada posee un

sub-sucesi´onnyjko convergente tal que:

limk→+∞yjk = ¯y

por (3.3) se tiene que la sucesi´on n y

ky¯ o

es decreciente y no negativa adem´as posee una subsucesi´onn

y

jky¯ o

,lo cual converge a 0. Por lo tanto n

y ky¯

o

converge a 0, y as´ı:

limk→+∞

y k ¯ y = 0

lo que implica que limk→+∞yk = ¯y.

Proposici´on 3.1.1 Las siguientes propiedades son verdaderas: a. ∂f(x)ˆ ⊂∂f(x), ∀x∈IRn.

b. Si f es diferenciable enentonces ∂fˆ (x) = {∇f(x)}, por lo tanto

∇f(¯x)∈∂f(¯x).

c. Si f es continuamente diferenciable en una vecindad de x entonces

ˆ

∂f(x) =∂f(x) ={∇f(x)}.

d. Si g =f+h, con f finito enyh es continua diferenciable sobre una vecindad de f enentonces

ˆ

(51)

Prueba.

Sea ˆ∂f(x) el subdiferencial de Clarke.

ˆ

∂f(x) = ns∈IRn:fo(x, v)≥ hs;vi, v ∈IRno,

∂f(x) = ns∈IRn :xx, f(x)f(x),s∂fˆ (xv) tal que sso

,

a. s∈∂fˆ (x) entonces se tiene; fo(x, v)≥ hs, vi, ∀v. ∃{xℓ}={x} →x

f(xn) =f(x) se tiene la convergencia a: f(x).

Luego tenemos, {sℓ}={s} ∈∂fˆ (x)s.

b. ∇f(¯x) ∈ ∂fˆ (¯x) pues f es diferenciable por Teorema 2.2.1 y por el ´ıtem a., ˆ

∂f(¯x)⊂∂f(¯x) de ambos tenemos que ∇f(¯x)∈∂f(x).

c. Como f es continuamente diferenciable en x, por Teorema 2.2.6 se cumple ˆ

∂f(x) ={∇f(x)}.

Por ´ıtem a., ˆ∂f(x)⊂∂f(x).

Sea s∈∂f(x)entonces ∃xℓ x, f(x)f(x), s∂fˆ (x).

Como ˆ∂f(xℓ) =nf(x)o=s.

∃nxℓo={x} →x, f(x) =f(x)f(x).

n

sℓo={s} ∈∂f(x).ˆ Entonces, fo(x, v)≥ hs, vi, v. Por lo tanto, s∂fˆ (x).

d. Del ´ıtem b.,

ˆ

∂f(¯x) +∇h(¯x) ⊂ ∂fˆ (¯x) + ˆ∂h(¯x),

⊂ ∂ˆ(f +h) (¯x),

(52)

Esto completa la prueba.

Observaci´on 3.1.1 De (3.2) y de la Proposici´on 3.1.1-d y la diferenciabilidad de (λk/2)|| · −xk−1||2. esto implica que;

0∈∂fˆ (xk) +λ

k(xk−xk−1),

as´ı existe gk ∂fˆ (xk) tal que:

gk=λ k

xk−1 xk

3.2

Resultados de convergencia

Teorema 3.2.1 Si f : IRn → IR∪ {+∞} es propia, acotada inferiormente y semi-continua inferior sobredomf, entonces la sucesi´on nxkodado por (3.1) y (3.2) existe.

Demostraci´on.

Por inducci´on, se cumple para k = 0 por (3.1). Asumiremos que xk existe. Como

f es semicontinua inferior, limitado inferiormente y || · −xk||2 es coerciva, entonces

f(·) + (λk/2)|| · −xk||2 es semicontinua inferior y coerciva. As´ı, esta funci´on tiene un

xk+1 como m´ınimo global (en particular un m´ınimo local) y por lo tanto

0∈∂ˆf(·) +λk+1

2

|| · −xk||2(xk+1).

Asumiremos las siguientes hip´otesis:

• Hip´otesis A: f :IRn→IR∪ {+∞} es una funci´on acotada inferiormente.

• Hip´otesis B: f :IRn→IR∪ {+∞} es semicontinua inferior y cuasi-convexa. Como nos interesa la convergencia asint´otica del m´etodo, asumimos tambi´en que en cada iteraci´on 0∈/ ∂f(xˆ k) lo cu´al implica quexk 6=xk−1, k.

Proposici´on 3.2.1 Bajo las hip´otesis A y B tenemos que nf(xk)o es decreciente y

convergente.

Prueba.

Comoxk 6=xk−1, entonces

D

(53)

de la Observaci´on (3.1.1),

D

gk;xk−1 −xkE>0.

Usando la cuasi-convexidad def y el Teorema 2.2.2 esto implica que

f(xk)< f(xk−1).

La convergencia de nf(xk)o se d´a por el l´ımite inferior de f ( f(xk) es una funci´on

no creciente).

Proposici´on 3.2.2 Las iteraciones nxko no son c´ıclicas.

Prueba.

Supongamos que existe l > j+ 1 tal que xl=xj, de la Proposici´on 3.2.1

f(xj) =f(xl)< . . . < f(xj+1)< f(xj),

pues f es no creciente, entonces

f(xj)< f(xj),

lo cu´al es una contradicci´on.

Por lo tanto xl6=xj.

Definimos el siguiente conjunto:

U =

x∈IRn/f(x)≤inf

j≥0f(x

j).

Observemos que este conjunto depende del punto inicial x0 y la sucesi´on {λk}.

SiU =∅ entonces es posible probar que:

i. limk→+∞f(xk) = infxIRnf(x).

Referencias

Documento similar