T027_10324686_T.pdf

(1)

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE CIENCIAS NATURALES Y MATEM ´ATICA

DEPARTAMENTO ACAD ´EMICO DE MATEM ´ATICA

M´

ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL

SUBDIFERENCIAL DE CLARKE

Tesis para obtar el T´ıtulo Profesional de Licenciado en

Matem´

atica

Miguel Angel Cano Lengua

(2)

M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE

Miguel Angel Cano Lengua

Tesis presentada a consideración del Cuerpo Docente, de la Facultad de Ciencias Naturales y Matemática de la Universidad Nacional del Callao, como parte de los requisitos para obtener el T´ıtulo Profesional de Licenciado en Matemática.

Aprobada por :

Prof. Ruth Medina Aparcana, Lic. Presidente

Prof. Prof. Elmer Le´on Z´arate, Lic. Secretario

Prof. Erik Alex Papa Quiroz, DSc. Asesor

(3)

FICHA CATALOGR ´AFICA

CANO LENGUA MIGUEL ANGEL

M´etodo del punto proximal para minimizar funciones cuasi-convexas u-sando el subdiferencial de Clarke, Callao [2010].

ix, 71p., 29.7 cm. (UNAC, Licenciado en Matem´atica, 2010).

Tesis, Ciencias Naturales y Matem´atica. I. Matem´atica.

(4)

(5)

Agradecimientos

Al concluir con este trabajo, que presento para optar el T´ıtulo Profesional de Li-cenciado en Matem´aticas Pura, deseo manifestar mi gratitud a las siguientes personas:

• Al Doctor Erik Alex Papa Quiroz, por su amistad y confianza. Por haberme sugerido el tema, por su orientaci´on segura y constante durante la realizaci´on del presente trabajo.

• A la Licenciada Elsa Marisa Quispe Cárdenas, por su amistad, por su apoyo y sugerencia en la elaboración y presentación de la tesis.

• A los profesores de la facultad de Ciencias Naturales y Matem´atica de la Uni-versidad Nacional del Callao por ser parte de mi formaci´on profesional.

• A mis amigos de la facultad de Ciencias Naturales y Matem´atica de la Univer-sidad Nacional del Callao en especial a: Pascual, Isidro y Lenin.

• A mi madre y hermanos por su cari˜no, confianza y apoyo.

(6)

RESUMEN

M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR

FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE

Miguel Angel Cano Lengua Diciembre - 2010

Asesor: DSc. Erik Alex Papa Quiroz

Titulo Obtenido: Licenciado en Matem´atica

En este trabajo proponemos una extensión del método del punto proximal para mi-nimizar funciones cuasi-convexas sin restricciones usando el subdiferencial de Clarke. Resolveremos problemas de optimización que tiene la forma:

(P) min{f(x) :x∈IRn}

dondef :IRn→IR ∪ {+∞} es una funci´on propia semicontinua inferior.

Dado una sucesión {λk} de parámetros positivos, el método genera una sucesión de puntos nxko_{, a partir de un punto inicial} _x0 _∈_IRn

, usando la siguiente regla:

Para cadak= 1,2,3, ...., Si 0∈∂fˆ (xk−1_{), donde ˆ}_∂f_{(x) es el subdiferencial de Clarke,}

entonces para. De otro modo, buscamos unxk _∈_IRn

tal que:

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk).

Asumiendo que f es una función lipchitziana, cuasi-convexa y no diferenciable pro-baremos que nxko _{converge a un punto candidato a solución. Además, daremos}

algunos ejemplos de funciones que cumplan con las condiciones mencionadas y luego realizaremos algunos experimentos computacionales.

Palabras Claves:

(7)

ABSTRACT

PROXIMAL POINT METHOD TO MINIMIZE QUASICONVEX FUNCTIONS USING THE CLARKE SUBDIFFERENTIAL

Miguel Angel Cano Lengua December - 2010

Adviser: DSc. Erik Alex Papa Quiroz. Obtained Degree: Mathematician.

We propose an extension of the proximal point method for minimizing unconstrained quasiconvex functions using Clarke’s subdifferential.

We solve optimization problems of the form:

(P) min{f(x) :x∈IRn}

wheref :IRn_→_IR _{∪ {}₊_∞} _{is a lower semicontinuous proper function.}

Given a sequence {λk} of positive parameters, the method generates a sequence of points nxko_{, from an initial point} _x0 _∈_IRn_{, using the following rule: For each}

k = 1,2,3, ...., If 0 ∈ ∂fˆ (xk−1_{), where ˆ}_∂f _{is Clarke’s subdifferential, then stop.}

Otherwise, find xk_∈_IRn _{such that}

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1_||2

!

(xk_).

Assuming thatf is a quasiconvex, lipchitzian and nondifferentiable function, we prove thatnxko_{converges to a candidate of the solution point of (P}_)._{Furthermore, we give}

some examples and some numerical examples.

Keywords:

(8)

´

_Indice

Introducci´on 1

1 Preliminares 5

1.1 S´ımbolos y Notaciones . . . 5 1.2 Definiciones B´asicas . . . 7 1.3 Subdiferenciabilidad . . . 11

2 Subdiferencial de Clarke 19

2.1 Generalizaci´on de la derivada . . . 19 2.2 Propiedades B´asicas . . . 19

3 El M´etodo de Punto Proximal 40

3.1 Resultados de convergencia Fej´er . . . 41 3.2 Resultados de convergencia . . . 44

4 Implementaciones y Aplicaciones 50

Bibliograf´ıa 60

(9)

Introducci´

on

En la actualidad existen diversas áreas que dan solución a problemas vinculados a las ciencias e ingenier´ıa, una de ellas es la Optimización Matemática que estudia la forma de encontrar la mejor solución a un problema dado dentro de todas las posibles alternativas. El modelo general de optimización está dado por:

(P)

         

        

Opt. f(x) s.a:

gi(x)≤0, i= 1, . . . , m

hj(x) = 0, j = 1, . . . , p

donde f : IRn → IR es una funci´on dada, Opt. f(x) significa minimizar o maximizar la funci´onf, gi :IRn→IR y hj :IRn→IR son funciones dadas.

Una clase particular y bien amplia del modelo (P) es la optimizaci´on cuasi-convexa (problemas donde la funci´on objetivo f es cuasi-convexa, esto es

f(λx+ (1−λ)y)≤max{f(x), f(y)}, para todoλ ∈[0,1], para todox, y ∈IRn,y las funciones que definen las restriccionesgi yhj son cuasi-convexas). Este problema fue

estudiado en el a˜no de 1951 por Arrow y Enthoven [2] motivados por las aplicaciones de las preferencias y utilidades en la teor´ıa del consumidor y posteriormente por di-versos investigadores, por ejemplo Kannai [13], Diewert, Avriel y Zang [8], Avriel, Diewert, Schaible y Zang [3], Tanaka [22], Mangasarian [16], Fenchel [10], Hiriart -Urruty [12], Lemar´echal [14], entre otros.

(10)

donde las funciones involucradas no son diferenciables, han estudiado la generalizaci´on de las propiedades del gradiente para funciones no diferenciables. En este contexto se estudiaron el subgradiente y subdiferencial de funciones convexas (una funci´on f : IRn → IR es convexa si f(λx + (1−λ)y) ≤ λf(x) + (1− λ)f(y), para todo λ ∈ [0,1], para todo x, y ∈ IRn_{), y subgradiente y subdiferencial generalizado para}

el caso no convexo, ver por ejemplo [6], donde aparecieron diversas generalizaciones dentro de ellos el subdiferencial de Clarke, [6] y [7]. También se desarrollaron diversos métodos para resolver problemas de optimización, dentro los cuales destacó el método del punto proximal, introducido por Martinet [18] y que consiste esencialmente en un método iterativo que resuelve en cada iteración un problema más simple de tal manera que paso a paso, las iteraciones se aproximan a la solución. Propiedades de conver-gencia del método proximal fueron probados para una clase bien amplia de funciones, llamadas funciones convexas quedando como una cuestión en abierto el problema de optimización cuasi-convexo.

Esta tesis est´a destinada a extender las propiedades de convergencia del punto proximal para resolver el siguiente problema de optimizaci´on

(P I)

            

min f(x) s.a:

x∈IRn

dondef :IRn→IR∪ {+∞} es una función real no diferenciable y no convexa. El método del punto proximal para funciones convexas fue introducido por Martinet [18] en 1978 y fue muy estudiada por Rockafellar, [20] y [21], para resolver problemas más generales de encontrar ceros de operadores monótonos maximales. Este método, para el problema (P I) y para el caso donde f es convexa, genera una sucesión de puntos {xk_}_{, a partir de un punto dado} _x0_{, tal que:}

Dado k = 1,2, . . .. Si 0 ∈ ∂fˆ (xk−1_{), entonces para el algoritmo. De otro modo}

buscamos unxk _∈_IRn _{tal que}

xk_∈_argmin (

f(·) + λk 2

!

|| · −xk−1_||2

)

(0.1) Fue demostrado que sif es convexa, propia y que la sucesi´on {λk} satisface:

(11)

entonces la sucesi´on nf(xk₎o _{converge al ´ınfimo de} _f _{y si adem´as el conjunto de}

soluciones ´optimas X∗ ₆₌_∅_, _entonces n_xko _{converge para una soluci´on del problema.}

Esta tesis está motivada a resolver el problema (P I) cuandof es cuasi-convexa usando el método proximal. Para ello, debemos observar que debido a la no convexidad de f, el problema (0.1) no es necesariamente convexo, más aún, no es necesariamente cuasi-convexo. Es por eso, que iteración (0.1) puede ser más dif´ıcil de resolver que el problema original (P I). Para superar esta gran dificultad, proponemos la iteración:

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk) (0.2)

lo que es más razonable de resolver desde el punto de vista teórico y práctico ya que en vez de encontrar el puntoxk_{que minimize la función}_f₍_·₎₊λk

2

||·−xk−1_||2_{, s´olo}

nece-sitamos encontrar un punto cr´ıtico generalizado del mismo. En este trabajo probamos la convergencia del método proximal usando la iteración (0.2) bajo la hipótesis que la funciónf localmente de Lipschitz, cuasi-convexa y no diferenciable.

La organización de la tesis es la siguiente. En el Cap´ıtulo 1, presentamos las he-rramientas necesarias para el desarrollo de este trabajo, entre otros veremos algunos resultados del análisis convexo, definición de subdiferenciabilidad, teor´ıa de análisis funcional. En el Cap´ıtulo 2, presentamos la teor´ıa del subdiferencial de Clarke, gene-ralización de la derivada y las propiedades básicas. En el Cap´ıtulo 3, parte central de la tesis, presentamos el método propuesto y sus resultados de convergencia, En el Cap´ıtulo 4, presentamos la implementación del método para algunas funciones y finalmente damos la bibliograf´ıa como fuente de información.

Este trabajo ha sido expuesto en :

• ”V Congreso Internacional de Matem´atica Aplicada y Computacional” realizado en la Universidad Nacional San Antonio de Abad del Cusco, Agosto del 2010.

• ”IV Seminario de Matem´atica Aplicada a la Ingenier´ıa” realizado en la Univer-sidad Ricardo Palma, facultad de Ingenier´ıa, Junio del 2008.

(12)

(13)

Cap´ıtulo 1

Preliminares

En este cap´ıtulo daremos los conceptos b´asicos que se necesitan para el mejor en-tendimiento y desarrollo de esta tesis.

1.1 S´ımbolos y Notaciones

f0_{(x, v) : Derivada direccional generalizada.}

ˆ

∂f(x): Subdiferencial de Clarke.

∂cf(x) : Subdiferencial convexof enx. ||.|| : Norma Euclideana.

IRn₊: El conjunto de las n-uplas cuyas componentes son no negativas. IRn

++: El conjunto de los n-uplas cuyas componentes son positivos.

B(x, ǫ): Bola abierta con centro x y radio ǫ

∇f: El gradiente de f lim inf: L´ımite inferior. lim sup: L´ımite superior.

max{a;b}: M´aximo entrea y b. xk_→_x _denota _lim

k→+∞ xk =x.

DadoX ⊂IRn int(X) es el interior de X.

Sea Ω⊂IRn_{un abierto de}_IRn_;_Ck_{(Ω) =}_{_f _:_U _→_IR;_f _{es k veces diferenciable en U}_}

P(IRn) : Conjunto de partes.

(14)

lim

y→x t↓0

supf(y+tv)−f(y)

t = infδ>0 _k_y₋sup_x_k₊_t<δ

(15)

1.2 Definiciones B´

asicas

Definici´on 1.2.1 Una funci´on f : IRn → IR∪ {+∞} es llamada convexa en IRn si para todo x, y ∈IRn _{y para todo} _λ_∈_[0,_1] _{se cumple que:}

f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y).

Definici´on 1.2.2 Una funci´on f : IRn _→ _IR_{∪ {}₊_∞} _{es llamada cuasi-convexa en}

IRn si para todo x, y ∈IRn y para todo λ∈[0,1] se cumple que:

f(λx+ (1−λ)y)≤max{f(x), f(y)}.

Observaci´on:

Toda funci´on convexa es cuasi-convexa, pero el rec´ıproco no siempre se cumple. Por ejemplo considere la funci´onf(x, y) =−e−x2₋_y2

es cuasi-covexa pero no es convexa.

Definici´on 1.2.3 Sea f : IRn _→ _IR _{una funci´on diferenciable en} _IRn_{. f} _{es llamada}

funci´on pseudoconvexa si para todo x, y ∈IRn tal que

h∇f(y);x−yi ≥0,

se tiene que f(y)≤f(x).

Definici´on 1.2.4 Sea f : IRn → IR es llamada semicontinua superior en x¯ si para toda sucesi´on nxℓo

convergente a x¯, tenemos: lim supl→∞f(xℓ)≤f(¯x).

f es llamada semicontinua inferior en x¯ si para toda sucesi´on nxℓo _{convergente a} _x_¯

se tiene que f(¯x)≤lim infl→∞f(xℓ).

Definici´on 1.2.5 Una funci´onf :IRn →IRes localmente lipschitziana con constante k en x∈IRn _{si existe alg´}_un _ǫ_≥₀ _{tal que}

|f(y)−f(z)| ≤kky−zk para todo z, y ∈B(x, ǫ).

Definici´on 1.2.6 Sea la funci´on f :IRn_→_IR _{es llamada subaditiva si:}

f(x+y)≤ f(x) +f(y), para todo x, y ∈IRn _.

(16)

f(λ.x) =λ.f(x), para todo λ≥0.

Definición 1.2.8 Sea la función f :IRn _→_IR_{∪ {}₊_∞} _{es llamada función propia si}

(a)domf 6=∅.

(b) ∀x∈domf,tenemos que f(x)>−∞.

Definici´on 1.2.9 (Operadores acotados en un espacio de Hilbert) Sean E y F es-pacios normados (sobre el mismo cuerpo). Se dice que un operador T : E → F, es acotado si T es lineal y

Supkxk=1{kT xk}<∞.

Que el operador lineal T : E → F sea acotado significa, que existe una constante M >0 tal que kT xk ≤M, para todo x∈E, con kxk= 1.

Teorema 1.2.1 Un operador lineal entre espacios normados es continuo si, y s´olo si, este es acotado.

Demostraci´on: Ver Nieto [19], Teorema 9.1 pp:94.

Teorema 1.2.2 (Teorema de representación de Fréchet-Riesz) Sea H un espacio de Hilbert. Si f es una aplicación lineal acotada de H, entonces existe un vector y∈H, y uno solo, tal que

f(x) =hx;yi,para todo x∈H

Adem´as, kyk=kfk.

Demostraci´on: Ver Nieto [19], Teorema 9.11 pp:103.

Teorema 1.2.3 Sea f : IRn → IR∪ {+∞} una funci´on propia. Entonces, f es cuasi-convexa si, y s´olo si, el conjunto {x∈IRn_:_f_(x)_≤_c_} _{es convexo, para cada}

(17)

Demostraci´on: Ver Bazaraa [5], Teorema 3.5.2. pp:108. Para el caso diferenciable usamos el siguiente resultado.

Teorema 1.2.4 Sea f : IRn _→ _IR _{una funci´on diferenciable. entonces,} _f _es

cuasi-convexa si, y s´olo si, ∀x, y ∈IRn tal que f(x)≤f(y), se tiene que

h∇f(x);x−yi ≤0.

Demostraci´on: Ver Bazaraa [5], Teorema 3.5.4. pp:109.

Teorema 1.2.5 (Hahn-Banach) Sea X un espacio vectorial lineal real , Y un sub-espacio de X. Si p:X →IRes un funcional positivamente homog´eneo,subaditiva y f : Y → IR, un funcional lineal tal que f(y) ≤ p(y) para todo y ∈ Y. Entonces, existe un funcional F :X →IR tal que ;

F(y) =f(y), para todo y∈Y. F(x)≤p(x), para todo x∈X.

Demostraci´on: Ver Friedman [11], Teorema 2.1.6. pp:14.

Teorema 1.2.6 (Teorema del valor medio) Sea f : [a, b]→IR una funci´on tal que. (i) f es continua en el intervalo [a, b] ;

(ii) f es diferenciable en el intervalo abierto (a, b).

Entonces, existe un n´umero c en el intervalo abierto (a, b) tal que

f(c) = f(b)−f(a) b−a

Demostraci´on: Ver Leithold [15], Teorema 4.3.2. pp:306-307.

Teorema 1.2.7 (Teorema del valor medio para funciones de varias variables) Sea Ω ⊆ IRn un conjunto abierto y sea f : Ω → IRn. suponga que Ω contiene a los puntos a, b y al segmento de l´ınea S que une a estos puntos y que f es diferenciable en todo punto de S. Entonces existe un punto cen S tal que;

kf(b)−f(a)k ≤ kDf(c)(b−a))k

(18)

Definici´on 1.2.10 (Conjunto acotado)

Se dice que un conjunto S ⊂ IRn está acotado si está contenido totalmente en una n-bola B(a, r) para algún r >0 y algún a∈IRn_.

Definici´on 1.2.11 Un conjunto S ⊂IRn _{es cerrado si su complemento denotado por}

¯

S es un conjunto abierto.

Teorema 1.2.8 Un conjunto Z es cerrado, si y s´olo si, para todo nzlo _⊂_Z _{tal que}

zl_→_z_¯ _entonces _z_¯_∈_Z.

Demostraci´on: Ver Elon L. [9], pp:38-39.

Teorema 1.2.9 (Heine-Borel)

SeaF un recubrimiento abierto de un conjuntoAdeIRn,cerrado y acotado. Entonces existe una subcolecci´on finita de F que tambi´en recubre a A.

Demostraci´on: Ver Apostol T.M. [1], pp:70-71.

Definici´on 1.2.12 (Conjunto Compacto)

Un conjuntoS ⊂IRn_{se llama compacto, si y s´olo si, cada recubrimiento de}_S _contiene

un subcubrimiento finito; esto es, una subcolecci´on finita tambi´en recubra a S. El teorema de Heine-Borel establece que todo conjunto de IRn_, _{es compacto si y solo}

(19)

1.3 Subdiferenciabilidad

Definici´on 1.3.1 Se define la derivada direccional de f enx en la direcci´on v ∈IRn como:

f′(x, v) =limt↓0

f(x+tv)−f(x)

t .

Si f es diferenciable en x, entonces la derivada direccional existe en toda direcci´on v ∈IRn, f′

(x;v) es una funci´on lineal de v tenemos la siguiente relaci´on:

f′(x, v) =h∇f(x);vi

Teorema 1.3.1 Sea f :IRn →IR una funci´on convexa. Entonces para cadax∈IRn, tenemos:

(i) f′(x, v) = max{hǫ;vi;ǫ∈∂cf(x)} ∀v ∈IRn

(ii) ∂cf(x) = n

ǫ ∈IRn _:_f′

(x, v)≥ hǫ;vi,∀v ∈IRno

(iii) ∂cf(x) 6= φ es un conjunto convexo y compacto, tal que kǫk ≤ k para todo

ǫ∈∂cf(x), donde k es una constante de Lipchitz para fen x;

(iv) El conjunto de las aplicaciones∂cf :IRn →IR es semicontinua superior, es decir,

si yℓ _→ _x _y _ǫℓ _∈ _∂

cf(yℓ) para cada ℓ, entonces cada punto de acumulaci´on ǫ de (ǫℓ)

est´a en ∂cf(x).

Demostraci´on:Ver Makela [17], pp:151.

Definici´on 1.3.2 Sea f :IRn →IRuna funci´on, dado x∈IRn es un subgradiente de f en x si:

f(y)≥f(x) +hs;y−xi,∀y∈IRn.

El conjunto de todos los subgradientes es llamado subdiferencial convexo de f en x y es denotado por ∂cf(x), esto es,

∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}.

Proposici´on 1.3.1 Seaf :IRn _→_IR_∪{₊_∞} _{una funci´on convexa y}_x_¯_∈_int(domf₎_.

(20)

∂cf(¯x) ={∇f(¯x)}.

Demostraci´on: Ver Makela [17], Teorema 2.1.6. pp:14.

Teorema 1.3.2 Sea f : IRn _→ _IR _{una funci´on convexa con constante de Lipschitz}

k >0, entonces se cumple:

(i) La derivada direccional en cada direcci´on v ∈IRn existe y satisface

f′(x, v) =inft>0

f(x+tv)−f(x)

t ;

(ii) La funci´on v →f′(x, v) es positivamente homog´enea y subaditiva sobre IRn con

f

′

(x, v)

≤kkvk,

(iii) f′

(x, v) es una funci´on semicontinua superior en (x;v) y es una funci´on de Lip-chitz con constante k sobre IRn,

(iv) −f′

(x, v)≤f′

(x, v).

Demostraci´on:Ver Makela [17], pp:9-12.

Ejemplo 1.3.1

Sea la funci´on f(x) = |x|veamos como es su subdiferencial convexo. Se sabe que:

|x|=

  

 

x, x≥0

−x, x <0

(i) Si x= 0, tenemos

∂cf(0) ={ξ∈IR :|y| ≥ |0|+ξ.y,∀y∈IR}.

Vemos que:

Si; y= 0 entonces ξ∈IR.

(21)

cuya gr´afica es:

Si; y <0 entonces −y ≥ξ.y ; luego −1≤ξ. Interceptando los conjuntos tenemos:

ξ ∈[−1,1].

Asi,

∂f(0) = [−1,1]. (ii) Si x >0; tenemos:

∂cf(x) = {ξ∈IR :|y| ≥ |x|+ξ.(y−0),∀y∈IR}

∂cf(x) = {ξ∈IR :|y| ≥x+ξ.(y−0),∀y∈IR}

Vemos que, si y= 0 entonces:

0≥x−ξ.x, que es equivalente a

0≥x(1−ξ), lo que implica que

(22)

Ahora si y >0; consideramos y 6=x, tenemos: y−x >0∨y−x <0 Siy−x <0 tenemos lo siguiente:

y≥x+ξ(y−x)

y−x≥ξ(y−x) lo que implica que

ξ ≥1

Si y−x >0 tenemos lo siguiente:

y≥x+ξ(y−x)

y−x≥ξ(y−x) lo que implica que

ξ≤1. Ahora si y >0; consideramos y=xtenemos

y≥x+ξ(y−x)

y−x≥ξ(y−x) ξ ∈IR

Interceptando los conjuntos tenemos que: ξ= 1

∂cf(x) = 1, ∀x >0.

(iii) Si x <0 tenemos

∂cf(x) = {ξ∈IR :|y| ≥ −x+ξ.(y−0),∀y∈IR}.

Se analiza en forma an´aloga para los casos cuando y = 0; y > 0, y < 0 entonces se obtiene que:

ξ=−1, y por lo tanto

(23)

De (i),(ii) y (iii) se concluye que:

∂cf(x) =       

     

1; x >0

−1; x <0 [−1,1] ; x= 0 Ejemplo 1.3.2

Sea f :IR→IRdefinida como :

f(x) =

  

 

1−x; x <1 x2 ₋_1, _x_≥₁

Verificar su subdiferenciabilidad.

cuya gr´afica es:

Sabemos que:

∂cf(x) = {s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}

(24)

(a) Siy <1 entonces f(y) = 1−y, reemplazando en la definici´on;

1−y ≥1−x+s(y−x), lo que es equivalente a;−(y−x)≥s(y−x)...(i) veamos los siguientes casos:

• Si (y−x)>0 simplificando en (i); se tiene:

−1≥s,entonces s∈ h−∞,−1].

• Si (y−x)<0; simplificando en (i); se tiene:

−1≤s,entonces s∈[−1,∞i.

• Si y=x simplificando en (i); se tiene: 0≥s.0, se cumple; ∀s∈IR

Iterceptando los conjuntos tenemos: s=−1

(b) Siy = 1 entonces f(y) = 0,reemplazando en la definici´on; 0≥1−x+s(y−x),lo que es equivalente a;−s(1−x)≥(1−x) como (1−x)>0,entonces −s ≥1;s∈ h−∞,−1]

de s= -1 ∧ s∈ h−∞,−1] se tiene : s= -1

(c) Siy >1 entonces f(y) = y2₋_1, _{reemplazando en la definici´on;}

y2₋₁_≥₁₋_x₊_s(y₋_x), _tomando _s ₌₋_{1 se tiene;}

(y−1)(y+ 1)≥1−x+ (−1)(y−x) lo que equivale a; (y−1)(y+ 1)≥1−x−y+x simplificando se tiene: y≥ −2 (lo cual es verdadero)

Luego de (a),(b) y (c) tenemos: ∂cf(x) = −1.

2. Si, x= 1 entonces; f(x) = 0 (a) Siy <1 entonces f(y) = 1−y,

(25)

(b) Siy ≥1 entoncesf(y) =y2₋₁

f(y)≥f(x) +s(y−x), lo que equivale a;

y2₋₁_≥_{0 +}_s(y₋_{1) se tiene (y}₋_1)(y_{+ 1)}_≥_s(y₋₁₎

lo equivale a (y+ 1)≥s tomando limy→1f(y),

obtenemos s≤2 luego s∈ h−∞,2] de (a) y (b) se tiene: ∂cf(x) = [−1,2]

3. Si, x >1, entonces x∈ h1,∞i; f(x) = x2₋₁

se tiene los siguientes casos:

(a) Siy ≥1 entoncesf(y) =y2₋_1, _{tenemos de la definici´on;}

∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}

se tiene: (y−x)2 _≥_0, _{desarrollando el binomio tenemos}

y2₊_x2 _≥_2xy, _{lo que es equivalente a:} _y2₋₁_{≥ −}₁₋_x2_{+ 2xy}

y2₋₁_≥_x2₋_{1 + 2xy}₋_2x2_, _{lo que equivale a:} _y2₋₁_≥_x2₋_{1 + 2x(y}₋_x)

f(y)≥f(x) +s(y−x), obtenemos: s= 2x (b) Siy <1 entonces f(y) = 1−y,

se tiene: 1−y ≥(x2₋_{1) + 2x(y}₋_x), _∀_{x >}_1; _∀_{y <}₁

lo que equivale a: 1−y≥ −x2₋_{1 + 2xy}

lo que equivale a: 0≥ −x2₋_{2 +}_{y(1 + 2x)...(∆)}

tenemos los siguientes casos:

• Si y ≤0 remplazando en (∆) es verdadero

• Si 0< y < 1 y x >1 tenemos lo siguiente:

y(1 + 2x)<(1 + 2x)lo que equivale a: −x2₋_{2 +}_{y(1 + 2x)}_<₋_x2₋_{1 + 2x}

lo que equivale a: −x2₋_{2 +}_{y(1 + 2x)}_<₋_(x2₋_2x_{+ 1)}

lo que equivale a: −x2₋_{2 +}_{y(1 + 2x)}_<₋_(x₋₁₎2 _<_{0 es verdadero}

de (a) y (b) tenemos: ∂cf(x) = 2x

(26)

∂Ff(x) =       

     

(27)

Cap´ıtulo 2

Subdiferencial de Clarke

2.1 Generalizaci´

on de la derivada

Definici´on 2.1.1 Dado f : IRn → IR localmente lipschitziana en el punto x ∈ IRn. La derivada direccional generalizada de f enx,en la direcci´on de v ∈IRn_,_{es definida}

por

f0(x, v) = lim_y_→_x

t↓0

supf(y+tv)−f(y) t

Debemos notar quef◦

siempre existe gracias a la condici´on de localmente lipschitz de

la funci´on f.

2.2 Propiedades B´

asicas

Teorema 2.2.1 Sea f localmente lipschitziana en x con constante k >0 entonces: (i) La funci´on v 7→f0_{(x, v)} _{es positivamente homog´enea y subaditiva en} _IRn

con

|f0(x, v)| ≤k||v||.

(ii) f0_{(x, .)} _{es una funci´on semicontinua superior y lipschitziana con constante} _k sobre IRn.

(28)

Demostraci´on.

(i) de la Definici´on 2.1.1

t↓0

supf(y+tv)−f(y)

t .

Tomando valor absoluto y aplicando una propiedad de l´ımite superior se tiene:

|f0(x, v)| ≤ _ylim_→_x

t↓0

sup

f(y+tv)−f(y) t

De la condici´on de localmente lipschitziana se tiene (Definici´on.1.2.5):

|f0_{(x, v)}_{| ≤} _lim

y→x t↓0

supk.||(y+tv)−(y)|| t

As´ı

|f0(x, v)| ≤_ylim

→xkt ||v||

t =k||v||, y por lo tanto,|f0_{(x, v)}_{| ≤}_k_||_v_||_.

Ahora mostraremos que la derivada es positivamente hom´ogenea, dondeλ >0:

f0_{(x, λv) = lim}

y→x t↓0

supf(y+tλv)−f(y) t

= lim_y_→_x

t↓0

supλ

(

f(y+tλv)−f(y) λt

)

= λ_ylim_→_x

t↓0

sup

(

f(y+tλv)−f(y) λt

)

= λf0(x, v)

Demostraremos la sub-aditividad. Seanv, w∈IRnarbitrarios, tomaremos valor absoluto y aplicaremos la propiedad de l´ımite superior

f0(x, v+w) = lim_y_→_x

t↓0

supf(y+t(v+w))−f(y) t

= lim_y_→_x

t↓0

(29)

≤ _ylim_→_x

t↓0

supf((y+tw) +tv)−f(y+tw) t + limy→x

t↓0

supf(y+tw)−f(y) t

≤ f0(x, v) +f0(x, w)

As´ı,v 7→f0_{(x, v) es subaditiva.}

(ii) Sean nxℓo

,nvℓo

⊂ IRn dos sucesiones tales que xℓ _→ _x _y _vℓ _→ _{v, por la}

definici´on de l´ımite superior

f0(x, vℓ) = inf

δ>0 ₍_y,t₎_∈sup_B₍₍_x,₀₎_,δ₎

f(y+tvℓ₎₋_f_(y)

t

!

≤ sup

||(y,t)−(x,0)||<δ

f(y+tvℓ₎₋_f(y)

t , ∀δ > 0 = sup

||y−x||+t<δ

f(y+tvℓ₎₋_f(y)

t , ∀δ >0 Sea δ= 1_ℓ → ∃{yℓ_}_,_{_tℓ_}_>_{0 tal que:}

f0(x, vℓ₎_< f(yℓ+tℓvℓ)−f(yℓ)

tℓ +

1 ℓ,

||yℓ−x||+tℓ < 1

ℓ, ∀ℓ∈IN tenemos as´ı,

f0_{(x, v}ℓ₎₋ 1

ℓ = ylim→xℓ

t↓0

supf(y+t

ℓ_vℓ₎₋_f(y)

t −

1 ℓ

≤ f(y

ℓ₊_tℓ_vℓ₎₋_f_(yℓ₎

tℓ

= f(y

ℓ₊_tℓ_v)₋_f_(yℓ₎

tℓ +

f(yℓ₊_tℓ_vℓ₎₋_f_(yℓ₊_tℓ_v)

tℓ

y por la condici´on de lipschitzianidad

|f(yℓ₊_tℓ_vℓ₎₋_f_(yℓ₊_tℓ_v)_|

t ≤k

||tℓ_vℓ₋_tℓ_v_||

tℓ =k||v

ℓ₋_v_{|| →}₀

Mientras ℓ→ ∞ probamos yℓ₊_tℓ_vℓ_, _yℓ₊_tℓ_v _∈_{B(x, ǫ) obtenemos:}

lim

ℓ→∞supf

0_(xℓ_{, v}ℓ₎_≤ _lim ℓ→∞sup

f(yℓ₊_tℓ_v)₋_f_(yℓ₎

tℓ ≤f

(30)

luego limℓ→∞supf0(xℓ, vℓ)≤f0(x, v),

lo que establece la semicontinuidad superior.

Se mostrar´a la condici´on de Lipschitz. Sean v, w∈IRn, si y+tv y y+tw ∈B(x, ǫ) entonces

f(y+tv)−f(y+tw)≤kt||v−w||.

Ordenando,

f(y+tv)−f(y) +f(y)−f(y+tw)≤kt||v−w||

tomando l´ımite superior se tiene:

lim

y→x t↓0

supf(y+tv)−f(y)

t ≤ ylim→x t↓0

f(y+tw)−f(y)

t +k||v−w|| lo que es equivalente a:

f0(x, v)−f0(x, w) ≤ k||v−w||

(iii)

f0(x,−v) = lim_y_→_x

t↓0

supf(y−tv)−f(y) t

= lim_y_→_x

t↓0

supf(m+tv−tv)−f(m+tv) t

= lim_y_→_x

t↓0

supf(m)−f(m+tv) t

= lim_y_→_x

t↓0

sup(−f)(m+tv)−(−f)(m)] t

= (−f)0(x, v) donde,m =y−tv.

Esto completa la prueba.

Definici´on 2.2.1 Sea f :IRn_→ _IR _{una funci´on localmente lipschitziana en} _x_∈ _IRn

entonces el sub-diferencial, en el sentido de Clarke, de f en x es el conjunto

ˆ

(31)

Cada elemento ξ ∈∂fˆ (x) es llamado subgradiente, en el sentido de Clarke, de f enx.

Ejemplo 2.2.1

La funci´on f(x) = x2_sen(1

x) es diferenciable excepto en el punto cero, hallaremos el

subdiferencial de Clarke en este punto. Su gr´afica es:

Usando la definici´on de la derivada generalizada tenemos:

t↓0

sup(y+tv)

2_sen( 1

y+tv)−y

2_sen(1

y)

t

Tomandox= 0 y por definici´on de subdiferencial de Clarke tenemos:

ˆ

∂f(0) = {r∈IR:f0_{(0, v)}_≥_r.v, _∀_v _∈_IR_}

= {r∈IR: lim_y

→x t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

(y+tv)2_sen( 1

y+tv)−(y)

2_sen(1

y)

(32)

= {r∈IR: lim

t↓0 sup

t2_v2_.sen( 1

t.v)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

v.sen( 1

t.v)

1

t.v

≥r.v}

= {r∈IR:v ≥r.v}

(i) Si v ≥0 entonces se tiene 1≥r (ii) Si v <0 entonces se tiene 1≥ −r

De (i) y (ii) se tiene r∈[−1,1],luego

ˆ

∂f(0) = [−1,1].

Teorema 2.2.2 Sea f :IRn →IR∪ {+∞} una funci´on propia semicontinua inferior y cuasi-convexa. Si g ∈∂f,ˆ y f(y)≤f(x) entonces

hg;y−xi ≤0

Demostraci´on.

Comog ∈∂fˆ(x) se tiene f0_{(x, v)}_{≥ h}_g_;_v_i_; _{para todo}_v _∈_IRn

Luego tenemos: f0_{(x, v) = lim}_y_→_x

t↓0

supf(y+tv_t)−f(y) ≥ hg;vi

lo cual es equivalente a: infδ>0 supky−xk+t<δ

f(y+tv)−f(y)

t ≥ hg;vi

en particularv =y−x tenemos sup_ky−xk+t<δ

f(y+t(y−x))−f(y)

t .

Tomandoδ = _n1,para todo n∈N, entonces existe {yn_}_,_{_tn_}_>₀

tal que kyn₋_x_k₊_tn _→₀ _{luego se tiene:}

sup_ky−xk+t<δ

f(y+t(y−x))−f(y)

t <

f(yn₊_tn₍_yn₋_x₎₎₋_f₍_y₎

t +

1

n

lo que es equivalente a: hg;y−xi ≤ f(yn+tn(yn_t−x))−f(y) + 1

n

efectuando operaciones tenemos:

hg;y−xi ≤ f((−tn)x+(1+_ttn)yn)−f(y) + 1

n como f es cuasi-convexa y f(x)≥f(y)

tenemos: hg;y−xi ≤ f(x)−_tnf(yn)+

1

(33)

tomando l´ımite obtenemos: hg;y−xi ≤0.

Ejemplo 2.2.2

Dada la siguiente funci´on:

f(x) =

  

 

4, |x| ≥4

|x|, |x|<4 Obtendremos el subdiferencial de Clarke para todox∈IR. De la definici´on:

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IRn}

La gr´afica es

a) Si x <−4 entonces x∈ h−∞,−4i se tiene que f(x) = 4

ˆ

∂f(x) = {r∈IRn/f0(x, v)≥r.v, ∀v ∈IR}

= {r∈IR: lim_y_→_x

t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

4−4

(34)

= {r∈IR: lim

t↓0

0

t ≥r.v} Luego se obtiene : ˆ∂f(x) = {0}

b) Si x=−4 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales

c) Si −4< x < 0 entoncesx∈ h−4,0i se tiene que f(x) = −x

ˆ

∂f(x) = {r ∈IRn _:_f0_{(x, v)}_≥_r.v, _∀_v _∈_IR_}

= {r ∈IR: lim_y

→x t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r ∈IR: lim

t↓0 sup

−(y+tv) +y

t ≥r.v} = {r ∈IR: lim

t↓0

−tv

t ≥r.v} = −v ≥r.v

Siv ≥0 entonces, −1≥r Si v <0 entonces, −1≤r

Luego se obtiene : ∂fˆ (x) = {−1}

d) Si x= 0 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales

Veamos cuando y → 0− _tenemos _{f(x) =} _k_x_k _{entonces por el ejemplo 1.3.1 se}

tiene;

ˆ

∂f(0) ={r∈IRn_/f0_{(0, v)}_≥_r.v, _∀_v _∈_IRn_}

ˆ

∂f(0) = [−1,1]. e) Si 0< x < 4 entoncesx∈ h0,4i

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}

t↓0

supf(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

(y+tv)−y

t ≥r.v} = {r∈IR: lim

t↓0

tv

(35)

Si v ≥0 entonces, 1≥r Siv <0 entonces, 1≤r

Luego se obtiene : ˆ∂f(x) = {1}.

f) Si x= 4 Aplicando el subdiferencial Clarke

g) Si x >4 entonces x∈ h4,∞i se tiene que f(x) = 4

ˆ

∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}

t↓0

sup f(y+tv)−f(y)

t ≥r.v}

= {r∈IR: lim

t↓0 sup

4−4

t ≥r.v} = {r∈IR: lim

t↓0

0

t ≥r.v}

Luego se obtiene : ˆ∂f(x) = {0}.

Luego interceptando de (a),(b),(d),(e),(f), y (g) tenemos:

ˆ

∂f(x) =

                          

0, x >4∨x <−4 φ, x= 4∨x=−4

−1, −4< x <0 [−1; 1], x= 0 1, −0< x <4

Teorema 2.2.3 Sea f una funci´on localmente Lipschitz enx con constante k (i) ˆ∂f(x) es un conjunto no vacio, convexo y compacto tal que ||ξ|| ≤k,

∀ξ∈∂fˆ (x).

(ii) f0_{(x, v) = max}_{h_ξ;_v_i_:_ξ_∈_∂fˆ _(x)_}_, _∀_v _∈_IRn

(36)

(iii) La aplicaci´on∂fˆ (·) :IRn _→_P_(IRn₎ _{es semicontinua superior.}

Demostraci´on.

(i) Del Teorema 2.2.1, item 1 la funci´on f0_(x,_·_{) :} _IRn _→

IR es positivamente homog´enea y subaditiva entonces por el Teorema de Hahn-Banach (Teorema 1.2.5) y el Teorema de representaci´on de Riez, ver Teorema 1.2.2 existe un vectorξ ∈IRn _{tal que}

hξ;vi ≤f0(x, v),∀v ∈IRn

Para probar la convexidad, seanξ, ξ′ _∈_∂fˆ _{(x) y} _λ_∈_[0,_{1], entonces}

hλξ+ (1−λ)ξ′_;_v_i ₌ _h_λξ;_v_i₊_h₍₁₋_λ)ξ′_;_v_i

= λhξ;vi+ (1−λ)hξ′;vi ≤ λf0(x, v) + (1−λ)f0(x, v) = f0(x, v),

por lo tanto,λξ+ (1−λ)ξ′ _∈_∂fˆ _{(x) y as´ı ˆ}_{∂f(x) es convexo.}

Demostraremos que ˆ∂f(x) es compacto, esto es, ˆ∂f(x) es acotado y cerrado. Probaremos que ˆ∂f(x) es acotado∀x∈IRn_.

Por la definici´on de Subdiferencial y el Teorema 2.2.1, item 1, tenemos

||ξ||2 =hξ;ξi ≤ |f0(x, ξ)| ≤k||ξ||, ∀ξ∈∂fˆ (x)

esto es,

||ξ||2 ≤ k||ξ||, ∀ξ∈∂fˆ (x)

esto implica que

||ξ|| ≤ k, ∀ξ∈∂fˆ (x)

entonces, ˆ∂f(x) es acotado.

(37)

Sea nξℓo_⊂_∂fˆ _{(x) una sucesi´on tal que} _ξℓ _→_ξ. _{Probaremos que}_ξ _∈_∂fˆ _(x).

Tenemos:

hξ;vi=

lim

l→∞ξ

ℓ_;_v ₌ _lim ℓ→∞

D

ξℓ_;_vE

≤ lim

ℓ→∞f

0_{(x, v)}

≤ f0(x, v), ∀v ∈IRn_.

entonces,ξ ∈∂fˆ (x). Por tanto, ˆ∂f(x) es cerrado.

(ii) Por ser ˆ∂f(x) continua y compacto y de la definici´on de la subdiferencial

f0(x, v)≥max{hξ;vi:ξ ∈∂fˆ (x)}, ∀v ∈IRn (2.2)

Probaremos ahora que

f0(x, v)≤max{hξ;vi:ξ∈∂fˆ (x)}, ∀v ∈IRn.

Por contradicci´on, supongamos que existevℓ ∈IRn tal que

f0(x, vℓ)>max{hξ;vℓi:ξ ∈∂f(x)} ≥ hξ;vℓi, ∀ξ∈∂fˆ (x)

⇒f0(x, vℓ)> f0(x, vℓ)(lo que es una contradicci´on con(2.2)).

Luego,

f0(x, v) = max{hξ;vi/ξ ∈∂f(x)}, ∀ ∈IRn_.

(iii) Sea nyℓo_⊂_IRn _{y (ξ}ℓ₎_⊂_∂f_(yℓ_{) para cada (ℓ), tal que}_yℓ _→_x _y _ξℓ _→_ξ,

entonces∀v ∈IRn tenemos

hξ;vi=

lim

ℓ→∞ξ

ℓ_;_v_{= lim} i→∞

D

ξℓ_;_vE

≤ lim

ℓ→∞supf

0_(yℓ_{, v).}

Por el Teorema 2.2.1, ii , f0_(x,_·_{) es semicontinua superior entonces,}

hξ;vi ≥f0(x, v)

(38)

Teorema 2.2.4 Sea f : IRn _→ _IR _{una funci´on localmente lipschitz en} _x _y

dife-renciable en x, entonces:

∇f(x)∈∂fˆ (x)

Demostraci´on.

Por la definici´on de diferenciabilidad la derivada direccional f′_{(x, v) existe} _∀_v _∈ _IRn

y

f′(x, v) = h∇f(x);vi, ∀v ∈IRn vemos que:

f(y+tv)−f(y)

t ≤(x,t)∈supB((x,0),δ)

f(y+tv)−f(y)

t , ∀(y, t) :||y−x||+t < δ,∀δ >0, en particular,

f(x+tv)−f(x)

t ≤(y,t)∈supB((x,0),δ)

f(y+tv)−f(y)

t , ∀δ >0, ∀t < δ, Luego tomando l´ımite cuando t→0

lim

t→∞

f(y+tv)−f(x)

t ≤f

0_{(x, v)}

f′(x, v)≤f0(x, v) Se sigue que:

f0(x, v)≤ h∇f(x);vi, ∀v ∈IRn_.

Por tanto, ∇f(x)∈∂fˆ (x)

Lema 2.2.5 Si f es continuamente diferenciable en x entonces f es localmente lip-schitziana en x.

Prueba.

De la hip´otesis, sea F :IRn →L(IRn, IR) tal que, para cada x∈IRn se tiene F(x) = Fx :IRn→IR definido por Fx(v) =h∇f(x);vi Por demostrar que F

(39)

Sea w∈B(x, γ), (B(x, γ) es la vecindad def, donde es locamente lipschitiziana )

∀ǫ >0,∃ kFy(v)−Fw(v)k>0 :ky−wk< δ ⇒ kFy −Fwk< ǫ kFy −Fwk=Supv6=0

kFy(v)−Fw(v)k

kvk < kky−wk

Tomandoδ tal que δ < ǫ/k, se tiene

kFy −Fwk ≤kky−wk< kδ < ǫ

entonces F es continua en una vecindad de x.

Luego se tiene que: F es acotada en una vecindad de x. por Teorema 1.2.1 Entonces kFxk ≤M

kFx(v)k

kvk ≤Supv6=0

kFx(v)k kvk ≤M

Luego se tiene:

h∇f(x);vi

kvk ≤M,

tomando v =∇f(x) se tiene k∇f(x)k ≤M para todow∈B(x, γ).

Sean y, y′ _∈_B_{(x, ǫ), entonces por el teorema del valor medio, existe} _z _∈_{(y, y}′₎_⊂

B(x, ǫ) tal que:

f(y)−f(y′) =| h∇f(z), y−y′i | ≤ ||∇f(z)|| ||y−y′||

|f(y)−f(y′)| ≤ ||∇f(z)|| ||y−y′|| |f(y)−f(y′)| ≤ M||y−y′||

por lo tanto, cumple la condici´on de Lipschitziana enx.

Teorema 2.2.6 Si f es continuamente diferenciable en x, entonces ˆ

∂f(x) ={∇f(x)}

Demostraci´on.

(40)

continuidad diferenciable, si xi →x, entonces el ∇f(xℓ) converge a ∇f(x), tenemos

que∀v ∈IRn

lim

xℓ_→_xf

′_(xℓ

, v) = lim

xℓ_→_xlimt↓0

f(xℓ₊_tv)₋_f(xℓ₎

t = lim

xℓ_→_x

D

∇f(xℓ_{), v}E

= h∇f(x);vi

= f′(x, v)

para todov ∈IRn _{se tiene,}

f′(x, v) = lim

xℓ_→_xf

′_(xℓ_{, v) = lim} xℓ_→_x

t↓0

f(xℓ₊_tv)₋_f_(x i)

t

= lim

xℓ_→_x

t↓0

supf(x

ℓ₊_tv)₋_f_(xℓ₎

t

= f0(x, v)

As´ı tenemos quef0_{(x, v) =} _h∇_{f(x), v}_i_,_∀_v _∈_IRn

. Supongamos que se tieneξ∈∂fˆ (x), para alg´un ξ6=∇f(x) entonces existe v0 ∈IRn tal que

h∇f(x);v0i=f(x, v0)>hξ;v0i

ahora,

h∇f(x);−v0i=f(x, v0)≥ hξ;−v0i

es equivalente

h∇f(x);v0i ≥ − hξ;v0i

h∇f(x);v0i ≤ hξ;v0i

lo cual es una contradicción con la hipótesis. Entonces,∇f(x) es el único subgra-diente def enx.

Teorema 2.2.7 Si la funci´on f : IRn _→ _IR _{es convexa y localmente lipschitz en}

(41)

(a) f′_{(x, v) =} _f0_{(x, v)}_,_∀_v _∈_IRn_.

(b) ∂cf(x) = ˆ∂f(x)

Demostraci´on.

Si (a) es verdadero, entonces (b) se sigue de la definici´on del subdiferencial en el sentido de Clarke (Definici´on 2.1.1) y del Teorema 1.3.1-ii. As´ı es suficiente probar la parte (a).

Por la definici´on de la derivada direccional generalizada, se tiene f0(x, v)≥f′(x, v), v ∈IRn_.

Por otro lado siδ > 0 fijo, entonces f0(x, v) = lim

x′_→_x

t↓0

supf(x

′₊_tv)₋_f(x′₎

t

= lim

ǫ↓0 _||_x′sup₋_x_||_<ǫ

supf(x

′ ₊_ǫv)₋_f_(x′₎

t de la prueba del Teorema 1.3.2 tenemos la funci´on

φ(t) = (1/t)(f(x′+tv)−f(x′)) es no decreciente, se puede escribir

f0(x;v) = lim

ǫ↓0 _||_x′₋sup_x_||_<ǫδ

f(x′₊_ǫv)₋_f_(x′₎

ǫ

Por la condici´on de Lipschitz para alg´un x′ _∈_B_(x;_{ǫδ) tenemos}

f(x′₊_ǫv)₋_f(x′₎

ǫ −

f(x+ǫv)−f(x) ǫ ≤

f(x′₊_ǫv)₋_f_(x₊_ǫv)

ǫ +

f(x)−f(x′₎

ǫ ≤ k

ǫ||x

′₋_x_||₊k

ǫ||x

′₋_x_||

≤ 2k

ǫ ||x

′ ₋_x_||

≤ 2k

ǫ (ǫδ)

≤ 2kδ.

f0(x, v)≤lim

ǫ↓0

f(x+ǫv)−f(x)

ǫ + 2δk=f

′_{(x, v) + 2δk}

(42)

Definici´on 2.2.2 La funci´on f : IRn _→ _IR _{es regular en} _x _∈ _IRn_{, si} _∀_v _∈ _IRn _la

derivada direccional f′_{(x, v)} _{existe y}

f′(x, v) = f0(x, v).

Algunas condiciones para que f sea regular.

Teorema 2.2.8 Sea f lipschitz enx si se cumple: (a) f es continuamente diferenciable en x.

(b) f es convexo.

(c) f =Pm

i=1λifi, dondeλi >0yfi es regular enxpara cada i= 1, ..., m, entonces

f es regular en x.

Prueba.

(a) Si f es continuamente diferenciable, entonces la derivada direccional f′_{(x, v)}

existe para todov ∈IRn _{y por la prueba del Teorema 2.2.6}

f0(x, v) = f′(x, v), ∀v ∈IRn_.

(b) Dado (a) la prueba de (b) se sigue de el Teorema 1.3.1-ii y el Teorema 2.2.7

(c) Es suficiente la prueba para m= 2. Por inducci´on, si f es regular en xy λ >0 entonces

(λf)0(x, v) =λf0(x, v) =λ′f(x, v) = (λf)′(x, v), ∀v ∈IRn_.

es evidente que (f1+f2)′ siempre existe y (f1+f2)′ =f1′ +f2′, por la definici´on

de la generalizaci´on de la derivada

(f +f2)≥(f1 +f2)′

tenemos

(f1+f2)0(x, v) = lim_y_→_x

t↓0

(43)

= lim

t↓0 sup

f1(y+tv) +f2(y+tv)−f1(y)−f2(y)

t

≤ _ylim_→_x

t↓0

supf1(y+tv)−f1(y) t + limy→x

t↓0

supf2(y+tv)−f2(y) t

= f₁0(x, v) +f₂0(x, v).

As´ı que

(f1+f2)′ =f1′ +f2′ =f10+f20 ≥(f1+f2)0

tambi´en

(f1+f2)′ = (f1+f2)0

esto completa la prueba.

Corolario 2.2.1 Si f es diferenciable, regular y localmente lipschitziana en x, en-tonces

ˆ

∂f(x) = {∇f(x)}.

Prueba.

∇f(x)∈∂fˆ (x) es diferenciable y lipschitziana entonces {∇f(x)} ⊂∂f(x).ˆ Por otro lado, sea ξ ∈∂fˆ (x); supongamos que ξ6=∇f(x)

f0(x, v) ≤ hξ;vi, ∀v ∈IRn

f′(x, v) = f0(x, v) = h∇f(x);vi h∇f(x);vi ≤ hξ;vi ∀v

v = − h∇f(x)−ξ;vi ≥0 ∀v v = (∇f(x)−ξ)

0 < ||∇f(x)−ξ||0 ≤0

lo cu´al es una contradicci´on, luego ˆ∂f(x)⊂ {∇f(x)}. Por lo tanto, ˆ

∂f(x) = {∇f(x)}.

Corolario 2.2.2 Sif es localmente de Lipschitziana enx, entonces para todo λ∈IR, ˆ

(44)

Prueba.

Comof es de Lipschitz, λf tambi´en es de lipschitz en x. Si λ≥0, entonces

(λf)0 ₌_{h f}0_{, tambi´en ˆ}_{∂(λ f}_{)(x) =} _λ_∂f_ˆ _{(x), para todo}_λ _≥_{0, se prueba para} _h ₌₋_1,

ξ∈∂(ˆ −f)(x) ⇔ (−f)0(x, v)≥ hξ;vi ∀v ∈IRn

⇔ f0(x,−v)≥ hξ;vi ∀v ∈IRn

⇔ f0(x,−v)≥ h−ξ;−vi ∀ −v ∈IRn

⇔ −ξ∈∂fˆ (x)

⇔ ξ∈ −∂fˆ (x)

Por lo tanto, ˆ∂(λf)(x) =λ∂f(x).ˆ

Teorema 2.2.9 Si f es localmente lipschitz en x y tiene un extremo en x, entonces

0∈∂fˆ (x)

Demostraci´on.

Suponemos primero que f alcanza un m´ınimo local en x, entonces existe ǫ, tal que f(x+tv)−f(x)≥0 para todo 0< t < ǫ y v ∈IRn, se tiene:

f0_{(x, v) = lim}

y→x t↓0

supf(y+tv)−f(y)

t ≥limt↓0 sup

f(x+tv)−f(x)

t ≥0

y tambi´en

f0(x, v)≥0 =h0, vi ∀v ∈IRn

por la definici´on de subdiferencial 0∈∂fˆ (x).

Suponemos que f alcanza un m´aximo local en x entonces −f alcanza un m´ınimo enx y por el Teorema 2.2.9, 0∈∂(ˆ −f)(x)

Lema 2.2.10 La funci´on g : [0,1]→IR definida por

(45)

es Lipschitziana en (0,1)

ˆ

∂g(t)⊂D∂fˆ (x+t(y−x);y−x)E

Prueba.

|g(t)−g(t′)| = |f(xt)−f(x′t)| ≤k||xt−x′t||

= k||x+t(y−x)−(x+t′(y−x))|| ≤ k||x+ty−tx−x−t′y+t′x|| ≤ k||t(y−x)−t′(y−x)||

≤ ||(y−x)(t−t′)|| ≤ k||y−x|| |t−t′|

entonces,|g(t)−g(t′₎_{| ≤}˜_k_|_t₋_t′_|_, _{t, t}′ _∈_(0,_{1); donde ˜}_k ₌_k_||_y₋_x_||_.

Por el Teorema 2.2.3 se tiene el conjunto ˆ∂g(t) y D∂fˆ (xt);y−x E

son compactos y convexos puesto que corresponden aIR. Se tiene el intervalo enIR, es suficiente probar para v =±1, tenemos

max{∂g(t)vˆ } ≤max{D∂f(xˆ t);y−x E

v}

por el Teorema 2.2.3 tenemos

max{∂g(t)ˆ v}=g0(t, v)

y,

max{∂g(t)ˆ v} = lim_s_→_y

λ↓0

supg(s+λ v)−g(s) λ

≤ lim

y′_→_x_t

λ↓0

supf(x+ [s+λv](y−x))−f(x+s(y−x)) λ

≤ lim

y′_→_x

t

λ↓0

supf(x+s(y−x)−λv(y−x))−f(y

′₎

λ

= f0(xt;v(y−x))

Adem´as, se sigue del Teorema 2.2.3,

f0(xt;v(y−x)) = max{ D

ˆ

∂f(xt);y−x E

(46)

y as´ı,

max{∂g(t)ˆ v} ≤max{D∂fˆ (xt);y−x E

v}

Por lo tanto, ˆ∂g(t)⊂D∂fˆ (x+t(y−x));y−xE

Teorema 2.2.11 Si las funciones fi : IRn → IR son localmente lipschitz en x para

i= 1, ..., m entonces para escalares λi ∈IR

∂

m X

i=1

λifi !

(x)⊂ m X

i=1

λi∂fi(x)

y se tiene la igualdad, en la suma, cada fi es regular en x y cada λi >0.

Demostraci´on.

Es suficiente la prueba param = 2 el caso se generaliza por inducci´on. Del Teorema 2.2.8 observamos que

(f1+f2)0(x, v)≤f10(x, v) +f20(x, v)

por la definici´on de subdiferenciabilidad ˆ

∂(f1+f2)(x, v)⊂∂fˆ 1(x) +∂f2(x).

Luego, del Corolario 2.2.2 tenemos ˆ

∂(λ1f1+λ2f2)(x)⊂∂ˆ(λ1f1)(x) + ˆ∂(λ2f2)(x) = λ1∂fˆ 1(x) +λ2∂fˆ 2(x)

consideremos lo siguiente, fi es regular en x y λi >0, para i= 1,2; por el Teorema

2.2.8 la funci´onλ1f1+λ2f2 es regular enx, entonces

(λ1f1+λ2f2)0 = (λ1f1 +λ2f2)′ =λ1f1′ +λ2f2′ =λ1f10+λ2f20

y luego se sigue:

ˆ

∂(λ1f1+λ2f2)(x) =λ1∂fˆ 1(x) +λ2∂fˆ 2(x)

Teorema 2.2.12 (Teorema del valor medio) Sea x, y ∈ IRn _{y sea la funci´on} _f

Lip-schitziana en un conjunto abierto U ⊂ IRn tal que el segmento de l´ınea [x, y] ⊂ U, entonces existe un punt u∈(x, y) tal que

(47)

Demostraci´on.

Se define la funci´onθ : [0,1]→IRtal que

θ(t) =f(xt) +t[f(x)−f(y)]

entonces θ es continua y,

θ(0) = f(x0) = f(x)

θ(1) = f(x1) +f(x)−f(y) =f(x)

entonces existe t0 ∈ (0,1) tal que se obtiene un extremo local t0 y por el Teorema

2.2.9, 0∈∂θ(t0) y por el Teorema 2.2.11 se tiene

ˆ

∂θ(t) = ˆ∂[f(xt) +t(f(x)−f(y))]⊂∂fˆ (xt) + [f(x)−f(y)] ˆ∂t

y adem´as por el Lema 2.2.10 se tiene

0∈D∂fˆ (xt);y−x E

+ [f(x)−f(y)].∂ˆ(t)

entonces, de ˆ∂(t) = 1 se sigue que

f(y)−f(x)∈D∂fˆ (µ);y−xE

de donde µ=xt∈(x, y), con ello se concluye el teorema.

Definici´on 2.2.3 (Subdiferencial de funciones no convexas)

Sea f : IRn _→ _IR_{∪ {}₊_∞} _{una funci´on propia, el conjunto de subgradientes}

genera-lizados (tambi´en llamado limite subdiferencial ) de f en x∈IRn denotado por ∂f(x) es definido como:

(48)

Cap´ıtulo 3

El M´

etodo de Punto Proximal

Consideremos el problema:

(P)              minf(x) s.a: x∈IRn

donde f :IRn →IR∪ {+∞} es una función propia, semicontinua inferior y IRn es el espacio euclidiano con norma || · ||. El Método de Punto Proximal clásico genera una sucesión{xk_} _{dado por}_x0 _∈_IRn

(un punto arbitrario) y

xk ∈arg min{f(x) + λk

2 ||x−x

k−1_||2 _: _x_∈_IRn_}

,

donde λk es un par´ametro positivo. Para resolver (P) introducimos el siguiente

m´etodo:

Dado una sucesi´on de par´ametros positivos {λk} y un punto inicial

x0 ∈IRn. (3.1)

Para cada k = 1,2, . . .. Si 0∈ ∂fˆ (xk−1_{), entonces el m´etodo finaliza. De otro modo}

buscamos unxk _∈_IRn _{tal que}

0∈∂ˆ f(·) + λk 2

!

|| · −xk−1||2

!

(xk) (3.2)

Observación 3.0.1 Este método es una extensión del método del punto proximal para funciones no convexas, en efecto si f es convexa entonces (3.2) se convierte en

xk = arg min

(

f(x) + λk

2 ||x−x

(49)

Observaci´on 3.0.2 Como estamos interesados en resolver (P) donde f es no con-vexa, es importante observar que el m´etodo (3.1) y (3.2) solamente necesita encontrar

un punto estacionario (no necesariamente un m´ınimo global) de la funci´on

regula-rizada f(·) + (λk

2 )|| · −x

k−1_||2_.

Probaremos bajo las hip´otesis quef es propia, acotado inferiormente y semicontinua inferior, las iteraciones nxko _{son bien definidas y si} _f _{es cuasi-convexa,} n_f_(xk₎o _es

no creciente y convergente.

Luego, definimos un conjunto en el cuál esté conteniendo el óptimo del conjunto

problema. Podemos obtener que:

lim

k→+∞f(x

k_{) = inf} x∈IRn

f(x).

Si el conjunto es vac´ıo y de la convergencia de nxko _{se generaliza un punto cr´ıtico,}

si {λk} es limitado y f es continua sobre su dominio.

Adem´as, si cada xk _{es un m´ınimo global de la funci´on regularizada dada en}

f(·) + (λk

2 )|| · −x

k−1_||2 _y _λ

k → 0 probamos que n

xko _{converge a un punto m´ınimo}

del problema (P). Como caso particular, obtenemos la convergencia del m´etodo a un punto m´ınimo global para funciones pseudoconvexas y convexas.

3.1 Resultados de convergencia Fej´

er

Definici´on 3.1.1 Una sucesi´on nyko_⊂_IRn

, es llamado Fej´er convergente a un con-junto U ⊆IRn_, _{con respecto a la norma euclidiana si:}

y

k+1₋_u ≤ y k₋ u

;∀u∈U,∀k ≥0 (3.3)

Teorema 3.1.1 Si la sucesi´on nyko _{es Fej´er convergente en un conjunto} _U ₆₌ _∅_,

entonces nyko _{es acotada. Si un punto de acumulaci´on} _y_¯ _de n_yko _{pertenece a} _U,

entonces

limk→+∞yk = ¯y

Demostraci´on.

(50)

y k₋ u ≤ y

0 ₋_u

;∀k≥0;

lo cual quiere decir que la sucesi´onnyko_{est´a contenida en la bola de centro}_u_{y radio} ky0₋_u_k_, _{por lo tanto es acotada.}

Sea x ∈ U un punto de acumulaci´on de nyko_{, como} n_yko _{es acotada posee un}

sub-sucesi´onnyjko _{convergente tal que:}

limk→+∞yjk = ¯y

por (3.3) se tiene que la sucesi´on n y

k₋_y_¯ o

es decreciente y no negativa adem´as posee una subsucesi´onn

y

jk₋_y_¯ o

,lo cual converge a 0. Por lo tanto n

y k₋_y_¯

o

converge a 0, y as´ı:

limk→+∞

y k₋ ¯ y = 0

lo que implica que limk→+∞yk = ¯y.

Proposici´on 3.1.1 Las siguientes propiedades son verdaderas: a. ∂f(x)ˆ ⊂∂f(x), ∀x∈IRn_.

b. Si f es diferenciable en x¯ entonces ∂fˆ (x) = {∇f(x)}, por lo tanto

∇f(¯x)∈∂f(¯x).

c. Si f es continuamente diferenciable en una vecindad de x entonces

ˆ

∂f(x) =∂f(x) ={∇f(x)}.

d. Si g =f+h, con f finito enx¯ yh es continua diferenciable sobre una vecindad de f en x¯ entonces

ˆ

(51)

Prueba.

Sea ˆ∂f(x) el subdiferencial de Clarke.

ˆ

∂f(x) = ns∈IRn:fo(x, v)≥ hs;vi, v ∈IRno,

∂f(x) = ns∈IRn _:_∃_xℓ _→_{x, f}_(xℓ₎_→_f_(x),_∃_sℓ _∈_∂f_ˆ _(xv_{) tal que} _sℓ _→_so

,

a. s∈∂fˆ (x) entonces se tiene; fo(x, v)≥ hs, vi, ∀v. ∃{xℓ_}₌_{_x_{} →}_x

f(xn_{) =}_f_{(x) se tiene la convergencia a:} _f(x).

Luego tenemos, {sℓ_}₌_{_s_{} ∈}_∂fˆ _(x)_→_s.

b. ∇f(¯x) ∈ ∂fˆ (¯x) pues f es diferenciable por Teorema 2.2.1 y por el ´ıtem a., ˆ

∂f(¯x)⊂∂f(¯x) de ambos tenemos que ∇f(¯x)∈∂f(x).

c. Como f es continuamente diferenciable en x, por Teorema 2.2.6 se cumple ˆ

∂f(x) ={∇f(x)}.

Por ´ıtem a., ˆ∂f(x)⊂∂f(x).

Sea s∈∂f(x)entonces ∃xℓ _→_{x, f}_(xℓ₎_→_f(x), _∃_sℓ _∈_∂fˆ _(xℓ_).

Como ˆ∂f(xℓ_{) =}n_∇_f_(xℓ₎o₌_sℓ_.

∃nxℓo₌_{_x_{} →}_x, _f(xℓ_{) =}_f_(x)_→_f(x).

n

sℓo₌_{_s_{} ∈}_∂f(x).ˆ _Entonces, _fo_{(x, v)}_{≥ h}_{s, v}_i_, _∀_{v. Por lo tanto,} _s_∈_∂fˆ _(x).

d. Del ´ıtem b.,

ˆ

∂f(¯x) +∇h(¯x) ⊂ ∂fˆ (¯x) + ˆ∂h(¯x),

⊂ ∂ˆ(f +h) (¯x),

(52)

Observaci´on 3.1.1 De (3.2) y de la Proposici´on 3.1.1-d y la diferenciabilidad de (λk/2)|| · −xk−1||2. esto implica que;

0∈∂fˆ (xk_{) +}_λ

k(xk−xk−1),

as´ı existe gk _∈_∂fˆ _(xk₎ _{tal que:}

gk₌_λ k

xk−1 ₋_xk

3.2 Resultados de convergencia

Teorema 3.2.1 Si f : IRn → IR∪ {+∞} es propia, acotada inferiormente y semi-continua inferior sobredomf, entonces la sucesi´on nxko_{dado por (3.1) y (3.2) existe.}

Demostraci´on.

Por inducci´on, se cumple para k = 0 por (3.1). Asumiremos que xk _{existe. Como}

f es semicontinua inferior, limitado inferiormente y || · −xk_||2 _{es coerciva, entonces}

f(·) + (λk/2)|| · −xk||2 es semicontinua inferior y coerciva. As´ı, esta funci´on tiene un

xk+1 _{como m´ınimo global (en particular un m´ınimo local) y por lo tanto}

0∈∂ˆf(·) +λk+1

2

|| · −xk_||2_(xk+1_).

Asumiremos las siguientes hip´otesis:

• Hip´otesis A: f :IRn→IR∪ {+∞} es una funci´on acotada inferiormente.

• Hipótesis B: f :IRn→IR∪ {+∞} es semicontinua inferior y cuasi-convexa. Como nos interesa la convergencia asintótica del método, asumimos también que en cada iteración 0∈/ ∂f(xˆ k_{) lo cuál implica que}_xk ₆₌_xk−1_, _∀_k.

Proposici´on 3.2.1 Bajo las hip´otesis A y B tenemos que nf(xk₎o _{es decreciente y}

convergente.

Prueba.

Comoxk ₆₌_xk−1_{, entonces}

D

(53)

de la Observaci´on (3.1.1),

D

gk;xk−1 −xkE>0.

Usando la cuasi-convexidad def y el Teorema 2.2.2 esto implica que

f(xk)< f(xk−1).

La convergencia de nf(xk₎o _{se d´a por el l´ımite inferior de} _f ₍ _f_(xk_{) es una funci´on}

no creciente).

Proposici´on 3.2.2 Las iteraciones nxko _{no son c´ıclicas.}

Prueba.

Supongamos que existe l > j+ 1 tal que xl₌_xj_{, de la Proposici´on 3.2.1}

f(xj) =f(xl)< . . . < f(xj+1)< f(xj),

pues f es no creciente, entonces

f(xj)< f(xj),

lo cu´al es una contradicci´on.

Por lo tanto xl₆₌_xj_.

Definimos el siguiente conjunto:

U =

x∈IRn/f(x)≤inf

j≥0f(x

j₎_.

Observemos que este conjunto depende del punto inicial x0 _{y la sucesi´on} _{_λ_k}_.

SiU =∅ entonces es posible probar que:

i. limk→+∞f(xk) = inf_x_∈_IRnf(x).