UNIVERSIDAD NACIONAL DEL CALLAO
FACULTAD DE CIENCIAS NATURALES Y MATEM ´ATICA
DEPARTAMENTO ACAD ´EMICO DE MATEM ´ATICA
M´
ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR
FUNCIONES CUASI-CONVEXAS USANDO EL
SUBDIFERENCIAL DE CLARKE
Tesis para obtar el T´ıtulo Profesional de Licenciado en
Matem´
atica
Miguel Angel Cano Lengua
M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR
FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE
Miguel Angel Cano Lengua
Tesis presentada a consideraci´on del Cuerpo Docente, de la Facultad de Ciencias Naturales y Matem´atica de la Universidad Nacional del Callao, como parte de los requisitos para obtener el T´ıtulo Profesional de Licenciado en Matem´atica.
Aprobada por :
Prof. Ruth Medina Aparcana, Lic. Presidente
Prof. Prof. Elmer Le´on Z´arate, Lic. Secretario
Prof. Erik Alex Papa Quiroz, DSc. Asesor
FICHA CATALOGR ´AFICA
CANO LENGUA MIGUEL ANGEL
M´etodo del punto proximal para minimizar funciones cuasi-convexas u-sando el subdiferencial de Clarke, Callao [2010].
ix, 71p., 29.7 cm. (UNAC, Licenciado en Matem´atica, 2010).
Tesis, Ciencias Naturales y Matem´atica. I. Matem´atica.
Agradecimientos
Al concluir con este trabajo, que presento para optar el T´ıtulo Profesional de Li-cenciado en Matem´aticas Pura, deseo manifestar mi gratitud a las siguientes personas:
• Al Doctor Erik Alex Papa Quiroz, por su amistad y confianza. Por haberme sugerido el tema, por su orientaci´on segura y constante durante la realizaci´on del presente trabajo.
• A la Licenciada Elsa Marisa Quispe C´ardenas, por su amistad, por su apoyo y sugerencia en la elaboraci´on y presentaci´on de la tesis.
• A los profesores de la facultad de Ciencias Naturales y Matem´atica de la Uni-versidad Nacional del Callao por ser parte de mi formaci´on profesional.
• A mis amigos de la facultad de Ciencias Naturales y Matem´atica de la Univer-sidad Nacional del Callao en especial a: Pascual, Isidro y Lenin.
• A mi madre y hermanos por su cari˜no, confianza y apoyo.
RESUMEN
M´ETODO DEL PUNTO PROXIMAL PARA MINIMIZAR
FUNCIONES CUASI-CONVEXAS USANDO EL SUBDIFERENCIAL DE CLARKE
Miguel Angel Cano Lengua Diciembre - 2010
Asesor: DSc. Erik Alex Papa Quiroz
Titulo Obtenido: Licenciado en Matem´atica
En este trabajo proponemos una extensi´on del m´etodo del punto proximal para mi-nimizar funciones cuasi-convexas sin restricciones usando el subdiferencial de Clarke. Resolveremos problemas de optimizaci´on que tiene la forma:
(P) min{f(x) :x∈IRn}
dondef :IRn→IR ∪ {+∞} es una funci´on propia semicontinua inferior.
Dado una sucesi´on {λk} de par´ametros positivos, el m´etodo genera una sucesi´on de puntos nxko, a partir de un punto inicial x0 ∈IRn
, usando la siguiente regla:
Para cadak= 1,2,3, ...., Si 0∈∂fˆ (xk−1), donde ˆ∂f(x) es el subdiferencial de Clarke,
entonces para. De otro modo, buscamos unxk ∈IRn
tal que:
0∈∂ˆ f(·) + λk 2
!
|| · −xk−1||2
!
(xk).
Asumiendo que f es una funci´on lipchitziana, cuasi-convexa y no diferenciable pro-baremos que nxko converge a un punto candidato a soluci´on. Adem´as, daremos
algunos ejemplos de funciones que cumplan con las condiciones mencionadas y luego realizaremos algunos experimentos computacionales.
Palabras Claves:
ABSTRACT
PROXIMAL POINT METHOD TO MINIMIZE QUASICONVEX FUNCTIONS USING THE CLARKE SUBDIFFERENTIAL
Miguel Angel Cano Lengua December - 2010
Adviser: DSc. Erik Alex Papa Quiroz. Obtained Degree: Mathematician.
We propose an extension of the proximal point method for minimizing unconstrained quasiconvex functions using Clarke’s subdifferential.
We solve optimization problems of the form:
(P) min{f(x) :x∈IRn}
wheref :IRn→IR ∪ {+∞} is a lower semicontinuous proper function.
Given a sequence {λk} of positive parameters, the method generates a sequence of points nxko, from an initial point x0 ∈IRn, using the following rule: For each
k = 1,2,3, ...., If 0 ∈ ∂fˆ (xk−1), where ˆ∂f is Clarke’s subdifferential, then stop.
Otherwise, find xk∈IRn such that
0∈∂ˆ f(·) + λk 2
!
|| · −xk−1||2
!
(xk).
Assuming thatf is a quasiconvex, lipchitzian and nondifferentiable function, we prove thatnxkoconverges to a candidate of the solution point of (P).Furthermore, we give
some examples and some numerical examples.
Keywords:
´
Indice
Introducci´on 1
1 Preliminares 5
1.1 S´ımbolos y Notaciones . . . 5 1.2 Definiciones B´asicas . . . 7 1.3 Subdiferenciabilidad . . . 11
2 Subdiferencial de Clarke 19
2.1 Generalizaci´on de la derivada . . . 19 2.2 Propiedades B´asicas . . . 19
3 El M´etodo de Punto Proximal 40
3.1 Resultados de convergencia Fej´er . . . 41 3.2 Resultados de convergencia . . . 44
4 Implementaciones y Aplicaciones 50
Bibliograf´ıa 60
Introducci´
on
En la actualidad existen diversas ´areas que dan soluci´on a problemas vinculados a las ciencias e ingenier´ıa, una de ellas es la Optimizaci´on Matem´atica que estudia la forma de encontrar la mejor soluci´on a un problema dado dentro de todas las posibles alternativas. El modelo general de optimizaci´on est´a dado por:
(P)
Opt. f(x) s.a:
gi(x)≤0, i= 1, . . . , m
hj(x) = 0, j = 1, . . . , p
donde f : IRn → IR es una funci´on dada, Opt. f(x) significa minimizar o maximizar la funci´onf, gi :IRn→IR y hj :IRn→IR son funciones dadas.
Una clase particular y bien amplia del modelo (P) es la optimizaci´on cuasi-convexa (problemas donde la funci´on objetivo f es cuasi-convexa, esto es
f(λx+ (1−λ)y)≤max{f(x), f(y)}, para todoλ ∈[0,1], para todox, y ∈IRn,y las funciones que definen las restriccionesgi yhj son cuasi-convexas). Este problema fue
estudiado en el a˜no de 1951 por Arrow y Enthoven [2] motivados por las aplicaciones de las preferencias y utilidades en la teor´ıa del consumidor y posteriormente por di-versos investigadores, por ejemplo Kannai [13], Diewert, Avriel y Zang [8], Avriel, Diewert, Schaible y Zang [3], Tanaka [22], Mangasarian [16], Fenchel [10], Hiriart -Urruty [12], Lemar´echal [14], entre otros.
donde las funciones involucradas no son diferenciables, han estudiado la generalizaci´on de las propiedades del gradiente para funciones no diferenciables. En este contexto se estudiaron el subgradiente y subdiferencial de funciones convexas (una funci´on f : IRn → IR es convexa si f(λx + (1−λ)y) ≤ λf(x) + (1− λ)f(y), para todo λ ∈ [0,1], para todo x, y ∈ IRn), y subgradiente y subdiferencial generalizado para
el caso no convexo, ver por ejemplo [6], donde aparecieron diversas generalizaciones dentro de ellos el subdiferencial de Clarke, [6] y [7]. Tambi´en se desarrollaron diversos m´etodos para resolver problemas de optimizaci´on, dentro los cuales destac´o el m´etodo del punto proximal, introducido por Martinet [18] y que consiste esencialmente en un m´etodo iterativo que resuelve en cada iteraci´on un problema m´as simple de tal manera que paso a paso, las iteraciones se aproximan a la soluci´on. Propiedades de conver-gencia del m´etodo proximal fueron probados para una clase bien amplia de funciones, llamadas funciones convexas quedando como una cuesti´on en abierto el problema de optimizaci´on cuasi-convexo.
Esta tesis est´a destinada a extender las propiedades de convergencia del punto proximal para resolver el siguiente problema de optimizaci´on
(P I)
min f(x) s.a:
x∈IRn
dondef :IRn→IR∪ {+∞} es una funci´on real no diferenciable y no convexa. El m´etodo del punto proximal para funciones convexas fue introducido por Martinet [18] en 1978 y fue muy estudiada por Rockafellar, [20] y [21], para resolver problemas m´as generales de encontrar ceros de operadores mon´otonos maximales. Este m´etodo, para el problema (P I) y para el caso donde f es convexa, genera una sucesi´on de puntos {xk}, a partir de un punto dado x0, tal que:
Dado k = 1,2, . . .. Si 0 ∈ ∂fˆ (xk−1), entonces para el algoritmo. De otro modo
buscamos unxk ∈IRn tal que
xk∈argmin (
f(·) + λk 2
!
|| · −xk−1||2
)
(0.1) Fue demostrado que sif es convexa, propia y que la sucesi´on {λk} satisface:
entonces la sucesi´on nf(xk)o converge al ´ınfimo de f y si adem´as el conjunto de
soluciones ´optimas X∗ 6=∅, entonces nxko converge para una soluci´on del problema.
Esta tesis est´a motivada a resolver el problema (P I) cuandof es cuasi-convexa usando el m´etodo proximal. Para ello, debemos observar que debido a la no convexidad de f, el problema (0.1) no es necesariamente convexo, m´as a´un, no es necesariamente cuasi-convexo. Es por eso, que iteraci´on (0.1) puede ser m´as dif´ıcil de resolver que el problema original (P I). Para superar esta gran dificultad, proponemos la iteraci´on:
0∈∂ˆ f(·) + λk 2
!
|| · −xk−1||2
!
(xk) (0.2)
lo que es m´as razonable de resolver desde el punto de vista te´orico y pr´actico ya que en vez de encontrar el puntoxkque minimize la funci´onf(·)+λk
2
||·−xk−1||2, s´olo
nece-sitamos encontrar un punto cr´ıtico generalizado del mismo. En este trabajo probamos la convergencia del m´etodo proximal usando la iteraci´on (0.2) bajo la hip´otesis que la funci´onf localmente de Lipschitz, cuasi-convexa y no diferenciable.
La organizaci´on de la tesis es la siguiente. En el Cap´ıtulo 1, presentamos las he-rramientas necesarias para el desarrollo de este trabajo, entre otros veremos algunos resultados del an´alisis convexo, definici´on de subdiferenciabilidad, teor´ıa de an´alisis funcional. En el Cap´ıtulo 2, presentamos la teor´ıa del subdiferencial de Clarke, gene-ralizaci´on de la derivada y las propiedades b´asicas. En el Cap´ıtulo 3, parte central de la tesis, presentamos el m´etodo propuesto y sus resultados de convergencia, En el Cap´ıtulo 4, presentamos la implementaci´on del m´etodo para algunas funciones y finalmente damos la bibliograf´ıa como fuente de informaci´on.
Este trabajo ha sido expuesto en :
• ”V Congreso Internacional de Matem´atica Aplicada y Computacional” realizado en la Universidad Nacional San Antonio de Abad del Cusco, Agosto del 2010.
• ”IV Seminario de Matem´atica Aplicada a la Ingenier´ıa” realizado en la Univer-sidad Ricardo Palma, facultad de Ingenier´ıa, Junio del 2008.
Cap´ıtulo 1
Preliminares
En este cap´ıtulo daremos los conceptos b´asicos que se necesitan para el mejor en-tendimiento y desarrollo de esta tesis.
1.1
S´ımbolos y Notaciones
f0(x, v) : Derivada direccional generalizada.
ˆ
∂f(x): Subdiferencial de Clarke.
∂cf(x) : Subdiferencial convexof enx. ||.|| : Norma Euclideana.
IRn+: El conjunto de las n-uplas cuyas componentes son no negativas. IRn
++: El conjunto de los n-uplas cuyas componentes son positivos.
B(x, ǫ): Bola abierta con centro x y radio ǫ
∇f: El gradiente de f lim inf: L´ımite inferior. lim sup: L´ımite superior.
max{a;b}: M´aximo entrea y b. xk→x denota lim
k→+∞ xk =x.
DadoX ⊂IRn int(X) es el interior de X.
Sea Ω⊂IRnun abierto deIRn;Ck(Ω) ={f :U →IR;f es k veces diferenciable en U}
P(IRn) : Conjunto de partes.
lim
y→x t↓0
supf(y+tv)−f(y)
t = infδ>0 ky−supxk+t<δ
1.2
Definiciones B´
asicas
Definici´on 1.2.1 Una funci´on f : IRn → IR∪ {+∞} es llamada convexa en IRn si para todo x, y ∈IRn y para todo λ∈[0,1] se cumple que:
f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y).
Definici´on 1.2.2 Una funci´on f : IRn → IR∪ {+∞} es llamada cuasi-convexa en
IRn si para todo x, y ∈IRn y para todo λ∈[0,1] se cumple que:
f(λx+ (1−λ)y)≤max{f(x), f(y)}.
Observaci´on:
Toda funci´on convexa es cuasi-convexa, pero el rec´ıproco no siempre se cumple. Por ejemplo considere la funci´onf(x, y) =−e−x2−y2
es cuasi-covexa pero no es convexa.
Definici´on 1.2.3 Sea f : IRn → IR una funci´on diferenciable en IRn. f es llamada
funci´on pseudoconvexa si para todo x, y ∈IRn tal que
h∇f(y);x−yi ≥0,
se tiene que f(y)≤f(x).
Definici´on 1.2.4 Sea f : IRn → IR es llamada semicontinua superior en x¯ si para toda sucesi´on nxℓo
convergente a x¯, tenemos: lim supl→∞f(xℓ)≤f(¯x).
f es llamada semicontinua inferior en x¯ si para toda sucesi´on nxℓo convergente a x¯
se tiene que f(¯x)≤lim infl→∞f(xℓ).
Definici´on 1.2.5 Una funci´onf :IRn →IRes localmente lipschitziana con constante k en x∈IRn si existe alg´un ǫ≥0 tal que
|f(y)−f(z)| ≤kky−zk para todo z, y ∈B(x, ǫ).
Definici´on 1.2.6 Sea la funci´on f :IRn→IR es llamada subaditiva si:
f(x+y)≤ f(x) +f(y), para todo x, y ∈IRn .
f(λ.x) =λ.f(x), para todo λ≥0.
Definici´on 1.2.8 Sea la funci´on f :IRn →IR∪ {+∞} es llamada funci´on propia si
(a)domf 6=∅.
(b) ∀x∈domf,tenemos que f(x)>−∞.
Definici´on 1.2.9 (Operadores acotados en un espacio de Hilbert) Sean E y F es-pacios normados (sobre el mismo cuerpo). Se dice que un operador T : E → F, es acotado si T es lineal y
Supkxk=1{kT xk}<∞.
Que el operador lineal T : E → F sea acotado significa, que existe una constante M >0 tal que kT xk ≤M, para todo x∈E, con kxk= 1.
Teorema 1.2.1 Un operador lineal entre espacios normados es continuo si, y s´olo si, este es acotado.
Demostraci´on: Ver Nieto [19], Teorema 9.1 pp:94.
Teorema 1.2.2 (Teorema de representaci´on de Fr´echet-Riesz) Sea H un espacio de Hilbert. Si f es una aplicaci´on lineal acotada de H, entonces existe un vector y∈H, y uno solo, tal que
f(x) =hx;yi,para todo x∈H
Adem´as, kyk=kfk.
Demostraci´on: Ver Nieto [19], Teorema 9.11 pp:103.
Teorema 1.2.3 Sea f : IRn → IR∪ {+∞} una funci´on propia. Entonces, f es cuasi-convexa si, y s´olo si, el conjunto {x∈IRn:f(x)≤c} es convexo, para cada
Demostraci´on: Ver Bazaraa [5], Teorema 3.5.2. pp:108. Para el caso diferenciable usamos el siguiente resultado.
Teorema 1.2.4 Sea f : IRn → IR una funci´on diferenciable. entonces, f es
cuasi-convexa si, y s´olo si, ∀x, y ∈IRn tal que f(x)≤f(y), se tiene que
h∇f(x);x−yi ≤0.
Demostraci´on: Ver Bazaraa [5], Teorema 3.5.4. pp:109.
Teorema 1.2.5 (Hahn-Banach) Sea X un espacio vectorial lineal real , Y un sub-espacio de X. Si p:X →IRes un funcional positivamente homog´eneo,subaditiva y f : Y → IR, un funcional lineal tal que f(y) ≤ p(y) para todo y ∈ Y. Entonces, existe un funcional F :X →IR tal que ;
F(y) =f(y), para todo y∈Y. F(x)≤p(x), para todo x∈X.
Demostraci´on: Ver Friedman [11], Teorema 2.1.6. pp:14.
Teorema 1.2.6 (Teorema del valor medio) Sea f : [a, b]→IR una funci´on tal que. (i) f es continua en el intervalo [a, b] ;
(ii) f es diferenciable en el intervalo abierto (a, b).
Entonces, existe un n´umero c en el intervalo abierto (a, b) tal que
f(c) = f(b)−f(a) b−a
Demostraci´on: Ver Leithold [15], Teorema 4.3.2. pp:306-307.
Teorema 1.2.7 (Teorema del valor medio para funciones de varias variables) Sea Ω ⊆ IRn un conjunto abierto y sea f : Ω → IRn. suponga que Ω contiene a los puntos a, b y al segmento de l´ınea S que une a estos puntos y que f es diferenciable en todo punto de S. Entonces existe un punto cen S tal que;
kf(b)−f(a)k ≤ kDf(c)(b−a))k
Definici´on 1.2.10 (Conjunto acotado)
Se dice que un conjunto S ⊂ IRn est´a acotado si est´a contenido totalmente en una n-bola B(a, r) para alg´un r >0 y alg´un a∈IRn.
Definici´on 1.2.11 Un conjunto S ⊂IRn es cerrado si su complemento denotado por
¯
S es un conjunto abierto.
Teorema 1.2.8 Un conjunto Z es cerrado, si y s´olo si, para todo nzlo ⊂Z tal que
zl→z¯ entonces z¯∈Z.
Demostraci´on: Ver Elon L. [9], pp:38-39.
Teorema 1.2.9 (Heine-Borel)
SeaF un recubrimiento abierto de un conjuntoAdeIRn,cerrado y acotado. Entonces existe una subcolecci´on finita de F que tambi´en recubre a A.
Demostraci´on: Ver Apostol T.M. [1], pp:70-71.
Definici´on 1.2.12 (Conjunto Compacto)
Un conjuntoS ⊂IRnse llama compacto, si y s´olo si, cada recubrimiento deS contiene
un subcubrimiento finito; esto es, una subcolecci´on finita tambi´en recubra a S. El teorema de Heine-Borel establece que todo conjunto de IRn, es compacto si y solo
1.3
Subdiferenciabilidad
Definici´on 1.3.1 Se define la derivada direccional de f enx en la direcci´on v ∈IRn como:
f′(x, v) =limt↓0
f(x+tv)−f(x)
t .
Si f es diferenciable en x, entonces la derivada direccional existe en toda direcci´on v ∈IRn, f′
(x;v) es una funci´on lineal de v tenemos la siguiente relaci´on:
f′(x, v) =h∇f(x);vi
Teorema 1.3.1 Sea f :IRn →IR una funci´on convexa. Entonces para cadax∈IRn, tenemos:
(i) f′(x, v) = max{hǫ;vi;ǫ∈∂cf(x)} ∀v ∈IRn
(ii) ∂cf(x) = n
ǫ ∈IRn :f′
(x, v)≥ hǫ;vi,∀v ∈IRno
(iii) ∂cf(x) 6= φ es un conjunto convexo y compacto, tal que kǫk ≤ k para todo
ǫ∈∂cf(x), donde k es una constante de Lipchitz para fen x;
(iv) El conjunto de las aplicaciones∂cf :IRn →IR es semicontinua superior, es decir,
si yℓ → x y ǫℓ ∈ ∂
cf(yℓ) para cada ℓ, entonces cada punto de acumulaci´on ǫ de (ǫℓ)
est´a en ∂cf(x).
Demostraci´on:Ver Makela [17], pp:151.
Definici´on 1.3.2 Sea f :IRn →IRuna funci´on, dado x∈IRn es un subgradiente de f en x si:
f(y)≥f(x) +hs;y−xi,∀y∈IRn.
El conjunto de todos los subgradientes es llamado subdiferencial convexo de f en x y es denotado por ∂cf(x), esto es,
∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}.
Proposici´on 1.3.1 Seaf :IRn →IR∪{+∞} una funci´on convexa yx¯∈int(domf).
∂cf(¯x) ={∇f(¯x)}.
Demostraci´on: Ver Makela [17], Teorema 2.1.6. pp:14.
Teorema 1.3.2 Sea f : IRn → IR una funci´on convexa con constante de Lipschitz
k >0, entonces se cumple:
(i) La derivada direccional en cada direcci´on v ∈IRn existe y satisface
f′(x, v) =inft>0
f(x+tv)−f(x)
t ;
(ii) La funci´on v →f′(x, v) es positivamente homog´enea y subaditiva sobre IRn con
f
′
(x, v)
≤kkvk,
(iii) f′
(x, v) es una funci´on semicontinua superior en (x;v) y es una funci´on de Lip-chitz con constante k sobre IRn,
(iv) −f′
(x, v)≤f′
(x, v).
Demostraci´on:Ver Makela [17], pp:9-12.
Ejemplo 1.3.1
Sea la funci´on f(x) = |x|veamos como es su subdiferencial convexo. Se sabe que:
|x|=
x, x≥0
−x, x <0
(i) Si x= 0, tenemos
∂cf(0) ={ξ∈IR :|y| ≥ |0|+ξ.y,∀y∈IR}.
Vemos que:
Si; y= 0 entonces ξ∈IR.
cuya gr´afica es:
Si; y <0 entonces −y ≥ξ.y ; luego −1≤ξ. Interceptando los conjuntos tenemos:
ξ ∈[−1,1].
Asi,
∂f(0) = [−1,1]. (ii) Si x >0; tenemos:
∂cf(x) = {ξ∈IR :|y| ≥ |x|+ξ.(y−0),∀y∈IR}
∂cf(x) = {ξ∈IR :|y| ≥x+ξ.(y−0),∀y∈IR}
Vemos que, si y= 0 entonces:
0≥x−ξ.x, que es equivalente a
0≥x(1−ξ), lo que implica que
Ahora si y >0; consideramos y 6=x, tenemos: y−x >0∨y−x <0 Siy−x <0 tenemos lo siguiente:
y≥x+ξ(y−x)
y−x≥ξ(y−x) lo que implica que
ξ ≥1
Si y−x >0 tenemos lo siguiente:
y≥x+ξ(y−x)
y−x≥ξ(y−x) lo que implica que
ξ≤1. Ahora si y >0; consideramos y=xtenemos
y≥x+ξ(y−x)
y−x≥ξ(y−x) ξ ∈IR
Interceptando los conjuntos tenemos que: ξ= 1
∂cf(x) = 1, ∀x >0.
(iii) Si x <0 tenemos
∂cf(x) = {ξ∈IR :|y| ≥ −x+ξ.(y−0),∀y∈IR}.
Se analiza en forma an´aloga para los casos cuando y = 0; y > 0, y < 0 entonces se obtiene que:
ξ=−1, y por lo tanto
De (i),(ii) y (iii) se concluye que:
∂cf(x) =
1; x >0
−1; x <0 [−1,1] ; x= 0 Ejemplo 1.3.2
Sea f :IR→IRdefinida como :
f(x) =
1−x; x <1 x2 −1, x≥1
Verificar su subdiferenciabilidad.
cuya gr´afica es:
Sabemos que:
∂cf(x) = {s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}
(a) Siy <1 entonces f(y) = 1−y, reemplazando en la definici´on;
1−y ≥1−x+s(y−x), lo que es equivalente a;−(y−x)≥s(y−x)...(i) veamos los siguientes casos:
• Si (y−x)>0 simplificando en (i); se tiene:
−1≥s,entonces s∈ h−∞,−1].
• Si (y−x)<0; simplificando en (i); se tiene:
−1≤s,entonces s∈[−1,∞i.
• Si y=x simplificando en (i); se tiene: 0≥s.0, se cumple; ∀s∈IR
Iterceptando los conjuntos tenemos: s=−1
(b) Siy = 1 entonces f(y) = 0,reemplazando en la definici´on; 0≥1−x+s(y−x),lo que es equivalente a;−s(1−x)≥(1−x) como (1−x)>0,entonces −s ≥1;s∈ h−∞,−1]
de s= -1 ∧ s∈ h−∞,−1] se tiene : s= -1
(c) Siy >1 entonces f(y) = y2−1, reemplazando en la definici´on;
y2−1≥1−x+s(y−x), tomando s =−1 se tiene;
(y−1)(y+ 1)≥1−x+ (−1)(y−x) lo que equivale a; (y−1)(y+ 1)≥1−x−y+x simplificando se tiene: y≥ −2 (lo cual es verdadero)
Luego de (a),(b) y (c) tenemos: ∂cf(x) = −1.
2. Si, x= 1 entonces; f(x) = 0 (a) Siy <1 entonces f(y) = 1−y,
(b) Siy ≥1 entoncesf(y) =y2−1
f(y)≥f(x) +s(y−x), lo que equivale a;
y2−1≥0 +s(y−1) se tiene (y−1)(y+ 1)≥s(y−1)
lo equivale a (y+ 1)≥s tomando limy→1f(y),
obtenemos s≤2 luego s∈ h−∞,2] de (a) y (b) se tiene: ∂cf(x) = [−1,2]
3. Si, x >1, entonces x∈ h1,∞i; f(x) = x2−1
se tiene los siguientes casos:
(a) Siy ≥1 entoncesf(y) =y2−1, tenemos de la definici´on;
∂cf(x) ={s∈IRn :f(y)≥f(x) +hs;y−xi,∀y∈IRn}
se tiene: (y−x)2 ≥0, desarrollando el binomio tenemos
y2+x2 ≥2xy, lo que es equivalente a: y2−1≥ −1−x2+ 2xy
y2−1≥x2−1 + 2xy−2x2, lo que equivale a: y2−1≥x2−1 + 2x(y−x)
f(y)≥f(x) +s(y−x), obtenemos: s= 2x (b) Siy <1 entonces f(y) = 1−y,
se tiene: 1−y ≥(x2−1) + 2x(y−x), ∀x >1; ∀y <1
lo que equivale a: 1−y≥ −x2−1 + 2xy
lo que equivale a: 0≥ −x2−2 +y(1 + 2x)...(∆)
tenemos los siguientes casos:
• Si y ≤0 remplazando en (∆) es verdadero
• Si 0< y < 1 y x >1 tenemos lo siguiente:
y(1 + 2x)<(1 + 2x)lo que equivale a: −x2−2 +y(1 + 2x)<−x2−1 + 2x
lo que equivale a: −x2−2 +y(1 + 2x)<−(x2−2x+ 1)
lo que equivale a: −x2−2 +y(1 + 2x)<−(x−1)2 <0 es verdadero
de (a) y (b) tenemos: ∂cf(x) = 2x
∂Ff(x) =
Cap´ıtulo 2
Subdiferencial de Clarke
2.1
Generalizaci´
on de la derivada
Definici´on 2.1.1 Dado f : IRn → IR localmente lipschitziana en el punto x ∈ IRn. La derivada direccional generalizada de f enx,en la direcci´on de v ∈IRn,es definida
por
f0(x, v) = limy→x
t↓0
supf(y+tv)−f(y) t
Debemos notar quef◦
siempre existe gracias a la condici´on de localmente lipschitz de
la funci´on f.
2.2
Propiedades B´
asicas
Teorema 2.2.1 Sea f localmente lipschitziana en x con constante k >0 entonces: (i) La funci´on v 7→f0(x, v) es positivamente homog´enea y subaditiva en IRn
con
|f0(x, v)| ≤k||v||.
(ii) f0(x, .) es una funci´on semicontinua superior y lipschitziana con constante k sobre IRn.
Demostraci´on.
(i) de la Definici´on 2.1.1
f0(x, v) = limy→x
t↓0
supf(y+tv)−f(y)
t .
Tomando valor absoluto y aplicando una propiedad de l´ımite superior se tiene:
|f0(x, v)| ≤ ylim→x
t↓0
sup
f(y+tv)−f(y) t
De la condici´on de localmente lipschitziana se tiene (Definici´on.1.2.5):
|f0(x, v)| ≤ lim
y→x t↓0
supk.||(y+tv)−(y)|| t
As´ı
|f0(x, v)| ≤ylim
→xkt ||v||
t =k||v||, y por lo tanto,|f0(x, v)| ≤k||v||.
Ahora mostraremos que la derivada es positivamente hom´ogenea, dondeλ >0:
f0(x, λv) = lim
y→x t↓0
supf(y+tλv)−f(y) t
= limy→x
t↓0
supλ
(
f(y+tλv)−f(y) λt
)
= λylim→x
t↓0
sup
(
f(y+tλv)−f(y) λt
)
= λf0(x, v)
Demostraremos la sub-aditividad. Seanv, w∈IRnarbitrarios, tomaremos valor absoluto y aplicaremos la propiedad de l´ımite superior
f0(x, v+w) = limy→x
t↓0
supf(y+t(v+w))−f(y) t
= limy→x
t↓0
≤ ylim→x
t↓0
supf((y+tw) +tv)−f(y+tw) t + limy→x
t↓0
supf(y+tw)−f(y) t
≤ f0(x, v) +f0(x, w)
As´ı,v 7→f0(x, v) es subaditiva.
(ii) Sean nxℓo
,nvℓo
⊂ IRn dos sucesiones tales que xℓ → x y vℓ → v, por la
definici´on de l´ımite superior
f0(x, vℓ) = inf
δ>0 (y,t)∈supB((x,0),δ)
f(y+tvℓ)−f(y)
t
!
≤ sup
||(y,t)−(x,0)||<δ
f(y+tvℓ)−f(y)
t , ∀δ > 0 = sup
||y−x||+t<δ
f(y+tvℓ)−f(y)
t , ∀δ >0 Sea δ= 1ℓ → ∃{yℓ},{tℓ}>0 tal que:
f0(x, vℓ)< f(yℓ+tℓvℓ)−f(yℓ)
tℓ +
1 ℓ,
||yℓ−x||+tℓ < 1
ℓ, ∀ℓ∈IN tenemos as´ı,
f0(x, vℓ)− 1
ℓ = ylim→xℓ
t↓0
supf(y+t
ℓvℓ)−f(y)
t −
1 ℓ
≤ f(y
ℓ+tℓvℓ)−f(yℓ)
tℓ
= f(y
ℓ+tℓv)−f(yℓ)
tℓ +
f(yℓ+tℓvℓ)−f(yℓ+tℓv)
tℓ
y por la condici´on de lipschitzianidad
|f(yℓ+tℓvℓ)−f(yℓ+tℓv)|
t ≤k
||tℓvℓ−tℓv||
tℓ =k||v
ℓ−v|| →0
Mientras ℓ→ ∞ probamos yℓ+tℓvℓ, yℓ+tℓv ∈B(x, ǫ) obtenemos:
lim
ℓ→∞supf
0(xℓ, vℓ)≤ lim ℓ→∞sup
f(yℓ+tℓv)−f(yℓ)
tℓ ≤f
luego limℓ→∞supf0(xℓ, vℓ)≤f0(x, v),
lo que establece la semicontinuidad superior.
Se mostrar´a la condici´on de Lipschitz. Sean v, w∈IRn, si y+tv y y+tw ∈B(x, ǫ) entonces
f(y+tv)−f(y+tw)≤kt||v−w||.
Ordenando,
f(y+tv)−f(y) +f(y)−f(y+tw)≤kt||v−w||
tomando l´ımite superior se tiene:
lim
y→x t↓0
supf(y+tv)−f(y)
t ≤ ylim→x t↓0
f(y+tw)−f(y)
t +k||v−w|| lo que es equivalente a:
f0(x, v)−f0(x, w) ≤ k||v−w||
(iii)
f0(x,−v) = limy→x
t↓0
supf(y−tv)−f(y) t
= limy→x
t↓0
supf(m+tv−tv)−f(m+tv) t
= limy→x
t↓0
supf(m)−f(m+tv) t
= limy→x
t↓0
sup(−f)(m+tv)−(−f)(m)] t
= (−f)0(x, v) donde,m =y−tv.
Esto completa la prueba.
Definici´on 2.2.1 Sea f :IRn→ IR una funci´on localmente lipschitziana en x∈ IRn
entonces el sub-diferencial, en el sentido de Clarke, de f en x es el conjunto
ˆ
Cada elemento ξ ∈∂fˆ (x) es llamado subgradiente, en el sentido de Clarke, de f enx.
Ejemplo 2.2.1
La funci´on f(x) = x2sen(1
x) es diferenciable excepto en el punto cero, hallaremos el
subdiferencial de Clarke en este punto. Su gr´afica es:
Usando la definici´on de la derivada generalizada tenemos:
f0(x, v) = limy→x
t↓0
sup(y+tv)
2sen( 1
y+tv)−y
2sen(1
y)
t
Tomandox= 0 y por definici´on de subdiferencial de Clarke tenemos:
ˆ
∂f(0) = {r∈IR:f0(0, v)≥r.v, ∀v ∈IR}
= {r∈IR: limy
→x t↓0
supf(y+tv)−f(y)
t ≥r.v}
= {r∈IR: lim
t↓0 sup
(y+tv)2sen( 1
y+tv)−(y)
2sen(1
y)
= {r∈IR: lim
t↓0 sup
t2v2.sen( 1
t.v)
t ≥r.v}
= {r∈IR: lim
t↓0 sup
v.sen( 1
t.v)
1
t.v
≥r.v}
= {r∈IR:v ≥r.v}
(i) Si v ≥0 entonces se tiene 1≥r (ii) Si v <0 entonces se tiene 1≥ −r
De (i) y (ii) se tiene r∈[−1,1],luego
ˆ
∂f(0) = [−1,1].
Teorema 2.2.2 Sea f :IRn →IR∪ {+∞} una funci´on propia semicontinua inferior y cuasi-convexa. Si g ∈∂f,ˆ y f(y)≤f(x) entonces
hg;y−xi ≤0
Demostraci´on.
Comog ∈∂fˆ(x) se tiene f0(x, v)≥ hg;vi; para todov ∈IRn
Luego tenemos: f0(x, v) = limy→x
t↓0
supf(y+tvt)−f(y) ≥ hg;vi
lo cual es equivalente a: infδ>0 supky−xk+t<δ
f(y+tv)−f(y)
t ≥ hg;vi
en particularv =y−x tenemos supky−xk+t<δ
f(y+t(y−x))−f(y)
t .
Tomandoδ = n1,para todo n∈N, entonces existe {yn},{tn}>0
tal que kyn−xk+tn →0 luego se tiene:
supky−xk+t<δ
f(y+t(y−x))−f(y)
t <
f(yn+tn(yn−x))−f(y)
t +
1
n
lo que es equivalente a: hg;y−xi ≤ f(yn+tn(ynt−x))−f(y) + 1
n
efectuando operaciones tenemos:
hg;y−xi ≤ f((−tn)x+(1+ttn)yn)−f(y) + 1
n como f es cuasi-convexa y f(x)≥f(y)
tenemos: hg;y−xi ≤ f(x)−tnf(yn)+
1
tomando l´ımite obtenemos: hg;y−xi ≤0.
Ejemplo 2.2.2
Dada la siguiente funci´on:
f(x) =
4, |x| ≥4
|x|, |x|<4 Obtendremos el subdiferencial de Clarke para todox∈IR. De la definici´on:
ˆ
∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IRn}
La gr´afica es
a) Si x <−4 entonces x∈ h−∞,−4i se tiene que f(x) = 4
ˆ
∂f(x) = {r∈IRn/f0(x, v)≥r.v, ∀v ∈IR}
= {r∈IR: limy→x
t↓0
supf(y+tv)−f(y)
t ≥r.v}
= {r∈IR: lim
t↓0 sup
4−4
= {r∈IR: lim
t↓0
0
t ≥r.v} Luego se obtiene : ˆ∂f(x) = {0}
b) Si x=−4 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales
c) Si −4< x < 0 entoncesx∈ h−4,0i se tiene que f(x) = −x
ˆ
∂f(x) = {r ∈IRn :f0(x, v)≥r.v, ∀v ∈IR}
= {r ∈IR: limy
→x t↓0
supf(y+tv)−f(y)
t ≥r.v}
= {r ∈IR: lim
t↓0 sup
−(y+tv) +y
t ≥r.v} = {r ∈IR: lim
t↓0
−tv
t ≥r.v} = −v ≥r.v
Siv ≥0 entonces, −1≥r Si v <0 entonces, −1≤r
Luego se obtiene : ∂fˆ (x) = {−1}
d) Si x= 0 Aplicando el subdiferencial Clarke, veamos los l´ımites laterales
Veamos cuando y → 0− tenemos f(x) = kxk entonces por el ejemplo 1.3.1 se
tiene;
ˆ
∂f(0) ={r∈IRn/f0(0, v)≥r.v, ∀v ∈IRn}
ˆ
∂f(0) = [−1,1]. e) Si 0< x < 4 entoncesx∈ h0,4i
ˆ
∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}
= {r∈IR: limy→x
t↓0
supf(y+tv)−f(y)
t ≥r.v}
= {r∈IR: lim
t↓0 sup
(y+tv)−y
t ≥r.v} = {r∈IR: lim
t↓0
tv
Si v ≥0 entonces, 1≥r Siv <0 entonces, 1≤r
Luego se obtiene : ˆ∂f(x) = {1}.
f) Si x= 4 Aplicando el subdiferencial Clarke
g) Si x >4 entonces x∈ h4,∞i se tiene que f(x) = 4
ˆ
∂f(x) = {r∈IRn:f0(x, v)≥r.v, ∀v ∈IR}
= {r∈IR: limy→x
t↓0
sup f(y+tv)−f(y)
t ≥r.v}
= {r∈IR: lim
t↓0 sup
4−4
t ≥r.v} = {r∈IR: lim
t↓0
0
t ≥r.v}
Luego se obtiene : ˆ∂f(x) = {0}.
Luego interceptando de (a),(b),(d),(e),(f), y (g) tenemos:
ˆ
∂f(x) =
0, x >4∨x <−4 φ, x= 4∨x=−4
−1, −4< x <0 [−1; 1], x= 0 1, −0< x <4
Teorema 2.2.3 Sea f una funci´on localmente Lipschitz enx con constante k (i) ˆ∂f(x) es un conjunto no vacio, convexo y compacto tal que ||ξ|| ≤k,
∀ξ∈∂fˆ (x).
(ii) f0(x, v) = max{hξ;vi:ξ∈∂fˆ (x)}, ∀v ∈IRn
(iii) La aplicaci´on∂fˆ (·) :IRn →P(IRn) es semicontinua superior.
Demostraci´on.
(i) Del Teorema 2.2.1, item 1 la funci´on f0(x,·) : IRn →
IR es positivamente homog´enea y subaditiva entonces por el Teorema de Hahn-Banach (Teorema 1.2.5) y el Teorema de representaci´on de Riez, ver Teorema 1.2.2 existe un vectorξ ∈IRn tal que
hξ;vi ≤f0(x, v),∀v ∈IRn
Para probar la convexidad, seanξ, ξ′ ∈∂fˆ (x) y λ∈[0,1], entonces
hλξ+ (1−λ)ξ′;vi = hλξ;vi+h(1−λ)ξ′;vi
= λhξ;vi+ (1−λ)hξ′;vi ≤ λf0(x, v) + (1−λ)f0(x, v) = f0(x, v),
por lo tanto,λξ+ (1−λ)ξ′ ∈∂fˆ (x) y as´ı ˆ∂f(x) es convexo.
Demostraremos que ˆ∂f(x) es compacto, esto es, ˆ∂f(x) es acotado y cerrado. Probaremos que ˆ∂f(x) es acotado∀x∈IRn.
Por la definici´on de Subdiferencial y el Teorema 2.2.1, item 1, tenemos
||ξ||2 =hξ;ξi ≤ |f0(x, ξ)| ≤k||ξ||, ∀ξ∈∂fˆ (x)
esto es,
||ξ||2 ≤ k||ξ||, ∀ξ∈∂fˆ (x)
esto implica que
||ξ|| ≤ k, ∀ξ∈∂fˆ (x)
entonces, ˆ∂f(x) es acotado.
Sea nξℓo⊂∂fˆ (x) una sucesi´on tal que ξℓ →ξ. Probaremos queξ ∈∂fˆ (x).
Tenemos:
hξ;vi=
lim
l→∞ξ
ℓ;v = lim ℓ→∞
D
ξℓ;vE
≤ lim
ℓ→∞f
0(x, v)
≤ f0(x, v), ∀v ∈IRn.
entonces,ξ ∈∂fˆ (x). Por tanto, ˆ∂f(x) es cerrado.
(ii) Por ser ˆ∂f(x) continua y compacto y de la definici´on de la subdiferencial
f0(x, v)≥max{hξ;vi:ξ ∈∂fˆ (x)}, ∀v ∈IRn (2.2)
Probaremos ahora que
f0(x, v)≤max{hξ;vi:ξ∈∂fˆ (x)}, ∀v ∈IRn.
Por contradicci´on, supongamos que existevℓ ∈IRn tal que
f0(x, vℓ)>max{hξ;vℓi:ξ ∈∂f(x)} ≥ hξ;vℓi, ∀ξ∈∂fˆ (x)
⇒f0(x, vℓ)> f0(x, vℓ)(lo que es una contradicci´on con(2.2)).
Luego,
f0(x, v) = max{hξ;vi/ξ ∈∂f(x)}, ∀ ∈IRn.
(iii) Sea nyℓo⊂IRn y (ξℓ)⊂∂f(yℓ) para cada (ℓ), tal queyℓ →x y ξℓ →ξ,
entonces∀v ∈IRn tenemos
hξ;vi=
lim
ℓ→∞ξ
ℓ;v= lim i→∞
D
ξℓ;vE
≤ lim
ℓ→∞supf
0(yℓ, v).
Por el Teorema 2.2.1, ii , f0(x,·) es semicontinua superior entonces,
hξ;vi ≥f0(x, v)
Teorema 2.2.4 Sea f : IRn → IR una funci´on localmente lipschitz en x y
dife-renciable en x, entonces:
∇f(x)∈∂fˆ (x)
Demostraci´on.
Por la definici´on de diferenciabilidad la derivada direccional f′(x, v) existe ∀v ∈ IRn
y
f′(x, v) = h∇f(x);vi, ∀v ∈IRn vemos que:
f(y+tv)−f(y)
t ≤(x,t)∈supB((x,0),δ)
f(y+tv)−f(y)
t , ∀(y, t) :||y−x||+t < δ,∀δ >0, en particular,
f(x+tv)−f(x)
t ≤(y,t)∈supB((x,0),δ)
f(y+tv)−f(y)
t , ∀δ >0, ∀t < δ, Luego tomando l´ımite cuando t→0
lim
t→∞
f(y+tv)−f(x)
t ≤f
0(x, v)
f′(x, v)≤f0(x, v) Se sigue que:
f0(x, v)≤ h∇f(x);vi, ∀v ∈IRn.
Por tanto, ∇f(x)∈∂fˆ (x)
Lema 2.2.5 Si f es continuamente diferenciable en x entonces f es localmente lip-schitziana en x.
Prueba.
De la hip´otesis, sea F :IRn →L(IRn, IR) tal que, para cada x∈IRn se tiene F(x) = Fx :IRn→IR definido por Fx(v) =h∇f(x);vi Por demostrar que F
Sea w∈B(x, γ), (B(x, γ) es la vecindad def, donde es locamente lipschitiziana )
∀ǫ >0,∃ kFy(v)−Fw(v)k>0 :ky−wk< δ ⇒ kFy −Fwk< ǫ kFy −Fwk=Supv6=0
kFy(v)−Fw(v)k
kvk < kky−wk
Tomandoδ tal que δ < ǫ/k, se tiene
kFy −Fwk ≤kky−wk< kδ < ǫ
entonces F es continua en una vecindad de x.
Luego se tiene que: F es acotada en una vecindad de x. por Teorema 1.2.1 Entonces kFxk ≤M
kFx(v)k
kvk ≤Supv6=0
kFx(v)k kvk ≤M
Luego se tiene:
h∇f(x);vi
kvk ≤M,
tomando v =∇f(x) se tiene k∇f(x)k ≤M para todow∈B(x, γ).
Sean y, y′ ∈B(x, ǫ), entonces por el teorema del valor medio, existe z ∈(y, y′)⊂
B(x, ǫ) tal que:
f(y)−f(y′) =| h∇f(z), y−y′i | ≤ ||∇f(z)|| ||y−y′||
|f(y)−f(y′)| ≤ ||∇f(z)|| ||y−y′|| |f(y)−f(y′)| ≤ M||y−y′||
por lo tanto, cumple la condici´on de Lipschitziana enx.
Teorema 2.2.6 Si f es continuamente diferenciable en x, entonces ˆ
∂f(x) ={∇f(x)}
Demostraci´on.
continuidad diferenciable, si xi →x, entonces el ∇f(xℓ) converge a ∇f(x), tenemos
que∀v ∈IRn
lim
xℓ→xf
′(xℓ
, v) = lim
xℓ→xlimt↓0
f(xℓ+tv)−f(xℓ)
t = lim
xℓ→x
D
∇f(xℓ), vE
= h∇f(x);vi
= f′(x, v)
para todov ∈IRn se tiene,
f′(x, v) = lim
xℓ→xf
′(xℓ, v) = lim xℓ→x
t↓0
f(xℓ+tv)−f(x i)
t
= lim
xℓ→x
t↓0
supf(x
ℓ+tv)−f(xℓ)
t
= f0(x, v)
As´ı tenemos quef0(x, v) = h∇f(x), vi,∀v ∈IRn
. Supongamos que se tieneξ∈∂fˆ (x), para alg´un ξ6=∇f(x) entonces existe v0 ∈IRn tal que
h∇f(x);v0i=f(x, v0)>hξ;v0i
ahora,
h∇f(x);−v0i=f(x, v0)≥ hξ;−v0i
es equivalente
h∇f(x);v0i ≥ − hξ;v0i
h∇f(x);v0i ≤ hξ;v0i
lo cual es una contradicci´on con la hip´otesis. Entonces,∇f(x) es el ´unico subgra-diente def enx.
Teorema 2.2.7 Si la funci´on f : IRn → IR es convexa y localmente lipschitz en
(a) f′(x, v) = f0(x, v),∀v ∈IRn.
(b) ∂cf(x) = ˆ∂f(x)
Demostraci´on.
Si (a) es verdadero, entonces (b) se sigue de la definici´on del subdiferencial en el sentido de Clarke (Definici´on 2.1.1) y del Teorema 1.3.1-ii. As´ı es suficiente probar la parte (a).
Por la definici´on de la derivada direccional generalizada, se tiene f0(x, v)≥f′(x, v), v ∈IRn.
Por otro lado siδ > 0 fijo, entonces f0(x, v) = lim
x′→x
t↓0
supf(x
′+tv)−f(x′)
t
= lim
ǫ↓0 ||x′sup−x||<ǫ
supf(x
′ +ǫv)−f(x′)
t de la prueba del Teorema 1.3.2 tenemos la funci´on
φ(t) = (1/t)(f(x′+tv)−f(x′)) es no decreciente, se puede escribir
f0(x;v) = lim
ǫ↓0 ||x′−supx||<ǫδ
f(x′+ǫv)−f(x′)
ǫ
Por la condici´on de Lipschitz para alg´un x′ ∈B(x;ǫδ) tenemos
f(x′+ǫv)−f(x′)
ǫ −
f(x+ǫv)−f(x) ǫ ≤
f(x′+ǫv)−f(x+ǫv)
ǫ +
f(x)−f(x′)
ǫ ≤ k
ǫ||x
′−x||+k
ǫ||x
′−x||
≤ 2k
ǫ ||x
′ −x||
≤ 2k
ǫ (ǫδ)
≤ 2kδ.
f0(x, v)≤lim
ǫ↓0
f(x+ǫv)−f(x)
ǫ + 2δk=f
′(x, v) + 2δk
Definici´on 2.2.2 La funci´on f : IRn → IR es regular en x ∈ IRn, si ∀v ∈ IRn la
derivada direccional f′(x, v) existe y
f′(x, v) = f0(x, v).
Algunas condiciones para que f sea regular.
Teorema 2.2.8 Sea f lipschitz enx si se cumple: (a) f es continuamente diferenciable en x.
(b) f es convexo.
(c) f =Pm
i=1λifi, dondeλi >0yfi es regular enxpara cada i= 1, ..., m, entonces
f es regular en x.
Prueba.
(a) Si f es continuamente diferenciable, entonces la derivada direccional f′(x, v)
existe para todov ∈IRn y por la prueba del Teorema 2.2.6
f0(x, v) = f′(x, v), ∀v ∈IRn.
(b) Dado (a) la prueba de (b) se sigue de el Teorema 1.3.1-ii y el Teorema 2.2.7
(c) Es suficiente la prueba para m= 2. Por inducci´on, si f es regular en xy λ >0 entonces
(λf)0(x, v) =λf0(x, v) =λ′f(x, v) = (λf)′(x, v), ∀v ∈IRn.
es evidente que (f1+f2)′ siempre existe y (f1+f2)′ =f1′ +f2′, por la definici´on
de la generalizaci´on de la derivada
(f +f2)≥(f1 +f2)′
tenemos
(f1+f2)0(x, v) = limy→x
t↓0
= lim
t↓0 sup
f1(y+tv) +f2(y+tv)−f1(y)−f2(y)
t
≤ ylim→x
t↓0
supf1(y+tv)−f1(y) t + limy→x
t↓0
supf2(y+tv)−f2(y) t
= f10(x, v) +f20(x, v).
As´ı que
(f1+f2)′ =f1′ +f2′ =f10+f20 ≥(f1+f2)0
tambi´en
(f1+f2)′ = (f1+f2)0
esto completa la prueba.
Corolario 2.2.1 Si f es diferenciable, regular y localmente lipschitziana en x, en-tonces
ˆ
∂f(x) = {∇f(x)}.
Prueba.
∇f(x)∈∂fˆ (x) es diferenciable y lipschitziana entonces {∇f(x)} ⊂∂f(x).ˆ Por otro lado, sea ξ ∈∂fˆ (x); supongamos que ξ6=∇f(x)
f0(x, v) ≤ hξ;vi, ∀v ∈IRn
f′(x, v) = f0(x, v) = h∇f(x);vi h∇f(x);vi ≤ hξ;vi ∀v
v = − h∇f(x)−ξ;vi ≥0 ∀v v = (∇f(x)−ξ)
0 < ||∇f(x)−ξ||0 ≤0
lo cu´al es una contradicci´on, luego ˆ∂f(x)⊂ {∇f(x)}. Por lo tanto, ˆ
∂f(x) = {∇f(x)}.
Corolario 2.2.2 Sif es localmente de Lipschitziana enx, entonces para todo λ∈IR, ˆ
Prueba.
Comof es de Lipschitz, λf tambi´en es de lipschitz en x. Si λ≥0, entonces
(λf)0 =h f0, tambi´en ˆ∂(λ f)(x) = λ∂fˆ (x), para todoλ ≥0, se prueba para h =−1,
ξ∈∂(ˆ −f)(x) ⇔ (−f)0(x, v)≥ hξ;vi ∀v ∈IRn
⇔ f0(x,−v)≥ hξ;vi ∀v ∈IRn
⇔ f0(x,−v)≥ h−ξ;−vi ∀ −v ∈IRn
⇔ −ξ∈∂fˆ (x)
⇔ ξ∈ −∂fˆ (x)
Por lo tanto, ˆ∂(λf)(x) =λ∂f(x).ˆ
Teorema 2.2.9 Si f es localmente lipschitz en x y tiene un extremo en x, entonces
0∈∂fˆ (x)
Demostraci´on.
Suponemos primero que f alcanza un m´ınimo local en x, entonces existe ǫ, tal que f(x+tv)−f(x)≥0 para todo 0< t < ǫ y v ∈IRn, se tiene:
f0(x, v) = lim
y→x t↓0
supf(y+tv)−f(y)
t ≥limt↓0 sup
f(x+tv)−f(x)
t ≥0
y tambi´en
f0(x, v)≥0 =h0, vi ∀v ∈IRn
por la definici´on de subdiferencial 0∈∂fˆ (x).
Suponemos que f alcanza un m´aximo local en x entonces −f alcanza un m´ınimo enx y por el Teorema 2.2.9, 0∈∂(ˆ −f)(x)
Lema 2.2.10 La funci´on g : [0,1]→IR definida por
es Lipschitziana en (0,1)
ˆ
∂g(t)⊂D∂fˆ (x+t(y−x);y−x)E
Prueba.
|g(t)−g(t′)| = |f(xt)−f(x′t)| ≤k||xt−x′t||
= k||x+t(y−x)−(x+t′(y−x))|| ≤ k||x+ty−tx−x−t′y+t′x|| ≤ k||t(y−x)−t′(y−x)||
≤ ||(y−x)(t−t′)|| ≤ k||y−x|| |t−t′|
entonces,|g(t)−g(t′)| ≤˜k|t−t′|, t, t′ ∈(0,1); donde ˜k =k||y−x||.
Por el Teorema 2.2.3 se tiene el conjunto ˆ∂g(t) y D∂fˆ (xt);y−x E
son compactos y convexos puesto que corresponden aIR. Se tiene el intervalo enIR, es suficiente probar para v =±1, tenemos
max{∂g(t)vˆ } ≤max{D∂f(xˆ t);y−x E
v}
por el Teorema 2.2.3 tenemos
max{∂g(t)ˆ v}=g0(t, v)
y,
max{∂g(t)ˆ v} = lims→y
λ↓0
supg(s+λ v)−g(s) λ
≤ lim
y′→xt
λ↓0
supf(x+ [s+λv](y−x))−f(x+s(y−x)) λ
≤ lim
y′→x
t
λ↓0
supf(x+s(y−x)−λv(y−x))−f(y
′)
λ
= f0(xt;v(y−x))
Adem´as, se sigue del Teorema 2.2.3,
f0(xt;v(y−x)) = max{ D
ˆ
∂f(xt);y−x E
y as´ı,
max{∂g(t)ˆ v} ≤max{D∂fˆ (xt);y−x E
v}
Por lo tanto, ˆ∂g(t)⊂D∂fˆ (x+t(y−x));y−xE
Teorema 2.2.11 Si las funciones fi : IRn → IR son localmente lipschitz en x para
i= 1, ..., m entonces para escalares λi ∈IR
∂
m X
i=1
λifi !
(x)⊂ m X
i=1
λi∂fi(x)
y se tiene la igualdad, en la suma, cada fi es regular en x y cada λi >0.
Demostraci´on.
Es suficiente la prueba param = 2 el caso se generaliza por inducci´on. Del Teorema 2.2.8 observamos que
(f1+f2)0(x, v)≤f10(x, v) +f20(x, v)
por la definici´on de subdiferenciabilidad ˆ
∂(f1+f2)(x, v)⊂∂fˆ 1(x) +∂f2(x).
Luego, del Corolario 2.2.2 tenemos ˆ
∂(λ1f1+λ2f2)(x)⊂∂ˆ(λ1f1)(x) + ˆ∂(λ2f2)(x) = λ1∂fˆ 1(x) +λ2∂fˆ 2(x)
consideremos lo siguiente, fi es regular en x y λi >0, para i= 1,2; por el Teorema
2.2.8 la funci´onλ1f1+λ2f2 es regular enx, entonces
(λ1f1+λ2f2)0 = (λ1f1 +λ2f2)′ =λ1f1′ +λ2f2′ =λ1f10+λ2f20
y luego se sigue:
ˆ
∂(λ1f1+λ2f2)(x) =λ1∂fˆ 1(x) +λ2∂fˆ 2(x)
Esto completa la prueba.
Teorema 2.2.12 (Teorema del valor medio) Sea x, y ∈ IRn y sea la funci´on f
Lip-schitziana en un conjunto abierto U ⊂ IRn tal que el segmento de l´ınea [x, y] ⊂ U, entonces existe un punt u∈(x, y) tal que
Demostraci´on.
Se define la funci´onθ : [0,1]→IRtal que
θ(t) =f(xt) +t[f(x)−f(y)]
entonces θ es continua y,
θ(0) = f(x0) = f(x)
θ(1) = f(x1) +f(x)−f(y) =f(x)
entonces existe t0 ∈ (0,1) tal que se obtiene un extremo local t0 y por el Teorema
2.2.9, 0∈∂θ(t0) y por el Teorema 2.2.11 se tiene
ˆ
∂θ(t) = ˆ∂[f(xt) +t(f(x)−f(y))]⊂∂fˆ (xt) + [f(x)−f(y)] ˆ∂t
y adem´as por el Lema 2.2.10 se tiene
0∈D∂fˆ (xt);y−x E
+ [f(x)−f(y)].∂ˆ(t)
entonces, de ˆ∂(t) = 1 se sigue que
f(y)−f(x)∈D∂fˆ (µ);y−xE
de donde µ=xt∈(x, y), con ello se concluye el teorema.
Definici´on 2.2.3 (Subdiferencial de funciones no convexas)
Sea f : IRn → IR∪ {+∞} una funci´on propia, el conjunto de subgradientes
genera-lizados (tambi´en llamado limite subdiferencial ) de f en x∈IRn denotado por ∂f(x) es definido como:
Cap´ıtulo 3
El M´
etodo de Punto Proximal
Consideremos el problema:
(P) minf(x) s.a: x∈IRn
donde f :IRn →IR∪ {+∞} es una funci´on propia, semicontinua inferior y IRn es el espacio euclidiano con norma || · ||. El M´etodo de Punto Proximal cl´asico genera una sucesi´on{xk} dado porx0 ∈IRn
(un punto arbitrario) y
xk ∈arg min{f(x) + λk
2 ||x−x
k−1||2 : x∈IRn}
,
donde λk es un par´ametro positivo. Para resolver (P) introducimos el siguiente
m´etodo:
Dado una sucesi´on de par´ametros positivos {λk} y un punto inicial
x0 ∈IRn. (3.1)
Para cada k = 1,2, . . .. Si 0∈ ∂fˆ (xk−1), entonces el m´etodo finaliza. De otro modo
buscamos unxk ∈IRn tal que
0∈∂ˆ f(·) + λk 2
!
|| · −xk−1||2
!
(xk) (3.2)
Observaci´on 3.0.1 Este m´etodo es una extensi´on del m´etodo del punto proximal para funciones no convexas, en efecto si f es convexa entonces (3.2) se convierte en
xk = arg min
(
f(x) + λk
2 ||x−x
Observaci´on 3.0.2 Como estamos interesados en resolver (P) donde f es no con-vexa, es importante observar que el m´etodo (3.1) y (3.2) solamente necesita encontrar
un punto estacionario (no necesariamente un m´ınimo global) de la funci´on
regula-rizada f(·) + (λk
2 )|| · −x
k−1||2.
Probaremos bajo las hip´otesis quef es propia, acotado inferiormente y semicontinua inferior, las iteraciones nxko son bien definidas y si f es cuasi-convexa, nf(xk)o es
no creciente y convergente.
Luego, definimos un conjunto en el cu´al est´e conteniendo el ´optimo del conjunto
problema. Podemos obtener que:
lim
k→+∞f(x
k) = inf x∈IRn
f(x).
Si el conjunto es vac´ıo y de la convergencia de nxko se generaliza un punto cr´ıtico,
si {λk} es limitado y f es continua sobre su dominio.
Adem´as, si cada xk es un m´ınimo global de la funci´on regularizada dada en
f(·) + (λk
2 )|| · −x
k−1||2 y λ
k → 0 probamos que n
xko converge a un punto m´ınimo
del problema (P). Como caso particular, obtenemos la convergencia del m´etodo a un punto m´ınimo global para funciones pseudoconvexas y convexas.
3.1
Resultados de convergencia Fej´
er
Definici´on 3.1.1 Una sucesi´on nyko⊂IRn
, es llamado Fej´er convergente a un con-junto U ⊆IRn, con respecto a la norma euclidiana si:
y
k+1−u ≤ y k− u
;∀u∈U,∀k ≥0 (3.3)
Teorema 3.1.1 Si la sucesi´on nyko es Fej´er convergente en un conjunto U 6= ∅,
entonces nyko es acotada. Si un punto de acumulaci´on y¯ de nyko pertenece a U,
entonces
limk→+∞yk = ¯y
Demostraci´on.
y k− u ≤ y
0 −u
;∀k≥0;
lo cual quiere decir que la sucesi´onnykoest´a contenida en la bola de centrouy radio ky0−uk, por lo tanto es acotada.
Sea x ∈ U un punto de acumulaci´on de nyko, como nyko es acotada posee un
sub-sucesi´onnyjko convergente tal que:
limk→+∞yjk = ¯y
por (3.3) se tiene que la sucesi´on n y
k−y¯ o
es decreciente y no negativa adem´as posee una subsucesi´onn
y
jk−y¯ o
,lo cual converge a 0. Por lo tanto n
y k−y¯
o
converge a 0, y as´ı:
limk→+∞
y k− ¯ y = 0
lo que implica que limk→+∞yk = ¯y.
Proposici´on 3.1.1 Las siguientes propiedades son verdaderas: a. ∂f(x)ˆ ⊂∂f(x), ∀x∈IRn.
b. Si f es diferenciable en x¯ entonces ∂fˆ (x) = {∇f(x)}, por lo tanto
∇f(¯x)∈∂f(¯x).
c. Si f es continuamente diferenciable en una vecindad de x entonces
ˆ
∂f(x) =∂f(x) ={∇f(x)}.
d. Si g =f+h, con f finito enx¯ yh es continua diferenciable sobre una vecindad de f en x¯ entonces
ˆ
Prueba.
Sea ˆ∂f(x) el subdiferencial de Clarke.
ˆ
∂f(x) = ns∈IRn:fo(x, v)≥ hs;vi, v ∈IRno,
∂f(x) = ns∈IRn :∃xℓ →x, f(xℓ)→f(x),∃sℓ ∈∂fˆ (xv) tal que sℓ →so
,
a. s∈∂fˆ (x) entonces se tiene; fo(x, v)≥ hs, vi, ∀v. ∃{xℓ}={x} →x
f(xn) =f(x) se tiene la convergencia a: f(x).
Luego tenemos, {sℓ}={s} ∈∂fˆ (x)→s.
b. ∇f(¯x) ∈ ∂fˆ (¯x) pues f es diferenciable por Teorema 2.2.1 y por el ´ıtem a., ˆ
∂f(¯x)⊂∂f(¯x) de ambos tenemos que ∇f(¯x)∈∂f(x).
c. Como f es continuamente diferenciable en x, por Teorema 2.2.6 se cumple ˆ
∂f(x) ={∇f(x)}.
Por ´ıtem a., ˆ∂f(x)⊂∂f(x).
Sea s∈∂f(x)entonces ∃xℓ →x, f(xℓ)→f(x), ∃sℓ ∈∂fˆ (xℓ).
Como ˆ∂f(xℓ) =n∇f(xℓ)o=sℓ.
∃nxℓo={x} →x, f(xℓ) =f(x)→f(x).
n
sℓo={s} ∈∂f(x).ˆ Entonces, fo(x, v)≥ hs, vi, ∀v. Por lo tanto, s∈∂fˆ (x).
d. Del ´ıtem b.,
ˆ
∂f(¯x) +∇h(¯x) ⊂ ∂fˆ (¯x) + ˆ∂h(¯x),
⊂ ∂ˆ(f +h) (¯x),
Esto completa la prueba.
Observaci´on 3.1.1 De (3.2) y de la Proposici´on 3.1.1-d y la diferenciabilidad de (λk/2)|| · −xk−1||2. esto implica que;
0∈∂fˆ (xk) +λ
k(xk−xk−1),
as´ı existe gk ∈∂fˆ (xk) tal que:
gk=λ k
xk−1 −xk
3.2
Resultados de convergencia
Teorema 3.2.1 Si f : IRn → IR∪ {+∞} es propia, acotada inferiormente y semi-continua inferior sobredomf, entonces la sucesi´on nxkodado por (3.1) y (3.2) existe.
Demostraci´on.
Por inducci´on, se cumple para k = 0 por (3.1). Asumiremos que xk existe. Como
f es semicontinua inferior, limitado inferiormente y || · −xk||2 es coerciva, entonces
f(·) + (λk/2)|| · −xk||2 es semicontinua inferior y coerciva. As´ı, esta funci´on tiene un
xk+1 como m´ınimo global (en particular un m´ınimo local) y por lo tanto
0∈∂ˆf(·) +λk+1
2
|| · −xk||2(xk+1).
Asumiremos las siguientes hip´otesis:
• Hip´otesis A: f :IRn→IR∪ {+∞} es una funci´on acotada inferiormente.
• Hip´otesis B: f :IRn→IR∪ {+∞} es semicontinua inferior y cuasi-convexa. Como nos interesa la convergencia asint´otica del m´etodo, asumimos tambi´en que en cada iteraci´on 0∈/ ∂f(xˆ k) lo cu´al implica quexk 6=xk−1, ∀k.
Proposici´on 3.2.1 Bajo las hip´otesis A y B tenemos que nf(xk)o es decreciente y
convergente.
Prueba.
Comoxk 6=xk−1, entonces
D
de la Observaci´on (3.1.1),
D
gk;xk−1 −xkE>0.
Usando la cuasi-convexidad def y el Teorema 2.2.2 esto implica que
f(xk)< f(xk−1).
La convergencia de nf(xk)o se d´a por el l´ımite inferior de f ( f(xk) es una funci´on
no creciente).
Proposici´on 3.2.2 Las iteraciones nxko no son c´ıclicas.
Prueba.
Supongamos que existe l > j+ 1 tal que xl=xj, de la Proposici´on 3.2.1
f(xj) =f(xl)< . . . < f(xj+1)< f(xj),
pues f es no creciente, entonces
f(xj)< f(xj),
lo cu´al es una contradicci´on.
Por lo tanto xl6=xj.
Definimos el siguiente conjunto:
U =
x∈IRn/f(x)≤inf
j≥0f(x
j).
Observemos que este conjunto depende del punto inicial x0 y la sucesi´on {λk}.
SiU =∅ entonces es posible probar que:
i. limk→+∞f(xk) = infx∈IRnf(x).