Un método de convexi cación para resolver problemas de optimización monótona restringidos

Texto completo

(1)Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. Un método de convexificación para resolver problemas de optimización monótona restringidos. BI. BL. IO T. Tesis para optar el tı́tulo de Licenciado en Matemáticas. Autor: ANGULO VITERI JHON PAUL. Asesora: Dra. Jenny Rojas Jerónimo. Trujillo - Perú 2017. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. Un método de convexificación para resolver problemas de optimización monótona restringidos. BI. BL. IO T. Tesis para optar el tı́tulo de Licenciado en Matemáticas. Autor:. ANGULO VITERI JHON PAUL. Asesora: Dra. Jenny Rojas Jerónimo. Trujillo - Perú 2016. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(3) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Jurado. Dr. Nelson Aragonés Salazar. BI. BL. IO T. Dr. Julio Peralta Castañeda. Dra. Jenny Rojas Jerónimo Asesor. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(4) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Dedicatoria. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. BI. BL. IO T. Dedicado a mi familia por su constante apoyo durante mi formación profesional. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(5) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Agradecimiento. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. A todos los investigadores, estudiantes y personal del departamento de ma-. BI. BL. IO T. temáticas por su enseñanza académica. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(6) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Presentación. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Señores miembros del jurado:. Presento ante ustedes la tesis “Un método de convexificación para resolver problemas de optimización monótona restringidos”, con el propósito de obtener el tı́tulo profesional de Licenciado en Matemáticas. Esperando cumplir con los requerimientos de aprobación.. Agradezco anticipadamente sus opiniones y crı́ticas, pues me servirán como estı́mulo para continuar mejorando.. BI. BL. IO T. El Autor. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(7) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Lista de Sı́mbolos. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. H(y). : Matriz hessiana de g en y.. f ◦ (x; v). : Derivada direccional generalizada de f en x en la dirección v.. ∂c f (x). : Subgradiente de f en x para funciones convexas.. ∂f (x). : Subgradiente de f en x para funciones Lipschitz continua.. 00. f (x∗ , v ∗ , u) : Derivada direccional inferior de segundo orden de f . : Transpuesta del vector y.. xk −→ x∗. : Sucesión xk converge a x∗ .. BI. BL. IO T. yT. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(8) Jurado. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Índice general. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. III. Dedicatoria. IV. Agradecimiento. V. Presentación. VI. Lista de Sı́mbolos. VII. Resumen. IX. Abstract. X. IO T. INTRODUCCIÓN. XI. 1. BL. I. Preliminares. 1. 1.2. Monotonicidad y convexidad . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.3. Análisis no diferenciable . . . . . . . . . . . . . . . . . . . . . . . . .. 4. BI. 1.1. Tópicos de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . .. II. Convexificación de funciones monótonas 2.1. Convexificación de funciones dos veces continuamente diferenciable. 8 .. 9. 2.2. Convexificación de funciones monótonas no diferenciables . . . . . . . 19. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. ÍNDICE GENERAL. ix. III. Optimización monótona y maximización convexa. 32. 3.1. Algoritmo de aproximación externa . . . . . . . . . . . . . . . . . . . 34. 46. BI. BL. IO T. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. REFERENCIAS BIBLIOGRÁFICAS. 45. CA S. CONCLUSIONES. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(10) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Resumen. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. En este trabajo se presenta un método de convexificación para trasformar un problema de optimización monótona en un problema de maximización convexa tanto para funciones dos veces continuamente diferenciables y no diferenciables. Luego se hace uso del método de aproximación externa para problemas convexos, por lo tanto la solución del problema original se obtendrá del problema convexo.. Palabras claves: Optimización global, convexificación, minimización, monoto-. BI. BL. IO T. nicidad, programación convexa.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(11) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Abstract. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. In this work presents a method of convexification to transform a monotone optimization problem in a convex maximization problem for both functions twice continuously differentiable and non-differentiable.Then use the outer approximation method to convex problems, therefore the solution of the original problem is obtained from the equivalent convex problem.. Key words: Global Optimization, convexification, minimization, monotonicity,. BI. BL. IO T. convex programming.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(12) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. INTRODUCCIÓN. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. En toda actividad que el hombre realiza está presente la toma de decisiones. Las decisiones que deben tomarse generalmente se deben elegir de entre muchas alternativas pero en un contexto limitado. Evidentemente la alternativa a elegir debe ser la mejor.. En situaciones cotidianas y simples esta elección se realiza utilizando el sentido común, sin embargo cuando se trata de situaciones generales y complejas es necesario el uso de métodos que nos proporciona la ciencia. La parte de la ciencia que desarrolla propiedades y métodos para resolver este tipo de situaciones problemáticas se denomina teorı́a de optimización.. Una parte de la teorı́a de optimización es la programación lineal donde la función objetivo y las restricciones son funciones lineales [1], y cuando las variables son con-. IO T. tinuas, el problema de programación lineal es diferenciable y convexo, condiciones que proporcionan propiedades de optimalidad y el desarrollo de métodos óptimos. BL. en esta área. Aunque una amplia variedad de aplicaciones pueden resolverse usan-. BI. do programación lineal, con frecuencia se presentan problemas de tipo no lineal, es decir, cuando la función objetivo o alguna restricción son no lineales y para resolver estos problemas nuevamente la convexidad y diferenciabilidad juegan un rol muy importante desarrollándose el análisis convexo en optimización. Sin embargo cuando las funciones de un problema de programación no lineal son no diferenciables, surge la necesidad de desarrollar propiedades que permita elaborar métodos de solución para este tipo de problemas, agregando un nuevo capı́tulo en la teorı́a de optimización. A principios de 1970, Clarke, acuñó el término optimización no suave [3] para. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Introducción. xiii. categorizar la teorı́a que implica problemas de optimización no diferenciable, donde el método del subgradiente [2] es el más usado y conocido para resolver este tipo de problemas.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. Sin embargo al presentarse problemas de optimización de la forma:     max f (x)    (P ) s.t. fi ≤ bi , i = 1, 2, ..., m,       x ∈ X = { x : 0 ≤ lj ≤ xj ≤ Lj , j = 1, 2, ..., n},. donde las funciones f y fi , i = 1, 2, ..., m, son funciones continuas con propiedades monótonas (funciones crecientes o decrecientes) en [l, L] con l = (l1 , l2 , ..., ln )T y L = (L1 , L2 , ..., Ln )T hacia R, y debido a la monotonicidad de las funciones f y fi , la solución del problema (P ) presenta nuevas dificultades, dandose el desarrollo de la optimización monótona. La solusión del problema (P ), siempre se encuentra en la frontera de la región factible, sin embargo, puede tener múltiples soluciones locales ya que las funciones no necesariamente son convexas, por lo que se propone un método de convexificación, que consiste en convertir el problema de optimización monótona en un problema equivalente de maximización convexa, pues el área de optimización convexa cuenta con propiedades que garantizan la existencia y unicidad. IO T. de la solución. En este trabajo se demuestra que una función dos veces continuamente diferenciable se puede convexificar [7], y estos resultados se generalizan para. BL. funciones no suaves [8]. Por lo tanto la solución del problema original (P ) se puede obtener del problema equivalente convexo.. BI. En el capı́tulo 1, se presentan algunas definiciones, teoremas, corolarios y lemas que servirá para el desarrollo de este trabajo. En el capt́ulo 2, se discute la convexificación de funciones monótonas dos veces continuamente diferenciables y no diferenciables. En el capı́tulo 3, se demuestra que la solución del problema (P ) se obtiene del problema convexificado, además se propone el algoritmo de aproximación externa para resolver problemas de optimización convexa, finalmente se presenta un ejemplo en el que se hace uso la convexificación y luego el algoritmo de aproximación externa para solucionarlo.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(14) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo I Preliminares. En este capı́tulo se presentan definiciones, teoremas, corlarios y lemas que seran utilizados en el desarrolo de la tesis. En la primera sección se definen algunos conceptos sobre funciones continuas, en la segunda sección se enuncian definiciones y teoremas sobre convexidad y monotonicidad y en la tercera sección se presentan conceptos sobre análisis no suave.. 1.1.. Tópicos de funciones. IO T. Definición 1.1 Una sucesión (xn )n∈N. se llama acotada si existe un número. M ≥ 0, tal que para cada n ∈ N, se cumple la desigualdad. BI. BL. | xn |≤ M.. En otras palabras, una sucesión se llama acotada si el conjunto de sus valores son acotados. Teorema 1.1 Toda sucesión convergente es acotada. Teorema 1.2 Si lı́m xn = 0 e (yn ) es una sucesión acotada (convergente o no) n−→0. entonces lı́m xn yn = 0.. n−→0. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2 Monotonicidad y convexidad. 2. Teorema 1.3 Sea f : (a, b) ⊂ Rn → R una función continua, x0 ∈ (a, b) y {xn } ⊂ (a, b) tal que xn converge a xo . Entonces lı́m f (xn ) = f ( lı́m xn ) = f (xo ). n−→∞. CA S. n−→∞. Teorema 1.4 si (xn )n∈N y (yn )n∈N son sucesiones acotadas, entonces lı́m inf (xn + yn ) ≥ lı́m inf xn + lı́m inf yn n−→∞. n−→∞. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. n−→∞. Corolario 1.1 Sea f : [a, b] ⊂ R −→ R continua. Si f es derivable en (a, b), entonces existe θ ∈ (a, b) tal que. 0. f (b) − f (a) = f (θ)(b − a).. 1.2.. Monotonicidad y convexidad. Definición 1.2 Una función f : Rn → R es creciente (decreciente) en D ⊂ Rn con respecto a xi si. f (x1 , x2 , ..., xi−1 , x1i , xi+1 , ..., xn ) ≤ (≥)f (x1 , x2 , ..., xi−1 , x2i , xi+1 , ..., xn ) para x1i ≤ x2i ,, donde x1i , x2i ∈ Di = {xi :. (x1 , x2 , ..., xi−1 , xi , xi+1 , ..., xn ) ∈ D}.. IO T. Una función f : Rn → R es estrictamente creciente (estrictamente decreciente) en D ⊂ Rn con respecto a xi si. BL. f (x1 , x2 , ..., xi−1 , x1i , xi+1 , ..., xn ) < (>)f (x1 , x2 , ..., xi−1 , x2i , xi+1 , ..., xn ). BI. para x1i < x2i , donde x1i , x2i ∈ Di = {xi :. (x1 , x2 , ..., xi−1 , xi , xi+1 , ..., xn ) ∈ D}. Definición 1.3 Una función f : D ⊂ Rn → R es creciente (decreciente) si para. cualquier x, y ∈ D con xi < yi para i = 1, 2, ..., n, se cumple f (x) ≤ (≥)f (y). Una función f (x) es estrictamente creciente (estrictamente decreciente)si para cualquier x, y ∈ D con xi < yi para i = 1, 2, ..., n y x 6= y se cumple f (x) < (>)f (y). Definición 1.4 f : D ⊂ Rn → R es una función monótona en D ⊂ Rn si y sólo si f es creciente o decreciente.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2 Monotonicidad y convexidad. 3. Definición 1.5 Sea C ⊆ Rn , es un conjunto convexo si y sólo si para cualquier x1 , x2 ∈ C y λ ∈ [0, 1], se cumple. Es decir, el segmento de recta que une x1 y x2 está en C.. CA S. (1 − λ)x1 + λx2 ∈ C.. convexo.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Ejemplo 1.1 Probar que C = {x ∈ Rn : Ax = b, An×n , bn×1 } es un conjunto. En efecto: Sea y1 , y2 ∈ C y λ ∈ [0, 1], entonces Ay1 = b. Ay2 = b,. y. (1 − λ)Ay1 = (1 − λ)b. (1.1). λAy2 = λb.. (1.2). Sumando (1,1) y (1,2). IO T. (1 − λ)Ay1 + λAy2 = (1 − λ)b + λb A[(1 − λ)y1 + λy2 ] = b.. BL. Como (1 − λ)y1 + λy2 ∈ C, entonces C es un conjunto convexo.. BI. Definición 1.6 Sea f : C → R, donde C es un conjunto convexo no vacı́o en. Rn . f es una función convexa en C si y sólo si. f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ),. ∀x1 , x2 ∈ C. y. λ ∈ [0, 1].. ∀x1 , x2 ∈ C. y. λ ∈ [0, 1].. La función f es llamada estrictamente convexa si f (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 4. Ejemplo 1.2 Sea f : S ⊂ R → R, tal que f (x) = x2 , probar que es una función convexa.. CA S. En efecto: Será equivalente probar que. 0 ≤ λf (x1 ) + (1 − λ)f (x2 ) − f (λx1 + (1 − λ)x2 ),. ∀λ ∈ (0, 1), ∀x1 , x2 ∈ S,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. sustituyendo y operando. λf (x1 ) + (1 − λ)f (x2 ) − f (λx1 + (1 − λ)x2 ) = λx21 + (1 − λ)x22 − (λx1 + (1 − λ)x2 )2. = λx21 + (1 − λ)x22 − λ2 x21 − 2λ(1 − λ)x1 x2 − (1 − λ)2 x22 = x21 (λ − λ2 ) + x2 ((1 − λ) − (1 − λ)2 ) − 2λ(1 − λ)x1 x2 = λ(1 − λ)x21 + (1 − λ)λx22 − 2λ(1 − λ)x1 x2 = λ(1 − λ)(x21 + x22 − 2x1 x2 ) = λ(1 − λ)(x1 − x2 )2 ≥ 0.. Por lo tanto f es una función convexa.. IO T. Teorema 1.5 Sea S un conjunto convexo no vacı́o en Rn , y sea f : S → R una función dos veces diferenciable en S. Entonces f es convexa si y sólo si la matriz. BL. hessiana es semidefinida positiva para cada punto en S.. BI. 1.3.. Análisis no diferenciable. Definición 1.7 Sea Y un subconjunto de Rn . Una función f : Y → R satisface la condición de Lipschitz si existe una constante k no negativa tal que |f (x) − f (y)| ≤ k k x − y k. ∀x, y ∈ Y.. Definición 1.8 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn y d un vector en Rn . La derivada direccional generalizada de f en x en la dirección d,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 5. se define f ◦ (x; d) = lı́m sup y −→x t↓0. f (y + td) − f (y) t. CA S. donde y es un vector en Rn y t es un escalar positivo. A f ◦ (x; d) también se conoce como derivada generalizada de Clarke.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Definición 1.9 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn . La subdiferencial o gradiente de Clarke de f en x es el conjunto ∂f (x) de vectores ξ ∈ Rn tal que. ∂f (x) = {ξ ∈ Rn : f ◦ (x; d) ≥ ξ T d, ∀d ∈ Rn }.. Teorema 1.6 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn . Entonces. f ◦ (x; d) = máx{ξ T d : ξ ∈ ∂f (x)}. ∀ d ∈ Rn .. Definición 1.10 La subdiferencial de una función convexa f : Rn → R en x ∈ Rn es el conjunto ∂c f (x) de vectores ξ ∈ Rn tal que. ∂c f (x) = {ξ ∈ Rn : f (y) ≥ f (x) + ξ T (y − x), ∀ y ∈ Rn }.. IO T. Cada vector ξ ∈ ∂c f (x) es llamado subgradiente de f en x.. Teorema 1.7 Sea f : Rn → R una función convexa. Entonces la derivada direc-. BI. BL. cional clásica, f 0 (x, d), existe en toda dirección d ∈ Rn y ∀ x ∈ Rn f 0 (x, d) = max{ξ T d : ξ ∈ ∂c f (x)}, ∀ d ∈ Rn. y. ∂c f (x) = {ξ ∈ Rn : f 0 (x, d) ≥ ξ T d, ∀ d ∈ Rn }.. Teorema 1.8 La subdiferencial para funciones Lipschitz continua es una generalización de la subdiferencial para funciones convexas. Entonces, si f : Rn → R 0. es una función convexa, se cumple que f (x, d) = f ◦ (x; d) para todo d ∈ Rn , y ∂c f (x) = ∂f (x).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 6. Teorema 1.9 La subdiferencial para funciones Lipschitz continua es una generalización de la derivada clásica. Entonces, si f : Rn → R es una función Lipschitz continua y diferenciable en x ∈ Rn , se cumple que ∇f (x) ∈ ∂f (x).. CA S. Además, si f : Rn → R es continuamente diferenciable en x ∈ Rn , entonce ∂f (x) = {∇f (x)}.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Definición 1.11 Una función f es regular en x∗ si la derivada direccional f 0 (x∗ ; d) existe para todo d ∈ Rn y f 0 (x∗ ; d) = f ◦ (x∗ ; d) para todo d ∈ Rn , donde f ◦ (x∗ ; d) es la derivada direccional de Clarke.. Teorema 1.10 Sea la función g : Y ⊂ Rn −→ R, definida como g = f (h), donde h : Y −→ Rn y f : Rn −→ R. Si f es una función regular en x = h(y), y ∈ Y , y h una función continuamente diferenciable, entonces g es una función regular. Definición 1.12 Suponer que {xk } ⊂ Rn converge a x∗ ∈ Rn con xk 6= x∗ para cada k.. La sucesión {xk } es convergente a x∗ en la dirección u si existe {tk } satisfaciendo: tk > 0 y tk −→ 0 para k −→ ∞, tal que { x. k −x∗. tk. } −→ u.. k. ∗. −x Se observa que {xk } converge a x∗ en la dirección u si y sólo si { kxxk −x ∗ k } −→. u . kuk. IO T. Definición 1.13 Sea u ∈ Rn . Entonces se define ∂u f (x∗ ) como el conjunto de. vectores v tal que, para cada uno de ellos, existen sucesiones {xk } y {v k } con {xk }. BL. que converge a x∗ en la dirección u, {v k } que converge a v y v k pertenece a ∂f (xk ). BI. para cada k.. Luego, ∂u f (x∗ ) ⊆ ∂f (x∗ ). Definición 1.14 Sea v ∗ ∈ ∂u f (x∗ ). La derivada direccional inferior de segundo orden de f en x∗ y v ∗ en la dirección u, f 00 (x∗ , v ∗ , u) se define como lı́mı́nf(v k − v ∗ )T (xk − x∗ )/t2k , tomado sobre las suceciones {xk }, {v k }, {tk } para los cuales (i) tk > 0 para cada k y {xk } converge a x∗ .. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. k −x∗ ). (ii) { (x. tk. 7. } converge a u.. (iii) {v k } converge a v ∗ con v k ∈ ∂f (xk ) para cada k. Definición 1.15 Una función f es semisuave en x∗ si la sucesión {(v k )T u} con-. CA S. verge siempre que {xk } converge a x∗ en la dirección u y v k ∈ ∂f (xk ) para cada k.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Teorema 1.11 Sea la función g : Y ⊂ Rn −→ R, definida como g = f (h), donde h : Y −→ Rn y f : Rn −→ R. Si f es una función semisuave en x = h(y), y ∈ Y , y h una función continuamente diferenciable, entonces g es una función semisuave. Lema 1.1 Suponer que f es semisuave y regular en un conjunto abierto convexo W . Suponer tambien que f 00 (x∗ , v ∗ , u) ≥ 0 para cada tripleta (x∗ , v ∗ , u) con x∗ ∈ W ,. BI. BL. IO T. u ∈ Rn , y v ∗ ∈ ∂u f (x∗ ). Entonces, f es convexa en W .. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(21) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo II. Convexificación de funciones monótonas. En este capı́tulo se presenta la teorı́a que nos garantizará la convexificación de una función monótona. En la primera sección se desarrolla un teorema y dos corolarios para funciones dos veces continuamente diferenciable, estos resultados se generalizan para funciones no diferenciables en la segunda sección. Sea f una función definida en:. IO T. n Y X= [lj , Lj ] = [l1 , L1 ] × [l2 , L2 ] × ... × [ln , Ln ]. (2.1). j=1. con 0 < lj ≤ Lj para cada j hacia R. La función f es llamada función estrictamente. BL. monótona si es una función estrictamente monótona para cada xj .. BI. Sea h : (y1 , y2 , ..., yn ) 7−→ (h1 (y1 ), h2 (y2 ), ..., hn (yn )) una función biyectiva y sea la siguiente transformación de variable de la función f , g(y) = f (h(y)),. (2.2). donde el dominio de g es Y =. n Y j=1. Yj =. n Y. h−1 ([lj , Lj ]).. (2.3). j=1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 9. 2.1.. Convexificación de funciones monótonas dos veces continuamente diferenciables. y S n = {d ∈ Rn : kdk = 1}, se define. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. σ = min{dT ∇2 f (x)d : x ∈ X, d ∈ S n } ∂f η = min : x ∈ X, j = 1, 2, ..., n . ∂xj. CA S. Sea f una función dos veces continuamente diferenciable estrictamente monótona. Teorema 2.1 Sea f una función dos veces continuamente diferenciable y estrictamente creciente en X con η > 0 y hj , j = 1, 2, ..., n funciones dos veces continuamente diferenciable y estrictamente monótona que satisfacen la siguiente condición 00. hj (yj ) σ ≥ − , [hj 0 (yj )]2 η. ∀ yj ∈ Yj ,. j = 1, 2, ..., n,. (2.4). entonces g(y) = f (h(y)) es una función convexa en Y . Demostración. IO T. Debido a que f y h son funciones dos veces continuamente diferenciable, entonces g es una función dos veces continuamente diferenciable, por lo que será suficiente. BL. probar que la matriz hessiana de g es semidefinida positiva en Y .. BI. Para cualquier y ∈ Y , sea x = h(y), entonces x ∈ X, luego:. ∂g ∂f = h0j (yj ) , j = 1, 2, ..., n. ∂yj ∂xj 2 ∂ 2g ∂f 00 0 2∂ f = h (y ) + (h (y )) , i = 1, 2, ..., n. i i i i ∂yi2 ∂xi ∂x2i ∂ 2g ∂ 2f = h0i (yi )h0j (yj ) , i 6= j, j, i = 1, 2, ..., n. ∂yi ∂yj ∂xi ∂xj. (2.5) (2.6). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 10. Luego la matriz hessiana, H(y), de g es ∂2g (y) ∂y  1 ∂y1. Sea. ∂2g (y) ∂y1 ∂y3. ···. ∂2g (y) ∂y2 ∂y2. ∂2g (y) ∂y2 ∂y3. ···. ∂2g (y) ∂y3 ∂y2. ∂2g (y) ∂y3 ∂y3. ··· .... .. .. ∂2g (y) ∂yn ∂y2. .. .. ∂2g (y) ∂yn ∂y3. ···. . ∂2g (y) ∂y1 ∂yn .  ∂2g (y)  ∂y2 ∂yn   ∂2g (y)  ∂y3 ∂yn  .. ..    ∂2g (y) ∂yn ∂yn. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI.  ∂2g  ∂y2 ∂y1 (y)   2g 2 H(y) = ∇ g(y) =  ∂y∂ ∂y (y)  3 1  ..  .  2 ∂ g (y) ∂yn ∂y1. ∂2g (y) ∂y1 ∂y2. CA S. . h0i = h0i (yi ),. h00i = h00i (yi ), ∂f ∂xi. =. ∂f (x), ∂xi. ∂2f ∂x2i. =. ∂2f (x), ∂x2i. ∂2f ∂xi ∂xj. =. ∂2f (x), ∂xi ∂xj. ∀ i, j = 1, 2, ..., n.. BI. BL. IO T. Reemplazando (2.5) y (2.6) en H(y)   00 ∂f 0 2 ∂2f 0 0 ∂2f 0 0 ∂2f h + (h1 ) ∂x2 h1 h2 ∂x1 ∂x2 ··· h1 hn ∂x1 ∂xn 1  1 ∂x1  2 2   f 00 ∂f 0 2∂ f 0 0 ∂2f  h02 h01 ∂x∂2 ∂x  h + (h ) · · · h h 2 2 2 2 n ∂x ∂x ∂x ∂x n 1 2 2   2   .. .. .. ..   . . . .   0 0 ∂2f 0 2 ∂2f 0 0 ∂2f 00 ∂f hn h1 ∂xn ∂x1 hn h2 ∂xn ∂x2 · · · hn ∂xn + (hn ) ∂x2 n i h   00 2f 2f 2f h ∂f ∂ ∂ 0 h h01 (h01)2 ∂x1 + ∂x2 h01 h01 ∂x1 ∂x2 h02 ··· h01 ∂x∂1 ∂x n n 1 1   h 00 i   h2 ∂f ∂2f 0 ∂2f 0 0 0 0 ∂2f   h2 ∂x2 ∂x1 h1 h2 ∂x2 ∂xn h0n h2 (h0 )2 ∂x2 + ∂x2 h2 · · · 2 2   =  .. .. .. . .   . . . .  i  h 00 2 2 2 f f ∂f ∂ f h0n ∂x∂n ∂x · · · h0n (hh0n)2 ∂x h0 h0 + ∂x h0n h0n ∂x∂n ∂x 2 n 1 1 2 2 n n     00  h1 ∂f ∂2f ∂2f ∂2f 0 + · · · h01 0 · · · 0 h 0 · · · 0 ∂x1 ∂x2 ∂x1 ∂xn   1   (h01 )2 ∂x1 ∂x21  00 2f 2f 2f      h ∂ ∂f ∂ ∂ 0 0 2   0 h2 · · · 0   0 h2 · · · 0   + ∂x2 · · · ∂x2 ∂x1 (h02 )2 ∂x2 ∂x2 ∂xn       2 =.   .. .. . . .. . . ..   ..  .. .. .. . . . . .  . .  . . . . . . . .     h00 ∂2f ∂f ∂2f ∂2f 0 0 n 0 0 · · · hn 0 0 · · · hn · · · (h0 )2 ∂xn + ∂x2 ∂xn ∂x1 ∂xn ∂x2 n. n. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 11. Sea . 0. ···. h02.   ··· 0   . .. . ..   0 · · · hn. .. . 0. h1 ∂f  (h01 )2 ∂x1. +. 0. ∂2f ∂x21. ∂2f ∂x1 ∂x2 h00 ∂f 2 (h02 )2 ∂x2. ∂2f ∂x22. ∂2f ∂x1 ∂xn. . ∂2f ∂x2 ∂xn.       . EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. ∂2f ∂x2 ∂x1. ···. CA S.  h0  1  0 A(y) =   .. .  0  00   C(x) =    . . .. .. ∂2f ∂xn ∂x1. ∂2f ∂xn ∂x2. ∂2f ∂x1 ∂x2. ∂2f ∂x21.   ∂ 2 f  ∂x2 ∂x1  =  ..  . . .. .. ∂2f ∂xn ∂x2. ···  . ∂2f. ··· .... ∂x22. ··· .. .. ∂2f ∂x1 ∂xn . ···. ∂2f. ∂2f ∂xn ∂x1. +. .. .. .. .. h00 ∂f n (h0n )2 ∂xn. h00 ∂f 1 (h  01 )2 ∂x1.     ∂x2 ∂xn   ..  +  .     ∂2f ∂x2n. ···. 0 .. .. +. ∂2f ∂x2n. 0. h00 2 (h02 )2. 0. .. .. 0. ∂f ∂x2. ···. 0. ··· .. .. 0 .. .. ···. h00 ∂f n (h0n )2 ∂xn.        . = (∇2 f (x) + B(x)), donde. . ∂2f ∂x21. IO T.   ∂2f  ∂x2 ∂x1 2 ∇ f (x) =   ..  . . ∂2f ∂xn ∂x1. BI. BL. . h00 ∂f 1 (h  01 )2 ∂x1.   B(x) =    . 0 .. .. 0. ∂2f ∂x1 ∂x2. ···. ∂2f ∂x22. ··· .. .. ∂2f ∂xn ∂x2. ···. .. .. 0. h00 ∂f 2 (h02 )2 ∂x2. . ∂2f ∂x1 ∂xn  ∂2f   ∂x2 ∂xn . .. .. ∂2f ∂x2n. ···. ,   0. .. .. ··· .. .. 0 .. .. 0. ···. h00 ∂f n (h0n )2 ∂xn.        . En consecuencia H(y) = A(y)(∇2 f (x) + B(x))A(y). Ahora para todo d ∈ S n dT H(y)d = dT A(y)C(x)A(x)d. Es claro que A(y)C(x)A(y) es una matriz semidefinida positiva si y sólo si C(x) es una matriz semidefinida positiva.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 12. Por la definición de σ y η, se tiene. dT ∇2 f (x)d ≥ σ. ∀ xj ∈ [lj , Lj ],. y para cualquier d ∈ S n ,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. dT C(x)d = dT (∇2 f (x) + B(x))d. CA S. ∂f ≥η>0 ∂xj. ∀ d ∈ S n,. = dT ∇2 f (x)d + dT B(x)d. n X ∂f (x) h00j (yj ) 2 ≥σ+ d ∂xj [h0j (yj )]2 j j=1 X n σ d2j ≥σ+ η − η j=1. =σ−σ kdk. =σ−σ. = 0,. es decir, dT C(x)d ≥ 0. Luego C(x) es una matriz semidefinida positiva. Entonces H(y) = ∇2 g(y) es una matriz semidefinida positiva.. . IO T. Por lo tanto g es una función convexa.. Similarmente, una función estrictamente decreciente se puede convertir a una. BI. BL. función convexa a través de trasformaciones de variables satisfaciendo 00. hj (yj ) σ ≤ − , [hj 0 (yj )]2 η. ∀ y j ∈ Yj ,. j = 1, 2, ..., n.. Hay funciones especificas que satisfacen la condición (2.4), en particular, considerar las siguientes dos funciones 1 1 hj (yj ) = ln 1 − , p yj −1. hj (yj ) = yj p ,. p > 0,. j = 1, 2, ..., n.. (2.7). p > 0,. j = 1, 2, ..., n.. (2.8). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 13. Corolario 2.1 Sea f una función que satisface las condiciones del teorema anterior, con 1 1 hj (yj ) = ln 1 − , p yj. p > 0,. j = 1, 2, ..., n,. CA S. entonces existe una constante p1 ≥ 0 tal que g(y) = f (h(y)) es una función convexa i h en Y = (1−e1plj ) , (1−e1pLj ) cuando p ≥ p1 .. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Demostración. Será suficiente probar que se cumple (2.4), notar que ! 0 1 1 1 0 hj (yj ) = 1− p 1 − y1j yj ! 1 1 1 = yj −1 p yj2 yj 1 1 = p yj (yj − 1) 1 −(yj (yj − 1))0 = p yj2 (yj − 1)2 1 −((yj − 1) + yj ) = p yj2 (yj − 1)2 1 1 − 2yj = p yj2 (yj − 1)2 i h Ya que yj < 0 para yj ∈ (1−e1plj ) , (1−e1pLj ) , se tiene 1−2yj 1 00 2 2 hj (yj ) p y (yj −1) = j 2 0 2 [hj (yj )] 1 1. BI. BL. IO T. h00j (yj ). p. yj (yj −1). 2. =. p (1 − 2yj )(yj (yj − 1))2 pyj2 (yj − 1)2. = p(1 − 2yj ) > p. o n Para que la condición (2.4) se cumpla, se debe satisfacer que p ≥ p1 = max 0, − ση . Por lo tanto g es una función convexa en Y cunando p ≥ p1 .. . Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 14. De forma similar se enuncia el siguiente corolario usando la función (2. 6). Corolario 2.2 Sea f una función que satisface las condiciones del teorema anterior, con p > 0,. j = 1, 2, ..., n.. CA S. −1. hj (yj ) = yj p ,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. entonces existe un p2 ≥ 0 tal que g(y) = f (h(y)) es una función convexa en Y = Qn −p −p j=1 [Lj , lj ] cuando p ≥ p2 . Demostración. Será suficiente probar que se cumple (2.4), notar que. 1 (− 1 −1) h0j (yj ) = − yj p p 1 1 (− 1 −2) 00 hj (yj ) = − − − 1 yj p p p 1 1 (− 1 −2) + 1 yj p . = p p −p Ahora para todo yj ∈ L−p , se tiene j , lj h00j (yj ) (h0j (yj ))2. (− 1 −2) + 1 yj p 2 1 − −1 ( ) p − p1 yj. . =. 1 p. 1 p. IO T. 1. = (1 + p)yjp. BL. ≥ (1 + p). 1 Lj. BI. pues,. −p L−p j ≤ yj ≤ lj 1. p −1 L−1 j ≤ yj ≤ lj 1. entonces,. yjp ≥ L−1 j =. 1 . Lj. Sea L = max1≤j≤n Lj ,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 15. luego σ 1 ≥− Lj η σ (1 + p) ≥ − L η σ p ≥ − L − 1. η. CA S. (1 + p). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. n o σ Por lo tanto la condición (2.4) se cumple cuando p ≥ p2 = max 0, − η L − 1 .. . Para ilustrar la convexificación de una función estrictamente monótona se considera el siguiente ejemplo.. Ejemplo 2.1 Sea la función. 1 f (x) = (x − 2)3 + x, 3. x ∈ X = [1, 3].. Usando los corolarios (2.1) y (2.2), hallar los valores de p para garantizar la convexificación de f. En efecto. f 0 (x) = (x − 2)2 + 1. f 00 (x) = 2(x − 2),. BL. IO T. La función f es no convexa, pues. al evaluar para x = 1, se tiene que f 00 (x) = −2. Entonces f (x) es una función no. BI. convexa.. Notar que f 0 (x) = (x − 2)2 + 1 ≥ 1,. ∀x ∈ [1, 3]. f 00 (x) = 2(x − 2) ≥ −2,. ∀x ∈ [1, 3]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 16. Usando la función definida en (2.7) y el corolario (2.1),. BL. IO T. hallar. σ p1 = max 0, − η −2 p1 = max 0, − = 2, 1. BI. entonces para cualquier p ≥ p1 = 2 garantiza la convexidad de g.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 17. Usando la función definida en (2.8) y el corolario (2.2),. σ p2 = max 0, − L − 1 η (−2) p2 = max 0, − 3 − 1 = 5, 1. BL. IO T. hallar. BI. entonces para cuaquier p ≥ p2 = 5 se garantiza la convexidad de g.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 18. Por lo tanto en esta sección se probó que se puede convexificar una función dos veces continuamente diferenciable estrictamente creciente, en la siguiente sección se ampliará los resultados de convexificación para funciones no suaves. Especificamente. IO T. se probará que funciones estrictamente monótonas semisuaves y regulares pueden. BI. BL. ser convertidas en funciones convexas.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 2.2.. 19. Convexificación de funciones monótonas no diferenciables. (2.2).. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Sea W un conjunto abierto convexo tal que Y ⊆ W .. CA S. Se considera a X y Y definidos como en (2.1) y (2.3) respectivamente y g como. Teorema 2.2 Asumir que. i) f es una función semisuave y regular en un conjunto abierto convexo que contiene a X.. ii) f es una función estrictamente creciente en X y. ı́nf mı́n = {ξi : ξ = (ξ1 , ξ2 , ..., ξn )T ∈ ∂f (x), x ∈ X} ≥ > 0 i=1,...,n. ρ = ı́nf{f 00 (x, v, w) : x ∈ X, k w k= 1, v ∈ ∂w f (x)} > −∞ iii) hi ∈ C 2 (W ),. (2.9) (2.10). i = 1, 2, ..., n son funciones estrictamente monótonas convexas. que satisfacen. σ h00i (yi ) ≥ , 0 2 [hi (yi )] . y ∈ W,. i = 1, 2, ..., n,. (2.11). donde σ = −ρ.. IO T. Entonces g es una función convexa en cualquier subconjunto convexo de Y.. BL. Demostración. •) Asumir que ρ ≥ 0.. BI. Tenemos por i) que f es una función semisuave y regular en un conjunto abierto convexo contenido en X. Por la condición ii) ρ = ı́nf{f 00 (x, v, w) : x ∈ X, k w k= 1, v ∈ ∂w f (x)}} ≤ f 00 (x, v, w), entonces f 00 (x, v, w) ≥ ρ ≥ 0, consecuentemente f 00 (x, v, w) ≥ 0. Ahora por lema (1.1) concluimos que f es una función convexa.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 20. •) Sin pérdida de generalidad, asumir que σ = −ρ > 0, es decir, ρ < 0. Para y ∈ Y , sea x = h(y), entonces x ∈ X. Como f es una función semisuave en x = h(y) y h es una función continuamente. CA S. diferenciable, por teorema (1.11) se tiene que g(y) = f (h(y)) es semisuave en Y . También como f es una función regular en x = h(y) y h una función continuamente. Y.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. diferenciable, entonces por teorema (1.10) se tiene que g(y) = f (h(y)) es regular en. Luego g es una función semisuave y regular, por lo que será suficiente probar que g 00 (y ∗ , v ∗ , d) ≥ 0 para cualquier y ∗ ∈ Y , d ∈ Rn y v ∗ ∈ ∂d g(y ∗ ). En efecto:. dado cualquier y ∗ ∈ Y , d ∈ Rn , d 6= 0 y v ∗ ∈ ∂d g(y ∗ ), suponer que {y k }, {v k } y {tk } son sucesiones tales que 1. tk > 0, ∀k.. 2. {y k } converge a y ∗ . 3. { y. k −y ∗. tk. } converge a d.. 4. {v k } converge a v ∗ , con v k ∈ ∂g(y k ), para cada k.. IO T. Sea x∗ = h(y ∗ ) ∈ X y xk = h(y k ) para cada k, entonces {xk } −→ x∗ , cuando. BL. k −→ ∞, pues h es continua. Si hi ∈ C 2 (W ), existe θ1k , θ2k , ..., θnk ∈ (0, 1) tal que hi (yik ) − hi (yi∗ ) = h0i (yi∗ + θik (yik − yi∗ ))(yik − yi∗ ).. (2.12). BI. Consecuentemente xk − x∗ = h(y k ) − h(y ∗ ) = ∇h(η k )(y k − y ∗ ). (2.13). donde η k = (η1k , η2k , ..., ηnk ), ηik = yi∗ + θik (yik − yi∗ ), ∀ i = 1, 2, ..., n. También, se tiene que h0i (yj ) = 0,. ∀ i 6= j,. por lo que el jacobiano de h en η k es ∇h(η k ) = diag(h01 (η1k ), h02 (η2k ), ..., h0n (ηnk )).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 21. Dividiendo ambos lados de (2.13) entre tk y tomando lı́mite cuando k −→ ∞, se obtiene xk − x∗ (y k − y ∗ ) = lı́m ∇h(η k ) k−→∞ k−→∞ tk tk lı́m. CA S. = ∇h(y ∗ )d,. (2.14). u.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. sea u = ∇h(y ∗ )d. Entonces por la definición (1.12), {xk } converge a x∗ en la dirección. Por la regla de la cadena de la derivada generalizada del gradiente de Clarke, se cumple que. ∂g(y) ⊆ {∇h(y)ξ : ξ ∈ ∂f (h(y))},. y ∈ Y.. Ya que v k ∈ ∂g(y k ), entonces existe ξ k ∈ ∂f (xk ) tal que v k = ∇h(y k )ξ k. (2.15). Por la condición iii) del teorema, hi es una función estrictamente monótona para cada i, entonces, h0i (yi ) 6= 0 para todo i. Luego. ξ k = ∇h(y k )−1 v k ,. lı́m ξ k = lı́m ∇h(y k )−1 v k. k−→∞. BI. BL. IO T. y. k−→∞. = ∇h(y ∗ )−1 lı́m v k k−→∞. = ∇h(y ∗ )−1 v ∗ ,. por tanto {ξ k } converge, sea ξ ∗ = lı́m ξ k , k−→∞. por la cerradura de ∂f (x), ξ ∗ ∈ ∂f (x∗ ), además, ξ ∗ ∈ ∂u f (x∗ ) y v ∗ = ∇h(y ∗ )ξ ∗ .. (2.16). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 22. Usando (2.15) y (2.16), se tiene (v k − v ∗ )T (y k − y ∗ ) = (∇h(y k )ξ k − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ). CA S. = (∇h(y k )ξ k − ∇h(y k )ξ ∗ + ∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ). = [(∇h(y k )ξ k − ∇h(y k )ξ ∗ )T + (∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T ](y k − y ∗ ). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. = (∇h(y k )ξ k − ∇h(y k )ξ ∗ )T (y k − y ∗ ) + (∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ) = (ξ k − ξ ∗ )T ∇h(y k )(y k − y ∗ ) + (ξ ∗ )T (∇h(y k ) − ∇h(y ∗ ))(y k − y ∗ ), por lo tanto,. (v k − v ∗ )T (y k − y ∗ ) = (ξ k − ξ ∗ )T ∇h(y k )(y k − y ∗ ) + (ξ ∗ )T (∇h(y k ) − ∇h(y ∗ ))(y k − y ∗ ). (2.17). Como hi ∈ C 2 (W ), se tiene. 1 x∗i − xki = hi (yi∗ ) − hi (yik ) = h0i (yik )(yi∗ − yik ) + h00i (ζik )(yi∗ − yik )2 , 2 h0i (yik ) − h0i (yi∗ ) = h00i (δik )(yik − yi∗ ),. donde. IO T. ζik = yik + αik (yi∗ − yik ), δik = yi∗ + βik (yik − yi∗ ),. BI. BL. También. (2.18) (2.19). 0 < αik < 1,. 0 < βik < 1,. i = 1, 2, ..., n.. ∇h(y k ) = diag(h01 (y1k ), h02 (y2k ), ..., hn (ynk )),. (2.20). ∇h(y ∗ ) = diag(h01 (y1∗ ), h02 (y2∗ ), ..., hn (yn∗ )).. (2.21). Por lo tanto, la ecuación (2.17) puede ser reescrita usando (2.12), (2.18), (2.19),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 23. (2.20) y (2.21) como. CA S. (v k − v ∗ )(y k − y ∗ ) i h i h = (ξ1k − ξ1∗ ) · · · (ξnk − ξn∗ ) diag(h01 (y1k ), h02 (y2k ), ..., hn (ynk )) (y1k − y1∗ ) · · · (ynk − yn∗ ) h i h i + ξ1∗ · · · ξn∗ diag(h01 (y1k ) − h01 (y1∗ ), ..., h0n (ynk ) − hn (yn∗ )) (y1k − y1∗ ) · · · (ynk − yn∗ ). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. = [(ξ1k − ξ1∗ )h01 (y1k )(y1k − y1∗ ) + (ξ2k − ξ2∗ )h02 (y2k )(y2k − y2∗ ) + · · · + (ξnk − ξn∗ )h0n (ynk )(ynk − yn∗ )] + [ξ1∗ (h01 (y1k ) − h01 (y1∗ ))(y1k − y1∗ ) + · · · + ξn∗ (h0n (ynk ) − h0n (yn∗ ))(ynk − yn∗ )] = [(ξ1k − ξ1∗ )(h1 (y1k ) − h1 (y1∗ )) − (ξ1k − ξ1∗ )h1 (y1k ) + (ξ1k − ξ1∗ )h1 (y1∗ ) + (ξ1k − ξ1∗ )h01 (y1k )(y1k − y1∗ )] + · · ·. + [(ξnk − ξn∗ )(hn (ynk ) − hn (yn∗ )) − (ξnk − ξn∗ )hn (ynk ) + (ξnk − ξn∗ )hn (yn∗ ). + (ξnk − ξn∗ )h0n (ynk )(ynk − yn∗ )] 0 k 0 ∗ ∗ 0 0 k ∗ 2 ∗ (hn (yn ) − hn (yn )) k ∗ 2 ∗ (h1 (y1 ) − h1 (y1 )) k + ξ1 (y1 − y1 ) + · · · + ξn (yn − yn ) (ynk − yn∗ ) (y1k − y1∗ ) n X = (ξik − ξi∗ )(hi (yik ) − hi (yi∗ )) i=1. +. n X. (ξik − ξi∗ )hi (yi∗ ) − (ξik − ξi∗ )hi (yik ) − (ξik − ξi∗ )h0i (yik )(yi∗ − yik ). i=1. i=1 n X. ξi∗. (h0i (yik ) − h0i (yi∗ )) k (yi − yi∗ )2 (yik − yi∗ ). IO T. +. n X. =. (ξik. i=1. −. x∗i ). n X. +. (ξik − ξi∗ )[hi (yi∗ ) − hi (yik ) − h0i (yik )(yi∗ − yik )]. i=1. BL. n X. −. ξi∗ )(xki. +. ξi∗ (h00i (δik ))(yik − yi∗ )2. BI. i=1. k. ∗. k. ∗. = (ξ − ξ )(x − x ) +. n X. (ξik. i=1 n. = (ξ k − ξ ∗ )(xk − x∗ ) +. −. ξi∗ ). . n X 1 00 k (xk − x∗ )2 ∗ k 2 hi (ζi ) (yi − yi ) + ξi∗ h00i (δik ) i 0 k i2 2 hi (ηi ) i=1 n. X h00 (δ k ) 1X k ξi∗ 0i ki 2 (xki − x∗i )2 , (ξi − ξi∗ )h00i (ζik )(yi∗ − yik )2 + 2 i=1 hi (ηi ) i=1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 24. ası́ n. +. n X. ξi∗. i=1. 1X k (ξ − ξi∗ )h00i (ζik )(yi∗ − yik )2 2 i=1 i. h00i (δik ) k (x − x∗i )2 , h0i (ηik )2 i. (2.22). donde δik −→ yi∗ ,. ζik −→ yi∗ ,. cuando k −→ ∞,. i = 1, 2, ..., n,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. ηik −→ yi∗ ,. CA S. (v k − v ∗ )(y k − y ∗ ) = (ξ k − ξ ∗ )(xk − x∗ ) +. ahora como. (yik − yi∗ )2 = d2i , k−→∞ t2k. a) lı́m. b) lı́m (ξik − ξi∗ ) = 0, k−→∞. c) lı́m h00i (ζik ) = h00i (yi∗ ), k−→∞. combinando a), b) y c) y por teorema (1.2),. lı́m (ξik − ξi∗ )h00i (ζik ). k−→∞. (yik − yi∗ )2 = 0. t2k. (2.23). Dividiendo por t2k a (2.22), se tiene. n. IO T. k 2 ∗ (v k − v ∗ )(y k − y ∗ ) (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = + (ξ − ξ )h (ζ ) i i i t2k t2k 2 i=1 i t2k. +. n X. h00i (δik ) (xki − x∗i )2 , t2k h0i (ηik )2. (2.24). BL. i=1. ξi∗. BI. aplicando lı́m inf a (2.24), cuando k −→ ∞ y aplicando el teorema (1.4), se obtiene lı́m inf k−→∞. (v k − v ∗ )(y k − y ∗ ) t2k n. ∗ k 2 (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = lı́m inf [ + (ξ − ξ )h (ζ ) i i i k−→∞ t2k 2 i=1 i t2k. +. n X i=1. ξi∗. h00i (δik ) (xki − x∗i )2 ] t2k h0i (ηik )2. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(38) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 25. n. ∗ k 2 (ξ k − ξ ∗ )(xk − x∗ ) 1X k ∗ 00 k (yi − yi ) ≥ lı́m inf + lı́m inf (ξ − ξ )h (ζ ) i i i i k−→∞ k−→∞ 2 t2k t2k i=1. + lı́m inf k−→∞. n X. ξi∗. i=1. h00i (δik ) (xki − x∗i )2 t2k h0i (ηik )2 n. lı́m ξi∗. h00i (δik ) (xki − x∗i )2 , t2k h0i (ηik )2. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. +. n X. CA S. k 2 ∗ (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = lı́m inf + lı́m (ξ − ξ )h (ζ ) i i i k−→∞ t2k 2 i=1 k−→∞ i t2k. i=1. k−→∞. por (2.23), y usando (2.14). n. lı́m inf k−→∞. (ξ k − ξ ∗ )(xk − x∗ ) X ∗ h00i (yi∗ ) 2 (v k − v ∗ )(y k − y ∗ ) ≥ lı́m inf + ξi 0 ∗ 2 ui k−→∞ t2k t2k hi (yi ) i=1 00. ∗. ∗. 00. ∗. ∗. g (y , v , d) ≥ f (x , ξ , u) +. n X i=1. ξi∗. h00i (yi∗ ) 2 u. h0i (yi∗ )2 i. Por propiedad se cumple que f 00 (x, v, λw) = λ2 f 00 (x, v, w) para cualquier λ > 0 y usando (2.9) y (2.10),se tiene. n σX ∗ 2 ξ u i=1 i i σ ≥ kuk2 f 00 (x∗ , ξ ∗ , u/kuk) + kuk2 . g 00 (y ∗ , v ∗ , d) ≥ f 00 (x∗ , ξ ∗ , u) +. IO T. ≥ kuk2 (−σ + σ) = 0.. BL. Entonces g 00 (y ∗ , v ∗ , d) ≥ 0.. BI. Aplicando el lema (1.1), se concluye que g es una función convexa.. . A continuación se definen dos clases de funciónes que satisfacen la condición (2.11). Corolario 2.3 Sea f una función definida en X. Suponer que f satisface las condiciones del teorema (2.2). Definir 1 1 hj (yj ) = ln 1 − , p yj. p > 0,. j = 1, 2, ..., n,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(39) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. entonces g(y) = f (h(y)) es una función convexa en Y =. h. 1 1 , pL (1−eplj ) (1−e j ). 26. i. si existe. una constante p1 ≥ 0 tal que p ≥ p1 .. Será suficiente probar que se cumple la condición (2.11). En efecto: ! 0 1 1 1− yj 1 − y1j ! 1 1 1 = yj −1 p yj2 yj 1 1 = p yj (yj − 1). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. 1 h0j (yj ) = p. CA S. Demostración. 1 −(yj (yj − 1))0 = p yj2 (yj − 1)2 1 −((yj − 1) + yj ) = p yj2 (yj − 1)2 1 1 − 2yj = , p yj2 (yj − 1)2 i h se tiene que yj < 0 para yj ∈ (1−e1plj ) , (1−e1pLj ) , entonces. BI. BL. IO T. h00j (yj ). h00j (yj ) [h0j (yj )]2. 1 p. . = 1 p. =. 1−2yj yj2 (yj −1)2. 1 yj (yj −1). . 2. p2 (1 − 2yj )(yj (yj − 1))2 pyj2 (yj − 1)2. = p(1 − 2yj ) > p.. Ahora para que la condición (2.11) se cumpla, se debe tener que p ≥ σ , pero p > 0. Sea n σo p1 = max 0, . Por lo tanto g es convexa cuando p ≥ p1 .. . Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(40) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 27. Corolario 2.4 Sea f una función definida en X. Suponer que f satisface las condiciones del teorema (2.2). Definir p > 0,. j = 1, 2, ..., n.. entonces g(y) = f (h(y)) es una función convexa en Y =. −p −p j=1 [Lj , lj ]. Qn. si existe un. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. p2 ≥ 0 tal que p ≥ p2 .. CA S. −1. hj (yj ) = yj p ,. Demostración. Será suficiente probar que se cumple la condición (2.11). En efecto:. 1 (− 1 −1) h0j (yj ) = − yj p p 1 1 (− 1 −2) 00 hj (yj ) = − − − 1 yj p p p 1 1 (− 1 −2) + 1 yj p , = p p −p ahora para todo yj ∈ L−p , se tiene j , lj −p L−p j ≤ yj ≤ lj 1. p −1 L−1 j ≤ yj ≤ lj ,. 1. yjp ≥ L−1 j =. IO T. luego. BI. BL. Entonces. 1 Lj. y sea L = máx1≤j≤n Lj .. h00j (yj ) (h0j (yj ))2. (− 1 −2) + 1 yj p 2 1 − −1 ( ) p − p1 yj. =. 1 p. 1 p. 1. = (1 + p)yjp 1 Lj 1 ≥ (1 + p) . L ≥ (1 + p). Ahora para q la condición (2.11) se cumpla,se debe tener que (1 + p) L1 ≥ σ , entonces p ≥ σ L − 1 pero p > 0.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(41) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 28. Sea o n σ p2 = max 0, L − 1 . Por lo tanto g es convexa cuando p ≥ p2 .. CA S. . A continuación se presenta un ejemplo.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Ejemplo 2.2 Considerar la función. x ∈ X = [2, 5],. f (x) = max{f1 (x), f2 (x)}. donde. f1 (x) = −(1/4)(x − 5)2 + 4,. f2 (x) = (x − 4)|x − 4| + 2x − 2.. Aplicando el corolario (2.3), hallar el valor de p para garantizar la convexidad de g(y) = f (h(h)). Solución. Se observa que f es una función no convexa y no diferenciable, además se verifica que f es una función semisuave y regular en x.. BL. IO T. Reescribiendo la función f , se tiene.    −(1/4)(x − 5)2 + 4,   f (x) = −(x − 4)2 + 2x − 2,     (x − 4)2 + 2x − 2,. x ∈ [2, 3i, x ∈ [3, 4],. x ∈ h4, 5].. BI. Ahora hallar la subdiferencial de f ∗ Para x ∈ [2, 3i, se tiene por teorema(1.9), que ∂f (x) = −(1/2)(x − 5), pues f es una función continuamente diferenciable en [2, 3i. ∗ Para x = 3 y por teorema (1.8) se tiene que ∂f (x) = ∂c f (x), entonces ∂f (3) = λf10 (3) + (1 − λ)f20 (3),. ∀ λ ∈ [0, 1]. = λ(1) + (1 − λ)(4) = 4 − 3λ. ∀ λ ∈ [0, 1],. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(42) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 29. por tanto ∂f (x) = [1, 4]. ∗ Para x ∈ h3, 4], se tiene por teorema(1.9), que ∂f (x) = −2(x − 5), pues f es una función continuamente diferenciable en h3, 4].. CA S. ∗ Para x ∈ h4, 5], se tiene por teorema(1.9), que ∂f (x) = 2(x − 3), pues f es una función continuamente diferenciable en h4, 5].. BL. IO T. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Notar que ξ ≥ 1 para cualquier ξ ∈ ∂f (x).. BI. Ası́ = 1. Para |u| = 1 y v ∈ ∂u f (x), se tiene    −1/2, x ∈ [2, 3i,   00 f (x, v, u) = −2, x ∈ h3, 4i,     2, x ∈ h4, 5].. Faltarı́a analizar para x = 3 y x = 4.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(43) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 30. Para x = 4, se tiene que v = 2, donde v ∈ ∂u f (4), luego f 00 (4, 2, −1) = −2,. CA S. f 00 (4, 2, 1) = 2. Para x = 3, |u| = 1 y v ∈ ∂u f (3), se tiene. donde. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. f 00 (3, v, u) = max{λ1 f100 (3) + λ2 f200 (3) : (λ1 , λ2 ) ∈ S(3, v)},. S(3, v)) = {(λ1 , λ2 ) : v = λ1 f10 (3) + λ2 f20 (3), λ1 , λ2 ≥ 0, λ1 + λ2 = 1}. Para. f10 (3) = 1,. se tiene. f20 (3) = 4,. f100 (3) = −1/2,. f200 (3) = −2,. f 00 (3, 1, −1) = −1/2,. f 00 (3, 4, 1) = −2,. entonces para v ∈ (1, 4) y |u| = 1,. IO T. f 00 (3, v, u) = −1/2.. BL. Por lo tanto, para cualquier x ∈ [2, 5], y v ∈ ∂u f (x),. BI. f 00 (x, v, u) ≥ −2 = ρ,. pero σ = −ρ = 2. Luego, por el corolario (2.3), n σo 2 p1 = max 0, = max 0, = 2. 1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(44) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 31. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. Por lo tanto, para cualquier p ≥ 2 garantiza la convexidad de g(y)=f(h(y)).. IO T. Los resultados dados en esta sección proporcionan una base teórica para extender el alcance de los métodos de convexificación para funciones monótonas no diferen-. BI. BL. ciables.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(45) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo III. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Optimización monótona y maximización convexa. En este capı́tulo se prueba que la solución tanto global como local del problema monótono (P ) se puede hallar del problema equivalente convexo.. Dada una función h : Rn −→ Rn . Se considera la siguiente trasformación del problema (P ). IO T. (T ).       . max g(y) = f (h(y)). s.t. gi (y) = fi (h(y)) ≤ bi , i = 1, 2, ..., m,       y ∈ Y,. BL. donde h : Y −→ X es una función biyectiva con X = h(Y ).. Se denota por S y S̃ a la región factible del problema (P ) y del problema (T ). BI. respectivamente, S = {x ∈ X : fi (x) ≤ bi , i = 1, 2, ..., m}, S̃ = {y ∈ Y : gi (y) ≤ bi , i = 1, 2, ..., m}.. El siguiente teorema establece la equivalencia entre en el problema monótono (P ) y el problema convexo (T ).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(46) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 33. Teorema 3.1 Sea h una función sobreyectiva. Sea y ∗ ∈ S̃ una solución óptima global del problema (T ) si y sólo si x∗ = h(y ∗ ) ∈ S es una solución óptima global del problema (P ).. CA S. Demostración Sea x ∈ S ⊂ X. Dado que h es una función sobreyectiva y X = h(Y ), entonces. Se tiene. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. existe y ∈ Y tal que x = h(y).. fi (x) ≤ bi ⇐⇒ fi (h(y)) ≤ bi ⇐⇒ gi (y) ≤ bi. ∀ i = 1, 2, ..., m ∀ x ∈ X. ∀ i = 1, 2, ..., m ∀ y ∈ Y. asi que x ∈ S si y sólo si y ∈ S̃, además, como el problema que se esta analizando es un problema de maximización y y ∗ ∈ S̃ es una solución óptima global, se tiene g(y) ≤ g(y ∗ ) ⇐⇒ f (h(y)) ≤ f (h(y ∗ )) ⇐⇒ f (x) ≤ f (x∗ ). ∀ y ∈ S̃. ∀ x ∈ S.. Por lo tanto y ∗ ∈ S̃ es una solución óptima global del problema (T ) si y sólo si . IO T. x∗ ∈ S es una solución óptima global del problema (P ).. Teorema 3.2 Sea h una función sobreyectiva.. Si h−1 existe y tanto h como h−1 son funciones continuas, entonces y ∗ ∈ S es una. BL. solución óptima local del problema (T ) si y sólo si x∗ = h(y ∗ ) es una solución óptima. BI. local de (P ). Demostración Sea y ∗ ∈ S̃ es una solución óptima local del problema (T ), entonces existe > 0 tal que ∀ y ∈ B(y ∗ , ) ⊂ Rn , se cumple g(y ∗ ) ≥ g(y). ∀ y ∈ B(y ∗ , ) ∩ S̃,. pues se esta analizando un problema de maximización. Como h−1 es una función continua en S̃, entonces en particular, para B(y ∗ , ),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(47) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3.1 Algoritmo de aproximación externa. 34. ∃ B(x∗ , δ), con δ > 0, tal que h−1 (B(x∗ , δ) ∩ S) ⊆ B(y ∗ , ). Además por la prueba del teorema (3.1), se tiene que S = h(S̃). Entonces f (x∗ ) = f (h(y ∗ )) = g(y ∗ ) ≥ g(y) = f (h(y)) = f (x). ∀ x ∈ B(x∗ , δ) ∩ S,. CA S. f (x∗ ) ≥ f (x). ∀ x ∈ B(x∗ , δ) ∩ S,. lo que implica que x∗ es una solución óptima local del problema (P ). Similarmente. 3.1.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. se prueba el regreso.. Algoritmo de. aproximación. . externa para. resolver problemas de maximización convexa. Los problemas de optimización global más estudiados son los problemas de optimización convexa. Pues se sabe que una función convexa definida sobre un poliedro acotado siempre tiene su máximo en uno de los vérices del poliedro.. IO T. En esta sección se propone el algoritmo de Aproximación externa para resolver problemas convexos, donde la función objetivo es sucesivamente maximizada en una. BL. secuencia de poliedros que encierran a la región factible. En cada iteración el poliedro envolvente actual se refina mediante la adición de un plano de corte tangencial. BI. (hiperplano) a la región factible en un punto de frontera.. El algoritmo genera una sucesión no creciente de lı́mites superiores para el valor óptimo del problema (T ) y termina cuando la solución factible recurrente está dentro de una tolerancia dada.. El algoritmo de aproximación extera para el problema (T ) se describe de la siguiente forma:. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(48) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3.1 Algoritmo de aproximación externa. 35. ALGORITMO: Considerar el problema:. s.t. gi (y) ≤ 0, i = 1, 2, ..., m,       y ∈ Y,. CA S. max g(y). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. (T ).       . donde g es una función convexa en Rn , gi (y) ≤ 0, i = 1, 2, ..., m, son funciones convexas y sea S̃ = {y : gi (y) ≤ 0, i = 1, 2, ..., m.} la región factible del problema (T ) no vacı́o y compacto. ENTRADA:. q ∈ int(S̃) y > 0.. SALIDA:. solución y k .. Paso 0:. Sea u0 = g(q) (el mejor lı́mite inferior hasta el momento).. Definir un poliedro S̃ 0 que contenga a S̃ cuyos vértices de S̃ 0 son conocidos. Sea V 0 el conjunto de vértices de S̃ 0 . k = 1. Paso 1:. IO T. Resolver el problema :. (T k ).   . max g(y).  s.t. y ∈ S̃ k ,. BL. es decir, elegir el máx{g(v) : v ∈ V k+1 }.. BI. Luego sea y k = v solución del problema (T k ). Sea λk solución del problema de optimización unidimensional.. (Qk ).   . mı́n λ.  s.t. 0 ≤ λ ≤ 1,. y k + λ(q − y k ) ∈ S̃. Si λk = 0, entonces y k ∈ S̃ y además es la solución del problema (T ). Si λk > 0, denotar z k = y k + λ(q − y k ). Si g(z k ) > uk−1 , poner uk = g(z k ).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.