Un método de convexi cación para resolver problemas de optimización monótona restringidos

Texto completo

(1)Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. Un método de convexificación para resolver problemas de optimización monótona restringidos. BI. BL. IO T. Tesis para optar el tı́tulo de Licenciado en Matemáticas. Autor: ANGULO VITERI JHON PAUL. Asesora: Dra. Jenny Rojas Jerónimo. Trujillo - Perú 2017. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. Un método de convexificación para resolver problemas de optimización monótona restringidos. BI. BL. IO T. Tesis para optar el tı́tulo de Licenciado en Matemáticas. Autor:. ANGULO VITERI JHON PAUL. Asesora: Dra. Jenny Rojas Jerónimo. Trujillo - Perú 2016. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(3) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Jurado. Dr. Nelson Aragonés Salazar. BI. BL. IO T. Dr. Julio Peralta Castañeda. Dra. Jenny Rojas Jerónimo Asesor. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(4) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Dedicatoria. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. BI. BL. IO T. Dedicado a mi familia por su constante apoyo durante mi formación profesional. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(5) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Agradecimiento. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. A todos los investigadores, estudiantes y personal del departamento de ma-. BI. BL. IO T. temáticas por su enseñanza académica. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(6) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Presentación. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Señores miembros del jurado:. Presento ante ustedes la tesis “Un método de convexificación para resolver problemas de optimización monótona restringidos”, con el propósito de obtener el tı́tulo profesional de Licenciado en Matemáticas. Esperando cumplir con los requerimientos de aprobación.. Agradezco anticipadamente sus opiniones y crı́ticas, pues me servirán como estı́mulo para continuar mejorando.. BI. BL. IO T. El Autor. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(7) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Lista de Sı́mbolos. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. H(y). : Matriz hessiana de g en y.. f ◦ (x; v). : Derivada direccional generalizada de f en x en la dirección v.. ∂c f (x). : Subgradiente de f en x para funciones convexas.. ∂f (x). : Subgradiente de f en x para funciones Lipschitz continua.. 00. f (x∗ , v ∗ , u) : Derivada direccional inferior de segundo orden de f . : Transpuesta del vector y.. xk −→ x∗. : Sucesión xk converge a x∗ .. BI. BL. IO T. yT. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(8) Jurado. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Índice general. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. III. Dedicatoria. IV. Agradecimiento. V. Presentación. VI. Lista de Sı́mbolos. VII. Resumen. IX. Abstract. X. IO T. INTRODUCCIÓN. XI. 1. BL. I. Preliminares. 1. 1.2. Monotonicidad y convexidad . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.3. Análisis no diferenciable . . . . . . . . . . . . . . . . . . . . . . . . .. 4. BI. 1.1. Tópicos de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . .. II. Convexificación de funciones monótonas 2.1. Convexificación de funciones dos veces continuamente diferenciable. 8 .. 9. 2.2. Convexificación de funciones monótonas no diferenciables . . . . . . . 19. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. ÍNDICE GENERAL. ix. III. Optimización monótona y maximización convexa. 32. 3.1. Algoritmo de aproximación externa . . . . . . . . . . . . . . . . . . . 34. 46. BI. BL. IO T. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. REFERENCIAS BIBLIOGRÁFICAS. 45. CA S. CONCLUSIONES. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(10) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Resumen. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. En este trabajo se presenta un método de convexificación para trasformar un problema de optimización monótona en un problema de maximización convexa tanto para funciones dos veces continuamente diferenciables y no diferenciables. Luego se hace uso del método de aproximación externa para problemas convexos, por lo tanto la solución del problema original se obtendrá del problema convexo.. Palabras claves: Optimización global, convexificación, minimización, monoto-. BI. BL. IO T. nicidad, programación convexa.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(11) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Abstract. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. In this work presents a method of convexification to transform a monotone optimization problem in a convex maximization problem for both functions twice continuously differentiable and non-differentiable.Then use the outer approximation method to convex problems, therefore the solution of the original problem is obtained from the equivalent convex problem.. Key words: Global Optimization, convexification, minimization, monotonicity,. BI. BL. IO T. convex programming.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(12) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. INTRODUCCIÓN. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. En toda actividad que el hombre realiza está presente la toma de decisiones. Las decisiones que deben tomarse generalmente se deben elegir de entre muchas alternativas pero en un contexto limitado. Evidentemente la alternativa a elegir debe ser la mejor.. En situaciones cotidianas y simples esta elección se realiza utilizando el sentido común, sin embargo cuando se trata de situaciones generales y complejas es necesario el uso de métodos que nos proporciona la ciencia. La parte de la ciencia que desarrolla propiedades y métodos para resolver este tipo de situaciones problemáticas se denomina teorı́a de optimización.. Una parte de la teorı́a de optimización es la programación lineal donde la función objetivo y las restricciones son funciones lineales [1], y cuando las variables son con-. IO T. tinuas, el problema de programación lineal es diferenciable y convexo, condiciones que proporcionan propiedades de optimalidad y el desarrollo de métodos óptimos. BL. en esta área. Aunque una amplia variedad de aplicaciones pueden resolverse usan-. BI. do programación lineal, con frecuencia se presentan problemas de tipo no lineal, es decir, cuando la función objetivo o alguna restricción son no lineales y para resolver estos problemas nuevamente la convexidad y diferenciabilidad juegan un rol muy importante desarrollándose el análisis convexo en optimización. Sin embargo cuando las funciones de un problema de programación no lineal son no diferenciables, surge la necesidad de desarrollar propiedades que permita elaborar métodos de solución para este tipo de problemas, agregando un nuevo capı́tulo en la teorı́a de optimización. A principios de 1970, Clarke, acuñó el término optimización no suave [3] para. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Introducción. xiii. categorizar la teorı́a que implica problemas de optimización no diferenciable, donde el método del subgradiente [2] es el más usado y conocido para resolver este tipo de problemas.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. Sin embargo al presentarse problemas de optimización de la forma:     max f (x)    (P ) s.t. fi ≤ bi , i = 1, 2, ..., m,       x ∈ X = { x : 0 ≤ lj ≤ xj ≤ Lj , j = 1, 2, ..., n},. donde las funciones f y fi , i = 1, 2, ..., m, son funciones continuas con propiedades monótonas (funciones crecientes o decrecientes) en [l, L] con l = (l1 , l2 , ..., ln )T y L = (L1 , L2 , ..., Ln )T hacia R, y debido a la monotonicidad de las funciones f y fi , la solución del problema (P ) presenta nuevas dificultades, dandose el desarrollo de la optimización monótona. La solusión del problema (P ), siempre se encuentra en la frontera de la región factible, sin embargo, puede tener múltiples soluciones locales ya que las funciones no necesariamente son convexas, por lo que se propone un método de convexificación, que consiste en convertir el problema de optimización monótona en un problema equivalente de maximización convexa, pues el área de optimización convexa cuenta con propiedades que garantizan la existencia y unicidad. IO T. de la solución. En este trabajo se demuestra que una función dos veces continuamente diferenciable se puede convexificar [7], y estos resultados se generalizan para. BL. funciones no suaves [8]. Por lo tanto la solución del problema original (P ) se puede obtener del problema equivalente convexo.. BI. En el capı́tulo 1, se presentan algunas definiciones, teoremas, corolarios y lemas que servirá para el desarrollo de este trabajo. En el capt́ulo 2, se discute la convexificación de funciones monótonas dos veces continuamente diferenciables y no diferenciables. En el capı́tulo 3, se demuestra que la solución del problema (P ) se obtiene del problema convexificado, además se propone el algoritmo de aproximación externa para resolver problemas de optimización convexa, finalmente se presenta un ejemplo en el que se hace uso la convexificación y luego el algoritmo de aproximación externa para solucionarlo.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(14) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo I Preliminares. En este capı́tulo se presentan definiciones, teoremas, corlarios y lemas que seran utilizados en el desarrolo de la tesis. En la primera sección se definen algunos conceptos sobre funciones continuas, en la segunda sección se enuncian definiciones y teoremas sobre convexidad y monotonicidad y en la tercera sección se presentan conceptos sobre análisis no suave.. 1.1.. Tópicos de funciones. IO T. Definición 1.1 Una sucesión (xn )n∈N. se llama acotada si existe un número. M ≥ 0, tal que para cada n ∈ N, se cumple la desigualdad. BI. BL. | xn |≤ M.. En otras palabras, una sucesión se llama acotada si el conjunto de sus valores son acotados. Teorema 1.1 Toda sucesión convergente es acotada. Teorema 1.2 Si lı́m xn = 0 e (yn ) es una sucesión acotada (convergente o no) n−→0. entonces lı́m xn yn = 0.. n−→0. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2 Monotonicidad y convexidad. 2. Teorema 1.3 Sea f : (a, b) ⊂ Rn → R una función continua, x0 ∈ (a, b) y {xn } ⊂ (a, b) tal que xn converge a xo . Entonces lı́m f (xn ) = f ( lı́m xn ) = f (xo ). n−→∞. CA S. n−→∞. Teorema 1.4 si (xn )n∈N y (yn )n∈N son sucesiones acotadas, entonces lı́m inf (xn + yn ) ≥ lı́m inf xn + lı́m inf yn n−→∞. n−→∞. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. n−→∞. Corolario 1.1 Sea f : [a, b] ⊂ R −→ R continua. Si f es derivable en (a, b), entonces existe θ ∈ (a, b) tal que. 0. f (b) − f (a) = f (θ)(b − a).. 1.2.. Monotonicidad y convexidad. Definición 1.2 Una función f : Rn → R es creciente (decreciente) en D ⊂ Rn con respecto a xi si. f (x1 , x2 , ..., xi−1 , x1i , xi+1 , ..., xn ) ≤ (≥)f (x1 , x2 , ..., xi−1 , x2i , xi+1 , ..., xn ) para x1i ≤ x2i ,, donde x1i , x2i ∈ Di = {xi :. (x1 , x2 , ..., xi−1 , xi , xi+1 , ..., xn ) ∈ D}.. IO T. Una función f : Rn → R es estrictamente creciente (estrictamente decreciente) en D ⊂ Rn con respecto a xi si. BL. f (x1 , x2 , ..., xi−1 , x1i , xi+1 , ..., xn ) < (>)f (x1 , x2 , ..., xi−1 , x2i , xi+1 , ..., xn ). BI. para x1i < x2i , donde x1i , x2i ∈ Di = {xi :. (x1 , x2 , ..., xi−1 , xi , xi+1 , ..., xn ) ∈ D}. Definición 1.3 Una función f : D ⊂ Rn → R es creciente (decreciente) si para. cualquier x, y ∈ D con xi < yi para i = 1, 2, ..., n, se cumple f (x) ≤ (≥)f (y). Una función f (x) es estrictamente creciente (estrictamente decreciente)si para cualquier x, y ∈ D con xi < yi para i = 1, 2, ..., n y x 6= y se cumple f (x) < (>)f (y). Definición 1.4 f : D ⊂ Rn → R es una función monótona en D ⊂ Rn si y sólo si f es creciente o decreciente.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2 Monotonicidad y convexidad. 3. Definición 1.5 Sea C ⊆ Rn , es un conjunto convexo si y sólo si para cualquier x1 , x2 ∈ C y λ ∈ [0, 1], se cumple. Es decir, el segmento de recta que une x1 y x2 está en C.. CA S. (1 − λ)x1 + λx2 ∈ C.. convexo.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Ejemplo 1.1 Probar que C = {x ∈ Rn : Ax = b, An×n , bn×1 } es un conjunto. En efecto: Sea y1 , y2 ∈ C y λ ∈ [0, 1], entonces Ay1 = b. Ay2 = b,. y. (1 − λ)Ay1 = (1 − λ)b. (1.1). λAy2 = λb.. (1.2). Sumando (1,1) y (1,2). IO T. (1 − λ)Ay1 + λAy2 = (1 − λ)b + λb A[(1 − λ)y1 + λy2 ] = b.. BL. Como (1 − λ)y1 + λy2 ∈ C, entonces C es un conjunto convexo.. BI. Definición 1.6 Sea f : C → R, donde C es un conjunto convexo no vacı́o en. Rn . f es una función convexa en C si y sólo si. f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ),. ∀x1 , x2 ∈ C. y. λ ∈ [0, 1].. ∀x1 , x2 ∈ C. y. λ ∈ [0, 1].. La función f es llamada estrictamente convexa si f (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 4. Ejemplo 1.2 Sea f : S ⊂ R → R, tal que f (x) = x2 , probar que es una función convexa.. CA S. En efecto: Será equivalente probar que. 0 ≤ λf (x1 ) + (1 − λ)f (x2 ) − f (λx1 + (1 − λ)x2 ),. ∀λ ∈ (0, 1), ∀x1 , x2 ∈ S,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. sustituyendo y operando. λf (x1 ) + (1 − λ)f (x2 ) − f (λx1 + (1 − λ)x2 ) = λx21 + (1 − λ)x22 − (λx1 + (1 − λ)x2 )2. = λx21 + (1 − λ)x22 − λ2 x21 − 2λ(1 − λ)x1 x2 − (1 − λ)2 x22 = x21 (λ − λ2 ) + x2 ((1 − λ) − (1 − λ)2 ) − 2λ(1 − λ)x1 x2 = λ(1 − λ)x21 + (1 − λ)λx22 − 2λ(1 − λ)x1 x2 = λ(1 − λ)(x21 + x22 − 2x1 x2 ) = λ(1 − λ)(x1 − x2 )2 ≥ 0.. Por lo tanto f es una función convexa.. IO T. Teorema 1.5 Sea S un conjunto convexo no vacı́o en Rn , y sea f : S → R una función dos veces diferenciable en S. Entonces f es convexa si y sólo si la matriz. BL. hessiana es semidefinida positiva para cada punto en S.. BI. 1.3.. Análisis no diferenciable. Definición 1.7 Sea Y un subconjunto de Rn . Una función f : Y → R satisface la condición de Lipschitz si existe una constante k no negativa tal que |f (x) − f (y)| ≤ k k x − y k. ∀x, y ∈ Y.. Definición 1.8 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn y d un vector en Rn . La derivada direccional generalizada de f en x en la dirección d,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 5. se define f ◦ (x; d) = lı́m sup y −→x t↓0. f (y + td) − f (y) t. CA S. donde y es un vector en Rn y t es un escalar positivo. A f ◦ (x; d) también se conoce como derivada generalizada de Clarke.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Definición 1.9 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn . La subdiferencial o gradiente de Clarke de f en x es el conjunto ∂f (x) de vectores ξ ∈ Rn tal que. ∂f (x) = {ξ ∈ Rn : f ◦ (x; d) ≥ ξ T d, ∀d ∈ Rn }.. Teorema 1.6 Sea f : Rn → R una función Lipschitz continua en x ∈ Rn . Entonces. f ◦ (x; d) = máx{ξ T d : ξ ∈ ∂f (x)}. ∀ d ∈ Rn .. Definición 1.10 La subdiferencial de una función convexa f : Rn → R en x ∈ Rn es el conjunto ∂c f (x) de vectores ξ ∈ Rn tal que. ∂c f (x) = {ξ ∈ Rn : f (y) ≥ f (x) + ξ T (y − x), ∀ y ∈ Rn }.. IO T. Cada vector ξ ∈ ∂c f (x) es llamado subgradiente de f en x.. Teorema 1.7 Sea f : Rn → R una función convexa. Entonces la derivada direc-. BI. BL. cional clásica, f 0 (x, d), existe en toda dirección d ∈ Rn y ∀ x ∈ Rn f 0 (x, d) = max{ξ T d : ξ ∈ ∂c f (x)}, ∀ d ∈ Rn. y. ∂c f (x) = {ξ ∈ Rn : f 0 (x, d) ≥ ξ T d, ∀ d ∈ Rn }.. Teorema 1.8 La subdiferencial para funciones Lipschitz continua es una generalización de la subdiferencial para funciones convexas. Entonces, si f : Rn → R 0. es una función convexa, se cumple que f (x, d) = f ◦ (x; d) para todo d ∈ Rn , y ∂c f (x) = ∂f (x).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. 6. Teorema 1.9 La subdiferencial para funciones Lipschitz continua es una generalización de la derivada clásica. Entonces, si f : Rn → R es una función Lipschitz continua y diferenciable en x ∈ Rn , se cumple que ∇f (x) ∈ ∂f (x).. CA S. Además, si f : Rn → R es continuamente diferenciable en x ∈ Rn , entonce ∂f (x) = {∇f (x)}.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Definición 1.11 Una función f es regular en x∗ si la derivada direccional f 0 (x∗ ; d) existe para todo d ∈ Rn y f 0 (x∗ ; d) = f ◦ (x∗ ; d) para todo d ∈ Rn , donde f ◦ (x∗ ; d) es la derivada direccional de Clarke.. Teorema 1.10 Sea la función g : Y ⊂ Rn −→ R, definida como g = f (h), donde h : Y −→ Rn y f : Rn −→ R. Si f es una función regular en x = h(y), y ∈ Y , y h una función continuamente diferenciable, entonces g es una función regular. Definición 1.12 Suponer que {xk } ⊂ Rn converge a x∗ ∈ Rn con xk 6= x∗ para cada k.. La sucesión {xk } es convergente a x∗ en la dirección u si existe {tk } satisfaciendo: tk > 0 y tk −→ 0 para k −→ ∞, tal que { x. k −x∗. tk. } −→ u.. k. ∗. −x Se observa que {xk } converge a x∗ en la dirección u si y sólo si { kxxk −x ∗ k } −→. u . kuk. IO T. Definición 1.13 Sea u ∈ Rn . Entonces se define ∂u f (x∗ ) como el conjunto de. vectores v tal que, para cada uno de ellos, existen sucesiones {xk } y {v k } con {xk }. BL. que converge a x∗ en la dirección u, {v k } que converge a v y v k pertenece a ∂f (xk ). BI. para cada k.. Luego, ∂u f (x∗ ) ⊆ ∂f (x∗ ). Definición 1.14 Sea v ∗ ∈ ∂u f (x∗ ). La derivada direccional inferior de segundo orden de f en x∗ y v ∗ en la dirección u, f 00 (x∗ , v ∗ , u) se define como lı́mı́nf(v k − v ∗ )T (xk − x∗ )/t2k , tomado sobre las suceciones {xk }, {v k }, {tk } para los cuales (i) tk > 0 para cada k y {xk } converge a x∗ .. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3 Análisis no diferenciable. k −x∗ ). (ii) { (x. tk. 7. } converge a u.. (iii) {v k } converge a v ∗ con v k ∈ ∂f (xk ) para cada k. Definición 1.15 Una función f es semisuave en x∗ si la sucesión {(v k )T u} con-. CA S. verge siempre que {xk } converge a x∗ en la dirección u y v k ∈ ∂f (xk ) para cada k.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Teorema 1.11 Sea la función g : Y ⊂ Rn −→ R, definida como g = f (h), donde h : Y −→ Rn y f : Rn −→ R. Si f es una función semisuave en x = h(y), y ∈ Y , y h una función continuamente diferenciable, entonces g es una función semisuave. Lema 1.1 Suponer que f es semisuave y regular en un conjunto abierto convexo W . Suponer tambien que f 00 (x∗ , v ∗ , u) ≥ 0 para cada tripleta (x∗ , v ∗ , u) con x∗ ∈ W ,. BI. BL. IO T. u ∈ Rn , y v ∗ ∈ ∂u f (x∗ ). Entonces, f es convexa en W .. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(21) CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo II. Convexificación de funciones monótonas. En este capı́tulo se presenta la teorı́a que nos garantizará la convexificación de una función monótona. En la primera sección se desarrolla un teorema y dos corolarios para funciones dos veces continuamente diferenciable, estos resultados se generalizan para funciones no diferenciables en la segunda sección. Sea f una función definida en:. IO T. n Y X= [lj , Lj ] = [l1 , L1 ] × [l2 , L2 ] × ... × [ln , Ln ]. (2.1). j=1. con 0 < lj ≤ Lj para cada j hacia R. La función f es llamada función estrictamente. BL. monótona si es una función estrictamente monótona para cada xj .. BI. Sea h : (y1 , y2 , ..., yn ) 7−→ (h1 (y1 ), h2 (y2 ), ..., hn (yn )) una función biyectiva y sea la siguiente transformación de variable de la función f , g(y) = f (h(y)),. (2.2). donde el dominio de g es Y =. n Y j=1. Yj =. n Y. h−1 ([lj , Lj ]).. (2.3). j=1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 9. 2.1.. Convexificación de funciones monótonas dos veces continuamente diferenciables. y S n = {d ∈ Rn : kdk = 1}, se define. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. σ = min{dT ∇2 f (x)d : x ∈ X, d ∈ S n }   ∂f η = min : x ∈ X, j = 1, 2, ..., n . ∂xj. CA S. Sea f una función dos veces continuamente diferenciable estrictamente monótona. Teorema 2.1 Sea f una función dos veces continuamente diferenciable y estrictamente creciente en X con η > 0 y hj , j = 1, 2, ..., n funciones dos veces continuamente diferenciable y estrictamente monótona que satisfacen la siguiente condición 00. hj (yj ) σ ≥ − , [hj 0 (yj )]2 η. ∀ yj ∈ Yj ,. j = 1, 2, ..., n,. (2.4). entonces g(y) = f (h(y)) es una función convexa en Y . Demostración. IO T. Debido a que f y h son funciones dos veces continuamente diferenciable, entonces g es una función dos veces continuamente diferenciable, por lo que será suficiente. BL. probar que la matriz hessiana de g es semidefinida positiva en Y .. BI. Para cualquier y ∈ Y , sea x = h(y), entonces x ∈ X, luego:. ∂g ∂f = h0j (yj ) , j = 1, 2, ..., n. ∂yj ∂xj 2 ∂ 2g ∂f 00 0 2∂ f = h (y ) + (h (y )) , i = 1, 2, ..., n. i i i i ∂yi2 ∂xi ∂x2i ∂ 2g ∂ 2f = h0i (yi )h0j (yj ) , i 6= j, j, i = 1, 2, ..., n. ∂yi ∂yj ∂xi ∂xj. (2.5) (2.6). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 10. Luego la matriz hessiana, H(y), de g es ∂2g (y) ∂y  1 ∂y1. Sea. ∂2g (y) ∂y1 ∂y3. ···. ∂2g (y) ∂y2 ∂y2. ∂2g (y) ∂y2 ∂y3. ···. ∂2g (y) ∂y3 ∂y2. ∂2g (y) ∂y3 ∂y3. ··· .... .. .. ∂2g (y) ∂yn ∂y2. .. .. ∂2g (y) ∂yn ∂y3. ···. . ∂2g (y) ∂y1 ∂yn .  ∂2g (y)  ∂y2 ∂yn   ∂2g (y)  ∂y3 ∂yn  .. ..    ∂2g (y) ∂yn ∂yn. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI.  ∂2g  ∂y2 ∂y1 (y)   2g 2 H(y) = ∇ g(y) =  ∂y∂ ∂y (y)  3 1  ..  .  2 ∂ g (y) ∂yn ∂y1. ∂2g (y) ∂y1 ∂y2. CA S. . h0i = h0i (yi ),. h00i = h00i (yi ), ∂f ∂xi. =. ∂f (x), ∂xi. ∂2f ∂x2i. =. ∂2f (x), ∂x2i. ∂2f ∂xi ∂xj. =. ∂2f (x), ∂xi ∂xj. ∀ i, j = 1, 2, ..., n.. BI. BL. IO T. Reemplazando (2.5) y (2.6) en H(y)   00 ∂f 0 2 ∂2f 0 0 ∂2f 0 0 ∂2f h + (h1 ) ∂x2 h1 h2 ∂x1 ∂x2 ··· h1 hn ∂x1 ∂xn 1  1 ∂x1  2 2   f 00 ∂f 0 2∂ f 0 0 ∂2f  h02 h01 ∂x∂2 ∂x  h + (h ) · · · h h 2 2 2 2 n ∂x ∂x ∂x ∂x n 1 2 2   2   .. .. .. ..   . . . .   0 0 ∂2f 0 2 ∂2f 0 0 ∂2f 00 ∂f hn h1 ∂xn ∂x1 hn h2 ∂xn ∂x2 · · · hn ∂xn + (hn ) ∂x2 n i h   00 2f 2f 2f h ∂f ∂ ∂ 0 h h01 (h01)2 ∂x1 + ∂x2 h01 h01 ∂x1 ∂x2 h02 ··· h01 ∂x∂1 ∂x n n 1 1   h 00 i   h2 ∂f ∂2f 0 ∂2f 0 0 0 0 ∂2f   h2 ∂x2 ∂x1 h1 h2 ∂x2 ∂xn h0n h2 (h0 )2 ∂x2 + ∂x2 h2 · · · 2 2   =  .. .. .. . .   . . . .  i  h 00 2 2 2 f f ∂f ∂ f h0n ∂x∂n ∂x · · · h0n (hh0n)2 ∂x h0 h0 + ∂x h0n h0n ∂x∂n ∂x 2 n 1 1 2 2 n n     00  h1 ∂f ∂2f ∂2f ∂2f 0 + · · · h01 0 · · · 0 h 0 · · · 0 ∂x1 ∂x2 ∂x1 ∂xn   1   (h01 )2 ∂x1 ∂x21  00 2f 2f 2f      h ∂ ∂f ∂ ∂ 0 0 2   0 h2 · · · 0   0 h2 · · · 0   + ∂x2 · · · ∂x2 ∂x1 (h02 )2 ∂x2 ∂x2 ∂xn       2 =.   .. .. . . .. . . ..   ..  .. .. .. . . . . .  . .  . . . . . . . .     h00 ∂2f ∂f ∂2f ∂2f 0 0 n 0 0 · · · hn 0 0 · · · hn · · · (h0 )2 ∂xn + ∂x2 ∂xn ∂x1 ∂xn ∂x2 n. n. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 11. Sea . 0. ···. h02.   ··· 0   . .. . ..   0 · · · hn. .. . 0. h1 ∂f  (h01 )2 ∂x1. +. 0. ∂2f ∂x21. ∂2f ∂x1 ∂x2 h00 ∂f 2 (h02 )2 ∂x2. ∂2f ∂x22. ∂2f ∂x1 ∂xn. . ∂2f ∂x2 ∂xn.       . EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. ∂2f ∂x2 ∂x1. ···. CA S.  h0  1  0 A(y) =   .. .  0  00   C(x) =    . . .. .. ∂2f ∂xn ∂x1. ∂2f ∂xn ∂x2. ∂2f ∂x1 ∂x2. ∂2f ∂x21.   ∂ 2 f  ∂x2 ∂x1  =  ..  . . .. .. ∂2f ∂xn ∂x2. ···  . ∂2f. ··· .... ∂x22. ··· .. .. ∂2f ∂x1 ∂xn . ···. ∂2f. ∂2f ∂xn ∂x1. +. .. .. .. .. h00 ∂f n (h0n )2 ∂xn. h00 ∂f 1 (h  01 )2 ∂x1.     ∂x2 ∂xn   ..  +  .     ∂2f ∂x2n. ···. 0 .. .. +. ∂2f ∂x2n. 0. h00 2 (h02 )2. 0. .. .. 0. ∂f ∂x2. ···. 0. ··· .. .. 0 .. .. ···. h00 ∂f n (h0n )2 ∂xn.        . = (∇2 f (x) + B(x)), donde. . ∂2f ∂x21. IO T.   ∂2f  ∂x2 ∂x1 2 ∇ f (x) =   ..  . . ∂2f ∂xn ∂x1. BI. BL. . h00 ∂f 1 (h  01 )2 ∂x1.   B(x) =    . 0 .. .. 0. ∂2f ∂x1 ∂x2. ···. ∂2f ∂x22. ··· .. .. ∂2f ∂xn ∂x2. ···. .. .. 0. h00 ∂f 2 (h02 )2 ∂x2. . ∂2f ∂x1 ∂xn  ∂2f   ∂x2 ∂xn . .. .. ∂2f ∂x2n. ···. ,   0. .. .. ··· .. .. 0 .. .. 0. ···. h00 ∂f n (h0n )2 ∂xn.        . En consecuencia H(y) = A(y)(∇2 f (x) + B(x))A(y). Ahora para todo d ∈ S n dT H(y)d = dT A(y)C(x)A(x)d. Es claro que A(y)C(x)A(y) es una matriz semidefinida positiva si y sólo si C(x) es una matriz semidefinida positiva.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 12. Por la definición de σ y η, se tiene. dT ∇2 f (x)d ≥ σ. ∀ xj ∈ [lj , Lj ],. y para cualquier d ∈ S n ,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. dT C(x)d = dT (∇2 f (x) + B(x))d. CA S. ∂f ≥η>0 ∂xj. ∀ d ∈ S n,. = dT ∇2 f (x)d + dT B(x)d. n X ∂f (x) h00j (yj ) 2 ≥σ+ d ∂xj [h0j (yj )]2 j j=1  X   n σ d2j ≥σ+ η − η j=1. =σ−σ kdk. =σ−σ. = 0,. es decir, dT C(x)d ≥ 0. Luego C(x) es una matriz semidefinida positiva. Entonces H(y) = ∇2 g(y) es una matriz semidefinida positiva.. . IO T. Por lo tanto g es una función convexa.. Similarmente, una función estrictamente decreciente se puede convertir a una. BI. BL. función convexa a través de trasformaciones de variables satisfaciendo 00. hj (yj ) σ ≤ − , [hj 0 (yj )]2 η. ∀ y j ∈ Yj ,. j = 1, 2, ..., n.. Hay funciones especificas que satisfacen la condición (2.4), en particular, considerar las siguientes dos funciones   1 1 hj (yj ) = ln 1 − , p yj −1. hj (yj ) = yj p ,. p > 0,. j = 1, 2, ..., n.. (2.7). p > 0,. j = 1, 2, ..., n.. (2.8). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 13. Corolario 2.1 Sea f una función que satisface las condiciones del teorema anterior, con   1 1 hj (yj ) = ln 1 − , p yj. p > 0,. j = 1, 2, ..., n,. CA S. entonces existe una constante p1 ≥ 0 tal que g(y) = f (h(y)) es una función convexa i h en Y = (1−e1plj ) , (1−e1pLj ) cuando p ≥ p1 .. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Demostración. Será suficiente probar que se cumple (2.4), notar que ! 0 1 1 1 0 hj (yj ) = 1− p 1 − y1j yj !  1 1 1 = yj −1 p yj2 yj   1 1 = p yj (yj − 1)   1 −(yj (yj − 1))0 = p yj2 (yj − 1)2   1 −((yj − 1) + yj ) = p yj2 (yj − 1)2   1 1 − 2yj = p yj2 (yj − 1)2 i h Ya que yj < 0 para yj ∈ (1−e1plj ) , (1−e1pLj ) , se tiene   1−2yj 1 00 2 2 hj (yj ) p y (yj −1) =  j 2 0 2 [hj (yj )] 1 1. BI. BL. IO T. h00j (yj ). p. yj (yj −1). 2. =. p (1 − 2yj )(yj (yj − 1))2 pyj2 (yj − 1)2. = p(1 − 2yj ) > p. o n Para que la condición (2.4) se cumpla, se debe satisfacer que p ≥ p1 = max 0, − ση . Por lo tanto g es una función convexa en Y cunando p ≥ p1 .. . Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 14. De forma similar se enuncia el siguiente corolario usando la función (2. 6). Corolario 2.2 Sea f una función que satisface las condiciones del teorema anterior, con p > 0,. j = 1, 2, ..., n.. CA S. −1. hj (yj ) = yj p ,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. entonces existe un p2 ≥ 0 tal que g(y) = f (h(y)) es una función convexa en Y = Qn −p −p j=1 [Lj , lj ] cuando p ≥ p2 . Demostración. Será suficiente probar que se cumple (2.4), notar que. 1 (− 1 −1) h0j (yj ) = − yj p p    1 1 (− 1 −2) 00 hj (yj ) = − − − 1 yj p p p    1 1 (− 1 −2) + 1 yj p . = p p   −p Ahora para todo yj ∈ L−p , se tiene j , lj h00j (yj ) (h0j (yj ))2.  (− 1 −2) + 1 yj p  2 1 − −1 ( ) p − p1 yj.  . =. 1 p. 1 p. IO T. 1. = (1 + p)yjp. BL. ≥ (1 + p). 1 Lj. BI. pues,. −p L−p j ≤ yj ≤ lj 1. p −1 L−1 j ≤ yj ≤ lj 1. entonces,. yjp ≥ L−1 j =. 1 . Lj. Sea L = max1≤j≤n Lj ,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.1 Convexificación de funciones dos veces continuamente diferenciable 15. luego σ 1 ≥− Lj η σ (1 + p) ≥ − L η σ p ≥ − L − 1. η. CA S. (1 + p). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. n o σ Por lo tanto la condición (2.4) se cumple cuando p ≥ p2 = max 0, − η L − 1 .. . Para ilustrar la convexificación de una función estrictamente monótona se considera el siguiente ejemplo.. Ejemplo 2.1 Sea la función. 1 f (x) = (x − 2)3 + x, 3. x ∈ X = [1, 3].. Usando los corolarios (2.1) y (2.2), hallar los valores de p para garantizar la convexificación de f. En efecto. f 0 (x) = (x − 2)2 + 1. f 00 (x) = 2(x − 2),. BL. IO T. La función f es no convexa, pues. al evaluar para x = 1, se tiene que f 00 (x) = −2. Entonces f (x) es una función no. BI. convexa.. Notar que f 0 (x) = (x − 2)2 + 1 ≥ 1,. ∀x ∈ [1, 3]. f 00 (x) = 2(x − 2) ≥ −2,. ∀x ∈ [1, 3]. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 16. Usando la función definida en (2.7) y el corolario (2.1),. BL. IO T. hallar.   σ p1 = max 0, − η   −2 p1 = max 0, − = 2, 1. BI. entonces para cualquier p ≥ p1 = 2 garantiza la convexidad de g.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 17. Usando la función definida en (2.8) y el corolario (2.2),.   σ p2 = max 0, − L − 1 η   (−2) p2 = max 0, − 3 − 1 = 5, 1. BL. IO T. hallar. BI. entonces para cuaquier p ≥ p2 = 5 se garantiza la convexidad de g.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. 2.1 Convexificación de funciones dos veces continuamente diferenciable 18. Por lo tanto en esta sección se probó que se puede convexificar una función dos veces continuamente diferenciable estrictamente creciente, en la siguiente sección se ampliará los resultados de convexificación para funciones no suaves. Especificamente. IO T. se probará que funciones estrictamente monótonas semisuaves y regulares pueden. BI. BL. ser convertidas en funciones convexas.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 2.2.. 19. Convexificación de funciones monótonas no diferenciables. (2.2).. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Sea W un conjunto abierto convexo tal que Y ⊆ W .. CA S. Se considera a X y Y definidos como en (2.1) y (2.3) respectivamente y g como. Teorema 2.2 Asumir que. i) f es una función semisuave y regular en un conjunto abierto convexo que contiene a X.. ii) f es una función estrictamente creciente en X y. ı́nf mı́n = {ξi : ξ = (ξ1 , ξ2 , ..., ξn )T ∈ ∂f (x), x ∈ X} ≥  > 0 i=1,...,n. ρ = ı́nf{f 00 (x, v, w) : x ∈ X, k w k= 1, v ∈ ∂w f (x)} > −∞ iii) hi ∈ C 2 (W ),. (2.9) (2.10). i = 1, 2, ..., n son funciones estrictamente monótonas convexas. que satisfacen. σ h00i (yi ) ≥ , 0 2 [hi (yi )] . y ∈ W,. i = 1, 2, ..., n,. (2.11). donde σ = −ρ.. IO T. Entonces g es una función convexa en cualquier subconjunto convexo de Y.. BL. Demostración. •) Asumir que ρ ≥ 0.. BI. Tenemos por i) que f es una función semisuave y regular en un conjunto abierto convexo contenido en X. Por la condición ii) ρ = ı́nf{f 00 (x, v, w) : x ∈ X, k w k= 1, v ∈ ∂w f (x)}} ≤ f 00 (x, v, w), entonces f 00 (x, v, w) ≥ ρ ≥ 0, consecuentemente f 00 (x, v, w) ≥ 0. Ahora por lema (1.1) concluimos que f es una función convexa.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 20. •) Sin pérdida de generalidad, asumir que σ = −ρ > 0, es decir, ρ < 0. Para y ∈ Y , sea x = h(y), entonces x ∈ X. Como f es una función semisuave en x = h(y) y h es una función continuamente. CA S. diferenciable, por teorema (1.11) se tiene que g(y) = f (h(y)) es semisuave en Y . También como f es una función regular en x = h(y) y h una función continuamente. Y.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. diferenciable, entonces por teorema (1.10) se tiene que g(y) = f (h(y)) es regular en. Luego g es una función semisuave y regular, por lo que será suficiente probar que g 00 (y ∗ , v ∗ , d) ≥ 0 para cualquier y ∗ ∈ Y , d ∈ Rn y v ∗ ∈ ∂d g(y ∗ ). En efecto:. dado cualquier y ∗ ∈ Y , d ∈ Rn , d 6= 0 y v ∗ ∈ ∂d g(y ∗ ), suponer que {y k }, {v k } y {tk } son sucesiones tales que 1. tk > 0, ∀k.. 2. {y k } converge a y ∗ . 3. { y. k −y ∗. tk. } converge a d.. 4. {v k } converge a v ∗ , con v k ∈ ∂g(y k ), para cada k.. IO T. Sea x∗ = h(y ∗ ) ∈ X y xk = h(y k ) para cada k, entonces {xk } −→ x∗ , cuando. BL. k −→ ∞, pues h es continua. Si hi ∈ C 2 (W ), existe θ1k , θ2k , ..., θnk ∈ (0, 1) tal que hi (yik ) − hi (yi∗ ) = h0i (yi∗ + θik (yik − yi∗ ))(yik − yi∗ ).. (2.12). BI. Consecuentemente xk − x∗ = h(y k ) − h(y ∗ ) = ∇h(η k )(y k − y ∗ ). (2.13). donde η k = (η1k , η2k , ..., ηnk ), ηik = yi∗ + θik (yik − yi∗ ), ∀ i = 1, 2, ..., n. También, se tiene que h0i (yj ) = 0,. ∀ i 6= j,. por lo que el jacobiano de h en η k es ∇h(η k ) = diag(h01 (η1k ), h02 (η2k ), ..., h0n (ηnk )).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 21. Dividiendo ambos lados de (2.13) entre tk y tomando lı́mite cuando k −→ ∞, se obtiene xk − x∗ (y k − y ∗ ) = lı́m ∇h(η k ) k−→∞ k−→∞ tk tk lı́m. CA S. = ∇h(y ∗ )d,. (2.14). u.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. sea u = ∇h(y ∗ )d. Entonces por la definición (1.12), {xk } converge a x∗ en la dirección. Por la regla de la cadena de la derivada generalizada del gradiente de Clarke, se cumple que. ∂g(y) ⊆ {∇h(y)ξ : ξ ∈ ∂f (h(y))},. y ∈ Y.. Ya que v k ∈ ∂g(y k ), entonces existe ξ k ∈ ∂f (xk ) tal que v k = ∇h(y k )ξ k. (2.15). Por la condición iii) del teorema, hi es una función estrictamente monótona para cada i, entonces, h0i (yi ) 6= 0 para todo i. Luego. ξ k = ∇h(y k )−1 v k ,. lı́m ξ k = lı́m ∇h(y k )−1 v k. k−→∞. BI. BL. IO T. y. k−→∞. = ∇h(y ∗ )−1 lı́m v k k−→∞. = ∇h(y ∗ )−1 v ∗ ,. por tanto {ξ k } converge, sea ξ ∗ = lı́m ξ k , k−→∞. por la cerradura de ∂f (x), ξ ∗ ∈ ∂f (x∗ ), además, ξ ∗ ∈ ∂u f (x∗ ) y v ∗ = ∇h(y ∗ )ξ ∗ .. (2.16). Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 22. Usando (2.15) y (2.16), se tiene (v k − v ∗ )T (y k − y ∗ ) = (∇h(y k )ξ k − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ). CA S. = (∇h(y k )ξ k − ∇h(y k )ξ ∗ + ∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ). = [(∇h(y k )ξ k − ∇h(y k )ξ ∗ )T + (∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T ](y k − y ∗ ). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. = (∇h(y k )ξ k − ∇h(y k )ξ ∗ )T (y k − y ∗ ) + (∇h(y k )ξ ∗ − ∇h(y ∗ )ξ ∗ )T (y k − y ∗ ) = (ξ k − ξ ∗ )T ∇h(y k )(y k − y ∗ ) + (ξ ∗ )T (∇h(y k ) − ∇h(y ∗ ))(y k − y ∗ ), por lo tanto,. (v k − v ∗ )T (y k − y ∗ ) = (ξ k − ξ ∗ )T ∇h(y k )(y k − y ∗ ) + (ξ ∗ )T (∇h(y k ) − ∇h(y ∗ ))(y k − y ∗ ). (2.17). Como hi ∈ C 2 (W ), se tiene. 1 x∗i − xki = hi (yi∗ ) − hi (yik ) = h0i (yik )(yi∗ − yik ) + h00i (ζik )(yi∗ − yik )2 , 2 h0i (yik ) − h0i (yi∗ ) = h00i (δik )(yik − yi∗ ),. donde. IO T. ζik = yik + αik (yi∗ − yik ), δik = yi∗ + βik (yik − yi∗ ),. BI. BL. También. (2.18) (2.19). 0 < αik < 1,. 0 < βik < 1,. i = 1, 2, ..., n.. ∇h(y k ) = diag(h01 (y1k ), h02 (y2k ), ..., hn (ynk )),. (2.20). ∇h(y ∗ ) = diag(h01 (y1∗ ), h02 (y2∗ ), ..., hn (yn∗ )).. (2.21). Por lo tanto, la ecuación (2.17) puede ser reescrita usando (2.12), (2.18), (2.19),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 23. (2.20) y (2.21) como. CA S. (v k − v ∗ )(y k − y ∗ ) i h i h = (ξ1k − ξ1∗ ) · · · (ξnk − ξn∗ ) diag(h01 (y1k ), h02 (y2k ), ..., hn (ynk )) (y1k − y1∗ ) · · · (ynk − yn∗ ) h i h i + ξ1∗ · · · ξn∗ diag(h01 (y1k ) − h01 (y1∗ ), ..., h0n (ynk ) − hn (yn∗ )) (y1k − y1∗ ) · · · (ynk − yn∗ ). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. = [(ξ1k − ξ1∗ )h01 (y1k )(y1k − y1∗ ) + (ξ2k − ξ2∗ )h02 (y2k )(y2k − y2∗ ) + · · · + (ξnk − ξn∗ )h0n (ynk )(ynk − yn∗ )] + [ξ1∗ (h01 (y1k ) − h01 (y1∗ ))(y1k − y1∗ ) + · · · + ξn∗ (h0n (ynk ) − h0n (yn∗ ))(ynk − yn∗ )] = [(ξ1k − ξ1∗ )(h1 (y1k ) − h1 (y1∗ )) − (ξ1k − ξ1∗ )h1 (y1k ) + (ξ1k − ξ1∗ )h1 (y1∗ ) + (ξ1k − ξ1∗ )h01 (y1k )(y1k − y1∗ )] + · · ·. + [(ξnk − ξn∗ )(hn (ynk ) − hn (yn∗ )) − (ξnk − ξn∗ )hn (ynk ) + (ξnk − ξn∗ )hn (yn∗ ). + (ξnk − ξn∗ )h0n (ynk )(ynk − yn∗ )]   0 k 0 ∗ ∗ 0 0 k ∗ 2 ∗ (hn (yn ) − hn (yn )) k ∗ 2 ∗ (h1 (y1 ) − h1 (y1 )) k + ξ1 (y1 − y1 ) + · · · + ξn (yn − yn ) (ynk − yn∗ ) (y1k − y1∗ ) n X = (ξik − ξi∗ )(hi (yik ) − hi (yi∗ )) i=1. +. n X. (ξik − ξi∗ )hi (yi∗ ) − (ξik − ξi∗ )hi (yik ) − (ξik − ξi∗ )h0i (yik )(yi∗ − yik ). i=1. i=1 n X. ξi∗. (h0i (yik ) − h0i (yi∗ )) k (yi − yi∗ )2 (yik − yi∗ ). IO T. +. n X. =. (ξik. i=1. −. x∗i ). n X. +. (ξik − ξi∗ )[hi (yi∗ ) − hi (yik ) − h0i (yik )(yi∗ − yik )]. i=1. BL. n X. −. ξi∗ )(xki. +. ξi∗ (h00i (δik ))(yik − yi∗ )2. BI. i=1. k. ∗. k. ∗. = (ξ − ξ )(x − x ) +. n X. (ξik. i=1 n. = (ξ k − ξ ∗ )(xk − x∗ ) +. −. ξi∗ ). .  n X 1 00 k (xk − x∗ )2 ∗ k 2 hi (ζi ) (yi − yi ) + ξi∗ h00i (δik ) i 0 k i2 2 hi (ηi ) i=1 n. X h00 (δ k ) 1X k ξi∗ 0i ki 2 (xki − x∗i )2 , (ξi − ξi∗ )h00i (ζik )(yi∗ − yik )2 + 2 i=1 hi (ηi ) i=1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 24. ası́ n. +. n X. ξi∗. i=1. 1X k (ξ − ξi∗ )h00i (ζik )(yi∗ − yik )2 2 i=1 i. h00i (δik ) k (x − x∗i )2 , h0i (ηik )2 i. (2.22). donde δik −→ yi∗ ,. ζik −→ yi∗ ,. cuando k −→ ∞,. i = 1, 2, ..., n,. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. ηik −→ yi∗ ,. CA S. (v k − v ∗ )(y k − y ∗ ) = (ξ k − ξ ∗ )(xk − x∗ ) +. ahora como. (yik − yi∗ )2 = d2i , k−→∞ t2k. a) lı́m. b) lı́m (ξik − ξi∗ ) = 0, k−→∞. c) lı́m h00i (ζik ) = h00i (yi∗ ), k−→∞. combinando a), b) y c) y por teorema (1.2),. lı́m (ξik − ξi∗ )h00i (ζik ). k−→∞. (yik − yi∗ )2 = 0. t2k. (2.23). Dividiendo por t2k a (2.22), se tiene. n. IO T. k 2 ∗ (v k − v ∗ )(y k − y ∗ ) (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = + (ξ − ξ )h (ζ ) i i i t2k t2k 2 i=1 i t2k. +. n X. h00i (δik ) (xki − x∗i )2 , t2k h0i (ηik )2. (2.24). BL. i=1. ξi∗. BI. aplicando lı́m inf a (2.24), cuando k −→ ∞ y aplicando el teorema (1.4), se obtiene lı́m inf k−→∞. (v k − v ∗ )(y k − y ∗ ) t2k n. ∗ k 2 (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = lı́m inf [ + (ξ − ξ )h (ζ ) i i i k−→∞ t2k 2 i=1 i t2k. +. n X i=1. ξi∗. h00i (δik ) (xki − x∗i )2 ] t2k h0i (ηik )2. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(38) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 25. n. ∗ k 2 (ξ k − ξ ∗ )(xk − x∗ ) 1X k ∗ 00 k (yi − yi ) ≥ lı́m inf + lı́m inf (ξ − ξ )h (ζ ) i i i i k−→∞ k−→∞ 2 t2k t2k i=1. + lı́m inf k−→∞. n X. ξi∗. i=1. h00i (δik ) (xki − x∗i )2 t2k h0i (ηik )2 n. lı́m ξi∗. h00i (δik ) (xki − x∗i )2 , t2k h0i (ηik )2. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. +. n X. CA S. k 2 ∗ (ξ k − ξ ∗ )(xk − x∗ ) 1 X k ∗ 00 k (yi − yi ) = lı́m inf + lı́m (ξ − ξ )h (ζ ) i i i k−→∞ t2k 2 i=1 k−→∞ i t2k. i=1. k−→∞. por (2.23), y usando (2.14). n. lı́m inf k−→∞. (ξ k − ξ ∗ )(xk − x∗ ) X ∗ h00i (yi∗ ) 2 (v k − v ∗ )(y k − y ∗ ) ≥ lı́m inf + ξi 0 ∗ 2 ui k−→∞ t2k t2k hi (yi ) i=1 00. ∗. ∗. 00. ∗. ∗. g (y , v , d) ≥ f (x , ξ , u) +. n X i=1. ξi∗. h00i (yi∗ ) 2 u. h0i (yi∗ )2 i. Por propiedad se cumple que f 00 (x, v, λw) = λ2 f 00 (x, v, w) para cualquier λ > 0 y usando (2.9) y (2.10),se tiene. n σX ∗ 2 ξ u  i=1 i i σ ≥ kuk2 f 00 (x∗ , ξ ∗ , u/kuk) + kuk2 . g 00 (y ∗ , v ∗ , d) ≥ f 00 (x∗ , ξ ∗ , u) +. IO T. ≥ kuk2 (−σ + σ) = 0.. BL. Entonces g 00 (y ∗ , v ∗ , d) ≥ 0.. BI. Aplicando el lema (1.1), se concluye que g es una función convexa.. . A continuación se definen dos clases de funciónes que satisfacen la condición (2.11). Corolario 2.3 Sea f una función definida en X. Suponer que f satisface las condiciones del teorema (2.2). Definir   1 1 hj (yj ) = ln 1 − , p yj. p > 0,. j = 1, 2, ..., n,. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(39) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. entonces g(y) = f (h(y)) es una función convexa en Y =. h. 1 1 , pL (1−eplj ) (1−e j ). 26. i. si existe. una constante p1 ≥ 0 tal que p ≥ p1 .. Será suficiente probar que se cumple la condición (2.11). En efecto: ! 0 1 1 1− yj 1 − y1j !  1 1 1 = yj −1 p yj2 yj   1 1 = p yj (yj − 1). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. 1 h0j (yj ) = p. CA S. Demostración.   1 −(yj (yj − 1))0 = p yj2 (yj − 1)2   1 −((yj − 1) + yj ) = p yj2 (yj − 1)2   1 1 − 2yj = , p yj2 (yj − 1)2 i h se tiene que yj < 0 para yj ∈ (1−e1plj ) , (1−e1pLj ) , entonces. BI. BL. IO T. h00j (yj ). h00j (yj ) [h0j (yj )]2. 1 p. . =  1 p. =. 1−2yj yj2 (yj −1)2. 1 yj (yj −1). . 2. p2 (1 − 2yj )(yj (yj − 1))2 pyj2 (yj − 1)2. = p(1 − 2yj ) > p.. Ahora para que la condición (2.11) se cumpla, se debe tener que p ≥ σ , pero p > 0. Sea n σo p1 = max 0, .  Por lo tanto g es convexa cuando p ≥ p1 .. . Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(40) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 27. Corolario 2.4 Sea f una función definida en X. Suponer que f satisface las condiciones del teorema (2.2). Definir p > 0,. j = 1, 2, ..., n.. entonces g(y) = f (h(y)) es una función convexa en Y =. −p −p j=1 [Lj , lj ]. Qn. si existe un. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. p2 ≥ 0 tal que p ≥ p2 .. CA S. −1. hj (yj ) = yj p ,. Demostración. Será suficiente probar que se cumple la condición (2.11). En efecto:. 1 (− 1 −1) h0j (yj ) = − yj p p    1 1 (− 1 −2) 00 hj (yj ) = − − − 1 yj p p p    1 1 (− 1 −2) + 1 yj p , = p p   −p ahora para todo yj ∈ L−p , se tiene j , lj −p L−p j ≤ yj ≤ lj 1. p −1 L−1 j ≤ yj ≤ lj ,. 1. yjp ≥ L−1 j =. IO T. luego. BI. BL. Entonces. 1 Lj. y sea L = máx1≤j≤n Lj .. h00j (yj ) (h0j (yj ))2.  (− 1 −2) + 1 yj p  2 1 − −1 ( ) p − p1 yj.   =. 1 p. 1 p. 1. = (1 + p)yjp 1 Lj 1 ≥ (1 + p) . L ≥ (1 + p). Ahora para q la condición (2.11) se cumpla,se debe tener que (1 + p) L1 ≥ σ , entonces p ≥ σ L − 1 pero p > 0.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(41) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 28. Sea o n σ p2 = max 0, L − 1 .  Por lo tanto g es convexa cuando p ≥ p2 .. CA S. . A continuación se presenta un ejemplo.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Ejemplo 2.2 Considerar la función. x ∈ X = [2, 5],. f (x) = max{f1 (x), f2 (x)}. donde. f1 (x) = −(1/4)(x − 5)2 + 4,. f2 (x) = (x − 4)|x − 4| + 2x − 2.. Aplicando el corolario (2.3), hallar el valor de p para garantizar la convexidad de g(y) = f (h(h)). Solución. Se observa que f es una función no convexa y no diferenciable, además se verifica que f es una función semisuave y regular en x.. BL. IO T. Reescribiendo la función f , se tiene.    −(1/4)(x − 5)2 + 4,   f (x) = −(x − 4)2 + 2x − 2,     (x − 4)2 + 2x − 2,. x ∈ [2, 3i, x ∈ [3, 4],. x ∈ h4, 5].. BI. Ahora hallar la subdiferencial de f ∗ Para x ∈ [2, 3i, se tiene por teorema(1.9), que ∂f (x) = −(1/2)(x − 5), pues f es una función continuamente diferenciable en [2, 3i. ∗ Para x = 3 y por teorema (1.8) se tiene que ∂f (x) = ∂c f (x), entonces ∂f (3) = λf10 (3) + (1 − λ)f20 (3),. ∀ λ ∈ [0, 1]. = λ(1) + (1 − λ)(4) = 4 − 3λ. ∀ λ ∈ [0, 1],. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(42) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 29. por tanto ∂f (x) = [1, 4]. ∗ Para x ∈ h3, 4], se tiene por teorema(1.9), que ∂f (x) = −2(x − 5), pues f es una función continuamente diferenciable en h3, 4].. CA S. ∗ Para x ∈ h4, 5], se tiene por teorema(1.9), que ∂f (x) = 2(x − 3), pues f es una función continuamente diferenciable en h4, 5].. BL. IO T. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Notar que ξ ≥ 1 para cualquier ξ ∈ ∂f (x).. BI. Ası́  = 1. Para |u| = 1 y v ∈ ∂u f (x), se tiene    −1/2, x ∈ [2, 3i,   00 f (x, v, u) = −2, x ∈ h3, 4i,     2, x ∈ h4, 5].. Faltarı́a analizar para x = 3 y x = 4.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(43) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 30. Para x = 4, se tiene que v = 2, donde v ∈ ∂u f (4), luego f 00 (4, 2, −1) = −2,. CA S. f 00 (4, 2, 1) = 2. Para x = 3, |u| = 1 y v ∈ ∂u f (3), se tiene. donde. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. f 00 (3, v, u) = max{λ1 f100 (3) + λ2 f200 (3) : (λ1 , λ2 ) ∈ S(3, v)},. S(3, v)) = {(λ1 , λ2 ) : v = λ1 f10 (3) + λ2 f20 (3), λ1 , λ2 ≥ 0, λ1 + λ2 = 1}. Para. f10 (3) = 1,. se tiene. f20 (3) = 4,. f100 (3) = −1/2,. f200 (3) = −2,. f 00 (3, 1, −1) = −1/2,. f 00 (3, 4, 1) = −2,. entonces para v ∈ (1, 4) y |u| = 1,. IO T. f 00 (3, v, u) = −1/2.. BL. Por lo tanto, para cualquier x ∈ [2, 5], y v ∈ ∂u f (x),. BI. f 00 (x, v, u) ≥ −2 = ρ,. pero σ = −ρ = 2. Luego, por el corolario (2.3),   n σo 2 p1 = max 0, = max 0, = 2.  1. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(44) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 2.2 Convexificación de funciones monótonas no diferenciables. 31. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. CA S. Por lo tanto, para cualquier p ≥ 2 garantiza la convexidad de g(y)=f(h(y)).. IO T. Los resultados dados en esta sección proporcionan una base teórica para extender el alcance de los métodos de convexificación para funciones monótonas no diferen-. BI. BL. ciables.. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(45) EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. Capı́tulo III. CA S. Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Optimización monótona y maximización convexa. En este capı́tulo se prueba que la solución tanto global como local del problema monótono (P ) se puede hallar del problema equivalente convexo.. Dada una función h : Rn −→ Rn . Se considera la siguiente trasformación del problema (P ). IO T. (T ).       . max g(y) = f (h(y)). s.t. gi (y) = fi (h(y)) ≤ bi , i = 1, 2, ..., m,       y ∈ Y,. BL. donde h : Y −→ X es una función biyectiva con X = h(Y ).. Se denota por S y S̃ a la región factible del problema (P ) y del problema (T ). BI. respectivamente, S = {x ∈ X : fi (x) ≤ bi , i = 1, 2, ..., m}, S̃ = {y ∈ Y : gi (y) ≤ bi , i = 1, 2, ..., m}.. El siguiente teorema establece la equivalencia entre en el problema monótono (P ) y el problema convexo (T ).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(46) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 33. Teorema 3.1 Sea h una función sobreyectiva. Sea y ∗ ∈ S̃ una solución óptima global del problema (T ) si y sólo si x∗ = h(y ∗ ) ∈ S es una solución óptima global del problema (P ).. CA S. Demostración Sea x ∈ S ⊂ X. Dado que h es una función sobreyectiva y X = h(Y ), entonces. Se tiene. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. existe y ∈ Y tal que x = h(y).. fi (x) ≤ bi ⇐⇒ fi (h(y)) ≤ bi ⇐⇒ gi (y) ≤ bi. ∀ i = 1, 2, ..., m ∀ x ∈ X. ∀ i = 1, 2, ..., m ∀ y ∈ Y. asi que x ∈ S si y sólo si y ∈ S̃, además, como el problema que se esta analizando es un problema de maximización y y ∗ ∈ S̃ es una solución óptima global, se tiene g(y) ≤ g(y ∗ ) ⇐⇒ f (h(y)) ≤ f (h(y ∗ )) ⇐⇒ f (x) ≤ f (x∗ ). ∀ y ∈ S̃. ∀ x ∈ S.. Por lo tanto y ∗ ∈ S̃ es una solución óptima global del problema (T ) si y sólo si . IO T. x∗ ∈ S es una solución óptima global del problema (P ).. Teorema 3.2 Sea h una función sobreyectiva.. Si h−1 existe y tanto h como h−1 son funciones continuas, entonces y ∗ ∈ S es una. BL. solución óptima local del problema (T ) si y sólo si x∗ = h(y ∗ ) es una solución óptima. BI. local de (P ). Demostración Sea y ∗ ∈ S̃ es una solución óptima local del problema (T ), entonces existe  > 0 tal que ∀ y ∈ B(y ∗ , ) ⊂ Rn , se cumple g(y ∗ ) ≥ g(y). ∀ y ∈ B(y ∗ , ) ∩ S̃,. pues se esta analizando un problema de maximización. Como h−1 es una función continua en S̃, entonces en particular, para B(y ∗ , ),. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(47) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3.1 Algoritmo de aproximación externa. 34. ∃ B(x∗ , δ), con δ > 0, tal que h−1 (B(x∗ , δ) ∩ S) ⊆ B(y ∗ , ). Además por la prueba del teorema (3.1), se tiene que S = h(S̃). Entonces f (x∗ ) = f (h(y ∗ )) = g(y ∗ ) ≥ g(y) = f (h(y)) = f (x). ∀ x ∈ B(x∗ , δ) ∩ S,. CA S. f (x∗ ) ≥ f (x). ∀ x ∈ B(x∗ , δ) ∩ S,. lo que implica que x∗ es una solución óptima local del problema (P ). Similarmente. 3.1.. EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. se prueba el regreso.. Algoritmo de. aproximación. . externa para. resolver problemas de maximización convexa. Los problemas de optimización global más estudiados son los problemas de optimización convexa. Pues se sabe que una función convexa definida sobre un poliedro acotado siempre tiene su máximo en uno de los vérices del poliedro.. IO T. En esta sección se propone el algoritmo de Aproximación externa para resolver problemas convexos, donde la función objetivo es sucesivamente maximizada en una. BL. secuencia de poliedros que encierran a la región factible. En cada iteración el poliedro envolvente actual se refina mediante la adición de un plano de corte tangencial. BI. (hiperplano) a la región factible en un punto de frontera.. El algoritmo genera una sucesión no creciente de lı́mites superiores para el valor óptimo del problema (T ) y termina cuando la solución factible recurrente está dentro de una tolerancia dada.. El algoritmo de aproximación extera para el problema (T ) se describe de la siguiente forma:. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(48) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 3.1 Algoritmo de aproximación externa. 35. ALGORITMO: Considerar el problema:. s.t. gi (y) ≤ 0, i = 1, 2, ..., m,       y ∈ Y,. CA S. max g(y). EC Y AD M E AT C EM IEN ÁT CIA IC S AS FÍ SI. (T ).       . donde g es una función convexa en Rn , gi (y) ≤ 0, i = 1, 2, ..., m, son funciones convexas y sea S̃ = {y : gi (y) ≤ 0, i = 1, 2, ..., m.} la región factible del problema (T ) no vacı́o y compacto. ENTRADA:. q ∈ int(S̃) y  > 0.. SALIDA:. solución y k .. Paso 0:. Sea u0 = g(q) (el mejor lı́mite inferior hasta el momento).. Definir un poliedro S̃ 0 que contenga a S̃ cuyos vértices de S̃ 0 son conocidos. Sea V 0 el conjunto de vértices de S̃ 0 . k = 1. Paso 1:. IO T. Resolver el problema :. (T k ).   . max g(y).  s.t. y ∈ S̃ k ,. BL. es decir, elegir el máx{g(v) : v ∈ V k+1 }.. BI. Luego sea y k = v solución del problema (T k ). Sea λk solución del problema de optimización unidimensional.. (Qk ).   . mı́n λ.  s.t. 0 ≤ λ ≤ 1,. y k + λ(q − y k ) ∈ S̃. Si λk = 0, entonces y k ∈ S̃ y además es la solución del problema (T ). Si λk > 0, denotar z k = y k + λ(q − y k ). Si g(z k ) > uk−1 , poner uk = g(z k ).. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

Figure

Actualización...

Referencias

Actualización...