El método de aproximación exterior para el problema de optimización no lineal monótona
123
0
0
Texto completo
(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. SG RA DO. JURADO DICTAMINADOR. —————————————————– Dra. Jenny Margarita Rojas Jeronimo. DE. PO. PRESIDENTE. —————————————————–. TE CA. Ms. Nelson Omar Aragones Salazar. BI BL. IO. SECRETARIO. —————————————————– Dr. Edmundo Ruben Vergara Moreno VOCAL. i Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(3) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Dedicatoria. A MIS PADRES:. SG RA DO. Jesus Ana María y. BI BL. IO. TE CA. DE. PO. Juan Bautista.. Lic. Robert Angel Urbina Medina. ii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(4) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Agradecimiento. A los docentes de la Maestría en Matemáticas de la Escuela de Postgrado de. SG RA DO. La Unversidad Nacional de Trujillo, mi reconocimiento y eterna gratitud por sus valiosas enseñanzas. En especial a mí asesor, Dr. Edmundo Vergara Moreno por su acertado, eficiente y valioso asesoramiento, ser guía en la realización, proceso y. BI BL. IO. TE CA. DE. PO. culminación de la presente tesis.. Lic. Robert Angel Urbina Medina. iii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(5) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. SG RA DO. Índice general. Presentación Dedicatoria. PO. Agradecimiento. Abstract. TE CA. Introducción. DE. Resumen. i. ii. iii. vi. vii. viii. 1. Materiales y Métodos.. 1. 1.1. Funciones convexas . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. IO. Convexidad y diferenciabilidad en la optimización. 2. 1.3. Propiedades de las Funciones Convexas . . . . . . . . . . . . . . . .. 3. 1.4.. Máximos y Mínimos de Funciones Convexas . . . . . . . . . . . . .. 6. 1.5. Monotonicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 1.6. Criterio de Monotonía de Funciones . . . . . . . . . . . . . . . . . .. 8. 1.7. Funciones Monótonas no Suaves . . . . . . . . . . . . . . . . . . . .. 9. 1.8. Reglas de Cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 1.9. Una Clase Especial de Funciones . . . . . . . . . . . . . . . . . . .. 14. BI BL. 1.2. Funciones diferenciables . . . . . . . . . . . . . . . . . . . . . . . .. iv Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(6) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 1.10. Problemas de Programación No Lineal . . . . . . . . . . . . . . . .. 15. 1.11. Optimización Convexa . . . . . . . . . . . . . . . . . . . . . . . . .. 15. 1.12. Optimización Monótona . . . . . . . . . . . . . . . . . . . . . . . .. 16. 2. Materiales y Métodos.. SG RA DO. Monotonicidad y Convexidad. 18. 2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 18. 2.2. Monotonicidad y Convexidad . . . . . . . . . . . . . . . . . . . . .. 19. 2.2.1. Convexificación de una Función Monótona Univariable . . .. 20. 2.2.2. Convexificación de una Función Monótona Multivariable . .. 21. PO. 3. Resultado y Discusión.. Optimización Monótona y Minimización Cóncava. 70. 3.1. Equivalencia a la Minimización Cóncava . . . . . . . . . . . . . . .. 71. DE. 3.2. Algoritmo de Aproximación Exterior Para Problemas de Minimización 74. 3.3. Algoritmo (Método de Aproximación Exterior Poliédrico) . . . . . .. 76. TE CA. Cóncava . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 100. Bibliografia. 101. IO. Conclusiones. 104. BI BL. Anexos. v Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(7) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Resumen. En este trabajo, se resuelve un problema de optimización no lineal, monótona. SG RA DO. y no convexa mediante un método de aproximación exterior, pero previamente se transforma en un problema convexo. Dado el problema: máx. x∈X⊆Rn. f (x). s.a : gi (x) ≤ bi ;. i = 1, . . . , m.. (P ). X = {x ∈ Rn / ℓj ≤ xj ≤ uj ; j = 1, . . . , n},. PO. donde f y gi , ∀ i; son funciones continuas, no convexas y monótonas.. Así, se tiene que (P ) es un problema de Optimización Global, no lineal, monótona y no convexa. Esto implica que el problema (P ), tiene múltiples soluciones óptimas. DE. locales en la región factible S = {x ∈ X : gi (x) ≤ bi , ∀ i}, y de la monotonicidad,. S.. TE CA. se tiene que las soluciones óptimas locales de (P ), se encuentran en la frontera de. Luego, se realiza el proceso de convexificación de f y gi , ∀ i; para lo cual se introduce una transformación t : Rn → Rn , no lineal, estrictamente monótona, inyectiva y. IO. convexa, que convexifica a las funciones f y gi , ∀ i, mediante el cambio de variable,. BI BL. dado por t(y) = x, donde t es sobreyectiva y por ende biyectiva, obteniendose (P T ): máx [f (t(y)) = Φ(y)]. y∈Y t ⊆Rn. s.a :. ψi (y) = gi (t(y)) ≤ bi ,. (P T ) i = 1, . . . , m,. Este problema (P T ), con región factible St = {y ∈ Y t / ψi (y) ≤ bi ,. ∀ i}, se. resuelve, usando el método de Aproximación Exterior, cuyo procedimeinto se describe, mediante el algoritmo de Aproximación Exterior, se demuestra su convergencia, se implementa el algoritmo en Matlab y se presenta un ejemplo ilustrativo. vi Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(8) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Abstract In this paper, we solve an optimization problem and not lineal, monotonous and not convex, by Exterior Approximation method, which previously transformed into a convex problem.. máx. x∈X⊆Rn. SG RA DO. Given the problem: f (x). s.a : gi (x) ≤ bi ;. i = 1, . . . , m.. (P ). X = {x ∈ Rn / ℓj ≤ xj ≤ uj ; j = 1, . . . , n},. where f and gi , ∀ i, are continuous functions, not convex and monotonous.. PO. Therefore, we have arrived that (P ) is a Global Optimization Problem, not lineal, monotonous and not convex. This implies that the problem (P ) has multiple local optimal solutions in the feasible region S = {x ∈ X : gi (x) ≤ bi , ∀ i}, and from. DE. the monotonicity, it has that the local optimal solutions of (P ), lie in the border of S.. TE CA. The convexification process of f and gi , ∀ i, is then carried out by introducing the transformation t : Rn → Rn , not lineal, but strictly monotonous, injective and convex, that convexifies the functions f and gi , ∀ i, due to the change of variable,. IO. given that t(y) = x, where t is surjective and thus bijective, obtaining (P T ): máx [f (t(y)) = Φ(y)]. BI BL. y∈Y t ⊆Rn. s.a :. ψi (y) = gi (t(y)) ≤ bi ,. (P T ) i = 1, . . . , m,. This problem (P T ), with feasible region St = {y ∈ Y t / ψi (y) ≤ bi ,. ∀ i}, is solved. using the Exterior Approximation method whose procedure is described later on, through the Exterior Approximation algorithm, whose convergence is demostrated, the algorithm is implemented in Matlab and is presented whith an illustrative example. vii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Introducción. La optimización en general es una de las áreas de la matemática con mayor. SG RA DO. aplicación en problemas de la vida real, especialmente la optimización no lineal y dentro de este, la optimización no lineal convexa, es la que tiene gran número de propiedades comunes con los de optimización lineal que es la que posee métodos exactos y métodos de aproximaciones muy eficientes.. Sin embargo, en un problema real para usar métodos de optimización lineal para resolverlo, frecuentemente se necesita hacer fuertes idealizaciones para llevarlo a. PO. un modelo lineal. Esto produce un modelo impreciso del problema real y como consecuencia la solución óptima del modelo puede no ser óptima para el problema real. De esto se observa que un modelo matemático no lineal reproducirá con mayor. DE. precisión el problema real y por tanto su solución óptima sería óptima para el problema subyacente.. TE CA. De todo esto se deduce la importancia que tiene conocer métodos de solución de problemas de optimización no lineal que pueden verse en [1], o diseñar otros métodos que permitan resolverlos.. BI BL. IO. Un problema de optimización no lineal restringido es de la forma: máx. x∈X⊆Rn. f (x). s.a : gi (x) ≤ bi ;. i = 1, . . . , m.. con X = {x ∈ Rn / ℓj ≤ xj ≤ uj ; j = 1, . . . , n},. donde f y gi son funciones continuas de valor real definidas sobre X, tal que almenos una de ellas es no lineal. Un modelo no lineal puede tener diferentes características que están dadas por las funciones que definen el modelo, así pueden ser: Modelos no lineales convexos, que son los más estudiados [1, 3]; Modelos no lineales cóncavos diferenciables o suaves, viii. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(10) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. estudiados en [6, 13, 14, 15]; modelos no lineales monótonos estudiados en [16, 18, 21], modelos no lineales y no convexos estudiados en [5, 8, 17], etc. La optimización global, es uno de los retos más importantes de la investigación en el área de optimización. Desde hace más de 4 décadas ha atraído mucho la atención. SG RA DO. de investigadores como en [16, 19, 24]. Una clase importante de problemas de optimización global con características especiales, son los modelos de optimización no lineal monótonas, estudiados recientemente como pude verse en [19, 21]. Parece que es muy difícil (casi imposible) diseñar un método eficiente para encontrar soluciones óptimas globales para problemas generales de optimización global, de ahí la necesidad de diseñar métodos que. PO. resuelvan modelos no lineales con características especiales, como son la convexidad, concavidad, monotonicidad, etc. En particular, para el problema de minimización de funciones cóncavas se han diseñado varios algoritmos como métodos de puntos. DE. extremos seleccionados, métodos de planos de corte, y métodos de aproximación exterior, [2, 9, 20].. TE CA. En los últimos años se han estudiado también problemas de optimización no lineal monótonas debido a su variedad de aplicaciones. Este problema se modela como: máx. x∈X⊆Rn. f (x). i = 1, . . . , m,. con X = {x ∈ Rn : ℓj ≤ xj ≤ uj ;. (P ) j = 1, . . . , n},. BI BL. IO. s.a : gi (x) ≤ bi ;. donde f y gi son funciones crecientes y continuas sobre X.. Las funciones f y gi ; no necesariamente son convexas o separables y debido a la monotonicidad de f y gi , las soluciones óptimas de (P ) se encuentran sobre la frontera de la región factible. El problema (P ) puede tener múltiples soluciones óptimas locales sobre la frontera, debido a que f no necesariamente es convexa y los gi no necesariamente son convexas, lo que hace de (P ) un problema de optimización global con una característica especial. ix. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(11) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Entre las diversas aplicaciones de estos modelos se tiene en problemas de asignación de recursos, estudiado por Ibaraki-Etall [11], en la confiabilidad de redes, estudiados por Hansen Etall [6], Tzafestas [27] y otros. Debido a que la monotonicidad y la convexidad son dos propiedades diferentes de. SG RA DO. una función real, pero que están estrechamente relacionadas en el análisis convexo clásico y la necesidad que se tiene de resolver eficientemente el problema (P ) surge la interrogante: ¿una función monótona no convexa puede ser transformada a una función convexa mediante transformaciones de las variables?. Como es conocido una transformación lineal no cambia la propiedad de convexidad de una función real por lo tanto es necesario recurrir a transformaciones no lineales. Luego teniendo. PO. un problema de optimización no lineal convexo, el método de aproximación exterior es una buena alternativa para resolverlo y no ha sido tratado en la bibliografía, ni en reportes de investigación que se ha revisado. Esto nos lleva a plantearnos. DE. el problema: ¿será posible diseñar un método eficiente basado en aproximaciones exteriores para resolver el problema de optimización no lineal. TE CA. monótono?.. Teniendo en cuenta que el método de aproximación exterior se aplica a problemas de optimización convexa, los problemas monótonas no convexos, transformando. IO. primeramente a problemas convexos será posible resolverlo. Así en este trabajo, en el primer capítulo se hace una revisión de la optimización. BI BL. convexa, en el segundo capítulo se presenta la transformación de una función monónota no convexa a convexa, y en el tercer capítulo se propone un método de solución de problemas de optimización monótonas no convexas basado en aproximación exterior; finalmente se enuncia las conclusiones a las que se ha arribado y se mencionan las referencias utilizadas. El Autor. x Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(12) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. SG RA DO. Capítulo 1 Materiales y Métodos.. DE. optimización. PO. Convexidad y diferenciabilidad en la. En este capítulo se presentan diversas definiciones y propiedades necesarias para. 1.1.. TE CA. el desarrollo del trabajo.. Funciones convexas. IO. Definición 1.1.1 (Convexidad) Sea f : S ⊆ Rn → R una función, dónde S es. BI BL. un conjunto convexo no vacío. La función f es convexa sobre S; si y sólo sí; para cada par de vectores x1 ∈ S. y x2 ∈ S y cualquier escalar λ ∈ [0, 1] se cumple la desigualdad: f [λx1 + (1 − λ)x2 ] ≤ λf (x1 ) + (1 − λ)f (x2 ). (∗). La función f es concava sobre S; si y sólo sí; para cada par de vectores x1 ∈ S y x2 ∈ S y cualquier escalar λ,. λ ∈ [0, 1] se cumple la desigualdad:. f [λx1 + (1 − λ)x2 ] ≥ λf (x1 ) + (1 − λ)f (x2 ). (∗∗). 1 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. De éstas, se deduce que f es cóncava sobre S si −f es convexa sobre S. Definición 1.1.2 Sea f : S ⊆ Rn → R una función, dónde S es un conjunto convexo no vacío. La función f es estrictamente convexa sobre S; si y sólo si; ∀ x1 ∈ S y. SG RA DO. ∀ x2 ∈ S; x1 ̸= x2 se cumple la desigualdad estricta en (∗).. La función f es estrictamente cóncava sobre S; si y sólo sí; ∀ x1 ∈ S y ∀ x2 ∈ S; x1 ̸= x2 se cumple la desigualdad estricta en (∗∗).. Funciones diferenciables. PO. 1.2.. Definición 1.2.1 Sea S ⊆ Rn un conjunto no vacío y sea f : S → R una función. ◦. f se llama diferenciable en x̄ ∈ S, si existe un vector gradiente ∇f (x̄) ∈ Rn y una. DE. función α : Rn → R tal que: ∀ x ∈ S, se tiene:. TE CA. f (x) = f (x̄) + [∇f (x̄)]t (x − x̄) + ∥x − x̄∥α(x̄, x − x̄), donde, lı́m α(x̄, x − x̄) = 0. x→x̄. La representación de f arriba se llama “expansión de f en serie de Taylor de primer orden en x̄”, y sin el término que involucra la función α, la representación resultante. IO. de f se llama “aproximación de f en serie de Taylor de primer orden en x̄”.. BI BL. Definición 1.2.2 Sea S ⊆ Rn un conjunto no vacío y sea f : S → R una función. ◦. f se llama dos veces diferenciable en x̄ ∈ S, si existe un vector gradiente ∇f (x̄) ∈ Rn , y una matriz simétrica H[f (x̄)] de orden n × n llamada matriz Hessiana de f en x̄, y una función α : Rn → R tal que:. 1 f (x) = f (x̄)+[∇f (x̄)]t (x−x̄)+ (x−x̄)t H[f (x̄)](x−x̄)+∥x−x̄∥2 α(x̄, x−x̄), ∀x ∈ S. 2 Donde, lı́m α(x̄, x − x̄) = 0. x→x̄. 2 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(14) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Teorema 1.2.1 (Valor Medio) Sea S ⊆ Rn un conjunto convexo abierto no vacío y sea f : S → R una función diferenciable. El teorema del valor medio puede ser enunciado como sigue: ∀x1 ∈ S y ∀ x2 ∈ S, tenemos:. SG RA DO. f (x2 ) = f (x1 ) + [∇f (x)]t (x2 − x1 ), donde, x = λx1 + (1 − λ)x2 ; para algún λ ∈ (0, 1).. Teorema 1.2.2 (Taylor) Sea S ⊆ Rn un conjunto convexo abierto no vacío y sea f : S → R una función dos veces diferenciable. El teorema de Taylor de 2do orden puede ser enunciado como sigue: ∀ x1 ∈ S y ∀ x2 ∈ S, se tiene:. PO. 1 f (x2 ) = f (x1 ) + [∇f (x1 )]t (x2 − x1 ) + (x2 − x1 )t H[f (x)](x2 − x1 ), 2. donde, H[f (x)] es la matriz Hessiana de f en x, y x = λx1 + (1 − λ)x2 , para algún. Propiedades de las Funciones Convexas. TE CA. 1.3.. DE. λ ∈ (0, 1).. 1. Sea S ⊆ Rn un conjunto convexo no vacío y sea f : S → R una función convexa. Entonces, f es continua en el int(S).. IO. 2. Sea f : Rn → R una función convexa. Sea x̄ ∈ Rn y sea d ̸= 0, d ∈ Rn un vector dirección. Entonces, existe la derivada direccional de f en x̄ en la. BI BL. dirección d, f ′ (x̄, d).. 3. Sea S ⊆ Rn un conjunto convexo no vacío y sea f : S → R una función. ◦. Suponga que para cada punto x̄ ∈ S, existe un vector ξ, denominado subgradiente, tal que: f (x) ≥ f (x̄) + ξ t (x − x̄);. ∀ x ∈ S.. Entonces, f es convexa sobre int(S). 3 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 4. Sea f : S ⊆ Rn → R una función diferenciable sobre un conjunto convexo abierto no vacío S. f es convexa; si y sólo si; ∀ x̄ ∈ S se tiene que: f (x) ≥ f (x̄) + [∇f (x̄)]t (x − x̄);. ∀ x ∈ S.. SG RA DO. 5. Sea f : S ⊆ Rn → R una función diferenciable sobre un conjunto convexo abierto no vacío S. f es convexa; si y sólo si; ∀ x1 ∈ S y ∀ x2 ∈ S se tiene que:. [∇f (x2 ) − ∇f (x1 )]t (x2 − x1 ) ≥ 0. 6. Sea f : S ⊆ Rn → R una función dos veces diferenciable sobre un conjunto. PO. convexo abierto no vacío S. Entonces,. f es convexa en S; si y sólo si; la matriz Hessiana de f en x̄ es semidefinida positiva en cada punto de S. Esto es:. ∀ x ∈ Rn. DE. f es convexa en S, si y sólo si, ∀ x̄ ∈ S se verifica: xt H[f (x̄)]x ≥ 0;. TE CA. f es estrictamente convexa en S; si y sólo si, la matriz Hessiana de f en x̄ es definida positiva en cada punto de S. Esto es: f es estrictamente convexa en S; si y sólo si; ∀ x̄ ∈ S se verifica: ∀ x ∈ Rn ,. x ̸= 0.. IO. xt H[f (x̄)]x > 0;. BI BL. Observación 1.3.1 Las demostraciones de estas propiedades están en [1]. Observación 1.3.2 Sea f : S ⊆ R → R, una función convexa en un conjunto. convexo S = [a, b] ↔ f ′′ (x̄) ≥ 0, ∀ x̄ ∈ S. En efecto:. Por la propiedad (6) se tiene: f es convexa en S = [a, b]; si y sólo si; ∀ x ∈ R, ∀ x̄ ∈ S : xt H[f (x̄)]x ≥ 0. Sea: ∀ x ∈ R/ x ̸= 0 → x2 > 0. 4 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Pero: 0 ≤ xt H[f (x̄)]x = x2 f ′′ (x̄) 0 ≤ x2 f ′′ (x̄). SG RA DO. 0 ≤ f ′′ (x̄), ∀ x̄ ∈ S. Ejemplo 1.3.1 Considere la función f : R2 → R tal que f (x1 , x2 ) = x31 + 2x22 . Entonces, f es una función convexa estricta sobre S = {x = (x1 , x2 ) ∈ R2 / x1 > 0} Solución.. fx = 3x2 1 1. , fx2 = 4x2. PO. fx1 x1 = 6x1 , fx2 x2 = 4 , fx1 x2 = 0 , fx2 x1 = 0. Luego,. . TE CA. . DE. La matriz Hessiana de f en x̄ ∈ S, es dada por: fx1 x1 fx1 x2 6x1 0 6x1 0 H[f (x̄)] = = ⇒ H[f (x̄)] = . fx2 x1 fx2 x2 0 4 0 4. x1 2 ∀x= ∈ R / x ̸= (0, 0) y x2. ∀ x̄ ∈ S.. Se tiene que:. . . BI BL. IO. 6x1 0 xt H[f (x̄)]x = [x1 x2 ]1×2 0 4 2×2. . . x1 x2. 2×1. . . x1 3 2 = [6x21 4x2 ] = 6x1 + 4x2 x2. xt H[f (x̄)]x = 6x31 + 4x22 .. Como,. x1 > 0 ⇒ 6x31 > 0.. Como, x2 ∈ R ⇒ 4x22 ≥ 0.. 5 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Así, 6x31 + 4x22 > 0. ∀ x ∈ R2 ,. x ̸= (0, 0) y. ∀ x̄ ∈ S se tiene: xt H[f (x̄)]x > 0. Entonces,. la matriz Hessiana de f en x̄ es definida positiva en cada punto de S.. 1.4.. SG RA DO. ∴ f es estrictamente convexa en S.. Máximos y Mínimos de Funciones Convexas. Definiciones.. PO. Sea f : Rn → R función convexa y sea el problema:. min f (x). s.a : x ∈ S ⊆ Rn. DE. Un punto x ∈ S, se llama “solución factible” para el problema. Si x ∈ S y además f (x̄) ≤ f (x),. ∀ x ∈ S. Entonces, x se llama “solución. TE CA. óptima” ó “solución óptima global” o simplemente una “solución” para el problema.. Si x ∈ S y si existe una ε-vecindad Nε (x̄), de x̄ tal que: f (x) ≥ f (x̄),. IO. ∀ x ∈ S ∩ Nε (x̄). Entonces, x̄ se llama “solución óptima local”.. BI BL. Si x ∈ S y si f (x) > f (x̄),. ∀ x ∈ S ∩ Nε (x̄);. x ̸= x̄, para algún ε > 0.. Entonces, x̄ se llama “solución óptima local estricta”.. Si x ∈ S es el único mínimo local en S ∩ Nε (x̄). Entonces, x̄ se llama “solución óptima local fuerte”.. Propiedades.. 6 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 1. Sea S un conjunto convexo no vacío y sea f : S ⊆ Rn → R, una función convexa sobre S. Sea el problema: mı́n f (x). x∈S. SG RA DO. Suponga que x̄ ∈ S es una solución óptima local para el problema. Entonces, x̄ es una solución óptima global.. Si x̄ es un mínimo local estricto, ó si f es estrictamente convexa. Entonces, x̄ es la única solución optima global y es también un mínimo local fuerte.. PO. 2. Sea S un conjunto convexo no vacío y sea f : S ⊆ Rn → R,. una función. convexa sobre S. Sea el problema: {mı́n f (x) : x ∈ S}. DE. El punto x̄ ∈ S es una solución óptima para el problema; si y solo si, f tiene un subgradiente ξ en x̄ tal que: ξ t (x − x̄) ≥ 0, ∀x ∈ S .. TE CA. Si f es dos veces diferenciable y suponga que x̄ es una solución óptima. Entonces el conjunto de soluciones óptimas alternativas es caracterizada por el conjunto:. IO. S ∗ = {x ∈ S : [∇f (x̄)]t (x − x̄) ≤ 0 y ∇f (x) = ∇f (x̄)}. BI BL. Observación 1.4.1 Las demostraciones de estas propiedades están en [1]. De las definiciones y propiedades anteriores se concluye que maximizar una función cóncava es similar a minimizar una función convexa.. 7 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 1.5.. Monotonicidad. Definición 1.5.1 Una función f : S ⊆ Rn → R es creciente sobre S; si y sólo si; ∀ x, y ∈ S :. x ≥ y ⇒ f (x) ≥ f (y).. (∗). ∀ x, y ∈ S :. SG RA DO. La función f es decreciente sobre S; si y sólo si;. x ≥ y ⇒ f (x) ≤ f (y). (∗∗). Definición 1.5.2 Una función f : S ⊆ Rn → R es estrictamente creciente sobre S; si y sólo si; se cumple la desigualdad estricta en (∗).. La función f es estrictamente decreciente sobre S; si y sólo si; se cumple la de-. PO. sigualdad estricta en (∗∗).. Definición 1.5.3 Una función f : S ⊆ Rn → R es monótona; si y sólo si; f es. DE. creciente o decreciente sobre S.. Observación 1.5.1 Sea S ⊆ Rn un conjunto compacto convexo.. TE CA. Una función f : S → R es estrictamente creciente sobre S, si f (xi ), ∀ i = 1, n es una función estrictamente creciente. La función f es estrictamente decreciente sobre S, si f (xi ), ∀ i = 1, n es una. IO. función estrictamente decreciente.. Criterio de Monotonía de Funciones. BI BL. 1.6.. Teorema 1.6.1 Sea f : (a, b) ⊂ R → R una función diferenciable sobre (a, b). f es creciente sobre (a, b); si y sólo si; f ′ (x) ≥ 0, f es decreciente sobre (a, b); si y sólo si; f ′ (x) ≤ 0,. ∀ x ∈ (a, b). ∀ x ∈ (a, b).. Observación 1.6.1 Sea f : (a, b) ⊂ R → R una función diferenciable sobre (a, b). f es estrictamente creciente sobre (a, b); si y sólo si; f ′ (x) > 0,. ∀ x ∈ (a, b).. 8 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. f es estrictamente decreciente sobre (a, b); si y sólo si; f ′ (x) < 0, ∀ x ∈ (a, b). Propiedad. Sea f : S ⊆ Rn → R una función.. decreciente (resp. creciente) sobre S.. 1.7.. SG RA DO. Si f crece (resp. decrece) sobre el conjunto S. Entonces, la función −f es. Funciones Monótonas no Suaves. Sea W ⊆ Rn un conjunto abierto, sea x∗ ∈ W, u ∈ Rn y u ̸= 0.. PO. Definición 1.7.1 Sea f : Rn → R una función localmente Lipschitz. Esto es: f es Lipschitz cerca a un punto dado de x ∈ Rn , si existe un escalar k y un ε > 0. DE. tal que:. |f (x′′ ) − f (x′ )|R ≤ k∥x′′ − x′ ∥Rn ;. ∀ x′′ , x′. en Bε (x) = x + εB.. TE CA. Aquí: B es una bola abierta unitaria en Rn y Bε (x) es una bola abierta en Rn de centro en x y radio ε.. Definición 1.7.2 Suponga que, {xk } → x∗ con xk ̸= x∗ ,. ∀ k. Entonces, {xk }. IO. converge a x∗ en la dirección u, si existe {tk } con tk > 0 y tk → 0, para k → ∞, tal que: { x. k −x∗. tk. } → u.. BI BL. O equivalentemente: {xk } → x∗ en la dirección u; si y sólo si;. {. (xk −x∗ ) ∥xk −x∗ ∥. }. →. u . ∥u∥. Definición 1.7.3 Sea f : Rn → R una función. Sean x ∈ Rn y y ∈ Rn . La derivada direccional generalizada de f en x en la dirección v, denotado por f 0 (x, v), se define por: f 0 (x, v) = lı́m sup y→x λ↓0. f (y + λv) − f (y) . λ. 9 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(21) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Definición 1.7.4 Sea f : Rn → R una función. Sea x ∈ Rn . El gradiente generalizado de f en x, denotado por ∂f (x), es un conjunto no vacío definido por: ∂f (x) = {ξ ∈ Rn : f 0 (x, v) ≥ ⟨v, ξ⟩,. ∀ v ∈ Rn }.. SG RA DO. Observación 1.7.1 Si f : W ⊆ Rn → R, es una función de clase C 1 en un punto x∗ ∈ W (f ∈ C 1 ). Entonces ∂f (x∗ ) = ∇f (x∗ ).. Definición 1.7.5 Sea f : W ⊆ Rn → R una función. El gradiente generalizado de f en x∗ en la dirección de u, denotado por ∂u f (x∗ ) es el conjunto de vectores v tal que, para cada uno de ellos existen sucesiones {xk } y {v k } tales que: {xk } → x∗ en. . v : P ara cada v, existen sucesiones {xk } y {v k } tales que : . ∗. {x } → {x } en la dirección u, {v } → v, con v ∈ ∂f (x ), k. DE. ∂u f (x∗ ) =. ∀ k. Esto es:. PO. la dirección u, {v k } → v, y v k ∈ ∂f (xk ),. k. k. k. ∀k . .. Definición 1.7.6 Sea f : W ⊆ Rn → R una función. Sea v ∗ ∈ ∂u f (x∗ ). La. TE CA. derivada direccional inferior de segundo orden de f en x∗ y v ∗ en la dirección u, f−′′ (x∗ , v ∗ , u) es definido por:. IO. f−′′ (x∗ , v ∗ , u) = lı́m ı́nf k→∞. (v k − v ∗ )t (xk − x∗ ) , (tk )2. si se cumple que, para toda tripleta de sucesiones {xk }, {v k }, {tk }, se tiene:. BI BL. i) tk > 0, ∀k {. ii). (xk −x∗ ) tk. }. y. {xk } → x∗. →u. iii) {v k } → v ∗ , con v k ∈ ∂f (xk ), ∀ k.. Definición 1.7.7 Sea f : W ⊆ Rn → R una función. La función f es regular en x∗ , si existe la derivada direccional f ′ (x∗ , v), ∀ v ∈ Rn y f ′ (x∗ , v) = f 0 (x∗ , v), ∀ v ∈ Rn ; donde f 0 (x∗ , v) es la derivada direccional generalizada. 10 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Definición 1.7.8 Sea f : W ⊆ Rn → R una función. La función f es semisuave { } en x∗ , si la sucesión (v k )t u converge, cuando {xk } → x∗ , en la dirección u y v k ∈ ∂f (xk ), ∀ k. Lema 1.7.1 Sea f : W ⊆ Rn → R una función. Suponga que f es una función. SG RA DO. semisuave y regular sobre el conjunto abierto y convexo W .. Suponga también que f−′′ (x∗ , v ∗ , u) ≥ 0, para todo triple (x∗ , v ∗ , u) con x∗ ∈ W , u ∈ Rn , v ∗ ∈ ∂u f (x∗ ). Entonces, f es convexa sobre W .. Definición 1.7.9 Sea f : X → R una función. Sea X un espacio de Banach y sea X ∗ el espacio dual de X de las funcionales lineales continuas sobre X. Se adopta. PO. la convención de usar ⟨ξ, v⟩ ó ⟨v, ξ⟩ para ξ(v).. El gradiente generalizado de f en x, denotado por ∂f (x), es un subconjunto. DE. de X ∗ dado por:. TE CA. ∂f (x) = {ξ ∈ X ∗ / f 0 (x; v) ≥ ⟨ξ, v⟩;. ∀ v ∈ X}. Se denota por ∥ξ∥∗ a la norma en X ∗ ∥ξ∥∗ = sup{⟨ξ, v⟩/ v ∈ X,. ∥v∥ ≤ 1}. IO. Definición 1.7.10 Sean X e Y espacios de Banach y sea F : X → Y una apli-. BI BL. cación. La derivada direccional usual de F en x en la dirección de v ∈ X, es dado por:. F ′ (x; v) = lı́m λ↓0. F (x + λv) − F (x) , λ. cuando el limite existe.. Definición 1.7.11 Sean X e Y espacios de Banach. Sea L(X, Y ) el espacio de las funcionales lineales continuas de X a Y y sea F : X → Y una aplicación, F admite. 11 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. una derivada estricta en x, si existe un elemento de L(X, Y ) denotado por Ds F (x), tal que para cada v ∈ X, cumple lo siguiente: F (x′ + λv) − F (x′ ) x′ →x λ. (Ds F (x))(v) = ⟨Ds F (x), v⟩ = lı́m λ↓0. SG RA DO. Note que, Ds F (x) es llamada una “Derivada estricta del tipo-Hadamard”. Teorema 1.7.1 Sean fi : Rn → R; i = 1, 2, . . . , m y E : Rm → R. ∀ x ∈ Rn . Defina:. Y (x) = (f1 (x), f2 (x), . . . , fm (x)),. F (x) = E(Y (x)).. Si fi , ∀ i = 1, 2, . . . , m son funciones semisuaves en x ∈ Rn y E es una función. 1.8.. PO. semisuave en Y (x) ∈ Rm . Entonces, F es semisuave en x.. Reglas de Cadena. DE. Sea X un espacio de Banach, y. TE CA. f = g ◦ h,. donde, h : X → Rn y g : Rn → R, son funciones dadas. Las funciones componentes de h son denotadas por hi (i = 1, . . . , n). Se identifica (Rn )∗ con Rn . Entonces un elemento α de ∂g, puede considerarse como. IO. un vector n-dimensional α = (α1 , . . . , αn ).. BI BL. Teorema 1.8.1 (Regla de la cadena I) Sea, { n } ∑ ∂f (x) ⊂ co αi ξi : ξi ∈ ∂hi (x), α ∈ ∂g (h(x)) , i=1. (donde, co denota la envoltura convexo cerrado-debil), y la igualdad cumple bajo. cualquiera de las siguientes hipótesis adicionales: i) g es regular en h(x), cada hi es regular en x, y todo elemento α de ∂g (h(x)) tiene componentes no negativas. (En este caso, de esto sigue que f es regular en x). 12 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. ii) g es estrictamente diferenciable en h(x) y n = 1. (En este caso, el co es superfluo). iii) g es regular en h(x) y h es estrictamente diferenciable en x. (En este caso,. SG RA DO. de esto sigue que f es regular en x, y el co es superfluo). Teorema 1.8.2 (Regla de la cadena II) Sean X e Y espacios de Banach. Sea F : X → Y una aplicación y sea g : Y → R una función. i). a) Si F es estrictamente diferenciable en x y g es lipschitz cerca de F (x). Entonces, f = (g ◦ F ) es lipschitz cerca de x.. ii). PO. b) ∂f (x) ⊂ ∂ g (F (x)) ◦ Ds F (x). • La igualdad en la inclusion cumple si g(o − g)es regular en F (x), en tal. DE. caso f (o − f ) es también regular en x.. • La igualdad en la inclusion también cumple si F aplica cualquier vecin-. TE CA. dad de x, en una vecindad de F (x) la cual es un conjunto denso. Consecuencias:. (∗1 ) El significado de i − (b), es que todo elemento z ∈ ∂f (x), puede representarse. IO. como una composición de una aplicación ξ ∈ ∂g(F (x))y Ds F (x).. BI BL. Esto es:. z = ξoDs F (x),. donde. Ds F( x). ξ. |X −→ {zY −→ R} z=ξ◦Ds F (x). (∗2 ) Además, ⟨z, v⟩ = ⟨ξ, Ds F (x)(v)⟩;. ∀ v ∈ X,. donde; ⟨ , ⟩ representa a la dualidad. 13 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. (∗3 ) Si ∗ denota el adjunto, podemos escribir i − (b), en la forma equivalente: ∂f (x) ⊂ [Ds F (x)]∗ [∂g(F (x))] = ∂g(F (x)) ◦ Ds F (x).. Una Clase Especial de Funciones. SG RA DO. 1.9.. Sea W ⊆ Rn un conjunto abierto y sea x∗ ∈ W . Sea f : W → R una función de la forma: f (x) =. m ∑. gi (hi (x));. i=1. ∀ x ∈ W,. (∗). donde, las funciones gi y hi son como siguen:. PO. hi : W → R tal que:. ∀ x ∈ W.. DE. hi (x) = máx{hij (x)/ 1 ≤ j ≤ pi };. ∀ i = 1, . . . , m; son funciones que van de W hacia. Además, hi1 , hi2 , . . . , hipi ,. TE CA. R y de clase C 2 sobre W . gi : R → R,. ∀ i = 1, . . . , m, son funciones de clase C 2 sobre una vecindad. (en R) del conjunto hi (W ).. IO. Además, sea i = 1, . . . , m y sea x ∈ W , se define dos conjuntos:. BI BL. Ii (x) = {j/ hi (x) = hij (x),. 1 ≤ j ≤ pi }. Si (x) = {wi = (wi1 , wi2 , . . . , wipi ) ∈ Rpi / wij ≥ 0, ∀ j; pi ∑. wij = 1; wij = 0 si j ∈ / Ii (x)}.. j=1. También, sea v ∈ ∂f (x∗ ) se define el conjunto: w = (w1 , . . . , wm ) : wi ∈ Si (x∗ ); ∀ i = 1, m y pi S(x∗ , v) = m ∑ ∑ v= gi′ (hi (x∗ ))wij ∇hij (x∗ ). . .. i=1 j=1. 14 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Teorema 1.9.1 Suponga que f es como en (∗), con gi′ (hi (x∗ )) ≥ 0, ∀ i = 1, . . . , m. Sea u ∈ Rn y v ∗ ∈ ∂u f (x∗ ). Entonces, f ′′ (x∗ , v ∗ , u) existe y se expresa por: ′′. ∗. ∗. f (x , v , u) =. m ∑. gi′′ (hi (x∗ ))[h′i (x∗ , u)]2. i=1. }. wij gi′ (hi (x∗ ))H[hij (x∗ )]u.u/w ∈ S(x∗ , v ∗ ) .. i=1 j=1. 1.10.. SG RA DO. + máx. { m p i ∑∑. Problemas de Programación No Lineal. Dado el problema: f (x). PO. mı́n. x∈S⊆Rn. s.a : gi (x) ≤ bi ,. (Pe). i = 1, . . . , m,. DE. donde f y gi , para i = 1, . . . , m son funciones de valor real definidas sobre S ⊆ Rn , y si alguna de ellas es no lineal, se dice que (Pe) es un problema de optimización no. TE CA. lineal restringido. Aquí,. f se llama función objetivo. S = {x ∈ Rn : gi (x) ≤ bi ;. i = 1, . . . , m} se llama región factible.. IO. x ∈ S, se llama solución factible.. BI BL. Si x̄ ∈ S tal que f (x̄) ≤ f (x),. ∀ x ∈ S. Entonces, x̄ ∈ S se llama solución. óptima.. 1.11.. Optimización Convexa. Cuando en (Pe) f y gi ,. i = 1, . . . , m son funciones convexas, se dice que, (Pe). es un problema de optimización convexa.. 15 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Corolario 1.11.1 Sea f : S ⊆ Rn → R una función diferenciable en x∗ ∈ S. Si x∗ es un mínimo local. Entonces, ∇f (x∗ ) = 0. Teorema 1.11.1 Cualquier mínimo local en un problema de optimización convexa. SG RA DO. es un mínimo global. Observación 1.11.1. Si alguna de las funciones f ó gi , i = 1, . . . , m es no diferenciable. Entonces, el problema de optimización convexa (Pe) se llama no diferenciable.. Si gi , ∀ i = 1, . . . , m son funciones convexas. Entonces, S se llama región. Optimización Monótona. DE. 1.12.. PO. factible convexa.. Un problema de optimización no lineal monótona (restringida) se escribe de la. TE CA. forma: máx. x∈X⊆Rn. f (x). s.a : gi (x) ≤ bi ,. i = 1, . . . , m,. (P ). con X = {x ∈ Rn : ℓj ≤ xj ≤ uj ; j = 1, . . . , n},. IO. donde, f y gi son funciones crecientes y continuas sobre X.. BI BL. En este problema las funciones f y gi no necesariamente son convexas o separables y además debido a la monotonicidad de f y de las funciones gi , las soluciones óptimas de (P ), siempre se localizan sobre la frontera de la región factible. El problema (P ) puede tener multiples soluciones óptimas locales sobre la frontera, debido a que f no necesariamente es convexa y los gi no necesariamente son convexas. Por tanto, en este caso (P ) es un problema de optimización Global. Monotonicidad y convexidad están ambas estrechamente relacionadas pero con propiedades diferentes en el análisis convexo clásico de una función real, una de 16 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. las preguntas interesantes es “si una función monótona no convexa puede transformarse en una función convexa vía ciertas transformaciones de variable”. Es sabido que una transformación lineal no cambia la convexidad de una función real, por tanto es necesario recurrir a transformaciones no lineales, para convertir una función. BI BL. IO. TE CA. DE. PO. SG RA DO. monótona no convexa en una función convexa.. 17 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. SG RA DO. Capítulo 2 Materiales y Métodos.. Introducción. DE. 2.1.. PO. Monotonicidad y Convexidad. Los problemas de optimización no lineal monótona pueden ser formulados de la. TE CA. siguiente forma: máx. x∈X⊆Rn. f (x). s.a : gi (x) ≤ bi ;. i = 1, . . . , m,. (P ). IO. con X = {x ∈ Rn : ℓj ≤ xj ≤ uj ; j = 1, . . . , n} = [ℓ, u],. donde f : X ⊆ Rn → R y todas las funciones gi : X ⊆ Rn → R son funciones. BI BL. crecientes y continuas sobre X = [ℓ, u], con ℓ = (ℓ1 , . . . , ℓn )t ∈ Rn y u = (u1 , . . . , un )t ∈ Rn .. Las funciones f y gi “no necesariamente son convexas o separables”. Debido a la monotonicidad de f y de las funciones gi , las soluciones óptimas de. (P ) siempre se encuentran en la frontera de la región factible. Maximizar una función decreciente sujeto a restricciones decrecientes puede formularse como el problema (P ), considerando que si f es creciente, −f es decreciente 18 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. y que si gi es creciente, −gi es decreciente. “Debido a que pueden existir multiples soluciones óptimas locales sobre la frontera, el problema (P ) es un problema de optimización global” de una estructura especial. En aplicaciones reales la monotonicidad de las funciones aparecen de forma natural. SG RA DO. cuando se consideran problemas con estructuras propias. Por ejemplo, en problemas de asignación de recursos, ver [11] la utilidad que se obtiene es mayor cuando la cantidad de recursos asignados crece. En la confiabilidad de redes, la confiabilidad total del sistema, el peso, volumen y costo son crecientes, cuando la confiabilidad en los subsistemas también crece ver [27].. En el presente capítulo el objetivo es la convexificación de funciones monótonas,. PO. que consiste en convertir una función monótona no convexa en una función convexa mediante transformaciones de variables no lineales.. Además cabe mencionar que dicho proceso de convexificación involucra a la función. DE. de transformación y a la transformación de variable.. Monotonicidad y Convexidad. TE CA. 2.2.. La monotonicidad y la convexidad de una función real son dos propiedades diferentes pero que están estrictamente relacionados en el aspecto del análisis con-. IO. vexo clásico.. BI BL. Una de las interrogantes más interesantes es “si una función monótona no convexa puede o no ser transformada en una función convexa mediante transformaciones de variables”. Además como las transformaciones lineales no cambian la convexidad de una función real, se debe utilizar transformaciones no lineales para convertir una función monótona no convexa en una función convexa.. 19 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 2.2.1.. Convexificación de una Función Monótona Univariable. Teorema 2.2.1 Sea f : S ⊂ R → R una función estrictamente creciente y 2 veces diferenciable. Sea t : R → R una función estrictamente monótona y convexa. Se. convexa; si y sólo si,. ∀ x ∈ R. Entonces, g es una función. SG RA DO. define: g : R → R tal que: g(x) = f (t(x)),. t′′ (x) f ′′ (t(x)) ≥ ; ∀ x. − [t′ (x)]2 f ′ (t(x)) Prueba.. (2.1). ⇒] Si g es una función convexa. Demostrar que:. PO. t′′ (x) f ′′ (t(x)) ≥− ′ ; ∀ x. [t′ (x)]2 f (t(x)) Por hipótesis:. diferenciable.. ∀ x ∈ R y f es 2 veces diferenciable. Entonces g es 2 veces. DE. Como g(x) = f (t(x));. TE CA. Como f es una función estrictamente creciente en S. Entonces, f ′ (s) > 0, ∀ s ∈ S. Pero t(x) ∈ S. Entonces, f ′ (t(x)) > 0. Como t es una función estrictamente monótona en R. Entonces t′ (x) ̸= 0, ∀ x ∈ R. Entonces, [t′ (x)]2 > 0,. ∀ x ∈ R.. IO. Como g es una función convexa en R ⇔ g ′′ (x) ≥ 0,. ∀ x ∈ R.. BI BL. Además,. g ′ (x) = f ′ (t(x))t′ (x) g ′′ (x) = f ′′ (t(x))[t′ (x)]2 + f ′ (t(x)).t′′ (x).. Reemplazando g ′′ (x), se tiene: f ′′ (t(x))[t′ (x)]2 + f ′ (t(x)).t′′ (x) ≥ 0 t′′ (x)f ′ (t(x)) ≥ −f ′′ (t(x))[t′ (x)]2 20 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. t′′ (x) f ′′ (t(x)) ≥ − [t′ (x)]2 f ′ (t(x)) ⇐] Sea: t′′ (x) f ′′ (t(x)) ≥ − [t′ (x)]2 f ′ (t(x)). Como: [t′ (x)]2 > 0 y f ′ (t(x)) > 0. Entonces,. SG RA DO. Demostrar que, g es una función convexa.. t′′ (x)f ′ (t(x)) ≥ −f ′′ (t(x))[t′ (x)]2. t′′ (x)f ′ (t(x)) + f ′′ (t(x))[t′ (x)]2 ≥ 0 | {z } g ′′ (x) ≥ 0,. ∀ x ∈ R.. PO. ∴ g es una función convexa en R.. En este teorema, la desigualdad (2.1) viene a ser la condición del “cambio de. DE. variable o transformación de dominio” que debe tener una transformación de variable no lineal t, para convexificar una función f de una sola variable, creciente y 2. 2.2.2.. TE CA. veces diferenciable.. Convexificación de una Función Monótona Multivaria-. IO. ble. Sea f : X ⊆ Rn → R una función estrictamente creciente y dos veces diferen-. BI BL. ciable, con X = [α, β] = {x ∈ Rn / α ≤ x ≤ β}, donde α y β ∈ Rn con 0 < α < β.. Además, sea t : Rn → Rn una aplicación inyectiva. Se define la función g : Y t ⊆ Rn → R, tal que g(y) = f (t(y)). Donde, Dom(g) = Y t = t−1 (X) = {y = (y1 , . . . , yn )t / y = t−1 (x),. ∀ x ∈ X}.. Sean, γ = mı́n{dt H[f (x)]d/ x ∈ X, µ = mı́n{. ∂f / x ∈ X, ∂xj. ∥d∥2 = 1}. j = 1, . . . , n}.. 21 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Sean, α = (α1 , . . . , αn ) ∈ Rn y β = (β1 , . . . , βn ) ∈ Rn . Como, 0 < α < β ⇔ 0 < αi < βi ;. ∀ i = 1, . . . , n.. Se sabe que : X = [α, β] = {x ∈ Rn / α ≤ x ≤ β} ∀ i = 1, n}. SG RA DO. = {x ∈ Rn / αi ≤ xi ≤ βi ;. = {x ∈ Rn / x = (x1 , . . . , xn ) ∈ ([α1 , β1 ] × . . . × [αn , βn ])} = {x ∈ R / x ∈ n. n ∏. [αi , βi ]} =. i=1. Luego, X = [α, β] =. n ∏. n ∏. [αi , βi ].. i=1. [αi , βi ] es un conjunto convexo y compacto.. i=1. PO. A continuación se tiene el siguiente teorema sobre convexificación.. Teorema 2.2.2 Sea f una función dos veces diferenciable y estrictamente creciente sobre X = [α, β] y µ > 0. Suponga que t(y) = (t1 (y1 ), . . . , tn (yn )) es una. monótona.. TE CA. Si t satisface la condición:. DE. aplicación separable y cada ti : R → R es 2 veces diferenciable y estrictamente. t′′j (yj ) γ ≥− ; ′ 2 [tj (yj )] µ. ∀ yj ∈ Yjt = t−1 j ([αj , βj ]),. j = 1, . . . , n.. (2.2). IO. Entonces, g(y) es una función convexa sobre cualquier subconjunto convexo de Y t . Similarmente, una función estrictamente decreciente f sobre X, también. BI BL. puede convertirse en una función convexa mediante un cambio de variable dado por la condición: t′′j (yj ) γ ≤ − ; ′ [tj (yj )]2 µ. ∀ yj ∈ Yjt ,. j = 1, . . . , n.. Prueba. 1. Si f es convexa, considerando t(y) = I(y) = y, y definiendo g(y) = f (t(y)) = f (y);. y ∈ Y t , se obtiene g convexa. 22. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. 2. Si f no es convexa. Como Y t = t−1 (X) , ∀ y ∈ Y t ,. ∀ x ∈ X, se tiene:. y = t−1 (x) 7−→ t(y) = t(t−1 (x)) = x 7−→ x = t(y).. SG RA DO. De donde se tiene: (x1 , . . . , xn ) = (t1 (y1 ), . . . , tn (yn )).. PO. Usando la propiedad de igualdad de pares ordenados obtenemos: x1 = t1 (y1 ) .. ⇒ xi = ti (yi ); ∀ i = 1, . . . , n. . x = t (y ) n n n Así,. DE. g : Y t ⊆ Rn −→ R y 7−→ g(y),. TE CA. g es una función 2 veces diferenciable sobre un conjunto convexo Y t . Entonces es suficiente demostrar que, la matriz Hessiana de g es semidefinida positiva. IO. en cada punto de Y t . Esto es: ∀ y ∈ Rn ,. ∀ ȳ ∈ Y t :. y t H[g(ȳ)]y ≥ 0.. BI BL. Por otro lado:. g = f (t(y)) ∂g ∂ d = f (t1 , . . . , tn ). ti (yi ) ∂yi ∂ti dyi ∂f ′ ∂g = .t (yi ) ∂yi ∂ti i. (*). ] [ ∂ 2g ∂ ∂f ′ = .t (yi ) ∂yi2 ∂yi ∂ti i 23. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. [. ( )] ∂ ∂f ∂f d ′ = .t′i (yi ) + . t (yi ) ∂yi ∂ti ∂ti dyi i ( ) ∂ ∂f ∂f ′′ = .t′i (yi ).t′i (yi ) + .t (yi ) ∂ti ∂ti ∂ti i ∂f ′′ ∂ 2f ′ [t (y )]2 + .t (yi ) 2 i i ∂ti ∂ti i ] [ 2 ∂ 2g ∂ f ∂f t′′i (yi ) ′ . t′ (yi ) = ti (yi ) + ∂yi2 ∂t2i ∂ti (ti (yi ))2 i. SG RA DO. =. (**) (. ∂g ∂yi. ). [ ] [ ( )] ∂ ∂f ′ ∂ ∂f ∂f d ′ = .ti (yi ) = t′i (yi ) + t (yi ); i ̸= j ∂yj ∂ti ∂yj ∂ti ∂ti dyj i ( ) ∂f d ∂ ∂f = .t′j (yj ).t′i (yi ) + [r(yi )] ∂tj ∂ti ∂ti dyj =. ∂2f ′ ∂f .tj (yj )t′i (yi ) + ·0 ∂ti ∂tj ∂ti. =. ∂ 2f ′ .t (yj )t′i (yi ) + 0 ∂ti ∂tj j. DE. PO. ∂ ∂yj. =. ∂ 2f ′ .t (yj )t′i (yi ) ∂ti ∂tj j. Ahora, sea:. TE CA. ∂ 2g ∂ 2 ft ′ = t′i (yi ). .t (yj ); ∂yi ∂yj ∂ti ∂tj j. i ̸= j.. IO. A(ȳ) = diag(t′1 (y1 ), . . . , t′n (yn )) ( ) ∂f t1′′ (y1 ) ∂f t′′n (yn ) B(x) = diag . ,..., . ∂x1 [t′1 (y1 )]2 ∂xn [t′n (yn )]2. (2.3) (2.4). BI BL. Expresando en forma matricial, se tiene: . A(ȳ) = . t′1 (y1 ) . . . . . . .. . t′2 (y2 ) .. .. . . 0. .... 0 .. . .. .. . . . t′n (yn ). n×n. 24 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. B(x) = . . t′′ (y ) ∂f . 1 1 ∂x1 [t′1 (y1 )]2. .... .... .. . .. .. t′′ (y ) ∂f . 2 2 ∂x2 [t′2 (y2 )]2. 0. .... ... ∂2g. ∂y2 ∂y1. ∂y22. ∂y2 ∂y3. ∂2g ∂y3 ∂y1. ∂2g ∂y3 ∂y2. ∂2g ∂y32. .... ∂2g ∂y3 ∂yn. ∂2g ∂yn ∂y3. .... ∂2g 2 ∂yn. .. .. ]. t′1 (y1 ). 2f t′1 (y1 ) ∂t∂ ∂t t′2 (y2 ). t′2 (y2 ). [. 1. ∂2 f ∂t2 2. +. 1. 2 t′′ (y ) ∂f . 2 2 ∂t2 [t′ (y )]2 2 2. ]. ∂y2 ∂yn. ∂2 f ∂t1 ∂t3 ∂2 f ∂t2 ∂t3 ∂2 f ∂t2 3. ... .... TE CA. ∂2 f ∂t1 ∂t2 ∂2 f ∂t2 2 ∂2 f ∂t3 ∂t2. .... ∂2 f ∂t1 ∂tn ∂2 f ∂t2 ∂tn ∂2 f ∂t3 ∂tn. ∂2 f ∂tn ∂t2. ∂2 f ∂tn ∂t3. .... {z. ∂2 f ∂t2 n. . n. t′2 (y2 ). . . + . ∂f ∂t1. .... .. t′′ 1 (y1 ) [t′1 (y1 )]2. . . .. }. t′n (yn ). [. . . . ∂2 f ∂t2 n. |. t′′ (y ) ∂f + ∂t . ′n n 2 n. [tn (yn )]. ]. . t′n (yn ). n×n. .... .... 0 . . .. t′′ (y ) ∂f . 2 2 ∂t2 [t′ (y )]2 2 2. . . .. . .... .. . . .. .. ... {z B(x). H[f (x)]. . 2 t′ (yn ) 1 n n 2f t′2 (y2 ) ∂t∂ ∂t t′ (yn ) 2 n n. f t′1 (y1 ) ∂t∂ ∂t. .... 0. n×n. n×n. .... 2. . . .... 2f t′n (yn ) ∂t∂ ∂t t′2 (y2 ). . . .. ∂2 f ∂tn ∂t1. .... ∂2g. . . .. 2f t′n (yn ) ∂t∂ ∂t t′1 (y1 ). ∂2 f ∂t2 1 ∂2 f ∂t2 ∂t1 ∂2 f ∂t3 ∂t1. .... ∂2g ∂y1 ∂yn. ∂f ∂tn. .. t′′ n (yn ) [t′n (yn )]2. . BI BL. H[g(ȳ)] = A(ȳ)[H[f (t(y))] + B(x)]A(ȳ) = A(ȳ)[H[f (x)] + B(x)]A(ȳ) H[g(ȳ)] = A(ȳ)[H[f (x)] + B(x)]A(ȳ). Sea:. C(x) = H[f (x)] + B(x);. ∀x∈X. H[g(ȳ)] = A(ȳ)C(x)A(ȳ). Ahora, se tiene que demostrar que: C(x) = H[f (x)] + B(x);. . n×n } . IO. Luego,. ∂2g. . . . n. H[g(ȳ)] = A(ȳ). | . ∂2g. ∂2g ∂yn ∂y2. n×n. SG RA DO. t′′ (y ) ∂2 f ∂f + ∂t . ′1 1 2 [t1 (y1 )] ∂t2 1 1 2f t′2 (y2 ) ∂t∂ ∂t t′ (y1 ) 2 1 1. ∂2g ∂y1 ∂y3. PO. ′ t1 (y1 ) H[g(ȳ)] = . [. ∂2g ∂y1 ∂y2. ∂2g ∂yn ∂y1. . ′′ ∂f . tn (yn ) ∂xn [t′n (yn )]2. ∂2g ∂y12. DE. . .. .... Luego, combinando (2.3) y (2.4), se obtiene: H[g(ȳ)] = . 0 .. . .. .. ∀ x ∈ X, es una matriz semi definida positiva. 25. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/. .A(ȳ)..
(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Sea la esfera unitaria en Rn : S n = {d ∈ Rn / ∥d∥2 = 1}. Como f es 2 veces diferenciable en X. Entonces f es 2 veces continua en X. Luego, por la doble diferenciabilidad y continuidad de f en X, se tiene que todos. SG RA DO. los elementos de la matriz Hessiana existen y son finitos, por tanto γ es un número finito. Además,. γ = mı́n{dt H[f (x)]d/ ∀ x ∈ X, ∀ d ∈ S n } ⇒ dt H[f (x)]d ≥ γ, y µ = mı́n{. ∂f ∂f / x ∈ X, ∀ j = 1, 2, . . . , n} ⇒ ≥ µ; ∂xj ∂xj. ∀ d ∈ S n.. ∀ j = 1, n.. Basta probar:. Sea y =. ∥y∥y , ∥y∥. ∀ y ∈ Rn , y ̸= 0, y d =. TE CA. Luego,. ∀ y ∈ Rn ,. ∀ x ∈ X.. DE. y t C(x)y ≥ 0;. PO. Para demostrar que C(x) es semi definida positiva en cada punto de X.. y . ∥y∥. Entonces d ∈ S n . Entonces y = ∥y∥d.. y t C(x)y = (∥y∥d)t C(x)(∥y∥d) = ∥y∥dt C(x)∥y∥d = ∥y∥2 dt C(x)d. Entonces y t C(x)y = ∥y∥2 dt C(x)d ≥ 0 si. dt C(x)d ≥ 0. Entonces solo falta de-. IO. mostrar que:. dt C(x)d ≥ 0;. ∀ d ∈ S n,. ∀ x ∈ X.. BI BL. Para cualquier d ∈ S n , se tiene que: dt C(x)d = dt [H[f (x)] + B(x)]d = dt H[f (x)]d + dt B(x)d ≥ γ + dt B(x)d dt C(x)d ≥ γ + dt B(x)d.. Pero:. ( t. d B(x)d = (d1 , . . . , dn ) diag. ∂f t′′1 (y1 ) ∂f t′′n (yn ) , . . . , ∂x1 [t′1 (y1 )]2 ∂xn [t′n (yn )]2. ) . d1 .. .. . dn 26 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(38) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. = d1 dt B(x)d =. ∂f t′′1 (y1 ) ∂f t′′n (yn ) dn d + . . . + d 1 n ∂x1 [t′1 (y1 )]2 ∂xn [t′n (yn )]2. n ∂f t′′1 (y1 ) 2 ∂f t′′n (yn ) 2 ∑ ∂f t′′j (yj ) 2 d = d + . . . + d. ∂x1 [t′1 (y1 )]2 1 ∂xn [t′n (yn )]2 n j=1 ∂xj [t′j (yj )]2 j. Luego,. n ∑ ∂f t′′j (yj ) 2 d C(x)d ≥ γ + d. ∂xj [t′j (yj )]2 j j=1. SG RA DO. t. Como tj : R → R es estrictamente monótona. Entonces t′j (yj ) ̸= 0; Entonces t′j (yj ) > 0; Ahora sean: ∂f ∂xj. δ=. j = 1, n.. t′′ j (yj ) / [t′j (yj )]2. ≥ µ ; µ > 0;. δ≥0. y. δ≥σ;. σ=. δ ≥ 0,. σ ∈ R.. Luego, se tienen:. σ∈R. ∂f δ ≥ µσ. ∂xj. PO. ∴. −γ / µ. j = 1, n.. DE. n n ∑ ∑ ∂f ∂f 2 2 2 δ dj ≥ µσ dj ⇒ δ dj ≥ µ σ d2j . ∂xj ∂x j j=1 j=1. Luego,. n n n ∑ ∑ ∑ ∂f t′′j (yj ) 2 ∂f 2 d C(x) d ≥ γ + d =γ + .δdj ≥ γ + µσ d2j ′ 2 j ∂x [t (y )] ∂x j j j j j=1 j=1 j=1. TE CA. t. dt C(x) d ≥ γ +. n ∑. µ σ d2j = γ +. IO. j=1. n ∑. −γ d2j = γ − γ. j=1. n ∑. d2j = γ − γ(1) = 0.. j=1. BI BL. Por tanto,. dt C(x) d ≥ 0; ∀ d ∈ S n , ∀x ∈ X.. O equivalentemente:. Además, sean: y ∈ Rn ,. y t C(x)y ≥ 0;. ∀ y ∈ Rn ,. ∀ x ∈ X.. ȳ ∈ Y t se tiene: y t H[g(ȳ)]y = y t A(ȳ)C(x)A(ȳ)y. 27 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(39) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. ′ ′ ′ ′ = (y1 , . . . , yn )1×n [diag(t1 (y1 ), . . . , tn (yn ))]n×n .C(x).[diag(t1 (y1 ), . . . , tn (yn ))]n×n . y1 .. . yn. ′ y1 t1 (y1 ) .. = [y1 t′1 (y1 ), . . . , yn t′n (yn )]1×n C(x) . yn t′n (yn ) ∗ y1 . . = [y1∗ , . . . , yn∗ ]1×n C(x) . ∗ yn n×1. . n×1. . SG RA DO. . . n×1. PO. y t H[g(ȳ)]y = (y ∗ )t C(x)y ∗ .. Como C(x) es semidefinida positiva en cada punto de X. Entonces para: x ∈ X ⇒ (y ∗ )t C(x)y ∗ ≥ 0.. y. DE. y ∗ ∈ Rn Luego,. TE CA. y t H[g(ȳ)]y ≥ 0;. ∀ y ∈ Rn ,. ∀ ȳ ∈ Y t .. Corolario 2.2.1 Sean, p1 = máx{0, − µγ } y p2 = máx{0, − β̄γ − 1}, donde µ β̄ = mı́n βj . 1≤j≤n. IO. Entonces,. 1 p. ln(1 − y1 ), con tj (yj ) =. BI BL. (i) La aplicación t(y) =. 1 p. ln(1 −. 1 ); yj. p > 0, j = 1, n.. Satisface la condición 2.2, del teorema 2.2.2, cuando p > p1 . −1/p. (ii) La aplicación t(y) = y −1/p , con tj (yj ) = yj. ; p > 0, j = 1, n.. Satisface la condición 2.2, del teorema 2.2.2, cuando p > p2 .. Demostración: (i). 1. tj (yj ) = t′j (yj ) =. 1 p. ln(. 1 d p dyj. yj −1 ); yj. ln(. p > 0, j = 1, n. yj −1 ) yj. =. 1 yj . d (1 p (yj−1 ) dyj. −. 1 ) yj. 28 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(40) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. = t′j (yj ) = 2. t′′j (yj ) =. 1 yj . p (yj−1). −. d (1) dyj yj. =. 1 yj .1 p (yj−1) yj2. =. 1 p(yj −1)yj. 1 p(yj2 −yj ) 1 d [ 1 ] p dyj yj2 −yj. 1 d (yj2 p dyj. =. − yj )−1 = p1 . − (yj2 − yj )−2 dydj (yj2 − yj ) = − p1 (yj2 − yj )−2 (2yj − 1) (2y −1). (2y −1). j j 1 = − p1 (y2 −y 2 = − p y 2 .(y −1)2 j) j. t′′j (yj ) =. −1 (2yj −1) p yj2 (yj −1)2. 3. [t′j (yj )]2 = [t′j (yj )]2 =. 1 p2 (yj2 −yj )2. =. 1 p2 yj2 (yj −1)2. 1 . p2 yj2 (yj −1)2. Luego, 1 [tj′ (yj )]2. =−. 1 (2yj − 1) 2 2 .p yj (yj − 1)2 = −p(2yj − 1) 2 2 p yj (yj − 1) 1. [t′j (yj )]2. DE. t′′j (yj ).. PO. t′′j (yj ).. Se tiene:. j. SG RA DO. j. {. = −p(2yj − 1).. TE CA. γ p1 = máx 0, − µ. }. γ ⇒ p1 ≥ − . µ. Como,. p > p1 ≥ −. IO. Pero,. (. 1 1− yj. ). >0. γ γ ⇒p>− . µ µ. 1 < 1 ⇒ yj < 0 ∨ yj > 1. yj. ⇒. BI BL. Tomando,. yj < 0 ⇒ −2yj > 0. ⇒. (−2yj + 1) > 1.. Luego,. (1 − 2yj ) > 1 γ µ γ (1 − 2yj )p > − . µ p>−. 29 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(41) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Así, t′′j (yj ) γ = p(1 − 2yj ) > − ′ 2 [tj (yj )] µ ∴. t′′j (yj ) γ > − ; ′ [tj (yj )]2 µ. ∀ yj ∈ Yjt = ⟨−∞, 0⟩. (ii) ⇒. (p+1) 1 ′ tj (yj ) = − (yj )− p p ′. ⇒. [tj (yj )]2 =. t′j (yj ) = ′′. 2(p+1) 1 − p (y ) j p2. 2(p+1) p. =. (2p+1) p+1 (yj )− p 2 p 1 = 2(p+1) p2 (yj ) p. tj (yj ) =. 1 . [tj (yj )]2 ′. PO. p2 (yj ). d (yj )−1/p dyj. SG RA DO. −1/p. tj (yj ) = yj. Luego, ′′. 2(p+1) (2p+1) tj (yj ) (p + 1) − p 2 p (y ) .p (y ) = (p + 1)(yj )1/p . = j j ′ 2 2 p [tj (yj )]. DE. ′′. tj (yj ) √ = (p + 1) p yj . ′ 2 [tj (yj )]. TE CA. De donde se tiene:. { } β̄γ p2 = máx 0, − −1 µ. p2 > −. β̄γ − 1. µ. ( ) β̄γ −γ p > p2 > − − 1 = β̄ −1 µ µ ( ) ( ) −γ −γ p > β̄ −1 ⇒ (p + 1) > β̄ . µ µ. BI BL. IO. y. ⇒. Por otro lado:. yj > 0 ⇒. √ p. yj > 0,. p > 0.. Además: −1/p. yj ∈ t−1 j ([αj , βj ]) ⇒ αj ≤ tj (yj ) ≤ βj ⇒ αj ≤ yj 1 ≤ βj √ p y j. ⇒. √ βj p yj ≥ 1;. ≤ βj. ∀ j = 1, n.. 30 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
(42) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación. Como β̄ = mı́n βj , Entonces j=1,n. √ β̄ p yj ≥ 1.. Por otro lado, f es una función no convexa definida en el conjunto convexo X =. ∃ d ∈ S n , ∃ x ∈ X : dt H[f (x)]d < 0. Luego, γ = mı́n{dt H[f (x)]d/ d ∈ S n ,. x ∈ X} =⇒ γ < dt H[f (x)]d < 0 =⇒ γ < 0.. Como, µ > 0, (. √ p. β̄ yj ≥ 1 ∧. −γ µ. ) ≥0. Luego,. ). ⇒. √ p. DE. (p + 1) > β̄. −γ µ. −γ ≥ 0. µ (. Pero: (. ⇒. γ<0. β̄. −γ µ. ). PO. Luego,. SG RA DO. [α, β]. Entonces por la propiedad 6 de funciones convexas se tiene:. √ p. √ p. ∧ ( yj > 0) ⇒ (p + 1) yj > β̄. yj ≥. (. −γ µ. −γ . µ. ). √ p. yj ≥. −γ . µ. TE CA. −γ √ (p + 1) p yj > . µ. Así,. IO. t′′j (yj ) −γ > ; ′ 2 [tj (yj )] µ. BI BL. Ejemplo 2.2.1 Considere f : X → R;. ∀ yj ∈ Yjt = ⟨0, +∞⟩. X = [1, 3].. Sea,. f (x) = (x − 2)3 + 2x,. x ∈ X,. función estrictamente creciente y no convexa sobre X.. Se quiere convexificar f , por una función g?. Solución.. 31 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.
Documento similar