Un problema de optimización convexa y su aplicación

Texto completo

(1)Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN. INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL. B. IB. LI O. TE. PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS. AUTOR:. LUIS ALBERTO BLAS BALTODANO. ASESOR: Dr. MILTÓN CORTÉZ GUTIÉRREZ. TRUJILLO - PERÚ 2015. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(2) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS. TE. UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN. LI O. INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL. B. IB. PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS AUTOR: LUIS ALBERTO BLAS BALTODANO. ASESOR: Dr. MILTÓN CORTÉZ GUTIÉRREZ TRUJILLO - PERÚ 2015. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(3) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Jurado. Dr. ULISES ZAVALETA CALDERÓN Presidente. Secretario. B. IB. LI O. TE. Dr. NELSON OMAR ARAGONÉS SALAZAR. Ms. JORGE LUIS HORNA MERCEDES Vocal. iii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(4) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. A mi madre:YOLANDA BALTODANO Y.. SI C. A. S. Dedicatoria. que con mucho amor y constante apoyo y sacrificio supo guiarme. A mis Abuelitos: Segundo y Angelica Que ya no están conmigo, pero que. IB. LI O. TE. para lograr alcanzar mi sueño.. B. este sueño era compartido por ellos mi profundo agradecimiento por su constante apoyo y cariño que me supieron dar en los momentos adversos.. iv Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(5) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Agradecimiento. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Es propicia la oportunidad para expresar mi agradecimiento a todos los profesores de la Escuela de Matemáticas que con su aporte intelectual me guiarón por el camino del estudio y superación, en especial a la Dra. Jenny Rojas, por su valiosa orientación. B. IB. LI O. TE. y apoyo en la culminación del presente trabajo.. v Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(6) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Presentación. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Señores miembros del jurado:. En cumplimiento a lo prescrito por el reglamento de grados de la Facultad de Ciencias Físicas y Matemáticas de la Escuela de Matemáticas de la Universidad Nacional de Trujillo, me es honroso presentar a vuestra consideración el presente trabajo titulado:. UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN;. para optar el Título de Licenciado en Ciencias Matemáticas. Con la consideración de que el presente trabajo pueda estar incompleto, acepto muy honestamente todas sus. TE. apreciaciones y sugerencias que tengan a bien formular, lo cual me servirá para mejorarlo. El Autor. B. IB. LI O. en el futuro.. vi Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(7) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Lista de Símbolos. —. Envolvente convexa de S.. epi(f ). —. Epígrafo de la función convexa f .. B. IB. LI O. TE. conv(S). vii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(8) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Resumen. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. En este trabajo identificamos las técnicas que estudia la optimización convexa y su importancia en aplicaciones de ingeniería, en telecomunicaciones, proceso de señales, economía, etc. pues permite identificar la estructura de la solución óptima, debido a que cualquier solución local es también una solución global y además existe una teoría de dualidad asociada al problema de optimización convexa y unas condiciones de punto optimal que permiten verificar si la solución hallada es la exacta o la mejor aproximación a ella.. En los últimos años se han producido avances significativos en la utilización de técnicas de optimización convexa en las diversas áreas de aplicación, como las mencionadas en el párrafo anterior y en problemas como: localización de sensores; optimización de potencia en redes de tipo malla; tratamiento de imágenes, producción, etc. sobre todo hallando. TE. la solución de manera eficiente a problemas que originalmente eran intratables. Por lo tanto en este trabajo se presenta las diferentes técnicas matemáticas para la res-. LI O. olución de problemas de optimización convexa y donde se encuentra la solución óptima del problema.. B. IB. Debido a las diversas aplicaciones de la optimización convexa, aqui tambien resolvemos el problema de optimizar una función convexa f : Rn → R, bajo restricciones de regiones. también convexas planteándonos como objetivos principales, el análisis de la solución del problema, la caracterización de la solución de un problema convexo, y la aplicación de esta teoría en problemas de economía o ingeniería.. viii Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(9) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Abstract. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. In this paper we identify techniques that studies the convex optimization and its importance in engineering applications, telecommunications, signal processing, economics, etc. then identifies the structure of the optimal solution, because any local solution is also a global solution and also there is associated duality theory of convex optimization problem and optimal conditions point that show whether the exact solution is found or best approximation to it.. In recent years there have been significant advances in the use of convex optimization techniques in various application areas, such as those mentioned in the preceding paragraph and problems such as: location of sensors; Power optimization in mesh-like networks; image processing, production, etc. especially finding efficient solution to intractable problems that were originally manner.. TE. Therefore in this paper the mathematical models for solving convex optimization problems and where the optimal solution is found techniques is presented. In this paper the. LI O. mathematical models for solving convex optimization problems and where the optimal solution is presented techniques.. B. IB. Due to the various applications of convex optimization, in this paper we solve the problem of optimizing a convex function f : Rn → R, under restrictions by posing convex regions also main objectives, analysis of the solution of the problem, the characterization of the solution of a convex problem and the application of this theory in economics or engineering problems.. ix Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(10) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Introducción. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. La optimización es una herramienta esencial para la formulación de muchos problemas, estudia el cómo hacer la mejor elección cuando se tiene un conjunto limitado de requerimientos y una función definida sobre ellos, la cual debe minimizarse o maximizarse. La Optimización, como línea de investigación, surgió a mediados del siglo anterior y en todo este tiempo se ha usado en diversas aplicaciones de diferentes áreas. En un inicio, el trabajo de Lions y Stampacchia[6] sobre desigualdades variacionales, motivaron el estudio de la convergencia de la solución del problema de aproximación, que posteriormente fue usada por Attouch[1], para establecer la convergencia de la aproximación de Yoshida para la solución de la resolvente de ecuaciones tipo evolución. Similares interrogantes surgen en problemas de optimización, Wysman[15] fue el primero en aplicar estos resultados a problemas de la teoría de Decisión y Van Cutsem aplicó estos resultados a problemas. TE. de optimización estocástica. En el presente trabajo revisamos las características sobresalientes de la teoría de convergencia de funciones convexas. La optimización convexa. LI O. estudia de manera concreta la minimización de funciones convexas reales definidas para variables que se encuentran en un subconjunto convexo de un espacio vectorial.. B. IB. El problema de optimización puede ser expresado, sin perder generalidad, como: M in{f (x) : g(x) = 0}, donde f : Rn → R y g : Rm → Rn , donde x es la variable a determinar. Las técnicas que estudia la optimización convexa son importantes en aplicaciones de ingeniería, en telecomunicaciones, proceso de señales, economía, etc. pues permite identificar la estructura de la solución óptima, debido a que cualquier solución local es también una solución global y además existe una teoría de dualidad asociada al problema de optimización conx. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(11) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. vexa y unas condiciones de punto optimal que permiten verificar si la solución hallada es la exacta o la mejor aproximación a ella. Por otro lado esta teoría también permite el diseño de algoritmos numéricos muy potentes que resuelven este tipo de problemas de forma bastante eficiente[2]. En los últimos años se han producido avances significativos. S. en la utilización de técnicas de optimización convexa en las diversas áreas de aplicación,. SI C. A. como las mencionadas en el párrafo anterior y en problemas como: localización de sensores; optimización de potencia en redes de tipo malla; tratamiento de imágenes[12],. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. producción, etc. sobre todo hallando la solución de manera eficiente a problemas que originalmente eran intratables.. Debido a las diversas aplicaciones de la optimización convexa, en el presente trabajo resolvemos el problema de ¿Cómo utilizar una función convexa f : Rn → R, bajo restricciones de regiones también convexas?, planteándonos como objetivos principales, el análisis de la solución del problema, la caracterización de la solución de un problema convexo, y la aplicación de esta teoría en problemas de economía.. El trabajo se ha organizado en los siguientes capítulos: En el primer capítulo, presentamos los conceptos y propiedades básicas de conjuntos, funciones convexas y convergen-. TE. cia de funciones convexas así como también los principios básicos de dualidad necesarios en el estudio de las condiciones de optimalidad en los problemas de optimización y se. LI O. definen algunos símbolos y notaciones necesarios para un buen entendimiento del trabajo. En el segundo capítulo presentamos el problema de optimización convexa, sus. B. IB. propiedades, equivalencias y algunos métodos de resolución para este tipo de problemas de optimización. En el tercer capítulo, presentamos la formulación y resolución de problemas de optimización convexa, relacionados a la economía. Finalmente presentamos las conclusiones del trabajo.. xi Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(12) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. Jurado Dedicatoria. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Índice general. Agradecimiento. Lista de Símbolos Resumen Abstract. iv v vii viii ix x. 1. Preliminares. 2. TE. Introducción. 2. 1.1.1. Separación y Soporte de Conjuntos . . . . . . . . . . . . . . . . .. 3. 1.1.2. Conjuntos Poliédricos - Puntos Extremos . . . . . . . . . . . . . .. 9. 1.1.3. Funciones Convexas. . . . . . . . . . . . . . . . . . . . . . . . . .. 13. 1.2. Generalización de una Función Convexa . . . . . . . . . . . . . . . . . .. 14. 1.2.1. Función Cuasi-Convexa . . . . . . . . . . . . . . . . . . . . . . . .. 14. 1.2.2. Funciones Cuasi-Convexas Diferenciables . . . . . . . . . . . . . .. 16. 1.2.3. Funciones Estrictamente Cuasi - Convexas . . . . . . . . . . . . .. 19. 1.3. Convergencia de Funciones Convexas . . . . . . . . . . . . . . . . . . . .. 20. 1.4. Dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 1.4.1. Función Dual de Lagrange . . . . . . . . . . . . . . . . . . . . . .. 23. LI O. 1.1. Conjuntos y Funciones Convexas . . . . . . . . . . . . . . . . . . . . . .. IB B. iii. 1 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(13) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 25. 1.4.3. Interpretación Geométrica del Problema Dual Lagrangiano . . . .. 25. 1.4.4. Condición de Slater . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 1.4.5. Condiciones de Optimalidad . . . . . . . . . . . . . . . . . . . . .. 29. S. 1.4.2. Problema Dual Lagrangiano . . . . . . . . . . . . . . . . . . . . .. 33. A. 2. Optimización Convexa. 33. 2.2. Óptimo Local y Global . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35. 2.3. Problemas Convexos Equivalentes . . . . . . . . . . . . . . . . . . . . . .. 40. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. 2.1. Formulación Estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.3.1.. Eliminando las Restricciones de Igualdad. . . . . . . . . . . . . .. 40. 2.3.2. Agregando Restricciones de Igualdad. . . . . . . . . . . . . . . . .. 40. 2.3.3. Variables de Holgura. . . . . . . . . . . . . . . . . . . . . . . . . .. 41. 2.3.4. Problema de la Forma Epígrafo. . . . . . . . . . . . . . . . . . . .. 41. 2.3.5. Minimización Sobre Algunas Variables. . . . . . . . . . . . . . . .. 41. 2.4. Optimización Cuasi-Convexa. . . . . . . . . . . . . . . . . . . . . . . . .. 42. 2.4.1. Condiciones de Optimalidad y Solución Óptima Local . . . . . . .. 42. 2.4.2. Optimización Cuasi-Convexa vía Problemas de Factibilidad Con44. 2.4.3. Método de Bisección para Optimización Cuasi-Convexa . . . . . .. 45. 2.5. Clasificación de Problemas de Optimización Convexa . . . . . . . . . . .. 46. TE. vexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. 46. 2.5.2. Problemas de Optimización Cuadráticas . . . . . . . . . . . . . .. 50. 2.5.3. Programación Cónica de Segundo Orden . . . . . . . . . . . . . .. 51. 2.5.4. Programación con Desigualdades Generalizadas . . . . . . . . . .. 51. 2.5.5. Programación Geométrica . . . . . . . . . . . . . . . . . . . . . .. 53. B. IB. LI O. 2.5.1. Problemas de Optimización Lineal. 3. Aplicación de Optimización Convexa: Aproximación y Ajuste. 56. 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. 3.2. Aproximación de Norma . . . . . . . . . . . . . . . . . . . . . . . . . . .. 56. 3.2.1. Problema Básico de Aproximación de Norma . . . . . . . . . . . .. 57. 3.2.2. Aproximación mediante una función de Penalización . . . . . . . .. 78. 2 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(14) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 82. Bibliografía. 83. B. IB. LI O. TE. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. SI C. A. S. Conclusiones. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(15) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. SI C. A. S. Capítulo 1. 1.1.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Preliminares Conjuntos y Funciones Convexas. En esta sección se presentan definiciones y propiedades básicas sobre conjuntos y funciones convexas.. Definición 1.1. Un conjunto S ⊂ Rn se dice que es convexo si para cada x1 , x2 ∈ S, entonces λx1 + (1 − λ)x2 ∈ S, ∀ λ ∈ [0, 1].. La forma λx1 + (1 − λ)x2 , λ ∈ [0, 1] se llama combinación convexa de x1 y x2 .. TE. Por inducción se prueba la generalización. LI O. λ1 x 1 + λ2 x2 + . . . + λn xn =. k ∑. λj xj . . .. j=1. l ∑. λj xj. j=1. Definición 1.2. Sea S ⊂ Rn , la envolvente convexa de S, denotado por conv(S) es. B. IB. el conjunto de todas las combinaciones convexas de S. Es decir: x ∈ conv(S) =⇒ x =. k ∑ j=1. λj xj ;. k ∑. λj = 1. j=1. Definición 1.3. S se llama cono convexo ⇔ ∀x1 , x2 ∈ S, ∀λ ∈ (0, 1) se tiene λx1 + (1 − λ)x2 ∈ S. Definición 1.4. S se llama cono con vértice en 0 ⇔ ∀x ∈ S, ∀λ > 0 se tiene λx ∈ S. 2 Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(16) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS. 1.1.1.. Separación y Soporte de Conjuntos. En optimización, las nociones de hiperplanos soporte y separación de conjuntos convexos disjuntos, son muy importantes. Casi todas las condiciones de optimalidad y las. S. relaciones de dualidad usan los conceptos y propiedades de separación y soporte de con-. A. juntos convexos.. SI C. Los resultados de esta sección se basan en el siguiente hecho geométrico: dado S un conjunto convexo y cerrado y un punto y ∈ / S existe un único punto x ∈ S con distancia. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. minima a y y un hiperplano que separa y y S.. Teorema 1.5. Sea S un conjunto convexo cerrado no vacío en Rn y sea y ∈ / S. Entonces existe un único x ∈ S con distancia minima a y. Además, x es el punto minimizante si y solo si (y − x)t (x − x) ≤ 0 ∀x ∈ S. Prueba. ver [Bazaraa] Observación.. y. t. α ( x −x ) = 0. x. S. LI O. TE. x. Figura 1.1:. B. IB. El ángulo entre los vectores (y − x) y (x − x) para cualquier x ∈ S es mayor o igual a 90◦ ,. por lo tanto (y − x)t .(x − x) ≤ 0, ∀x ∈ S los que nos dice que el conjunto S queda en el semi espacio αt (x − x) = 0 que pasa a través de x y tiene una normal α = (y − x). Esta característica no necesariamente se cumple en conjuntos no-convexos, como se observa en el siguiente gráfico:. 3. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(17) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS. S. x. SI C. A. S. y. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Figura 1.2: Definición 1.6. Un hiperplano H en Rn esta formado por: H = {x ∈ Rn : pt x = α}. donde p ∈ Rn no-nulo y α es un escalar.. El vector p se llama normal del hiperplano H. Un hiperplano H define dos semi espacios cerrados. H + = {x ∈ Rn : pt x ≥ α}. y. H − = {x ∈ Rn : pt x ≤ α}. LI O. TE. Y dos semi espacios abiertos. H + = {x ∈ Rn : pt x > α}. B. IB. y. H − = {x ∈ Rn : pt x < α}. Observación. ◦ Cualquier punto en Rn cae en H + , en H − o en ambos. ◦ Un hiperplano H y el correspondiente semiespacio pueden escribirse en referencia a un punto fijo.. 4. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(18) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS ◦ Si x ∈ H, entonces pt x = α y cualquier x ∈ H debe satisfacer pt x − p t x = α − α. S. pt x − p t x = 0. SI C. A. pt (x − x) = 0 Ejemplo.. . . C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ.  1     1    Sea H = {x ∈ R4 : x1 + x2 − x3 + 2x4 = 4}, el vector normal p =  . Luego  −1      2 el hiperplano H puede escribirse tomando como referencia cualquier punto x ∈ H, por ( )t ejemplo x = 0, 6, 0, −1 , en este caso. H = {x ∈ R4 : pt (x − x) = 0}. = {x ∈ R4 : (1, 1, −1, 2).(x1 , x2 − 6, x3 , x4 + 1) = 0} = {x ∈ R4 : x1 + x2 − 6 − x3 + 2(x4 + 1) = 0}. +. H. p. Η. B. IB. LI O. TE. Geométricamente:. −. x. Figura 1.3:. 5. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(19) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS Definición 1.7. Sean S1 y S2 conjuntos no vacíos en Rn . Un hiperplano H = {x ∈ Rn : pt x = α} se dice que separa S1 y S2 si pt x ≥ α, ∀x ∈ S1 y pt x ≤ α, ∀x ∈ S2 .. S. Si además S1 ∪ S2 ̸⊂ H entonces H separa de manera propia a S1 y S2 .. A. Si pt x > α ∀x ∈ S1 y pt x < α, ∀x ∈ S2 se dice que H separa de manera estricta S1 y. SI C. S2 .. Si pt x ≥ α + ϵ ∀x ∈ S1 y pt x ≤ α ∀x ∈ S2 para ϵ > 0 escalar, se dice que H separa. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. fuertemente S1 y S2 .. En la siguiente gráfica se muestra las diferentes tipos de separaciones: H. S. S1. 1. S1. S. S2. H S1. 2. S2. S2. Figura 1.4:. El siguiente teorema es uno de los mas importantes teoremas de separación, que es. TE. la base de condiciones de optimalidad en optimización.. LI O. Teorema 1.8. Sea S un conjunto convexo cerrado y no vacío en Rn y sea y ̸∈ S entonces existe un vector p ∈ Rn no nulo y un escalar α tal que pt y > α y pt x ≤ α, ∀x ∈ S.. B. IB. Prueba.. Sea S ⊂ Rn no vacío cerrado y convexo, sea y ̸∈ S, luego por el teorema (1.5), existe. x ∈ S único tal que (x − x)t (y − x) ≤ 0 ∀x ∈ S. como y ̸∈ S y − x ̸= 0 entonces considerando p = (y − x) y α = xt p = pt x se tiene que (x − x)t p ≤ 0. ∀x ∈ S. pt (x − x) ≤ 0 p t x − pt x ≤ 0 6. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(20) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS pt x ≤ p t x pt x ≤ α ∀x ∈ S mientras que. S. pt y − α = pt y − pt x. = (y − x)t (y − x) > 0 . C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. = ∥y − x∥2 > 0.. SI C. A. = pt (y − x). Una consecuencia conocida de este teorema que se usa para tener condiciones de optimalidad tanto de problemas de optimización lineal como no lineal como el teorema de Farkas que establece lo siguiente: Sea Am×n y c un n-vector, entonces exactamente uno de los siguientes sistemas tiene solución: Sistema 1:. Ax ≤ 0 y ct x > 0 , x ∈ Rn. Sistema 2:. At y = c y y ≥ 0 , y ∈ R m. TE. Prueba.(ver Bazaraa). Definición 1.9. Sea S ⊂ Rn no vacio y sea x ∈ ∂S(frontera de S).Un hiperplano. LI O. H = {x ∈ Rn : pt (x − x) = 0} se llama hiperplano soporte de S en x si S ⊆ H + , es. IB. decir que pt (x − x) ≥ 0 ∀x ∈ S o S ⊆ H − , es decir pt (x − x) ≤ 0 ∀x ∈ S.. B. Si además S ̸⊂ H, H es un hiperplano de separación propio de S en x.. Observación. La definición es equivalente a decir que H = {x ∈ Rn : pt (x − x) = 0} es un hiperplano soporte de S en x ∈ ∂S si pt x = ı́nf{pt x : x ∈ S}. 7. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(21) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS. de lo contrario pt x = sup{pt x : x ∈ S} Geométricamente, se tiene: S. H. H. S. S. − x. x. − x. H. 1. H. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Hiperplano soporte. − x. 2. SI C. − x. A. S. Hiperplano soporte Único. en más de un punto. Infinitos hiperplanos soporte. Hiperplano soporte impropio. Figura 1.5:. En el siguiente teorema se establece que un conjunto convexo en cada punto frontera tiene un hiperplano soporte.. Teorema 1.10. Sea S ⊂ Rn convexo y no-vacío y sea x ∈ ∂S, entonces existe un hiperplano soporte de S en x.Es decir existe p ∈ Rn tal que pt (x − x) ≤ 0 ∀x ∈ S (clausura de S).. Prueba.ver(Bazaraa).. TE. La minimización de una función convexa sobre alguna de las variables preserva la. LI O. convexidad del problema.. Definición 1.11. (Epígrafo de una función convexa). IB. Sea S ⊂ Rn no-vacío y sea f : S → R. El epígrafo de f denotado por epi(f ) es un. B. subconjunto de Rn+1 definido como epi(f ) = {(x, y) : x ∈ S, y ∈ Rn y ≥ f (x)} Definición 1.12. (Hipógrafo de una función convexa) Sea S ⊂ Rn no-vacío y sea f : S → R. El Hipógrafo denotado por hyp(f ) es un subcon-. junto de Rn+1 tal que hyp(f ) = {(x, y), x ∈ S, y ∈ Rn ; y ≤ f (x)}. 8. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(22) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS. epi ( f ). f. f epi ( f ). epi ( f ). S. hyp ( f ). SI C. hyp ( f ). f. A. hyp ( f ). C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Figura 1.6: Geométricamente. Teorema 1.13. Sea S ⊂ Rn no-vacío y convexo y sea f : S → R.Entonces f es convexa si y sólo si epi(f ) es un conjunto convexo. Prueba.. ⇒] Supongamos que f es convexa, demostraremos que epi(f ) es un conjunto convexo. Sea (x1 , y1 ), (x2 , y2 ) ∈ epi(f ), es decir x1 , x2 ∈ S tal que y1 ≥ f (x1 ) y tal que y2 ≥ f (x2 ). Sea λ ∈ (0, 1), entonces λy1 + (1 − λ)y2 ≥ λf (x1 ) + (1 − λ)f (x2 ) ≥ f (λx1 + (1 − λ)x2 ) pues f es convexa. Además λx1 +(1−λ)x2 ∈ S, [λx1 +(1−λ)x2 , λy1 +(1−λ)y2 ] ∈ epi(f ) y por lo tanto epi(f ) es convexo.. TE. ⇐] Supongamos que epi(f ) es convexa, y sean x1 , x2 ∈ S entonces [x1 , f (x1 )] y [x2 , f (x2 )] ∈ epi(f ) es convexo se tiene [λx1 +(1−λ)x2 , λf (x1 )+(1−λ)f (x2 )] ∈ epi(f ), para λ ∈ (0, 1). LI O. es decir λf (x1 ) + (1 − λ)f (x2 ) ≥ f (λx1 + (1 − λ)x2 ) para λ ∈< 0, 1 > por lo tanto f. B. IB. es convexa.. 1.1.2.. . Conjuntos Poliédricos - Puntos Extremos. Los conjuntos poliédricos representan un caso especial de conjuntos convexos. Definición 1.14. S ⊂ Rn se llama conjunto poliédrico si es la intersección de un numero finito de semi espacios cerrados. Es decir S = {x : pti x ≤ αi , i = 1, 2 . . . m}. 9. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(23) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS donde pi ∈ Rn , αi es un escalar para i = 1 . . . m. Observación.. S. Un conjunto poliédrico es un conjunto convexo.. A. Como una función puede ser representada por dos inecuaciones, un conjunto polié-. SI C. drico puede ser representado por un numero finito de inecuaciones y/o ecuaciones. Ejemplos.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. S = {x ∈ R2 : −x1 + x2 ≤ 2 , x2 ≤ 4 , x1 ≥ 0 , x2 ≥ 0} es un conjunto poliédrico. x. 2. (. (. 0 2. 2 4. ). S. ). x. 1. Figura 1.7:. TE. Definición 1.15. Sea S ⊂ Rn un conjunto convexo no- vacío. Un punto x ∈ S se llama. LI O. "punto extremo"de S si x = λx1 + (1 − λ)x2 con x1 , x2 ∈ S y λ ∈< 0, 1 > implica que x = x1 = x 2 .. B. IB. Ejemplos.. 1. S = {(x1 , x2 ) : x21 + x22 ≤ 1} sus puntos extremos es el conjunto E = {(x1 , x2 ) : x21 + x22 = 1} 2. S = {(x1 , x2 ) ∈ R2 : x21 + x22 ≤ 2 ; −x21 + 2x22 ≤ 1 , x1 , x2 ≥ 0} sus puntos extremos son: E = {(0, 0), (0, 1)( 23 , 43 ), (2, 0)}. 10. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(24) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS. E. A. S. Figura 1.8:. SI C. ( 2 / 3 , 4 /3 ). C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. ( 0 ,1 ). ( 2,0). ( 0 , 0). Figura 1.9:. 3. S = gen{(0, 0), (1, 1), (1, 3), (−2, 4), (0, 2)}, sus puntos extremos son: E = {(0, 0), (1, 1), (1, 3), (−2, 4)} (− 2 , 4 ). ( 1,3 ). B. IB. LI O. TE. ( 0 ,2). (. 1. 1. ). (0) 0. Figura 1.10:. Observación. Cualquier punto del poliedro S puede representarse como una combinación convexa de sus puntos extremos. En conjuntos convexos no acotados no es posible la representación de cada punto del conjunto como combinación convexa de sus puntos extremos, por ejemplo 11. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(25) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS S = {(x1 , x2 ) : x2 ≥ |x1 |} es convexo y cerrado pero no es acotado, tiene un solo punto extremo, el origen y obviamente S no es la combinación convexa de sus puntos extremos. Esto hace necesario el concepto de dirección extrema.. S. Definición 1.16. Sea S conjunto convexo cerrado, no vacío en Rn , un vector no nulo. A. d en Rn se llama una dirección de S si para cada x ∈ S , x + λd ∈ S , ∀λ ≥ 0. d1 y d2. SI C. son direcciones distintas de S si d1 ̸= αd2 para α > 0.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Una dirección d de S se llama "dirección de extremo"si no puede ser escrita como combinación lineal positiva de dos direcciones distintas, es decir:. Si d = λ1 d1 + λ2 d2 , λ1 , λ2 > 0 entonces d1 = αd2 para algún α > 0. Ejemplo.. S = {(x1 , x2 ) : x2 ≥ |x1 |} Las direcciones de S son los vectores no nulos que forman un. S. LI O. TE. d. d. 2. 1. Figura 1.11:. ángulo menor o igual a 45◦ con el vector (0, 1). Por ejemplo d1 = (1, 1) y d2 = (−1, 1). IB. son dos direcciones extremas de S, cualquier otra dirección de S puede ser representada. B. como combinación lineal positiva de d1 y d2 . Teorema de Representación. Sea S = {x ∈ Rn : Ax = b , x ≥ 0} un conjunto poliedrico no-vacio en Rn , donde Am×n es una matriz de rango m. Sean x1 , x2 , . . . , xk los puntos extremos de S y d1 , d2 , . . . , dl las direcciones extremas de S, entonces x ∈ S si y sólo si x=. k ∑. λj xj +. j=1. l ∑. µj dj. j=1. 12. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(26) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.1. CONJUNTOS Y FUNCIONES CONVEXAS k ∑. λj = 1. j=1. j = 1, 2, . . . , k. µj ≥ 0 ;. j = 1, 2, . . . , l. S. λj ≥ 0 ;. A. Este teorema permite representar a cada punto de un poliedro como la combinación. SI C. lineal no negativa de sus direcciones extremas mas una combinación convexa de sus puntos extremos. Si el poliedro es acotado no tiene direcciones extremas, por lo tanto. extremos.. 1.1.3.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. cada punto del poliedro se representara como la combinación convexa de sus puntos. Funciones Convexas.. Definición 1.17. Sea f : S → R, S ⊆ Rn no-vacío y convexo. La función f se dice que es convexa sobre S si. f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ). ∀x1 , x2 ∈ S y λ ∈< 0, 1 >. f se llama ”estrictamente convexa” en S si. ∀x1 , x2 ∈ S y λ ∈< 0, 1 >. TE. (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ). f se llama cóncava (estrictamente cóncava) sobre S si −f es convexa(estrictamente. LI O. convexa) sobre S.. B. IB. Ejemplos.. f : R2 → R : f (x1 , x2 ) = 2x21 + x22 − 2x1 x2 , es una función convexa pues, sea x = (x1 , x1 ), y = (y1 , y2 ) entonces:. λx + (1 − λ)y = λ(x1 , x2 ) + (1 − λ(y1 , y2 )) = (λx1 , λx2 ) + ((1 − λ)y1 , (1 − λ)y2 ) = (λx1 + (1 − λ)y1 , λx2 + (1 − λ)y2 ). 13. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(27) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA. luego f (λx + (1 − λ)y) = f (λx1 + (1 − λ)y1 , λx2 + (1 − λ)y2 ) = 2f (λx1 + (1 − λ)y1 )2 + (λx2 + (1 − λ)y2 )2 −. A. S. 2(λx1 + (1 − λ)y1 )(λx2 + (1 − λ)y2 ). Generalización de una Función Convexa. SI C. 1.2.. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Existen varios tipos de funciones similares a las funciones convexas de las cuales se usan solamente algunas de sus propiedades. En esta sección presentamos algunas de estos tipos de funciones.. 1.2.1.. Función Cuasi-Convexa. Definición 1.18. Sea f : S ⊂ Rn → R, S conjunto convexo no-vacío de Rn , f es una función cuasi-convexa, si para cada x1 , x2 ∈ S se cumple que. f [λx1 + (1 − λ)x2 ] ≤ máx{f (x1 ), f (x2 ))}.. f se dice que es cuasi-convexa si −f es cuasi-cóncava.. TE. Observación.. De la definición de la función cuasi-convexa, toda función convexa es también cuasi-. LI O. convexa.. El siguiente teorema caracteriza una función cuasi-convexa por la convexidad de sus. B. IB. curvas de nivel. Teorema 1.19. Sea f : S → R, S un conjunto convexo no vacío de Rn , f es una función. cuasi-convexa si y sólo si Sα = {x ∈ S : f (x) ≤ α} es convexo ∀α ∈ R. 14. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(28) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA. Prueba. ⇒] f es cuasi-convexa y sean x1 , x2 ∈ Sα . Luego x1 , x2 ∈ S y máx{f (x1 ), f (x2 )} ≤ α y sea x = λx1 + (1 − λ)x2 . Por la convexidad de S, x ∈ S. Además por la cuasi-convexidad de f , f (x) ≤ máx{f (x1 ), f (x2 )} ≤ α por lo tanto x ∈ Sα y además Sα es convexo.. S. ⇐] Supongamos que Sα es convexa para cada α ∈ R. Sean x1 , x2 ∈ S. Además , sea. SI C. A. λ ∈ (0, 1) y x = λx1 + (1 − λ)x2 luego para x1 , x2 ∈ Sα para α = máx{f (x1 ), f (x2 )}. Como Sα es convexo x ∈ Sα . Además. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. f (x) = f (λx1 + (1 − λ)x2 ) ≤ α = máx{f (x1 ), f (x2 )}. por lo tanto f es cuasi-convexa.. . Observación.. ◦ Sα definida como en el teorema se llama “ Conjunto nivel inferior” de f . ◦ El “conjunto nivel superior” de f es {x ∈ S : f (x) ≥ α} el cual es convexo ∀ α ∈ R si y sólo si f es cuasi-convexa.. ◦ La superficie de nivel: {x ∈ S : f (x) ≥ α} caracteriza a una función f cuasimonótona si y solo si este conjunto es convexo ∀ α ∈ Rn .. TE. El siguiente teorema, nos permite analizar el máximo de una función cuasi-convexa. LI O. sobre un conjunto poliédrico compacto.. Teorema 1.20. Sea S un conjunto poliédrico y compacto en Rn , sea f : S → R cuasi-. IB. convexa y continua sobre S. si se considera el problema de máx f (x) tal que x ∈ S,. B. entonces existe una solución óptima x para el problema, donde x es un punto extremo de S. Prueba. Sea f continua sobre S y, por lo tanto tiene máximo x′ , pues S es un conjunto acotado. Si hay un punto extremo xe tal que f (xe ) = f (x′ ) entonces se cumple el teorema. En otro caso, sean x1 . . . xk puntos extremos de S y considerando que f (x′ ) > f (xj );. 15. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(29) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA j = 1, 2 . . . k y como el punto x′ puede representarse en términos de los puntos extremos xj , j = 1, 2 . . . k x′ =. k ∑. λj xj. j=1. λj = 1. S. k ∑. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Como f (x′ ) > f (xj ) para cada j = 1 . . . m; entonces. SI C. λj > 0; j = 1, 2 . . . k. A. j=1. f (x′ ) > máx f (xj ) = α 1≤j≤k. (1.1). Luego sea Sα = {x : f (x) ≤ α}. xj ∈ xα para j = 1 . . . n y como f es cuasi-convexa, k ∑ ′ Sα es convexa. Por lo tanto x = λj xj ∈ Sα . Esto significa que f (x′ ) ≤ α lo que j=1. contradice (1.1). Por lo tanto f (x′ ) = f (xj ) para algún xj punto extremo.. 1.2.2.. Funciones Cuasi-Convexas Diferenciables. El siguiente teorema proporciona una caracterización necesaria y suficiente de una función cuasi-convexa diferenciable.. Teorema 1.21. Sea S ⊂ Rn un conjunto abierto convexo y no-vacío y sea f : S → R. TE. una función diferenciable sobre S, entonces f es cuasi-convexa si y solo si una de las. LI O. siguientes afirmaciones se cumple:. 1. Si x1 , x2 ∈ S y f (x1 ) ≤ f (x2 ) entonces ∇f (x2 )T (x1 − x2 ) ≤ 0.. B. IB. 2. Si x1 , x2 ∈ S y ∇f (x2 )T (x1 − x2 ) > 0, entonces f (x1 ) > f (x2 ).. Prueba. Las afirmaciones (1) y (2) son equivalentes, se probará la afirmación (1). ⇒] Sea f cuasi-convexa y x1 , x2 ∈ S tal que f (x1 ) ≤ f (x2 ). Como f es diferenciable en x2 y para λ ∈ (0, 1) f (λx1 + (1 − λ)x2 ) − f (x2 ) = λ∇f (x2 )T (x1 − x2 ) + λ∥x1 − x2 ∥α(x2 : λ(x1 − x2 )) 16. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(30) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA donde α(x2 ; λ(x1 − x2 )) → 0 cuando λ → 0. Por la cuasi-convexidad de f , se tiene f (λx1 + (1 − λ)x2 ) ≤ f (x2 ) y por lo tanto la ecuación anterior implica que. S. λ∇f (x2 )T (x1 − x2 ) + λ∥x1 − x2 ∥α(x2 : λ(x1 − x2 )) ≤ 0. SI C. ∇f (x2 )T (x1 − x2 ) + ∥x1 − x2 ∥α(x2 : λ(x1 − x2 )) ≤ 0. A. dividiendo entre λ. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Si λ → 0 se tiene ∇f (x2 )T (x1 − x2 ) ≤ 0. ⇐] Suponga que x1 , x2 ∈ S y que f (x1 ) ≤ f (x2 ), se necesita demostrar que dado (1), se tiene f (λx1 + (1 − λ)x2 ) ≤ f (x2 ) , ∀λ ∈ (0, 1) esto se hará mostrando que el conjunto L = {x : x = λx1 + (1 − λ)x2 , λ ∈ (0, 1), f (x1 ) > f (x2 )}. es vacío. Por contradicción, supongamos que L no es vacío y que x′ ∈ L, por lo tanto x′ = λx1 + (1 − λ)x2 para algún λ ∈ (0, 1) y f (x′ ) > f (x2 ), como f es diferenciable f es continua y existe un δ ∈ (0, 1) tal que. f (µx′ + (1 − µ)x2 ) > f (x2 ) ∀µ ∈ [δ, 1]. (1.2). TE. y f (x′ ) > f [δx′ + (1 − δ)x2 ], luego de esta desigualdad y del teorema del valor medio. 0 < f (x′ ) − f [δx′ + (1 − δ)x2 ] = (1 − δ)∇f (b x)T (x′ − x2 ). (1.3). IB. LI O. se tiene:. B. donde x b=µ bx′ + (1 − µ b)x2 para µ b ∈ (δ, 1). De 1.2 se tiene f (b x) > f (x2 ) dividiendo (1.3) entre 1 − δ > 0 se tiene ∇f (b x)T (x′ − x2 ) > 0. y a su vez implica que: ∇f (b x)T (x1 − x2 ) > 0 17. (1.4) Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(31) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA pero por otro lado, f (b x) > f (x2 ) ≥ f (x1 ) y x b es una combinación convexa de x1 y x2 , es decir b 1 + (1 − λ)x b 2, λ b ∈ (0, 1) x b = λx. b 1 − (1 − λ)x b 2) ≤ 0 ⇒ ∇f (b x)T ((1 − λ)x. A. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. b ⇒ (1 − λ)∇f (b x)T (x1 − x2 ) ≤ 0. SI C. b 1 − (1 − λ)x b 2) ≤ 0 ∇f (b x)T (x1 − λx. S. por hipótesis del teorema se tiene ∇f (b x)T (x1 − x b) ≤ 0 y tenemos que. que dividiendo entre 1 − λ se tiene. ∇f (b x)T (x1 − x2 ) ≤ 0. (1.5). lo que contradice (1.4). Por lo tanto, L es un conjunto vacío. Ejemplo.. Para ilustrar el teorema:. Sea f : R2 → R : f (x, y) = x3 + y 3 . y. ) ( ) 2 1 Sea x = yy= −2 0 Luego f (x) = 0 y f (y) = 1,luego f (x) < f (y). Por otro lado:. LI O. TE. (. ∇f (x, y) = 3x2 + 3y 2. B. IB. luego. ∇f (y)(x − y) = (3, 0).(1, −2) = 3,. por la parte necesaria del teorema f no es cuasi-convexa. Con este ejemplo también se muestra que la suma de dos funciones cuasi-convexas no necesariamente es cuasi-convexa.. 18. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(32) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA. 1.2.3.. Funciones Estrictamente Cuasi - Convexas. Estas funciones son importantes en la programación no-lineal, aseguran que el mínimo local sobre un conjunto convexo son mínimo y máximo global respectivamente.. S. Definición 1.22. Sea f : S ⊂ Rn → R, donde S es un conjunto no-vacío convexo en Rn ,. SI C. A. f se dice que es estrictamente cuasi convexa, si para cada x1 , x2 ∈ S con f (x1 ) ̸= f (x2 ), se tiene. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. f (λx1 + (1 − λ)x2 ) < máx{f (x1 ), f (x2 )} , λ ∈ (0, 1).. f se llama estrictamente cuasi cóncava si −f es estrictamente cuasi convexa.. ESTRICTA. ESTRICTAMENTE CUASI CONVEXAS. CUASI−CÓNCAVA. NI UNO NI OTRO. Figura 1.12:. Observación.. Toda función convexa es estrictamente cuasi convexa.. TE. Teorema 1.23. Sea f : Rn → R estrictamente cuasi-convexa. Sea el problema de. LI O. mı́n f (x) donde S conjunto convexo no-vacío en Rn . Sujeto a x ∈ S.. IB. Si x b es una solución optimal. Entonces x b es también un óptimo global.. B. Prueba. Por contradicción, suponga que f (e x) < f (b x) por la convexidad de S, λe x + (1 − λ)b x ∈ S,. λ ∈ (0, 1). Como x b es un mínimo local, entonces f (b x) ≤ f (λe x + (1 − λ)b x) , ∀λ ∈ (0, δ) para algun δ ∈ (0, 1). Como f es estrictamente cuasi-convexa y f (e x) < f (b x) luego f (b x) ≤ f (λe x + (1 − λ)b x) < f (b x) ,. λ ∈ (0, 1) ⇒⇐ esto contradice la hipótesis de. optimalidad local de x b por lo tanto x b es una solución optima global.. 19. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(33) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3. CONVERGENCIA DE FUNCIONES CONVEXAS. Observación.. f (x) =.    . 0,. si. x=0. si. x ̸= 0. A.   1,   . S. Toda función estrictamente cuasi convexa no es una función cuasi convexa, por ejemplo. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. f (x1 ) = f (x2 ) = 0 pero f ( 21 x1 + 12 x2 ) = f (0) = 1 > f (x2 ).. SI C. f es estrictamente cuasi convexa pero no es cuasi-convexa pues para x1 = 1 y x2 = −1. Lema 1.24. Sea S un conjunto convexo no-vacío en Rn y sea f : S → R estrictamente cuasi-convexa y semi continua inferior, entonces f es cuasi-convexa.. Definición 1.25. Sea S un conjunto convexo no-vacio en Rn y sea f : S → R se dice que es suedo-convexa si ∀x, y ∈ S : ∇f (x)(y − x) ≥ se tiene f (y) ≥ f (x).. 1.3.. Convergencia de Funciones Convexas. En esta sección presentamos algunas generalizaciones sobre la convergencia de las soluciones de problemas de aproximación, especialmente en problemas de optimización,. finita.. TE. en particular cuando se busca las soluciones numéricas de problemas de dimension in-. LI O. Se presenta las características sobresalientes de la teoría de la convergencia de funciones convexas. Los resultados se muestran para funciones convexas sobre Rn .. IB. Sean f , fv , v ∈ N funciones convexas cerradas con dominio en Rn y rango en Rn ∪+∞,. B. el domino efectivo de una función convexa f denotado por D(f ) es: D(f ) = {x ∈ Rn ; f (x) < +∞} el epígrafo de f es: E(f ) = {(x, α) ∈ Rn × R ; f (x) < α}. 20. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(34) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.3. CONVERGENCIA DE FUNCIONES CONVEXAS. Definición 1.26. Una función convexa f se dice que es cerrada si es semicontinua inferior (l.s.c) y D(f ) ̸= ϕ. En particular, esto implica que el epígrafo, E(f ) de f es un sub conjunto cerrado. S. propio de Rn × R que no contiene ninguna recta paralela a la recta x = 0.. A. Las sucesiones de funciones convexas cerradas presentan dos tipos de convergencia. SI C. que son muy importantes en la convergencia de las soluciones para problemas de optimización: convergencia puntual llamado ρ-convergencia Y la convergencia en términos. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. de los epígrafo llamada e-convergencia.. Definición 1.27. La sucesión {fv (x)}v∈N se dice que converge según la convergencia ρ-convergencia, denotado por. → fv − ρf. si ∀x ∈ Rn. lı́m fv (x) = f (x) v. donde se permite como valor de limite a +∞ y también como elemento de la sucesión. Este tipo de convergencia se presenta en la mayoría de los esquemas que involucran aproximaciones directas de la función f .. TE. Una sucesión de subconjuntos cerrados {Cv }, v ∈ N de Rn se dice que converge al. LI O. conjunto cerrado C si. lı́m sup Cv = C = lı́m inf Cv v. v. B. IB. y se escribe. Cv = C. donde lı́m sup Cv = {x = lı́m xµ : xµ ∈ Cµ , µ ∈ M ⊂ N} v. lı́m inf Cv = {x = lı́m xv : xv ∈ Cv , v ∈ N ⊂ N} v. 21. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(35) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. Definición 1.28. Una sucesión de funciones convexas se dice que es ϵ-convergente y se escribe como → fv − ϵf. A SI C. lı́m sup E(fv ) = E(f ) = lı́m inf E(fv ). S. Si el epígrafo de fv converge al epígrafo de f , esto significa :. Este tipo de convergencia se necesita para tener la convergencia de la solución de prob-. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. lemas de optimización. Observación.. La convergencia de una sucesión de conjuntos convexos y cerrados en Rn se obtiene considerando la distancia de un punto x aun conjunto D tal que d(x, y) es una métrica definida en Rn (métrica euclidiana).. 1.4.. Dualidad. En esta sección se verá una formulación que permite resolver problemas convexos. Se verá la forma de conseguir problemas de optimización convexa a partir de cualquier problema de optimización. Para esto es necesario definir la función lagrangiana y los. TE. multiplicadores de Lagrange, que permiten reincorporar las restricciones a las función. LI O. objetivo para luego generar un nuevo problema de optimización conocido como el problema dual lagrangiano. Si el problema inicial también llamado problema primal, es no-. IB. convexo el problema dual Lagrangiano asociado, si es convexo y por lo tanto es posible. B. resolverlo generando un límite (o cota) inferior para el valor óptimo del problema primal de la forma (2.1). Si el problema inicial es convexo y bajo algunas condiciones, entonces el límite se ajusta al valor óptimo del problema original y para que esto ocurra se estudian las condiciones de Karush-Khun-Tucker (KKT) que sirven de base a los algoritmos de resolución. En algunos casos hay aplicaciones en que la solución es más eficiente resolviendo el problema dual lagrangiano. 22. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(36) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. 1.4.1.. Función Dual de Lagrange. Sea el problema de optimización en forma estándar. gi (x) ≤ 0,. i = 1, 2 . . . , m. hj (x) = 0,. j = 1, 2 . . . , p. x ∈ D ⊆ Rn ∩∩. dom gi. dom hj .. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. donde D = dom f. ∩∩ p. m. (1.6). S. s.a :. A. f (x). SI C. mı́n. i=1. j=1. Se define la función lagrangiana.. L : Rn × Rm × Rp → R. asociada como. L(x, λ, µ) = f (x) +. m ∑. λi gi (x) +. i=1. p ∑. (1.7). µj hj (x). j=1. λi es el i-ésimo multiplicador de Lagrange asociado a la desigualdad gi (x) ≤ 0. µj es el j-ésimo multiplicador de Lagrange asociado a la ecuación hj (x) = 0 de forma vectorial se considera a λ y µ las variables duales o vectores multiplicadores de Lagrange, la función dual de Lagrange es:. θ(λ, µ) = ı́nf L(x, λ, µ) x∈D. TE. La función θ puede tomar o asumir −∞ para algún vector (λ, µ). La función L es afín. LI O. respecto a λ y µ y por tanto la función dual será el ínfimo puntual de una familia de funciones afines de (λ, µ) es decir θ es una función cóncava independientemente de si el. B. IB. problema primal (2.5) es o no convexo. Teorema 1.29. Dualidad Débil. Sea x e un punto factible de (2.5), es decir g(e x) ≤ 0. y h(e x) = 0 , x e ∈ D y sea (λ, µ) tal que λ ≥ 0, entonces θ(λ, µ) ≤ L(e x, λ, µ) ≤ f (e x) Prueba. Como gi ≤ 0, λi ≥ 0, i = 1 . . . m entonces λi .gi (e x) ≤ 0, ∀i = 1 . . . m, es decir m ∑. λi gi (e x) ≤ 0. i=1. 23. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(37) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. análogamente hj (e x) = 0 y µj es libre de signo, luego µj hj (e x) = 0 ∀i = 1 . . . p. m ∑. µj hj (e x) = 0. S. es decir. A. j=1. λi gi (e x) +. m ∑. µj hj (e x) ≤ 0 siλ ≥ 0. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. m ∑. SI C. luego se cumple que. sumando f (e x):. f (e x) + |. como. m ∑. m ∑. λi gi (e x) + {z L(e x, λ, µ). x) µj hj (e x) ≤ f (e } ≤ f (e x). θ(λ, µ) = ı́nf L(x, λ, µ) ≤ L(e x, λ, µ) x∈D. (1.8). (1.9). de (1.8) y (1.9) se tiene. . TE. θ(λ, µ) ≤ L(e x, λ, µ) ≤ f (e x). Observación.. LI O. Del teorema anterior, como θ(λ, µ) ≤ f (e x) para cualquier x e factible, también se cumplirá. B. IB. en el punto óptimo x∗ es decir θ(λ, µ) ≤ f (x∗ ) = z ∗. lo que significa que la función dual genera una cota inferior para el valor óptimo z ∗ . Este límite no será útil si θ(λ, µ) = −∞, por lo que se dirá de (λ, µ) el par dual factible cuando λ ≥ 0 y (λ, µ) ∈ dom(θ).. 24. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(38) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. 1.4.2.. Problema Dual Lagrangiano. Como se ha visto que si λ ≥ 0, el par (λ, µ) genera una cota inferior para el valor óptimo z ∗ del problema primal. El problema dual Lagrangiano consiste en buscar la. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. λ≥0. 1.4.3.. (1.10). θ(λ, µ). A. máx. SI C. (DP ). S. mejor de estas cotas, es decir:. Interpretación Geométrica del Problema Dual Lagrangiano. Por efectos de simplicidad consideraremos el problema de optimización con solo una restricción de desigualdad y sin restricciones de igualdad, es decir el problema primal es: mı́n. f (x). g(x) ≤ 0. (1.11). x ∈ D ⊂ Rn. En el plano (y, z) sea el conjunto G = {(y, z) : y = g(x), z = f (x), x ∈ D}, entonces G es la imagen de D bajo la aplicación (g, f ). El problema primal consiste en encontrar un. TE. punto en G tal que y ≤ 0 con valor mínimo en la ordenada. Este punto obviamente es. Z. (g, γ ) G. D. .. . (g(x),f(x)). x. B. B. IB. LI O. (y, z) en la figura.. −− (y,z) ϕ( λ ). z+ λ y = α. − m=− λ Y. Figura 1.13:. 25. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(39) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. El problema dual Lagrangiano es: máx. φ(λ) λ≥0. A. S. Supongamos que λ ≥ 0 es dado. Para determinar φ(λ) es necesario minimizar f (x) +. SI C. λg(x), para x ∈ D. Considerando y = g(x) y z = f (x) para x ∈ D, es necesario minimizar z + λy sobre los puntos de G. Se observa que z + λy = α es la ecuación de. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. una recta con pendiente −λ y con intersección en α en el eje z. Para minimizar z + λy sobre G es necesario reemplazar la recta z + λy = α en movimientos paralelos así mismo tanto como sea posible manteniéndola en contacto con G y en dirección de su gradiente negativo. Es decir la recta z + λy = α se desplaza hasta que sea soporte inferior de G, entonces el intercepto de dicha recta soporte con el eje Z genera a φ(λ) como se observa en la figura (1.13).. Por lo tanto el problema dual Lagrangiano equivale ha hallar la pendiente del hiperplano soporte tal que su intercepto con el eje Z sea maximal.. En la gráfica se observa que la solución del problema dual se obtiene en el hiperplano soporte de pendiente m = −λ (cualquier otro hiperplano soporte de pendiente negativa genera cotas inferiores para el valor óptimo del problema primal), la solución del proble-. TE. ma dual es λ y el valor objetivo óptimo del problema dual es z. Pero como z = f (x) en. LI O. este caso se tiene que z también es el valor óptimo de la función objetivo del problema primal.. IB. Ejemplo.. B. Sea el problema primal: mı́n s.a. x21 + x22 −x1 − x2 + 4 ≤ 0 x1 , x 2 ≥ 0. Se observa que el óptimo se encuentra en (2, 2) y f ∗ (2, 2) = 8. Considerando g(x) = −x1 − x2 + 4 y D = {(x1 , x2 ) : x1 , x2 ≥ 0} la función dual de. 26. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(40) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. lagrange es φ(λ) = ı́nf{x21 + x22 + λ(−x1 − x2 + 4); x1 , x2 ≥ 0} = ı́nf{x21 − λx1 : x1 ≥ 0} + ı́nf{x22 − λx2 : x2 ≥ 0 + 4λ}. A SI C. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. ínfimo es alcanzado en x1 = x2 = 0 por lo tanto:  1  − λ2 + 4λ ; λ ≥ 0 2 φ(λ) =  4λ ; λ < 0. S. luego el ínfimo de φ(λ) cuando λ ≥ 0 es alcanzado en x1 = x2 = λ/2 y cuando λ < 0 el. x. 2. (4,0). (x ,x ) 1 2. = ( 2,2 ). x. 1. LI O. TE. (4 , 0). Figura 1.14:. es la función dual lagrangiana. φ es una función cóncava y el problema dual la-. B. IB. grangiano es (D). máx. φ(λ). s.a. λ≥0. La solución del problema dual lagrangiano es en λ = 4 con φ(4) = 8. Observe que d∗ = φ(λ) = 8 = f ((2, 2)) = 8 es decir los valores óptimos de las funciones objetivos primal y dual son iguales.. 27. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(41) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD ϕ( λ ). 3. 4. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. 2. SI C. λ 1. A. S. (4,8). Figura 1.15:. Observación.. La diferencia z ∗ − d∗ es la distancia óptima de dualidades o “hueco de dualidad”. En algunos casos se utiliza este valor como cota inferior para el valor óptimo del problema primal cuando este es difícil de resolver, ya que el problema dual siempre es convexo.. 1.4.4.. Condición de Slater. Cuando la distancia óptima de dualidad es cero se dice que hay “dualidad fuerte” y. d∗ = z ∗ ,. TE. significa que. LI O. para esto se cumpla se debe tener ciertas condiciones conocidas como condiciones de. ∃ x ∈ int(D) :. B. IB. cualificación. Unas de estas condiciones es la condición de Slater: gi (x) < 0; i = 1 . . . m Ax = b. es decir que tiene que existir un punto x estrictamente factible, es decir que las restricciones de desigualdades se cumplen de forma estricta. Sin embargo si algunas de las restricciones de desigualdad son afines no es necesario que la desigualdad sea estricta puede ser (≤). Además, la condición de Slater también garantiza que si se cumple se puede encontrar una solución para el problema dual. 28. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(42) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. 1.4.5.. Condiciones de Optimalidad. Si es posible hallar un punto dual factible (λ, µ), servirá como prueba para garantizar que z ∗ ≥ φ(λ, µ).. S. Estos puntos permiten conocer en que medida es sub óptimo un punto x que sea factible,. Holgura Complementaria. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. 1.4.5.1.. SI C. f (x) − z ∗ ≤ f (x) − φ(λ, µ). A. sin necesidad de conocer el valor exacto de z ∗. Supongamos que el problema primal y dual presentan dualidad fuerte es decir que los valores objetivos de ambos problemas son iguales. Si x∗ es el óptimo del problema primal y (λ∗ , µ∗ ) del problema dual,. f (x∗ ) = φ(λ∗ , µ∗ ). = ı́nf (f (x) +. m ∑. x. ≤ f (x∗ ) +. λ∗i gi (x). +. m ∑. i. m ∑ i=1. µ∗i hi (x)). i. λ∗i gi (x∗ ) + | {z } ≤0. m ∑ i. µ∗i hi (x∗ ) | {z } =0. ≤ f (x∗ ). LI O. TE. esto indica que las desigualdades se tienen que cumplir como igualdades. Es decir m ∑ λ∗i gi (x) = 0 i=1. como los términos de esta sumatoria son negativos o cero, se llega a la condición de. B. IB. holgura complementaria λ∗i gi (x∗ ) = 0 i = 1 . . . m. que se cumple siempre que hay dualidad fuerte. Equivalentemente λ∗i > 0 ⇒ gi (x∗ ) = 0 i = 1 . . . m gi (x∗ ) < 0 ⇒ λ∗i = 0 cuando una restricción de desigualdad i, se cumple como igualdad se dice que es “activa” y esto ocurre cuando λi > 0. En otro caso no está activa y el multiplicador es cero. 29. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.

(43) Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT. 1.4. DUALIDAD. 1.4.5.2.. Condiciones de Karush-Khun-Tucker (KKT). Supongamos que las funciones f , gi , hi son diferenciables y no requerimos ninguna condición en cuanto a convexidad. Supongamos también que en los puntos x∗ y (λ∗ , µ∗ ) la. S. distancia de dualidad es cero. Como x∗ minimiza la función dual lagrangiana L(x, λ∗ , µ∗ ). ∇f (x ) +. m ∑. ∗. λ ∇gi (x) +. i=1. p ∑. SI C. ∗. A. su gradiente en x∗ tiene que hacerse cero, es decir:. µ∗ ∇hi (x) = 0. i=1. C Y A M DE A TE C I M EN Á C TI IA C S A S FÍ. Por lo tanto para que un problema con funciones objetivo y restricciones diferenciables tenga dualidad fuerte x∗ y (λ∗ , µ∗ ) tienen que cumplir las siguientes condiciones llamadas de Karush-Kuhun-Tucker (KKT). gi (x∗ ) ≤ 0 , i = 1 . . . m hi (x∗ ) = 0 , i = 1 . . . p λi ≥ 0 , i = 1 . . . m. λ∗i gi (x∗ ) ≤ 0 , i = 1 . . . m. ∗. ∇f (x ) +. m ∑. ∗. λ ∇gi (x) +. i=1. p ∑. µ∗ ∇hi (x) = 0. i=1. TE. En el siguiente teorema se da las condiciones suficientes para optimalidad según Karush-. LI O. Kuhun-Tucker.. Teorema 1.30. Sea D ⊂ Rn abierto y no-vacío y sea f : Rn → R, gi : Rn → R para. B. IB. i = 1 . . . m y hi : Rn → R para i = 1 . . . p sea el problema (P ). mı́n s.a. f (x) gi (x) ≤ 0 i = 1 . . . m hi (x) = 0 i = 1 . . . p x∈D. Sea x una solución factible y sea I = {i : gi (x) = 0} suponga x es un punto KKT, es decir que ∃λi ≥ 0 para i ∈ I y µi para i = 1 . . . p tal que 30. Bach. Luis A. Blas Baltodano. Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/.