FÍSICAS Y MATEMÁTICAS

(1)

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS F´ISICAS Y MATEM ´

ATICAS

ESCUELA ACAD´

EMICO PROFESIONAL DE MATEM ´

ATICAS

APROXIMACI ´

ON A LA SOLUCI ´

ON GLOBAL DE PROBLEMAS

DE MINIMIZACI ´

ON C ´

ONCAVOS MEDIANTE PROBLEMAS DE

PROGRAMACI ´

ON LINEAL

TESIS PARA OPTAR EL T´ITULO DE LICENCIADO EN MATEM ´ATICA

Autor:

Br. REYES ZAVALETA CESAR ANTONIO

Asesora:

Dra. Rojas Jer´onimo Jenny Margarita

Trujillo - Per´u 2018

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(2)

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS F´ISICAS Y MATEM ´

ATICAS

ESCUELA ACAD´

EMICO PROFESIONAL DE MATEM ´

ATICAS

APROXIMACI ´

ON A LA SOLUCI ´

ON GLOBAL DE PROBLEMAS

DE MINIMIZACI ´

ON C ´

ONCAVOS MEDIANTE PROBLEMAS DE

PROGRAMACI ´

ON LINEAL

TESIS PARA OPTAR EL T´ITULO DE LICENCIADO EN MATEM ´ATICA

Autor:

Br. REYES ZAVALETA CESAR ANTONIO

Asesora:

Dra. Rojas Jer´onimo Jenny Margarita Trujillo - Per´u 2018

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(3)

Jurado

Dr. Edmundo Vergara Moreno Presidente

Mg. Jorge Luis Horna Mercedes Secretario

Dra. Jenny Margarita Rojas Jer´onimo Vocal

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(4)

Dedicatoria

Se lo dedico a Dios por ser el gu´ıa en todo mi camino y fortalecerme en los momentos más dif´ıciles. A mis padres Juan Gilberto y Ana Mar´ıa que me dieron la Vida y me enseñaron como vivirla. A mis hermanos Carmen Esther y José Lu´ıs que más que hermanos son mis verdaderos amigos. A mi amor Anabel que me enseñó a Amar.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(5)

Agradecimiento

Quiero agradecer a mis padres por apoyarme siempre, a mis maestros por sus enseñanzas, en especial a mi asesora Dra. Jenny Margarita Rojas Jerónimo. Doy las gracias también al coordinador del curso de Tesis: Dr. Amado Méndez Cruz y a todos los profesores, personal administrativo y estudiantes del Departamento de Matemáticas por sus enseñanzas, apoyo y por el compartir desinteresado de material académico y otros.

+

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(6)

Presentaci´

on

Se˜nores miembros del jurado:

Presento ante ustedes el informe final del Proyecto de Tesis “ APROXIMACI ÓN A LA SOLUCI ÓN GLOBAL DE PROBLEMAS DE MINIMIZACI ÓN C ÓNCAVOS MEDIANTE PROBLEMAS DE PROGRAMACI ÓN LINEAL ”, con el propósito de optar el t´ıtulo de Licenciado en matemáticas. Esperando cumplir con los reque-rimientos de aprobación.

Agradezco anticipadamente sus opiniones y cr´ıticas, pues me servir´an como est´ımulo para continuar mejorando.

Reyes Zavaleta Cesar Antonio

Trujillo, 28 de Diciembre del 2018

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(7)

Lista de S´ımbolos

Rn : Espacio vectorial real n-dimencional.

Rm×n : Espacio de las matrices reales de orden m × n. H(S) : Envolvente convexa de un conjunto S en Rn. int(S) : Interior de un conjunto S en Rn_.

cl(S) : Clausura de un conjunto S en Rn. ´ınf f : Infimo de una funci´on f .

D : Conjunto convexo no vac´ıo en Rn.

z : Una soluci´on factible de la regi´on factible D.

Lf (z)(f ) : Conjunto de nivel inferior de una funci´on f en el punto z.

Uf (z)(f ) : Conjunto de nivel superior de una funci´on f en el punto z.

Ef (z)(f ) : Conjunto de nivel de una funci´on f en el punto z.

hyp(f ) : Hipógrafo de una función f . epi(f ) : Ep´ıgrafo de una función f .

Am

z : Conjunto de aproximaci´on del Ef (z)(f ).

A2n_z : Conjunto de aproximaci´on trivial del Ef (z)(f ).

B2n

z : Conjunto de aproximaci´on de segundo orden Ef (z)(f ).

C_z2n : Conjunto de aproximaci´on ortogonal del Ef (z)(f ).

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(8)

´

_{Indice general}

Jurado III

Dedicatoria IV

Agradecimiento V

Presentaci´on VI

Lista de S´ımbolos VII

Resumen X

Abstract XI

Introducci´on XII

I. Preliminares matem´aticos para minimizar problemas c´oncavos 1

1.1. Conjuntos convexos . . . 1

1.2. Funciones c´oncavas . . . 8

1.3. M´aximo y m´ınimo de funciones c´oncavas . . . 16

1.4. Generalizaciones de funciones c´oncavas . . . 19

1.5. M´etodos num´ericos para solucionar ecuaciones de una variable . . . . 22

II. Método de aproximación para minimizar problemas cóncavos me-diante problemas de programación lineal 25 2.1. Condición de optimalidad global . . . 26

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(9)

2.2. T´ecnicas de aproximaci´on del conjunto de nivel . . . 31

2.3. Construcci´on de puntos sobre el conjunto de nivel . . . 36

2.3.1. Conjunto de aproximaci´on trivial . . . 39

2.3.2. Conjunto de aproximaci´on de segundo orden . . . 39

2.3.3. Conjunto de aproximaci´on ortogonal . . . 43

III.Algoritmos, convergencia y ejemplos 45 3.1. Algoritmo, convergencia y ejemplos usando el A2n z . . . 46

3.2. Algoritmo y ejemplos usando la combinaci´on del A2n_z y B_z2n . . . 53

3.3. Algoritmo y ejemplos usando la combinaci´on del A2n z , Bz2n y Cz2n . . . 62

3.4. Algoritmos en el lenguaje de programaci´on C. . . 70

Resultados 75

Conclusiones 77

Sugerencias 78

Referencias Bibliogr´aficas 79

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(10)

Resumen

En el presente trabajo se analiza y determina condiciones para verificar la con-dición de optimalidad global para problemas de minimización cóncavos mediante problemas de programación lineal, haciendo uso de técnicas de aproximación del conjunto de nivel, de tal manera que se garantice la aproximación a la solución glo-bal de problemas de minimización cóncavos. La importancia del presente trabajo se justifica por la diversidad de clases de problemas de optimización global que pueden ser transformados en problemas de minimización cóncavos equivalentes, los cuales se presentan en muchos problemas de aplicación.

Para llevar a cabo el presente trabajo, se tuvo como referencia trabajos relaciona-dos con la aproximación a la solución global de problemas de minimización cóncavos como aproximaciones para problemas de programación cuadrática cóncava sobre un conjuto poliédrico. Se espera obtener mejores resultados para la aproximación a la solución global de problemas de minimización cóncavos.

Palabras claves: Optimización global; problemas de minimización cóncavos; problemas de programaci´

BIBLIOTECA

on lineal; t´ecnicas de aproximaci´on del conjunto de nivel.

DE

CIENCIAS

FÍSICAS

(11)

Abstract

In the present work we analyze and determine conditions to verify the global optimality condition for concave minimization problems in linear programming pro-blems, making use of approach techniques of the level set, so as to guarantee an approximation to the global solution from concave minimization problems. The im-portance of current work is the justification for the diversity of classes of global optimization problems that can be transformed into equivalent minimization pro-blems, which are presented in many application problems.

To perform a work with the present work, has a reference of works related to the approximation to the global solution of concave minimization problems as appro-ximations for quadratic programming problems on a polyhedral set. It is expected to obtain better results for the approximation to the global solution of concave minimization problems.

Key words: Global optimization; concave minimization problems; linear pro-gramming problems; level set approximation techniques.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(12)

Introducci´

on

El principal objetivo de la optimización global es encontrar el óptimo global de un problema, esto puede resultar dif´ıcil si tratamos de usar las técnicas de progra-mación no lineal, pues sólo encontraremos óptimos locales, que no necesariamente son globales. Es por esto que se hace imprescindible el desarrollo de técnicas que nos ayuden a encontrar la solución óptima global. En este trabajo se estudia una rama de la optimización global conocida como minimización cóncava. Las técnicas de minimización cóncavas cumplen un rol muy importante en diferentes campos de la optimización global, puesto que gran diversidad de problemas de optimización global pueden ser transformados en problemas de minimización cóncavos equivalen-tes. La minimización cóncava se puede aplicar en diferentes campos del conocimiento tales como en la econom´ıa, telecomunicaciones, transporte, diseño computacional y finanzas, ver [13].

Un problema de minimizaci´on c´oncava en general se puede formular matem´ ati-camente como:

m´ın f (x) s.a. x ∈ D,

donde f : D ⊆ Rn _{−→ R es una funci´on c´oncava y D ⊆ R}n_{un conjunto convexo. Los}

problemas de minimización cóncavos generalmente poseen muchas soluciones locales que no son globales. Cuando D es un pol´ıtopo, el m´ınimo global del problema ante-rior se encuentra en un vértice de D, ver [7,15]; para la solución de éstos casos, tanto locales como globales, se han propuesto aproximaciones determin´ısticas y estoc´ asti-cas, entre las que se cuentan con tres aproximaciones algoritmicas fundamentales, la primera aproximación es el método enumerativo y las otras dos aproximaciones

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(13)

son el método de aproximaciones sucesivas y el método de ramificación y acotación, ver [12, 11].

En el presente trabajo se resuelve el siguiente problema: ¿Bajo qué condiciones es posible tener una aproximación a la solución global de problemas de minimiza-ción cóncavos mediante problemas de programación lineal?, para esto, se determina condiciones que verifiquen la condición de optimalidad global para problemas de mi-nimización cóncavos y se presenta un método de aproximación basado en problemas de programación lineal.

Un problema de minimización cóncava con restricciones espec´ıficas se puede formular matemáticamente como:

m´ın f (x) s.a. x ∈ D,

donde f : D ⊂ Rn _{−→ R es una funci´on c´oncava diferenciable y D ⊂ R}n_{un conjunto}

convexo y compacto. La idea básica es encontrar una solución aproximada para el problema resolviendo problemas de programación lineal con las mismas restricciones que el problema original, es decir, el método consiste en generar una sucesión de minimizadores locales, ya sea finalizando en una solución óptima global o en una solución óptima global aproximada mediante un número finito de iteraciones, donde en cada iteración se resuelve una serie de problemas de programación lineal con las mismas restricciones del problema original, ver [1, 4].

El presente trabajo se desarrolla en tres cap´ıtulos organizados de la siguiente manera: En el cap´ıtulo I, se presenta los preliminares matemáticos para minimi-zar problemas cóncavos. En el cap´ıtulo II se desarrolla el método de aproximación para minimizar problemas cóncavos mediante problemas de programación lineal; se presenta una condición de optimalidad global para el problema cuasicóncavo, se introduce el concepto de técnicas de aproximación y conjunto de aproximación del conjunto de nivel, que serán utiles para la construcción de los algoritmos. En el cap´ıtulo III se desarrolla los algoritmos, convergencia y ejemplos; se presentan tres algoritmos para resolver el problema cuadrático cóncavo y se establecen sus propiedades de convergencia bajo ciertas condiciones.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(14)

Cap´ıtulo I

Preliminares matem´

aticos para

minimizar problemas c´

oncavos

A continuaci´on se presenta algunas definiciones, propiedades y resultados que ser´an la base para el desarrollo del presente trabajo.

1.1. Conjuntos convexos

Definici´on 1.1 (L´ınea) Sean los vectores x1, x2 ∈ Rn. La l´ınea que pasa a trav´es

de los puntos x1 y x2 es definida como el conjunto

{x ∈ Rn _{/ x = λx}

1 + (1 − λ)x2, λ ∈ R}

Definici´on 1.2 (Segmento cerrado) Sean los vectores x1, x2 ∈ Rn. El segmento

de l´ınea cerrado que pasa a trav´es de los puntos x1 y x2 es definida como el conjunto

{x ∈ Rn _{/ x = λx}

1+ (1 − λ)x2, 0 ≤ λ ≤ 1}

Los segmentos de l´ınea abiertos, cerrados-abiertos y abiertos-cerrados pueden ser definidos de manera an´aloga modificando las desigualdades para λ.

Definici´_{on 1.3 (Semiespacio) Sea el vector c ∈ R}n_{, c 6= 0 y el escalar z ∈ R. El} semiespacio abierto en Rn _{es definido como el conjunto}

{x ∈ Rn _{/ c}T_{x < z}}

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(15)

El semiespacio cerrado en Rn es definido como el conjunto {x ∈ Rn / cTx ≤ z}

Definici´_{on 1.4 (Hiperplano) Sea el vector c ∈ R}n_{, c 6= 0 y el escalar z ∈ R. El} hiperplano en Rn _{es definido como el conjunto}

{x ∈ Rn _{/ c}T_{x = z}}

Definici´_{on 1.5 (Hiperplano soporte) Sea D un conjunto no vac´ıo en R}n y sea ¯

x ∈ ∂D. Un hiperplano H = {x ∈ Rn _{/ c}T_{(x − ¯}_{x) = 0} es llamado un hiperplano}

soporte de D en ¯x, si cT(x − ¯x) ≥ 0 para todo x ∈ D, o bien, si cT(x − ¯x) ≤ 0 para todo x ∈ D

Definición 1.6 (Poliedro y Pol´ıtopo) La intersección de un número finito de semiespacios cerrados en Rn _{es definido como un poliedro. Un poliedro acotado es}

llamado un pol´ıtopo.

Se dice que x es un punto cerradura de un subconjunto X ⊆ Rn_{, si existe una}

sucesi´on {xk} ⊂ X tal que converge a x. La cerradura de X, se denota como cl(X),

es el conjunto de todos los puntos cerradura de X.

Definici´_{on 1.7 (Conjunto cerrado) Un subconjunto X ⊆ R}n es llamado cerrado, si es igual a su cerradura.

Observaci´on:

Un poliedro es un conjunto convexo y cerrado.

Definici´_{on 1.8 ( Conjunto abierto) Un subconjunto X ⊆ R}n_{es llamado abierto,}

si su complemento {x ∈ Rn _{/ x /}_{∈ X} es cerrado.}

Definici´_{on 1.9 (Conjunto acotado) Un subconjunto X ⊆ R}n_{es llamado acotado,}

si existe un escalar c > 0 tal que kxk ≤ c para todo x ∈ X.

Definici´_{on 1.10 (Conjunto compacto) Un subconjunto X ⊆ R}nes llamado com-pacto, si y s´olo si, es cerrado y acotado.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(16)

Conjunto convexo y envolvente convexa.

Definici´_{on 1.11 (Conjunto convexo) Un conjunto D en R}n _{es llamado convexo,}

si el segmento de l´ınea cerrado une a cualquier par de puntos x1 y x2 del conjunto

D, es decir, λx1+ (1 − λ)x2 pertenece al conjunto D para cualquier 0 ≤ λ ≤ 1.

Algunos ejemplos de conjuntos convexos son: 1. La l´ınea

2. Semiespacios abiertos y cerrados 3. Poliedros y pol´ıtopos

4. Todos los puntos dentro o sobre el c´ırculo 5. Todos los puntos dentro o sobre un pol´ıgono

Lema 1.1 (Algunas propiedades) Sean D1, D2 conjuntos convexos en Rn y λ un

escalar en R. Entonces

1. La intersecci´on D1∩ D2 es un conjunto convexo

2. La suma D1+ D2 es un conjunto convexo

3. El producto λD1 es un conjunto convexo

4. Para λ1 ≥ 0 y λ2 ≥ 0 tal que (λ1 + λ2)D1 = λ1D1 + λ2D1 es un conjunto

convexo. Demostraci´on:

Las demostraciones se encuentran en [5], proposici´on 2.3.

Definici´on 1.12 (Combinaci´on convexa) Sea {x1, x2, . . . , xr} un conjunto finito

de puntos en Rn_{. Una combinaci´}_{on convexa de este conjunto es un punto x ∈ R}n _de

la forma: x = λ1x1 + . . . + λrxr λ1+ . . . + λr= 1 λ1, . . . , λr ≥ 0

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(17)

Definici´_{on 1.13 (Envolvente convexa) Sea D un conjunto arbitrario en R}n. La envolvente convexa de D es denotada H(D) y es definida como la intersecci´on de todos los conjuntos convexos en Rn que contiene a D como un subconjunto, es decir, H(D) es el menor conjunto convexo que contiene a D.

Teorema 1.1 La H(D) es definida como el conjunto de todas las combinaciones convexas de D. Entonces x ∈ H(D) si y s´olo si x puede ser representado como:

x = r P i=1 λixi r P i=1 λi = 1 λi ≥ 0, i = 1, . . . , r xi ∈ D, i = 1, . . . , r

donde r es un entero positivo.

Demostraci´on:

La demostraci´on se encuentra en [5], teorema 2.7.

Definici´on 1.14 La envolvente convexa de un n´umero finito de puntos x1, x2, . . . , xk+1

en Rn _{se llama pol´ıtopo. Si x}

1, x2, . . . , xn+1 son afinmente independientes, es decir,

x2−x1, x3−x1, . . . , xn+1−x1son linealmente independientes, entonces H(x1, x2, . . . , xn+1)

se llama simplex con vertices en x1, x2, . . . , xn+1.

Observaci´on:

Cualquier punto x de la envolvente convexa de un conjunto D en Rn_{puede ser escrito}

como una combinaci´on convexa de a lo m´as n + 1 puntos de D como lo establece el siguiente teorema.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(18)

Teorema 1.2 (Caratheodory) Sea D un conjunto arbitrario en Rn. Si x ∈ H(D), entonces puede ser representado como:

x = n+1 P i=1 λixi n+1 P i=1 λi = 1 λi ≥ 0, i = 1, 2, . . . , n + 1 xi ∈ D, i = 1, 2, . . . , n + 1. Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.1.6 o en [5], teorema 2.8. Teorema 1.3 Sea D un conjunto convexo en Rn _{con int(D) 6= ∅, sea x}

1 ∈ cl(D)

y x2 ∈ int(D), entonces λx1+ (1 − λ)x2 ∈ int(D) para 0 < λ < 1.

Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.2.2

Teorema 1.4 (Vector minimizante) Sea D un conjunto convexo, cerrado y no vac´ıo en Rn y sea y /∈ D, entonces existe un ´unico ¯x ∈ D con distancia m´ınima a y, tal que

ky − ¯xk = m´ın ky − xk, para todo x ∈ D,

adem´as, ¯x es el vector minimizante, si y s´olo si, (y − ¯x)T_{(x − ¯}_{x) ≤ 0, para todo}

x ∈ D. Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.4.1 o en [8], teorema 3.3-1 Observaci´on:

Es decir que el ángulo formado entre los vectores (y − ¯x) y (x − ¯x) para todo x ∈ D es mayor ó igual a 90◦, lo que significa que el conjunto D está en el semiespacio αT_{(x − ¯}_{x) ≤ 0 en relaci´}_{on al hiperplano α}T_{(x − ¯}_{x) = 0 que pasa atraves de ¯}_{x y con}

normal α = (y − ¯x).

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(19)

Teorema 1.5 (Farkas) Sea A ∈ Rm×n y c ∈ Rn, entonces exactamente uno de los siguientes sistemas tiene soluci´on:

1. Ax ≤ 0, cT_{x > 0, para todo x ∈ R}n 2. AT_{y = c, y ≥ 0, para todo y ∈ R}m. Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.4.5

Puntos extremos y direcciones extremas

Definici´_{on 1.15 (Punto extremo) Sea D un conjunto convexo no vac´ıo en R}n. El vector x ∈ D es llamado un punto extremo de D, si x no se puede representar como una combinaci´on convexa estricta de dos puntos distintos en D, es decir, si x = λx1+ (1 − λ)x2 para 0 < λ < 1 y x1, x2 ∈ D, entonces x = x1 = x2.

Definici´on 1.16 (Rayo) Un rayo es una colecci´on de puntos de la forma

{x0 + λd / λ ≥ 0}, donde d es un vector distinto de cero. En este caso, x0 se

denomina v´ertice del rayo y d es una direcci´on del rayo.

Definici´on 1.17 (Direcci´on) Sea D un conjunto convexo cerrado no vac´ıo y d un vector distinto de cero en Rn_{, d se llama direcci´}_{on del conjunto D, si para todo}

x0 en el conjunto D, el rayo {x0+ λd / λ ≥ 0} tambi´en pertenece al conjunto.

Observaci´on:

Si el conjunto D es acotado, entonces no tiene direcciones.

Definición 1.18 (Dirección extrema) Sea D un conjunto convexo cerrado no vac´ıo y d un vector distinto de cero en Rn, d se llama direccion extrema del con-junto D, si no se puede representar como una combinación lineal positiva de dos direcciones distintas del conjunto D, es decir, si d = λ1d1 + λ2d2 donde λ1, λ2 > 0

entonces d1 = αd2 para α > 0.

Se dice que dos direcciones d1 y d2 son distintas, si d1 no se puede representar

como un m´ultiplo positivo de d2.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(20)

Observaci´on:

Cualquier otra direcci´on del conjunto que no sea multiplo de d1 o d2 se puede

repre-sentar como λ1d1+ λ2d2, donde λ1, λ2 > 0.

Teorema 1.6 (Caracterizaci´on de puntos extremos)

Sea D = {x ∈ Rn / Ax ≤ b, x ≥ 0} 6= ∅ un poliedro, donde A ∈ Rm×n, ran(A) = m, m ≤ n y b ∈ Rm_{, un vector x es un punto extremo de D, si y s´}_{olo si, A puede}

particionarce en la forma A = [B|NB] tal que x =      xB · · · xNB      =      B−1b · · · 0      , donde B ∈ Rm×m es no singular, NB ∈ Rm×(n−m) y B−1b ≥ 0. Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.6.4. Observaciones:

Cualquier solución x que satisfaga el teorema se llama solución básica factible, B es una base, xB variables básicas y xNB variables no básicas.

El n´umero de puntos extremos de D es finito (N◦m´ax de puntos extremos ≤ C_mn). Si D es un conjunto no vac´ıo, entonces D tiene al menos un punto extremo.

Teorema 1.7 (Caracterizaci´on de direcciones extremas)

Sea D = {x ∈ Rn _{/ Ax ≤ b, x ≥ 0} 6= ∅ un poliedro, donde A ∈ R}m×n_{, ran(A) = m,}

m ≤ n y b ∈ Rm, un vector ¯d es una direcci´on extrema de D, si y s´olo si, A puede particionarce en la forma A = [B|NB], donde B ∈ Rm×m _{es no singular,}

NB ∈ Rm×(n−m) tal que B−1aj ≤ 0 para alg´un aj de NB y ¯d es un m´ultiplo

po-sitivo de d =      −B−1_a j · · · ej     

donde ej = (0, . . . , 1, . . . , 0)T en la j-esima posici´on,

ej ∈ R(n−m). Demostraci´on:

La demostraci´on se encuentra en [3], teorema 2.6.6.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(21)

Observaciones:

El n´umero de direcciones extremas de D es finito (N◦m´ax de direcciones extremas ≤ (n − m)Cn

m).

D tiene al menos una direcci´on extrema, si y s´olo si, D es no acotado.

Teorema 1.8 Sea D = {x ∈ Rn / Ax ≤ b, x ≥ 0} 6= ∅ un poli´edro, donde A ∈ Rm×n_{, ran(A) = m, m ≤ n y b ∈ R}m_{, sean x}

1, x2, . . . , xk k-puntos extremos de

D y d1, d2, . . . , dl l-direcciones extremas de D, entonces x ∈ D, si y s´olo si

x = k P i=1 λixi+ l P j=1 αjdj k P i=1 λi = 1 λi ≥ 0, i = 1, 2, . . . , k αj ≥ 0, j = 1, 2, . . . , l. Demostraci´on:

1.2. Funciones c´

oncavas

Definici´on 1.19 (Funci´on c´_{oncava) Sea D un subconjunto convexo de R}n _{y f}

una función real sobre D. La función f se dice que es cóncava, si para cualesquier x1, x2 ∈ D, con 0 ≤ λ ≤ 1 se satisface:

f (λx1+ (1 − λ)x2) ≥ λf (x1) + (1 − λ)f (x2)

Definición 1.20 (Función estrictamente cóncava) Sea D un subconjunto conve-xo de Rn _{y f una funci´}_{on real sobre D. La funci´}_{on f se dice que es estrictamente}

c´oncava, si para cualesquier x1, x2 ∈ D, con 0 < λ < 1 se satisface:

f (λx1+ (1 − λ)x2) > λf (x1) + (1 − λ)f (x2)

Observaci´on:

La función f es cóncava sobre D si y sólo si −f es convexa sobre D. As´ı, los resulta-dos obteniresulta-dos para las funciones cóncavas pueden ser modificados en resultados de

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(22)

funciones convexas multiplicando por −1 y viceversa.

Las siguientes afirmaciones son algunas combinaciones de funciones c´oncavas que dan lugar a nuevas funciones c´oncavas :

1. Sean f1, f2, . . . , fn funciones c´oncavas sobre un subconjunto convexo D de Rn,

entonces

f = f1+ f2 + . . . + fn

es c´oncava.

2. Sea f una funci´on c´_{oncava sobre un subconjunto convexo D de R}n y λ un escalar positivo, entonces λf es c´oncava.

3. Sean f1, f2, . . . , fn funciones c´oncavas y acotadas inferiormente sobre un

sub-conjunto convexo D de Rn_{, entonces la funci´}_{on ´ınfimo}

f = ´ınf{f1, f2, . . . , fn}

es c´oncava.

4. Sean f1, f2, . . . , fnfunciones c´oncavas sobre un subconjunto convexo D de Rn,

entonces la función media geométrica f = ( n Y i fi)1/n es cóncava. Conjuntos de nivel

Definici´on 1.21 (Conjunto de nivel inferior) Sea D un conjunto convexo no vac´ıo en Rn_{, f : D −→ R una funci´on convexa y α un escalar real. El conjunto}

definido por

Lα = {x ∈ D / f (x) ≤ α}

es llamado conjunto de nivel inferior.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(23)

Lema 1.2 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on convexa y α un escalar real, entonces el conjunto de nivel inferior

Lα = {x ∈ D / f (x) ≤ α}

es un conjunto convexo.

La demostraci´on se encuentra en [3], lema 3.1.2.

Definición 1.22 (Conjunto de nivel superior) Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una función cóncava y α un escalar real. El conjunto definido por

Uα = {x ∈ D / f (x) ≥ α}

es llamado conjunto de nivel superior.

Lema 1.3 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on c´oncava y α un escalar real, entonces el conjunto de nivel superior

Uα = {x ∈ D / f (x) ≥ α} es un conjunto convexo. Demostraci´on:

La demostración es similar al lema 1.2, pues la función f es cóncava sobre D si y sólo si −f es convexa sobre D.

Definici´on 1.23 (Conjunto de nivel) Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on y α un escalar real. El conjunto definido por

Eα = {x ∈ D / f (x) = α}

es llamado conjunto de nivel.

Proposici´_{on 1.1 Sea D un conjunto convexo no vac´ıo en R}n _{y f : D −→ R una} funci´on diferenciable en D, entonces dado x0 ∈ D el vector ∇f (x0) es perpendicular

al conjunto Ef (x0) = {x ∈ D / f (x) = f (x0)}

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(24)

de nivel de f en x0.

Continuidad y semicontinuidad de una funci´on c´oncava

Definici´on 1.24 (Funci´_{on continua) Sea D un subconjunto de R}n_{, x}

0 ∈ D y f

una funci´on real definida sobre D. f es continua sobre x0, si alguna de las siguientes

condiciones que son equivalentes se satisface:

1. Para cada > 0 existe un δ > 0 : kx − x0k < δ, x ∈ D implica que

− < f (x) − f (x0) <

2. Para cada sucesi´on x1, x2, . . . , xn (xn∈ D) convergente a x0,

l´ım

n→∞f (xn) = f ( l´ımn→∞(xn)) = f (x0).

f es continua sobre D, si es continua sobre cada punto x0 ∈ D.

Definici´on 1.25 (Funci´on Semi-continua inferiormente) f es semi-continua in-feriormente en x0, si alguna de las siguientes condiciones que son equivalentes se

satisface:

1. Para cada > 0 existe un δ > 0 : kx − x0k < δ, x ∈ D implica que

− < f (x) − f (x0)

2. Para cada sucesi´on x1, x2, . . . , xn (xn∈ D) convergente a x0

l´ım

n→∞´ınf f (xn) ≥ f ( l´ımn→∞(xn)) = f (x0)

donde l´ım

n→∞´ınf f (xn) es el ´ınfimo del punto l´ımite de la sucesi´on f (x1), f (x2), . . . , f (xn).

f es semi-continua inferiormente sobre D, si es semi-continua inferiormente para cada x0 ∈ D.

Teorema 1.9 Sea D un conjunto convexo no vac´ıo en Rny f una funci´on c´ onca-va, entonces f es continua en el interior de D.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(25)

La demostraci´on se encuentra en [3], lema 3.1.3. Observaci´on:

Es posible que las funciones c´oncavas y convexas no sean continuas en cualquier lugar, pero los puntos de discontinuidad tienen que estar en la frontera de D.

Teorema 1.10 (Teorema de Weierstrass) Sea D ⊂ Rn _{compacto y f : D −→ R}

una funci´on real continua, entonces existen x1, x2 ∈ D tal que f (x1) ≤ f (x) ≤ f (x2)

para todo x ∈ D.

La demostraci´on se encuentra en [10], capitulo 1, corolario 3.

Teorema 1.11 Sea D un conjunto compacto no vac´ıo en Rn y sea f : D −→ R una funci´on continua sobre D, entonces el problema de m´ın {f (x) / x ∈ D} alcanza su m´ınimo en D. Demostraci´on:

Ep´ıgrafo y Hip´ografo de una funci´on

Definici´on 1.26 (Grafo de una funci´_{on) Sea D un conjunto no vac´ıo en R}n _y

sea f : D −→ R una funci´on. El grafo de la funcion f se define como el conjunto grf (f ) = {(x, f (x)) / x ∈ D} ⊂ Rn+1.

Definici´on 1.27 (Ep´ıgrafo de una funci´_{on) Sea D un conjunto no vac´ıo en R}n

y sea f : D −→ R una funci´on. El ep´ıgrafo de la funcion f , denotada por epi(f ), se define como el conjunto

epi(f ) = {(x, y) / x ∈ D, y ∈ R, y ≥ f (x)} ⊂ Rn+1.

Definici´on 1.28 (Hip´ografo de una funci´_{on) Sea D un conjunto no vac´ıo en R}n

y sea f : D −→ R una funci´on. El Hip´ografo de la funcion f , denotada por hyp(f ), se define como el conjunto

hyp(f ) = {(x, y) / x ∈ D, y ∈ R, y ≤ f (x)} ⊂ Rn+1.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(26)

Teorema 1.12 Sea D un conjunto convexo no vac´ıo en Rn y sea f : D −→ R una funci´on, entonces f es convexa, si y s´olo si, el epi(f ) es un conjunto convexo.

Demostraci´on:

Teorema 1.13 Sea D un conjunto convexo no vac´ıo en Rn _{y sea f : D −→ R}

una función, entonces f es cóncava, si y sólo si, el hyp(f ) es un conjunto convexo.

Demostraci´on:

La demostración es análoga al lema 1.12. Diferenciabilidad de funciones cóncavas

Definici´_{on 1.29 (Derivada direccional) Sea D un conjunto no vac´ıo en R}n_{, sea}

f : D −→ R una funci´on, sea ¯x ∈ D y d es un vector no nulo tal que ¯x + λd ∈ D para λ > 0 suficientemente peque˜no. La derivada direccional de f en ¯x a lo largo del vector d, denotado por f0(¯x, d), se define por el siguiente limite

f0(¯x, d) = l´ım

λ→0

f (¯x + λd) − f (¯x) λ , si existe.

Lema 1.4 Sea f : Rn _{−→ R una funci´on c´oncava. Considerar cualquier punto}

¯

x ∈ Rn _{y una direcci´}_{on no nula d ∈ R}n_{, entonces la derivada direccional f}0_(¯_{x, d) de}

f en ¯x en la direcci´on de d existe. Demostraci´on:

La demostraci´on es an´aloga al lema 3.1.5 en [3].

Definici´on 1.30 (Funci´_{on diferenciable) Sea D un conjunto no vac´ıo en R}n _y

f : D −→ R una funci´on, entonces f se dice que es diferenciable en ¯x ∈ int D, si existe un vector ∇f (¯x), llamado el vector gradiente y una funci´_{on α : R}n _{−→ R tal}

que f (x) = f (¯x) + ∇f (¯x)T(x − ¯x) + kx − ¯xkα(¯x; x − ¯x)

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(27)

para cada x ∈ D , donde el l´ım

x→¯xα(¯x; x − ¯x) = 0.

La funci´on f se dice que es difereciable en el conjunto abierto D0 ⊆ D, si es diferenciable en cada punto en D0.

Teorema 1.14 Sea D un conjunto convexo abierto no vac´ıo en Rn _{y f : D −→ R}

una función diferenciable en D, entonces f es cóncava, si y sólo si, para todo ¯x ∈ D se tiene

f (x) − f (¯x) ≤ ∇f (¯x)T(x − ¯x), para cada x ∈ D.

Similarmente, f es estrictamente cóncava, si y sólo si, para cada ¯x ∈ D se tiene f (x) − f (¯x) < ∇f (¯x)T(x − ¯x), para cada x 6= ¯x en D. Demostración:

La demostraci´on es an´aloga al teorema 3.3.3 en [3].

Teorema 1.15 Sea D un conjunto convexo abierto no vac´ıo en Rn y sea

f : D −→ R una función diferenciable en D, entonces f es cóncava, si y sólo si, para todo x1, x2 ∈ D se tiene

[∇f (x2) − ∇f (x1)]T(x2− x1) ≤ 0.

Similarmente, f es estrictamente c´oncava, si y s´olo si, para cada x1, x2 ∈ D distintos

se tiene [∇f (x2) − ∇f (x1)]T(x2− x1) < 0. Demostraci´on:

Matriz Hessiana definida negativa y semidefinida negativa

Definici´on 1.31 Sea H una matriz sim´_{etrica en R}n×n. La matriz H se dice ser definida negativa, si xT_{Hx < 0, para todo vector x ∈ R}n _{no nulo. La matriz H se}

dice ser semidefinida negativa, si xT_{Hx ≤ 0 para todo vector x ∈ R}n no nulo.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(28)

Definición 1.32 (Función dos veces diferenciable) Sea D un conjunto no vac´ıo en Rn _{y f : D −→ R una función, entonces f se dice que es dos veces diferenciable}

en ¯x ∈ int D, si existe un vector ∇f (¯x), una matriz sim´etrica H(¯x) de orden n × n llamada la matriz Hessiana y una funci´_{on α : R}n_{−→ R tal que}

f (x) = f (¯x) + ∇f (¯x)T(x − ¯x) + 1

2(x − ¯x)

T_H(¯_{x)(x − ¯}_{x) + kx − ¯}_xk2_α(¯_{x; x − ¯}_x)

para cada x ∈ D , donde el l´ım

x→¯xα(¯x; x − ¯x) = 0.

La funci´on f se dice que es dos veces difereciable en el conjunto abierto D0 ⊆ D, si es dos veces diferenciable en cada punto en D0.

una función dos veces diferenciable en D, entonces f es cóncava, si y sólo si, la matriz Hessiana es semidefinida negativa en cada punto en D.

Demostraci´on:

una funci´on dos veces diferenciable en D, si la matriz Hessiana es definida negativa en cada punto en D, entonces f es estrictamente c´oncava.

Resiprocamente, si f es estrictamente cóncava, entonces la matriz Hessiana es se-midefinida negativa en cada punto en D. Sinembargo, si f es estrictamente cóncava y cuadrática, entonces la matriz Hessiana es definida negativa.

Demostraci´on:

La demostración es análoga al teorema 3.3.8 en [3]. Lema 1.5 Considerar una matriz simétrica H =

  a b b c  entonces H es semide-finida negativa, si y s´olo si, a ≤ 0, c ≤ 0 y ac − b2 ≥ 0, y es definida negativa, si y s´olo si, las desigualdad anteriores son todas estrictas.

Una matriz H es semidefinida negativa (definida negativa), si y s´olo si, −H es semidefinida positiva (definida positiva).

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(29)

Demostraci´on:

Teorema 1.18 (F´_{ormula de Taylor infinitesimal) Sea f : I −→ R n-veces} di-ferenciable en el punto a ∈ I. La funci´_{on r : J −→ R, definida en el intervalo} J = {h ∈ R : a + h ∈ I} mediante la igualdad f (a + h) = f (a) + f0(a).h +f 00_(a) 2! .h 2_{+ . . . +} f(n)(a) n! .h n_{+ r(h),} cumple l´ım h→0 r(h)

hn = 0. Resiprocamente, si p(h) es un polinomio de grado ≤ n tal que

r(h) = f (a + h) − p(h) cumple l´ım

h→0

r(h)

hn = 0, entonces p(h) es el polinomio de Taylor

de orden n de f en el punto a, esto es,

n X i=0 f(i)_(a) i! .h i Demostraci´on:

La demostraci´on se encuentra en [9], capitulo 9, teorema 1.

Teorema 1.19 (F´_{ormula de taylor) Sea f : U −→ R una funci´on de clase C}2 en un abierto U ⊂ Rn_{. Para a ∈ U fijo y para todo v = (α}

1, α2, . . . , αn) ∈ Rn tal que a + v ∈ U , se tiene f (a + v) = f (a) + n X i=1 ∂f ∂xi .αi+ 1 2 n X i,j=1 ∂2f ∂xi∂xj .αiαj + r(v),

donde las derivadas parciales son calculadas en el punto a, entonces l´ım

v→0

r(v) kvk2 = 0.

La demostraci´on se encuentra en [10], capitulo 3, teorema 5.

1.3. M´

aximo y m´ınimo de funciones c´

oncavas

Sea D un conjunto convexo cerrado no vac´ıo en Rn_{, f : D −→ R una funci´on}

y considerar el problema de minimizar f (x) sujeto a x ∈ D. Entonces se tiene las siguientes definiciones:

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(30)

Definición 1.33 (Solución factible) Un punto x ∈ D es llamada una solución factible para el problema.

Definici´on 1.34 (M´ınimo local) Supongamos que x∗ ∈ D y que existe un > 0 tal que f (x) ≥ f (x∗) para todo x ∈ D tal que kx − x∗k < , entonces x∗ _{es un}

m´ınimo local.

Definici´on 1.35 (M´ınimo local estricto) Supongamos que x∗ ∈ D y que existe un > 0 tal que f (x) > f (x∗) para todo x ∈ D tal que kx − x∗k < , entonces x∗ _es

un m´ınimo local estricto.

Definici´on 1.36 (M´ınimo global) Supongamos que x∗ ∈ D y que f (x) ≥ f (x∗₎

para todo x ∈ D, entonces x∗ es un m´ınimo global.

En varias aplicaciones prácticas, calcular el m´ınimo global exacto puede ser una tarea dif´ıcil computacionalmente. Con mayor frecuencia se tiene más interés en identificar el m´ınimo global con una tolerancia ≥ 0 dada.

Definición 1.37 (M´ınimo - global) Supongamos que x∗ ∈ D es una solución factible, ≥ 0 es una pequeña tolerancia dada y f (x) ≥ f (x∗) − para todo

x ∈ D tal que kx − x∗k < , entonces x∗ _{es un m´ınimo - global.}

Máximo de una función cóncava

El principal resultado aqu´ı es que todo máximo local de un problema de maximiza-ción cóncava es tambien un máximo global.

Teorema 1.20 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una función cóncava sobre D y sea el problema de maximizar f (x) sujeto a x ∈ D, si x∗ ∈ D es una solución óptima local para el problema.

1. Entonces x∗ es una soluci´on ´optima global para el problema.

2. Si bien x∗ es un máximo local estricto o f es estrictamente cóncava, entonces x∗ es la única solución óptima global.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(31)

Demostraci´on:

Teorema 1.21 Sea f : Rn −→ R una funci´on c´oncava, D un conjunto convexo no vac´ıo en Rn_{y el problema de maximizar f (x) sujeto a x ∈ D. El punto x}∗ _{∈ D es}

una solución óptima para el problema, si y sólo si, f tiene un subgradiente ξ en x∗ tal que ξT_{(x − x}∗_{) ≤ 0 para todo x ∈ D.}

Demostraci´on:

Corolario 1.1 Bajo las suposiciones del teorema 1.21 si D es abierto, entonces x∗ ∈ D es una solución óptima para el problema, si y sólo si, existe un subgradiente cero de f en x∗_{. En particular si D = R}n_{, entonces x}∗ _{es un m´}_{aximo global, si y s´}_olo

si, existe un subgradiente cero de f en x∗.

Demostraci´on:

La demostraci´on es an´aloga al corolario 1 del teorema 3.4.3 en [3].

Corolario 1.2 Adicionando a las suposiciones del teorema 1.21 suponer que f es diferenciable, entonces x∗ ∈ D es una solucion ´optima, si y s´olo si,

∇f (x∗₎T_{(x − x}∗_{) ≤ 0. Por otro lado, si D es abierto entonces x}∗ _{es una soluci´}_on

´

optima, si y s´olo si, ∇f (x∗)T(x − x∗) = 0.

Demostraci´on:

La demostraci´on es an´aloga al corolario 2 del teorema 3.4.3 en [3].

M´ınimo de una funci´on c´oncava

Teorema 1.22 Sea f : Rn _{−→ R una funci´on c´oncava, D un conjunto convexo}

no vac´ıo en Rn y sea el problema de minimizar f (x) sujeto a x ∈ D, si x∗ ∈ D es una soluci´on ´optima local para el problema, entonces ξT_{(x − x}∗_{) ≥ 0 para todo}

x ∈ D, donde ξ es cualquier subgradiente de f en x∗.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(32)

Demostraci´on:

Corolario 1.3 Sea f : Rn −→ R una funci´on c´oncava diferenciable, D un con-junto convexo no vac´ıo en Rn_{y sea el problema de minimizar f (x) sujeto a x ∈ D, si}

x∗ ∈ D es una soluci´on ´optima local para el problema, entonces ∇f (x∗)T(x−x∗) ≥ 0 para todo x ∈ D.

La demostraci´on es an´aloga al corolario del teorema 3.4.6 en [3].

Teorema 1.23 Sea f : Rn _{−→ R una función cóncava, D un conjunto poliédrico}

compacto no vac´ıo en Rn _{y sea el problema de minimizar f (x) sujeto a x ∈ D,}

entonces existe una solución óptima x∗ para el problema, donde x∗ es un punto extremo de D. Demostración:

1.4. Generalizaciones de funciones c´

oncavas

Definición 1.38 (Función cuasic´_{oncava) Sea f : D −→ R una función, donde} D es un conjunto convexo no vac´ıo en Rn_{. La funci´}_{on f es llamada cuasic´}_oncava,

si para cada x1, x2 ∈ D, la siguiente desigualdad es valida

f (λx1 + (1 − λ)x2) ≥ m´ın{f (x1), f (x2)},

para cada λ ∈ (0, 1). Observaciones:

La función f es cuasicóncava, si −f es cuasiconvexa. Toda función cóncava es cuasicóncava.

Teorema 1.24 Sea f : D −→ R una función, donde D es un conjunto convexo no vac´ıo en Rn. La función f es llamada cuasicóncava, si y sólo si, Uα = {x ∈ D /

f (x) ≥ α} es un conjunto convexo para cada n´umero real α.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(33)

Demostraci´on:

Teorema 1.25 Sea D un conjunto poli´_{edrico compacto no vac´ıo en R}n y

f : Rn_{−→ R una funci´on cusic´oncava y continua en D. Si se considera el problema}

de minimizar f (x) sujeto a x ∈ D, entonces existe una soluci´on ´optima x∗ para el problema, donde x∗ es un punto extremo de D.

Demostraci´on:

Teorema 1.26 Sea D un conjunto convexo abierto no vac´ıo en Rn _y

f : D −→ R una función diferenciable en D, entonces f es cuasicóncava, si y sólo si, una de las siguientes afirmaciones equivalentes es válida

1. Si x1, x2 ∈ D y f (x1) ≥ f (x2) ⇒ ∇f (x2)T(x1− x2) ≤ 0 2. Si x1, x2 ∈ D y ∇f (x2)T(x1− x2) < 0 ⇒ f (x1) > f (x2) Demostraci´on:

Definici´on 1.39 (Funci´on cuasic´_{oncava estricta) Sea f : D −→ R una} fun-ci´_{on, donde D es un conjunto convexo no vac´ıo en R}n_{. La funci´}_{on f es llamada}

cuasic´oncava estricta, si para cada x1, x2 ∈ D con f (x1) 6= f (x2), se satisface

f (λx1+ (1 − λ)x2) > m´ın{f (x1), f (x2)},

para cada λ ∈ (0, 1). Observaci´on:

La función f es cuasicóncava estricta, si −f es cuasiconvexa estricta. Toda función cóncava es cuasicóncava estricta.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(34)

Teorema 1.27 Sea f : Rn −→ R una función cusicóncava estricta y sea el problema de maximizar f (x) sujeto a x ∈ D, donde D es un conjunto convexo no vac´ıo en Rn, si x∗ es una solución óptima local para el problema, entonces x∗ también es una solución óptima global para el problema.

Demostraci´on:

Lema 1.6 Sea D un conjunto convexo no vac´ıo en Rn_{, f : R}n_{−→ R una funci´on}

cusic´oncava estricta y semicontinua inferiormente, entonces f es cuasic´oncava.

Demostraci´on:

La demostraci´on es an´aloga al lema 3.5.7 en [3].

Condiciones de optimalidad global

Considerar el problema de minimización cuadrática cóncava m´ın f (x) = 1

2x

T_{Cx + d}T_x

s.a. x ∈ D,

donde f : Rn _{−→ R es una funci´on c´oncava y diferenciable, D es un conjunto}

convexo no vac´ıo en Rn, d ∈ Rn y C ∈ Rn×n es una matriz sim´etrica semidefinida negativa.

La condici´on de optimalidad global para este problema es dada por el siguiente teorema.

Teorema 1.28 (Strekalovsky), ver [14]. Sea z ∈ D tal que −∞ ≤ ´ınf

Rn

f (x) < f (z). Entonces z es una soluci´on del problema anterior, si y s´olo si,

(x − y)T∇f (y) ≥ 0, ∀ y ∈ Ef (z)(f ), ∀ x ∈ D,

donde Ec(f ) = {y ∈ Rn/ f (y) = c} es el conjunto de nivel.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(35)

1.5. M´

etodos num´

ericos para solucionar

ecuacio-nes de una variable

Teorema 1.29 (Teorema del valor intermedio), ver [2]. Si f ∈ C[a, b] y k es cualquier n´umero entre f (a) y f (b), entonces existe un n´umero c en (a, b) tal que f (c) = k.

Teorema 1.30 (Teorema del valor medio), ver [2]. Si f ∈ C[a, b] y f derivable en (a, b), entonces existe un n´umero c en (a, b) tal que

f0(c) = f (b) − f (a) b − a .

Acontinuación, se proponen algunos métodos numéricos para resolver un proble-ma de búsqueda de ra´ıces, de una ecuación de la forma f (x) = 0 para una función dada f .

M´etodo de bisecci´on

Suponer que f es una función continua en el intervalo [a, b] con f (a) y f (b) con signos diferentes. De acuerdo con el teorema del valor intermedio, existe un número p en (a, b) tal que f (p) = 0. Si bien el procedimiento se aplica aun que exista más de una ra´ız en el intervalo (a, b), por razones de simplicidad suponer que la ra´ız de este intervalo es única. El método requiere dividir var´ıas veces a la mitad los subintervalos de [a, b] y en cada paso, localizar la mitad que contenga a p.

Para iniciar, suponer que a1 = a y b1 = b y sea p1 el punto medio de [a, b], es decir,

p1 =

a1+ b1

2 .

Si f (p1) = 0, entonces p = p1, de no ser as´ı, entonces f (p1) tiene el mismo signo que

f (a1) o f (b1). Si f (p1) y f (a1) tienen el mismo signo, entonces p ∈ (p1, b1) y se toma

a2 = p1 y b2 = b1. Si f (p1) y f (a1) tienen signos opuestos, entonces p ∈ (a1, p1) y se

toma a2 = a1y b2 = p1. Desp´ues se vuelve aplicar el proceso iterativo al [a2, b2]. Este

método que se basa en el teorema del valor intermedio recibe el nombre de bisección o de búsqueda binaria.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(36)

Observaci´on:

Para iniciar el algoritmo de bisección hay que encontrar un intervalo [a, b], de modo que f (a) · f (b) < 0. En cada paso, la longitud del intervalo que contiene a la ra´ız de f se reduce en un factor de 2, por lo tanto es conveniente escoger un intervalo [a, b] lo más pequeño posible, para que as´ı el número de iteraciones sea menor. El método de bisección tiene la importante propiedad de que siempre converge a una solución.

Teorema 1.31 Suponer que f ∈ C[a, b] y f (a) · f (b) < 0. El método de bisección que se usa en el algoritmo genera una sucesión {pn}∞n=o que aproxima a una ra´ız de

p de f , tal que |pn− p| = b − a 2n , donde n ≥ 1. Demostraci´on:

La demostraci´on se encuentra en [2], teorema 2.1. Iteraci´on del punto fijo

Definición 1.40 (Punto fijo) Un punto fijo de una función g es un número p, tal que g(p) = p.

Los problemas de búsqueda de ra´ıces y los de punto fijo son equivalentes en el siguiente sentido: Dado un problema de buscar una ra´ız f (p) = 0, se puede definir una función g con un punto fijo en p de la forma g(x) = x − f (x). Por lo contrario, si la función g tiene un punto fijo en p, entonces la función definida por f (x) = x−g(x) tiene una ra´ız en p.

En el siguiente teorema se presentan condiciones para la existencia y unicidad del punto fijo.

Teorema 1.32 Si g ∈ C[a, b] y g(x) ∈ [a, b], ∀x ∈ [a, b], entonces g tiene un punto fijo en [a, b]. Si adem´as g0(x) existe en (a, b) y existe una constante positiva 0 < k < 1 con |g0(x)| ≤ k, ∀ x ∈ (a, b), entonces el punto fijo en [a, b] es ´unico.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(37)

Demostraci´on:

Para aproximar el punto fijo de una funci´on g, se elige una aproximac´ıon inicial p0 y

se genera la sucesi´on {pn}∞n=0 haciendo pn= g(pn−1), ∀ n ≥ 1. Si la sucesi´on converge

en p y si g es continua, entonces p = l´ım

n→∞pn = l´ımn→∞g(pn−1) = g( l´ımn→∞pn−1) = g(p)

y se obtiene una solución con x = g(x). Este método recibe el nombre de iteración del punto fijo o iteración funcional.

Teorema 1.33 (Teorema del punto fijo) Sea g ∈ C[a, b] tal que g(x) ∈ [a, b], ∀x ∈ [a, b]. Adem´as suponer que existe g0(x) en (a, b) y una constante positiva 0 < k < 1 tales que |g0(x)| ≤ k, ∀ x ∈ (a, b), entonces para cualquier n´umero p0 en [a, b], la

sucesi´on definida por

pn= g(pn−1), ∀ n ≥ 1

converge al ´unico punto fijo p en [a, b].

Demostraci´on:

Corolario 1.4 Si g satisface las hip´otesis del teorema anterior, las cotas del error que supone utilizar pn para aproximar a p est´an dadas por

|pn− p| ≤ knm´ax{p0− a, b − p0} y por |pn− p| ≤ kn 1 − k(p1− p0), ∀ n ≥ 1. Demostraci´on:

La demostraci´on se encuentra en [2], corolario 2.4.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(38)

Cap´ıtulo II

M´

etodo de aproximaci´

on para

minimizar problemas c´

oncavos

mediante problemas de

programaci´

on lineal

La siguiente Figura2.1 es la representación geométrica del tipo de problemas de minimización de funciones objetivos cóncavas diferenciables sobre una región factible convexa y compacta, que se resuelven usando la programación lineal.

Figura 2.1: Problema de minimizaci´on c´oncava.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(39)

2.1. Condici´

on de optimalidad global

Considerar el problema de minimizaci´on cuasic´oncava m´ın f (x)

s.a. x ∈ D,

(2.1) donde f : Rn −→ R es una funci´on cuasic´oncava diferenciable y D es un conjunto convexo en Rn_{, entonces el siguiente teorema generaliza el resultado de Strekalovsky,}

ver [14].

Teorema 2.1 Sea z una soluci´on ´optima global del problema (2.1), y sea Ec(f ) = {y ∈ Rn/ f (y) = c},

entonces

(x − y)T∇f (y) ≥ 0, ∀ y ∈ Ef (z)(f ), ∀ x ∈ D. (2.2)

Si adem´as, ∇f (y) 6= 0, ∀ y ∈ Ef (z)(f ), entonces la condici´on (2.2) es suficiente

para afirmar que z ∈ D es una soluci´on ´optima global del problema (2.1).

Demostraci´on:

Necesaria. Suponer que z es un m´ınimo global del problema (2.1) y sea y ∈ Ef (z)(f )

y x ∈ D, entonces se tiene f (x) ≥ f (y), luego f (x) − f (y) ≥ 0. Dado que la funci´on f es cuasic´oncava, resulta que f (αx + (1 − α)y) ≥ m´ın{f (x), f (y)} = f (y) para todo α ∈ [0, 1], esto implica f (y + α(x − y)) ≥ f (y) para todo α ∈ [0, 1], luego f (y + α(x − y)) − f (y) ≥ 0 para todo α ∈ [0, 1]. Por la formula de Taylor, existe una vecindad en el punto y en el cual:

f (y + α(x − y)) = f (y) + (α(x − y))T∇f (y) + o(α(x − y)), ∀ α > 0, donde l´ım

kα(x−y)k→0

o(α(x − y))

kα(x − y)k2 = 0, pero esto es equivalente a escribir

f (y + α(x − y)) = f (y) + α(x − y)T∇f (y) + αo(αkx − yk)

α , ∀ α > 0,

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(40)

con l´ım

α→0

o(αkx − yk)

α = 0, luego por ser f una funci´on cuasic´oncava se tiene f (y + α(x − y)) − f (y) = α

(x − y)T∇f (y) +o(αkx − yk) α ≥ 0, ∀ α > 0, y l´ım α→0 o(αkx − yk) α = 0, esto implica (x − y) T_{∇f (y) ≥ 0, ∀ y ∈ E} f (z)(f ), ∀ x ∈ D.

Suficiente. Por contraposición, suponer que z no es un m´ınimo global del problema (2.1), es decir, existe un u ∈ D tal que f (u) < f (z). Dado que la función es cuasi cóncava, entonces el conjunto de nivel superior Uf (z)(f ) = {x ∈ Rn/ f (x) ≥ f (z)}

es un conjunto convexo y adem´as es cerrado . Tener en cuenta que int Uf (z)(f ) 6= ∅,

pues z ∈ Uf (z)(f ), de acuerdo con la hip´otesis del teorema1.4. Denotar la proyecci´on

de u sobre Uf (z)(f ) por y, es decir, P ry Uf (z)(f ) u = y, y se satisface

ky − uk = m´ın

x∈Uf (z)(f )

kx − uk. De donde, se tiene que

ky − uk > 0 (2.3) ya que u /∈ Uf (z)(f ). Adem´as, y es considerado una soluci´on del siguiente problema

de minimizaci´on convexa

m´ın g(x) = 1

2kx − uk

2

s.a. x ∈ Uf (z)(f ).

Como Uf (z)(f ) 6= ∅ y convexo, la restricción tiene la condición de cualificación.

Bajo esta condición, y es una solución para el problema anterior, si y sólo si, existe un multiplicador de Lagrange λ tal que (y, λ) es solución del siguiente problema complementario no lineal mixto:

           ∇g(y) − λ∇f (y) = 0 λ(f (z) − f (y)) = 0 f (z) − f (y) ≤ 0, λ > 0. (2.4)

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(41)

Si λ = 0, entonces se tiene que ∇g(y) = y − u = 0, que contradice (2.3). Luego para λ > 0 en (2.4), se obtiene y − u − λ∇f (y) = 0, λ > 0, f (y) = f (z). Lo cual implica −ku − yk 2 λ = (u − y) T_{∇f (y), λ > 0,} f (y) = f (z).

De esto, se concluye que (u − y)T∇f (y) < 0, lo cual contradice (2.2). Por lo tanto z es una solución óptima global del problema (2.1). Del teorema 2.1 se tiene que un punto z0 ∈ D no es solución óptima global del problema (2.1_{) si existen x, y ∈ R}n _{tal que}

(x − y)T∇f (y) < 0, f (y) = f (z0), x ∈ D. En el siguiente ejemplo se muestra est´a afirmaci´on.

Ejemplo 2.1 Sea el problema de minimizaci´on cuasic´oncava m´ın f (x1, x2) = x2 1+ x22 1 − x1− x2 s.a. 0.6 ≤ x1 ≤ 7, 0.6 ≤ x2 ≤ 2.

donde f : R2 _{−→ R es una funci´on cuasic´oncava diferenciable y D = [0.6, 7]×[0.6, 2]}

es un pol´ıtopo en R2.

Las Figuras 2.2 y 2.3 son las representaciones geométricas del problema de minimización cuasicóncava.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(42)

Figura 2.2: Regi´on factible y curvas de nivel del problema.

Los puntos A = (0.6, 0.6)T_{, B = (0.6, 2)}T_{, C = (7, 2)}T _{y D = (7, 0.6)}T _son

los vértices de la región factible D. Las curvas de nivel de la función objetivo se obtienen de la ecuación (x1+ k 2) 2 + (x2+ k 2) 2 = k 2_{+ 2k} 2 , ∀ k ∈ R− < −2, 0 > y son circunferencias con centro en c = (−k₂, −k₂) y de radio r =

q

k2_+2k

2 .

Figura 2.3: Funci´on objetivo cuasic´oncava del problema.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(43)

de donde se observa lo siguiente:

1. La regi´on factible es un poliedro acotado (pol´ıtopo).

2. Las curvas de nivel de la funci´on objetivo son circunferencias. 3. El punto factible (0.6, 0.6)T _{es una soluci´}_{on ´}_{optima local.}

4. El punto factible (7, 0.6)T _{es la soluci´}_{on ´}_{optima global.}

5. La solución óptima local y global son puntos extremos. 6. La función objetivo es cuasicóncava.

Esta ´ultima afirmaci´on se puede demostrar usando la validez de una de las siguientes afirmaciones que son equivalentes:

1. Si x1, x2 ∈ D y f (x1) ≥ f (x2) ⇒ ∇f (x2)T(x1− x2) ≤ 0 2. Si x1, x2 ∈ D y ∇f (x2)T(x1− x2) < 0 ⇒ f (x1) > f (x2). El gradiente de la funci´on es ∇f (x) = x 2 2− 2x1x2− x21+ 2x1 (1 − x1− x2)2 ,x 2 1− 2x1x2− x22+ 2x2 (1 − x1− x2)2 T ,

para comprobar que el punto factible A = (0.6 , 0.6)T que es un v´ertice en D, es un m´ınimo local para el problema y no un m´ınimo global, entonces elegir un par de puntos x = (5, 2)T ∈ D y y = (3, 3)T _{∈ E}

f (A)(f ) tal que, se satisface

f (y) = f (A) = −3.6, adem´as se tiene (x − y)T_{∇f (y) = −}12

15 < 0, por tanto el punto

A ∈ D no es una soluci´

BIBLIOTECA

on ´optima global para el problema.

DE

CIENCIAS

FÍSICAS

(44)

2.2. T´

ecnicas de aproximaci´

on del conjunto

de nivel

Para una mejor discusión, se considera sólo el caso cóncavo del problema (2.1), m´ın f (x)

s.a. x ∈ D,

(2.5) donde f : Rn _{−→ R es una funci´on c´oncava diferenciable y D es un conjunto convexo}

y compacto en Rn.

Definici´on 2.1 El conjunto Ef (z)(f ) definido por

Ef (z)(f ) = {y ∈ Rn/ f (y) = f (z)},

es llamado conjunto de nivel de f en el punto z.

Tener en cuenta que la condici´on de optimalidad (2.2) para el problema (2.5) requiere resolver el problema de programaci´on lineal.

m´ın (x − y)T∇f (y) s.a. x ∈ D,

para todo y ∈ Ef (z)(f ). Este es un problema dif´ıcil de resolver, por lo tanto se

necesita encontrar un conjunto de aproximación apropiado de tal manera que se pueda comprobar la condición de optimalidad en un número finito de puntos.

En los siguientes lemas 2.1 y 2.2 se demuestra que encontrar un punto en el conjunto de nivel de f (x) es posible te´oricamente.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(45)

Lema 2.1 Sea h ∈ Rn, z ∈ D el cual no es un maximizador global de f sobre Rn, x∗ una soluci´on ´optima del problema

m´ax f (x) s.a. x ∈ Rn

y el conjunto de todas las soluciones ´optimas es un conjunto acotado, entonces existe un unico n´umero real positivo α, tal que x∗ + αh ∈ Ef (z)(f ).

Demostraci´on:

Existencia. La existencia de un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f )

se demostrar´a por el absurdo. Suponer que no existe un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ), es decir, f (x∗+ αh) 6= f (z), ∀ α ≥ 0, entonces se tiene que

f (x∗+ αh) > f (z), ∀ α ≥ 0.

Tener en cuenta que el hip´ografo de una funci´on f denotada y definida por hyp(f ) = {(x, r) ∈ Rn+1_{/ f (x) ≥ r} es un conjunto convexo y adem´}_{as es cerrado, ya que f es}

una función cóncava, luego para α ≥ 0, se tiene que el punto (x∗+αh, f (z)) ∈ hyp(f ). A continuación se demuestra que el vector (h, 0) es una dirección de hyp(f ), es decir, para todo vector y ∈ hyp(f ) y para todo número real positivo β se tiene que (y + β(h, 0)) ∈ hyp(f ). Por el absurdo, suponer que existe un vector y ∈ hyp(f ) y un n´_{umero real positivo β tal que y+β(h, 0) ∈ R}n+1_{\hyp(f ). Ya que R}n+1_{\hyp(f ) es un}

conjunto abierto, entonces existe un n´umero real µ tal que, satisface las siguientes condiciones:

µ(x∗_{, f (z)) + (1 − µ)(y + β(h, 0)) ∈ R}n+1\hyp(f ), 0 < µ < 1 (2.6) Por otro lado, se demuestra que µ(x∗, f (z)) + (1 − µ)(y + β(h, 0)) se encuentra en el segmento de recta que une algunos dos puntos de hyp(f ). Para los puntos (x∗, f (z)) + (1−µ)β_µ (h, 0) y y se tiene la siguiente ecuaci´on

µ((x∗, f (z)) +(1 − µ)β µ (h, 0)) + (1 − µ)y = µ(x ∗ , f (z)) + (1 − µ)(y + β(h, 0)),

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(46)

luego por la convexidad de hyp(f ), se tiene µ(x∗, f (z))+(1−µ)(y+β(h, 0)) ∈ hyp(f ), lo cual contradice (2.6). Por lo tanto (h, 0) es una direcci´on de hyp(f ). Luego ya que (x∗, f (x∗)) ∈ hyp(f ), entonces la siguiente afirmacion es verdadera

(x∗, f (x∗)) + α(h, 0) ∈ hyp(f ), ∀ α ≥ 0, esto implica

(x∗ + αh, f (x∗)) ∈ hyp(f ), ∀ α ≥ 0, es decir se tiene

f (x∗+ αh) ≥ f (x∗), ∀ α ≥ 0.

De esto, se concluye que x∗+ αh es tambien un maximizador global de f , ∀ α ≥ 0, porque x∗ _{es un maximizador global de f sobre R}n_{, lo cual contradice a la suposici´}_on

en el lema. Por lo tanto existe un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ).

Unicidad. Para demostrar la propiedad de la unicidad, suponer que existen dos n´umeros reales positivos α1, α2 tal que x∗ + αih ∈ Ef (z)(f ) para todo i = 1, 2 es

decir, f (x∗ + α1h) = f (z) y f (x∗+ α2h) = f (z). Sin p´erdida de generalidad, se

puede asumir que 0 < α1 ≤ α2, esto implica 0 < α_α1₂ ≤ 1. Luego por ser f una

funci´on c´oncava se tiene

f (z) = f (x∗ + α1h) = f (x∗− α1 α2 x∗+ α1 α2 x∗+ α1h) = f ((1 − α1 α2 )x∗+α1 α2 (x∗+ α2h)) ≥ (1 − α1 α2 )f (x∗) + α1 α2 f (x∗+ α2h) = (1 − α1 α2 )f (x∗) + α1 α2 f (z) ≥ f (z), esto implica f (z) ≥ (1 −α1 α2 )f (x∗) + α1 α2 f (z) ≥ f (z).

De esto, se concluye que la ´ultima desigualdad es valida si α1 = α2, por lo tanto el

n´umero real positivo α es ´unico. Bajo algunas condiciones, es posible calcular un punto en el conjunto de nivel. Esto se demuestra en la siguiente lema 2.2 .

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

(47)

Lema 2.2 Sea un punto z ∈ D y un vector h ∈ Rn, tal que hT∇f (z) < 0 y sea x∗ el maximizador global de f sobre D. Entonces existe un ´unico n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ).

Demostraci´on:

Por el absurdo. Suponer que no existe un ´unico n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ), es decir, f (z) 6= f (x∗+ αh), ∀ α ≥ 0, entonces se tiene

f (z) < f (x∗+ αh), ∀ α ≥ 0, esto implica

0 < f (x∗+ αh) − f (z), ∀ α ≥ 0.

Por un lado, tener en cuenta que f (x∗) ≥ f (z), ∀ z ∈ D, esto implica f (x∗) − f (z) ≥ 0, ∀ z ∈ D.

Luego por ser f una funci´on c´oncava y diferenciable, se tine (x∗− z)T_{∇f (z) ≥ f (x}∗

) − f (z) ≥ 0, esto implica

(x∗− z)T∇f (z) ≥ 0.

De la ´ultima desigualdad y de la suposici´on que hT_{∇f (z) < 0, se puede concluir}

(x∗− z)T_{∇f (z)}

hT_{∇f (z)} ≤ 0.

Por otro lado, dado que f es una funci´on c´oncava y diferenciable, para todo α ≥ 0, se tiene 0 < f (x∗+ αh) − f (z) ≤ (x∗ + αh − z)T∇f (z) = (x∗− z)T_{∇f (z) + αh}T_{∇f (z).} Luego para α = −(x ∗_{− z)}T_{∇f (z)} hT_{∇f (z)} ≥ 0, se obtiene que 0 < f (x∗+ αh) − f (z) ≤ 0,

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y

MATEMÁTICAS

(48)

esto implica

f (x∗+ αh) = f (z),

lo cual es una contradicción a la suposición de que no existe un único número real positivo α tal que x∗+ αh ∈ Ef (z)(f ). Por lo tanto la afirmación está demostrada.

En el siguiente ejemplo 2.2 se determina f´ormulas anal´ıticas de como encontrar un punto en el conjunto de nivel de f (x) para el problema (2.7), bajo ciertas condiciones.

Ejemplo 2.2 Sea el problema de minimización cuadrática cóncava m´ın f (x) = 1

2x

T_{Cx + d}T_x

s.a. x ∈ D,

(2.7) donde f : Rn −→ R es una funci´on c´oncava y diferenciable, D es un conjunto convexo en Rn_{, d ∈ R}n _{y C ∈ R}n×n _{es una matriz sim´}_{etrica definida negativa.}

Ya que C es una matriz definida negativa, se tiene que hTCh < 0 para todo h 6= 0. Por los lemas 2.1 y 2.2 existe un único número real positivo α tal que x∗ + αh ∈ Ef (z)(f ), es decir, f (x∗ + αh) = f (z), luego resolviendo la ecuación

f (x∗+ αh) = f (z) con respecto a α, se tiene f (z) = 1 2(x ∗ + αh)TC(x∗+ αh) + dT(x∗+ αh) = 1 2(x ∗T Cx∗+ αx∗TCh + αhTCx∗+ α2hTCh) + dTx∗+ αdTh = 1 2x ∗T Cx∗+ dTx∗+1 2(αx ∗T Ch + αhTCx∗+ α2hTCh) + αdTh = f (x∗) + αhT(Cx∗+ d) + 1 2α 2 hTCh, esto implica f (x∗) + αhT(Cx∗+ d) + 1 2α 2_hT_{Ch = f (z).}

Luego como x∗ _{es el maximizador global de f sobre R}n _{y C es una matriz definida}

negativa, se tiene ∇f (x∗) = 0, entonces se satisface Cx∗ + d = 0, esto implica x∗ = −C−1d. Usando este resultado se tiene que