UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS F´ISICAS Y MATEM ´
ATICAS
ESCUELA ACAD´
EMICO PROFESIONAL DE MATEM ´
ATICAS
APROXIMACI ´
ON A LA SOLUCI ´
ON GLOBAL DE PROBLEMAS
DE MINIMIZACI ´
ON C ´
ONCAVOS MEDIANTE PROBLEMAS DE
PROGRAMACI ´
ON LINEAL
TESIS PARA OPTAR EL T´ITULO DE LICENCIADO EN MATEM ´ATICA
Autor:
Br. REYES ZAVALETA CESAR ANTONIO
Asesora:
Dra. Rojas Jer´onimo Jenny Margarita
Trujillo - Per´u 2018
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS F´ISICAS Y MATEM ´
ATICAS
ESCUELA ACAD´
EMICO PROFESIONAL DE MATEM ´
ATICAS
APROXIMACI ´
ON A LA SOLUCI ´
ON GLOBAL DE PROBLEMAS
DE MINIMIZACI ´
ON C ´
ONCAVOS MEDIANTE PROBLEMAS DE
PROGRAMACI ´
ON LINEAL
TESIS PARA OPTAR EL T´ITULO DE LICENCIADO EN MATEM ´ATICA
Autor:
Br. REYES ZAVALETA CESAR ANTONIO
Asesora:
Dra. Rojas Jer´onimo Jenny Margarita Trujillo - Per´u 2018
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
Jurado
Dr. Edmundo Vergara Moreno Presidente
Mg. Jorge Luis Horna Mercedes Secretario
Dra. Jenny Margarita Rojas Jer´onimo Vocal
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Dedicatoria
Se lo dedico a Dios por ser el gu´ıa en todo mi camino y fortalecerme en los momentos m´as dif´ıciles. A mis padres Juan Gilberto y Ana Mar´ıa que me dieron la Vida y me ense˜naron como vivirla. A mis hermanos Carmen Esther y Jos´e Lu´ıs que m´as que hermanos son mis verdaderos amigos. A mi amor Anabel que me ense˜n´o a Amar.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Agradecimiento
Quiero agradecer a mis padres por apoyarme siempre, a mis maestros por sus ense˜nanzas, en especial a mi asesora Dra. Jenny Margarita Rojas Jer´onimo. Doy las gracias tambi´en al coordinador del curso de Tesis: Dr. Amado M´endez Cruz y a todos los profesores, personal administrativo y estudiantes del Departamento de Matem´aticas por sus ense˜nanzas, apoyo y por el compartir desinteresado de material acad´emico y otros.
+
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Presentaci´
on
Se˜nores miembros del jurado:
Presento ante ustedes el informe final del Proyecto de Tesis “ APROXIMACI ´ON A LA SOLUCI ´ON GLOBAL DE PROBLEMAS DE MINIMIZACI ´ON C ´ONCAVOS MEDIANTE PROBLEMAS DE PROGRAMACI ´ON LINEAL ”, con el prop´osito de optar el t´ıtulo de Licenciado en matem´aticas. Esperando cumplir con los reque-rimientos de aprobaci´on.
Agradezco anticipadamente sus opiniones y cr´ıticas, pues me servir´an como est´ımulo para continuar mejorando.
Reyes Zavaleta Cesar Antonio
Trujillo, 28 de Diciembre del 2018
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Lista de S´ımbolos
Rn : Espacio vectorial real n-dimencional.
Rm×n : Espacio de las matrices reales de orden m × n. H(S) : Envolvente convexa de un conjunto S en Rn. int(S) : Interior de un conjunto S en Rn.
cl(S) : Clausura de un conjunto S en Rn. ´ınf f : Infimo de una funci´on f .
D : Conjunto convexo no vac´ıo en Rn.
z : Una soluci´on factible de la regi´on factible D.
Lf (z)(f ) : Conjunto de nivel inferior de una funci´on f en el punto z.
Uf (z)(f ) : Conjunto de nivel superior de una funci´on f en el punto z.
Ef (z)(f ) : Conjunto de nivel de una funci´on f en el punto z.
hyp(f ) : Hip´ografo de una funci´on f . epi(f ) : Ep´ıgrafo de una funci´on f .
Am
z : Conjunto de aproximaci´on del Ef (z)(f ).
A2nz : Conjunto de aproximaci´on trivial del Ef (z)(f ).
B2n
z : Conjunto de aproximaci´on de segundo orden Ef (z)(f ).
Cz2n : Conjunto de aproximaci´on ortogonal del Ef (z)(f ).
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
´
Indice general
Jurado III
Dedicatoria IV
Agradecimiento V
Presentaci´on VI
Lista de S´ımbolos VII
Resumen X
Abstract XI
Introducci´on XII
I. Preliminares matem´aticos para minimizar problemas c´oncavos 1
1.1. Conjuntos convexos . . . 1
1.2. Funciones c´oncavas . . . 8
1.3. M´aximo y m´ınimo de funciones c´oncavas . . . 16
1.4. Generalizaciones de funciones c´oncavas . . . 19
1.5. M´etodos num´ericos para solucionar ecuaciones de una variable . . . . 22
II. M´etodo de aproximaci´on para minimizar problemas c´oncavos me-diante problemas de programaci´on lineal 25 2.1. Condici´on de optimalidad global . . . 26
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
2.2. T´ecnicas de aproximaci´on del conjunto de nivel . . . 31
2.3. Construcci´on de puntos sobre el conjunto de nivel . . . 36
2.3.1. Conjunto de aproximaci´on trivial . . . 39
2.3.2. Conjunto de aproximaci´on de segundo orden . . . 39
2.3.3. Conjunto de aproximaci´on ortogonal . . . 43
III.Algoritmos, convergencia y ejemplos 45 3.1. Algoritmo, convergencia y ejemplos usando el A2n z . . . 46
3.2. Algoritmo y ejemplos usando la combinaci´on del A2nz y Bz2n . . . 53
3.3. Algoritmo y ejemplos usando la combinaci´on del A2n z , Bz2n y Cz2n . . . 62
3.4. Algoritmos en el lenguaje de programaci´on C. . . 70
Resultados 75
Conclusiones 77
Sugerencias 78
Referencias Bibliogr´aficas 79
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Resumen
En el presente trabajo se analiza y determina condiciones para verificar la con-dici´on de optimalidad global para problemas de minimizaci´on c´oncavos mediante problemas de programaci´on lineal, haciendo uso de t´ecnicas de aproximaci´on del conjunto de nivel, de tal manera que se garantice la aproximaci´on a la soluci´on glo-bal de problemas de minimizaci´on c´oncavos. La importancia del presente trabajo se justifica por la diversidad de clases de problemas de optimizaci´on global que pueden ser transformados en problemas de minimizaci´on c´oncavos equivalentes, los cuales se presentan en muchos problemas de aplicaci´on.
Para llevar a cabo el presente trabajo, se tuvo como referencia trabajos relaciona-dos con la aproximaci´on a la soluci´on global de problemas de minimizaci´on c´oncavos como aproximaciones para problemas de programaci´on cuadr´atica c´oncava sobre un conjuto poli´edrico. Se espera obtener mejores resultados para la aproximaci´on a la soluci´on global de problemas de minimizaci´on c´oncavos.
Palabras claves: Optimizaci´on global; problemas de minimizaci´on c´oncavos; problemas de programaci´
BIBLIOTECA
on lineal; t´ecnicas de aproximaci´on del conjunto de nivel.DE
CIENCIAS
FÍSICAS
Abstract
In the present work we analyze and determine conditions to verify the global optimality condition for concave minimization problems in linear programming pro-blems, making use of approach techniques of the level set, so as to guarantee an approximation to the global solution from concave minimization problems. The im-portance of current work is the justification for the diversity of classes of global optimization problems that can be transformed into equivalent minimization pro-blems, which are presented in many application problems.
To perform a work with the present work, has a reference of works related to the approximation to the global solution of concave minimization problems as appro-ximations for quadratic programming problems on a polyhedral set. It is expected to obtain better results for the approximation to the global solution of concave minimization problems.
Key words: Global optimization; concave minimization problems; linear pro-gramming problems; level set approximation techniques.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Introducci´
on
El principal objetivo de la optimizaci´on global es encontrar el ´optimo global de un problema, esto puede resultar dif´ıcil si tratamos de usar las t´ecnicas de progra-maci´on no lineal, pues s´olo encontraremos ´optimos locales, que no necesariamente son globales. Es por esto que se hace imprescindible el desarrollo de t´ecnicas que nos ayuden a encontrar la soluci´on ´optima global. En este trabajo se estudia una rama de la optimizaci´on global conocida como minimizaci´on c´oncava. Las t´ecnicas de minimizaci´on c´oncavas cumplen un rol muy importante en diferentes campos de la optimizaci´on global, puesto que gran diversidad de problemas de optimizaci´on global pueden ser transformados en problemas de minimizaci´on c´oncavos equivalen-tes. La minimizaci´on c´oncava se puede aplicar en diferentes campos del conocimiento tales como en la econom´ıa, telecomunicaciones, transporte, dise˜no computacional y finanzas, ver [13].
Un problema de minimizaci´on c´oncava en general se puede formular matem´ ati-camente como:
m´ın f (x) s.a. x ∈ D,
donde f : D ⊆ Rn −→ R es una funci´on c´oncava y D ⊆ Rnun conjunto convexo. Los
problemas de minimizaci´on c´oncavos generalmente poseen muchas soluciones locales que no son globales. Cuando D es un pol´ıtopo, el m´ınimo global del problema ante-rior se encuentra en un v´ertice de D, ver [7,15]; para la soluci´on de ´estos casos, tanto locales como globales, se han propuesto aproximaciones determin´ısticas y estoc´ asti-cas, entre las que se cuentan con tres aproximaciones algoritmicas fundamentales, la primera aproximaci´on es el m´etodo enumerativo y las otras dos aproximaciones
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
son el m´etodo de aproximaciones sucesivas y el m´etodo de ramificaci´on y acotaci´on, ver [12, 11].
En el presente trabajo se resuelve el siguiente problema: ¿Bajo qu´e condiciones es posible tener una aproximaci´on a la soluci´on global de problemas de minimiza-ci´on c´oncavos mediante problemas de programaci´on lineal?, para esto, se determina condiciones que verifiquen la condici´on de optimalidad global para problemas de mi-nimizaci´on c´oncavos y se presenta un m´etodo de aproximaci´on basado en problemas de programaci´on lineal.
Un problema de minimizaci´on c´oncava con restricciones espec´ıficas se puede formular matem´aticamente como:
m´ın f (x) s.a. x ∈ D,
donde f : D ⊂ Rn −→ R es una funci´on c´oncava diferenciable y D ⊂ Rnun conjunto
convexo y compacto. La idea b´asica es encontrar una soluci´on aproximada para el problema resolviendo problemas de programaci´on lineal con las mismas restricciones que el problema original, es decir, el m´etodo consiste en generar una sucesi´on de minimizadores locales, ya sea finalizando en una soluci´on ´optima global o en una soluci´on ´optima global aproximada mediante un n´umero finito de iteraciones, donde en cada iteraci´on se resuelve una serie de problemas de programaci´on lineal con las mismas restricciones del problema original, ver [1, 4].
El presente trabajo se desarrolla en tres cap´ıtulos organizados de la siguiente manera: En el cap´ıtulo I, se presenta los preliminares matem´aticos para minimi-zar problemas c´oncavos. En el cap´ıtulo II se desarrolla el m´etodo de aproximaci´on para minimizar problemas c´oncavos mediante problemas de programaci´on lineal; se presenta una condici´on de optimalidad global para el problema cuasic´oncavo, se introduce el concepto de t´ecnicas de aproximaci´on y conjunto de aproximaci´on del conjunto de nivel, que ser´an utiles para la construcci´on de los algoritmos. En el cap´ıtulo III se desarrolla los algoritmos, convergencia y ejemplos; se presentan tres algoritmos para resolver el problema cuadr´atico c´oncavo y se establecen sus propiedades de convergencia bajo ciertas condiciones.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Cap´ıtulo I
Preliminares matem´
aticos para
minimizar problemas c´
oncavos
A continuaci´on se presenta algunas definiciones, propiedades y resultados que ser´an la base para el desarrollo del presente trabajo.
1.1.
Conjuntos convexos
Definici´on 1.1 (L´ınea) Sean los vectores x1, x2 ∈ Rn. La l´ınea que pasa a trav´es
de los puntos x1 y x2 es definida como el conjunto
{x ∈ Rn / x = λx
1 + (1 − λ)x2, λ ∈ R}
Definici´on 1.2 (Segmento cerrado) Sean los vectores x1, x2 ∈ Rn. El segmento
de l´ınea cerrado que pasa a trav´es de los puntos x1 y x2 es definida como el conjunto
{x ∈ Rn / x = λx
1+ (1 − λ)x2, 0 ≤ λ ≤ 1}
Los segmentos de l´ınea abiertos, cerrados-abiertos y abiertos-cerrados pueden ser definidos de manera an´aloga modificando las desigualdades para λ.
Definici´on 1.3 (Semiespacio) Sea el vector c ∈ Rn, c 6= 0 y el escalar z ∈ R. El semiespacio abierto en Rn es definido como el conjunto
{x ∈ Rn / cTx < z}
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
El semiespacio cerrado en Rn es definido como el conjunto {x ∈ Rn / cTx ≤ z}
Definici´on 1.4 (Hiperplano) Sea el vector c ∈ Rn, c 6= 0 y el escalar z ∈ R. El hiperplano en Rn es definido como el conjunto
{x ∈ Rn / cTx = z}
Definici´on 1.5 (Hiperplano soporte) Sea D un conjunto no vac´ıo en Rn y sea ¯
x ∈ ∂D. Un hiperplano H = {x ∈ Rn / cT(x − ¯x) = 0} es llamado un hiperplano
soporte de D en ¯x, si cT(x − ¯x) ≥ 0 para todo x ∈ D, o bien, si cT(x − ¯x) ≤ 0 para todo x ∈ D
Definici´on 1.6 (Poliedro y Pol´ıtopo) La intersecci´on de un n´umero finito de semiespacios cerrados en Rn es definido como un poliedro. Un poliedro acotado es
llamado un pol´ıtopo.
Se dice que x es un punto cerradura de un subconjunto X ⊆ Rn, si existe una
sucesi´on {xk} ⊂ X tal que converge a x. La cerradura de X, se denota como cl(X),
es el conjunto de todos los puntos cerradura de X.
Definici´on 1.7 (Conjunto cerrado) Un subconjunto X ⊆ Rn es llamado cerrado, si es igual a su cerradura.
Observaci´on:
Un poliedro es un conjunto convexo y cerrado.
Definici´on 1.8 ( Conjunto abierto) Un subconjunto X ⊆ Rnes llamado abierto,
si su complemento {x ∈ Rn / x /∈ X} es cerrado.
Definici´on 1.9 (Conjunto acotado) Un subconjunto X ⊆ Rnes llamado acotado,
si existe un escalar c > 0 tal que kxk ≤ c para todo x ∈ X.
Definici´on 1.10 (Conjunto compacto) Un subconjunto X ⊆ Rnes llamado com-pacto, si y s´olo si, es cerrado y acotado.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Conjunto convexo y envolvente convexa.
Definici´on 1.11 (Conjunto convexo) Un conjunto D en Rn es llamado convexo,
si el segmento de l´ınea cerrado une a cualquier par de puntos x1 y x2 del conjunto
D, es decir, λx1+ (1 − λ)x2 pertenece al conjunto D para cualquier 0 ≤ λ ≤ 1.
Algunos ejemplos de conjuntos convexos son: 1. La l´ınea
2. Semiespacios abiertos y cerrados 3. Poliedros y pol´ıtopos
4. Todos los puntos dentro o sobre el c´ırculo 5. Todos los puntos dentro o sobre un pol´ıgono
Lema 1.1 (Algunas propiedades) Sean D1, D2 conjuntos convexos en Rn y λ un
escalar en R. Entonces
1. La intersecci´on D1∩ D2 es un conjunto convexo
2. La suma D1+ D2 es un conjunto convexo
3. El producto λD1 es un conjunto convexo
4. Para λ1 ≥ 0 y λ2 ≥ 0 tal que (λ1 + λ2)D1 = λ1D1 + λ2D1 es un conjunto
convexo. Demostraci´on:
Las demostraciones se encuentran en [5], proposici´on 2.3.
Definici´on 1.12 (Combinaci´on convexa) Sea {x1, x2, . . . , xr} un conjunto finito
de puntos en Rn. Una combinaci´on convexa de este conjunto es un punto x ∈ Rn de
la forma: x = λ1x1 + . . . + λrxr λ1+ . . . + λr= 1 λ1, . . . , λr ≥ 0
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
Definici´on 1.13 (Envolvente convexa) Sea D un conjunto arbitrario en Rn. La envolvente convexa de D es denotada H(D) y es definida como la intersecci´on de todos los conjuntos convexos en Rn que contiene a D como un subconjunto, es decir, H(D) es el menor conjunto convexo que contiene a D.
Teorema 1.1 La H(D) es definida como el conjunto de todas las combinaciones convexas de D. Entonces x ∈ H(D) si y s´olo si x puede ser representado como:
x = r P i=1 λixi r P i=1 λi = 1 λi ≥ 0, i = 1, . . . , r xi ∈ D, i = 1, . . . , r
donde r es un entero positivo.
Demostraci´on:
La demostraci´on se encuentra en [5], teorema 2.7.
Definici´on 1.14 La envolvente convexa de un n´umero finito de puntos x1, x2, . . . , xk+1
en Rn se llama pol´ıtopo. Si x
1, x2, . . . , xn+1 son afinmente independientes, es decir,
x2−x1, x3−x1, . . . , xn+1−x1son linealmente independientes, entonces H(x1, x2, . . . , xn+1)
se llama simplex con vertices en x1, x2, . . . , xn+1.
Observaci´on:
Cualquier punto x de la envolvente convexa de un conjunto D en Rnpuede ser escrito
como una combinaci´on convexa de a lo m´as n + 1 puntos de D como lo establece el siguiente teorema.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Teorema 1.2 (Caratheodory) Sea D un conjunto arbitrario en Rn. Si x ∈ H(D), entonces puede ser representado como:
x = n+1 P i=1 λixi n+1 P i=1 λi = 1 λi ≥ 0, i = 1, 2, . . . , n + 1 xi ∈ D, i = 1, 2, . . . , n + 1. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.1.6 o en [5], teorema 2.8. Teorema 1.3 Sea D un conjunto convexo en Rn con int(D) 6= ∅, sea x
1 ∈ cl(D)
y x2 ∈ int(D), entonces λx1+ (1 − λ)x2 ∈ int(D) para 0 < λ < 1.
Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.2.2
Teorema 1.4 (Vector minimizante) Sea D un conjunto convexo, cerrado y no vac´ıo en Rn y sea y /∈ D, entonces existe un ´unico ¯x ∈ D con distancia m´ınima a y, tal que
ky − ¯xk = m´ın ky − xk, para todo x ∈ D,
adem´as, ¯x es el vector minimizante, si y s´olo si, (y − ¯x)T(x − ¯x) ≤ 0, para todo
x ∈ D. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.4.1 o en [8], teorema 3.3-1 Observaci´on:
Es decir que el ´angulo formado entre los vectores (y − ¯x) y (x − ¯x) para todo x ∈ D es mayor ´o igual a 90◦, lo que significa que el conjunto D est´a en el semiespacio αT(x − ¯x) ≤ 0 en relaci´on al hiperplano αT(x − ¯x) = 0 que pasa atraves de ¯x y con
normal α = (y − ¯x).
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Teorema 1.5 (Farkas) Sea A ∈ Rm×n y c ∈ Rn, entonces exactamente uno de los siguientes sistemas tiene soluci´on:
1. Ax ≤ 0, cTx > 0, para todo x ∈ Rn 2. ATy = c, y ≥ 0, para todo y ∈ Rm. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.4.5
Puntos extremos y direcciones extremas
Definici´on 1.15 (Punto extremo) Sea D un conjunto convexo no vac´ıo en Rn. El vector x ∈ D es llamado un punto extremo de D, si x no se puede representar como una combinaci´on convexa estricta de dos puntos distintos en D, es decir, si x = λx1+ (1 − λ)x2 para 0 < λ < 1 y x1, x2 ∈ D, entonces x = x1 = x2.
Definici´on 1.16 (Rayo) Un rayo es una colecci´on de puntos de la forma
{x0 + λd / λ ≥ 0}, donde d es un vector distinto de cero. En este caso, x0 se
denomina v´ertice del rayo y d es una direcci´on del rayo.
Definici´on 1.17 (Direcci´on) Sea D un conjunto convexo cerrado no vac´ıo y d un vector distinto de cero en Rn, d se llama direcci´on del conjunto D, si para todo
x0 en el conjunto D, el rayo {x0+ λd / λ ≥ 0} tambi´en pertenece al conjunto.
Observaci´on:
Si el conjunto D es acotado, entonces no tiene direcciones.
Definici´on 1.18 (Direcci´on extrema) Sea D un conjunto convexo cerrado no vac´ıo y d un vector distinto de cero en Rn, d se llama direccion extrema del con-junto D, si no se puede representar como una combinaci´on lineal positiva de dos direcciones distintas del conjunto D, es decir, si d = λ1d1 + λ2d2 donde λ1, λ2 > 0
entonces d1 = αd2 para α > 0.
Se dice que dos direcciones d1 y d2 son distintas, si d1 no se puede representar
como un m´ultiplo positivo de d2.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Observaci´on:
Cualquier otra direcci´on del conjunto que no sea multiplo de d1 o d2 se puede
repre-sentar como λ1d1+ λ2d2, donde λ1, λ2 > 0.
Teorema 1.6 (Caracterizaci´on de puntos extremos)
Sea D = {x ∈ Rn / Ax ≤ b, x ≥ 0} 6= ∅ un poliedro, donde A ∈ Rm×n, ran(A) = m, m ≤ n y b ∈ Rm, un vector x es un punto extremo de D, si y s´olo si, A puede
particionarce en la forma A = [B|NB] tal que x = xB · · · xNB = B−1b · · · 0 , donde B ∈ Rm×m es no singular, NB ∈ Rm×(n−m) y B−1b ≥ 0. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.6.4. Observaciones:
Cualquier soluci´on x que satisfaga el teorema se llama soluci´on b´asica factible, B es una base, xB variables b´asicas y xNB variables no b´asicas.
El n´umero de puntos extremos de D es finito (N◦m´ax de puntos extremos ≤ Cmn). Si D es un conjunto no vac´ıo, entonces D tiene al menos un punto extremo.
Teorema 1.7 (Caracterizaci´on de direcciones extremas)
Sea D = {x ∈ Rn / Ax ≤ b, x ≥ 0} 6= ∅ un poliedro, donde A ∈ Rm×n, ran(A) = m,
m ≤ n y b ∈ Rm, un vector ¯d es una direcci´on extrema de D, si y s´olo si, A puede particionarce en la forma A = [B|NB], donde B ∈ Rm×m es no singular,
NB ∈ Rm×(n−m) tal que B−1aj ≤ 0 para alg´un aj de NB y ¯d es un m´ultiplo
po-sitivo de d = −B−1a j · · · ej
donde ej = (0, . . . , 1, . . . , 0)T en la j-esima posici´on,
ej ∈ R(n−m). Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.6.6.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Observaciones:
El n´umero de direcciones extremas de D es finito (N◦m´ax de direcciones extremas ≤ (n − m)Cn
m).
D tiene al menos una direcci´on extrema, si y s´olo si, D es no acotado.
Teorema 1.8 Sea D = {x ∈ Rn / Ax ≤ b, x ≥ 0} 6= ∅ un poli´edro, donde A ∈ Rm×n, ran(A) = m, m ≤ n y b ∈ Rm, sean x
1, x2, . . . , xk k-puntos extremos de
D y d1, d2, . . . , dl l-direcciones extremas de D, entonces x ∈ D, si y s´olo si
x = k P i=1 λixi+ l P j=1 αjdj k P i=1 λi = 1 λi ≥ 0, i = 1, 2, . . . , k αj ≥ 0, j = 1, 2, . . . , l. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.6.7.
1.2.
Funciones c´
oncavas
Definici´on 1.19 (Funci´on c´oncava) Sea D un subconjunto convexo de Rn y f
una funci´on real sobre D. La funci´on f se dice que es c´oncava, si para cualesquier x1, x2 ∈ D, con 0 ≤ λ ≤ 1 se satisface:
f (λx1+ (1 − λ)x2) ≥ λf (x1) + (1 − λ)f (x2)
Definici´on 1.20 (Funci´on estrictamente c´oncava) Sea D un subconjunto conve-xo de Rn y f una funci´on real sobre D. La funci´on f se dice que es estrictamente
c´oncava, si para cualesquier x1, x2 ∈ D, con 0 < λ < 1 se satisface:
f (λx1+ (1 − λ)x2) > λf (x1) + (1 − λ)f (x2)
Observaci´on:
La funci´on f es c´oncava sobre D si y s´olo si −f es convexa sobre D. As´ı, los resulta-dos obteniresulta-dos para las funciones c´oncavas pueden ser modificados en resultados de
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
funciones convexas multiplicando por −1 y viceversa.
Las siguientes afirmaciones son algunas combinaciones de funciones c´oncavas que dan lugar a nuevas funciones c´oncavas :
1. Sean f1, f2, . . . , fn funciones c´oncavas sobre un subconjunto convexo D de Rn,
entonces
f = f1+ f2 + . . . + fn
es c´oncava.
2. Sea f una funci´on c´oncava sobre un subconjunto convexo D de Rn y λ un escalar positivo, entonces λf es c´oncava.
3. Sean f1, f2, . . . , fn funciones c´oncavas y acotadas inferiormente sobre un
sub-conjunto convexo D de Rn, entonces la funci´on ´ınfimo
f = ´ınf{f1, f2, . . . , fn}
es c´oncava.
4. Sean f1, f2, . . . , fnfunciones c´oncavas sobre un subconjunto convexo D de Rn,
entonces la funci´on media geom´etrica f = ( n Y i fi)1/n es c´oncava. Conjuntos de nivel
Definici´on 1.21 (Conjunto de nivel inferior) Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on convexa y α un escalar real. El conjunto
definido por
Lα = {x ∈ D / f (x) ≤ α}
es llamado conjunto de nivel inferior.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Lema 1.2 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on convexa y α un escalar real, entonces el conjunto de nivel inferior
Lα = {x ∈ D / f (x) ≤ α}
es un conjunto convexo.
La demostraci´on se encuentra en [3], lema 3.1.2.
Definici´on 1.22 (Conjunto de nivel superior) Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on c´oncava y α un escalar real. El conjunto definido por
Uα = {x ∈ D / f (x) ≥ α}
es llamado conjunto de nivel superior.
Lema 1.3 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on c´oncava y α un escalar real, entonces el conjunto de nivel superior
Uα = {x ∈ D / f (x) ≥ α} es un conjunto convexo. Demostraci´on:
La demostraci´on es similar al lema 1.2, pues la funci´on f es c´oncava sobre D si y s´olo si −f es convexa sobre D.
Definici´on 1.23 (Conjunto de nivel) Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on y α un escalar real. El conjunto definido por
Eα = {x ∈ D / f (x) = α}
es llamado conjunto de nivel.
Proposici´on 1.1 Sea D un conjunto convexo no vac´ıo en Rn y f : D −→ R una funci´on diferenciable en D, entonces dado x0 ∈ D el vector ∇f (x0) es perpendicular
al conjunto Ef (x0) = {x ∈ D / f (x) = f (x0)}
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
de nivel de f en x0.
Continuidad y semicontinuidad de una funci´on c´oncava
Definici´on 1.24 (Funci´on continua) Sea D un subconjunto de Rn, x
0 ∈ D y f
una funci´on real definida sobre D. f es continua sobre x0, si alguna de las siguientes
condiciones que son equivalentes se satisface:
1. Para cada > 0 existe un δ > 0 : kx − x0k < δ, x ∈ D implica que
− < f (x) − f (x0) <
2. Para cada sucesi´on x1, x2, . . . , xn (xn∈ D) convergente a x0,
l´ım
n→∞f (xn) = f ( l´ımn→∞(xn)) = f (x0).
f es continua sobre D, si es continua sobre cada punto x0 ∈ D.
Definici´on 1.25 (Funci´on Semi-continua inferiormente) f es semi-continua in-feriormente en x0, si alguna de las siguientes condiciones que son equivalentes se
satisface:
1. Para cada > 0 existe un δ > 0 : kx − x0k < δ, x ∈ D implica que
− < f (x) − f (x0)
2. Para cada sucesi´on x1, x2, . . . , xn (xn∈ D) convergente a x0
l´ım
n→∞´ınf f (xn) ≥ f ( l´ımn→∞(xn)) = f (x0)
donde l´ım
n→∞´ınf f (xn) es el ´ınfimo del punto l´ımite de la sucesi´on f (x1), f (x2), . . . , f (xn).
f es semi-continua inferiormente sobre D, si es semi-continua inferiormente para cada x0 ∈ D.
Teorema 1.9 Sea D un conjunto convexo no vac´ıo en Rny f una funci´on c´ onca-va, entonces f es continua en el interior de D.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
La demostraci´on se encuentra en [3], lema 3.1.3. Observaci´on:
Es posible que las funciones c´oncavas y convexas no sean continuas en cualquier lugar, pero los puntos de discontinuidad tienen que estar en la frontera de D.
Teorema 1.10 (Teorema de Weierstrass) Sea D ⊂ Rn compacto y f : D −→ R
una funci´on real continua, entonces existen x1, x2 ∈ D tal que f (x1) ≤ f (x) ≤ f (x2)
para todo x ∈ D.
La demostraci´on se encuentra en [10], capitulo 1, corolario 3.
Teorema 1.11 Sea D un conjunto compacto no vac´ıo en Rn y sea f : D −→ R una funci´on continua sobre D, entonces el problema de m´ın {f (x) / x ∈ D} alcanza su m´ınimo en D. Demostraci´on:
La demostraci´on se encuentra en [3], teorema 2.3.1.
Ep´ıgrafo y Hip´ografo de una funci´on
Definici´on 1.26 (Grafo de una funci´on) Sea D un conjunto no vac´ıo en Rn y
sea f : D −→ R una funci´on. El grafo de la funcion f se define como el conjunto grf (f ) = {(x, f (x)) / x ∈ D} ⊂ Rn+1.
Definici´on 1.27 (Ep´ıgrafo de una funci´on) Sea D un conjunto no vac´ıo en Rn
y sea f : D −→ R una funci´on. El ep´ıgrafo de la funcion f , denotada por epi(f ), se define como el conjunto
epi(f ) = {(x, y) / x ∈ D, y ∈ R, y ≥ f (x)} ⊂ Rn+1.
Definici´on 1.28 (Hip´ografo de una funci´on) Sea D un conjunto no vac´ıo en Rn
y sea f : D −→ R una funci´on. El Hip´ografo de la funcion f , denotada por hyp(f ), se define como el conjunto
hyp(f ) = {(x, y) / x ∈ D, y ∈ R, y ≤ f (x)} ⊂ Rn+1.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Teorema 1.12 Sea D un conjunto convexo no vac´ıo en Rn y sea f : D −→ R una funci´on, entonces f es convexa, si y s´olo si, el epi(f ) es un conjunto convexo.
Demostraci´on:
La demostraci´on se encuentra en [3], teorema 3.2.2.
Teorema 1.13 Sea D un conjunto convexo no vac´ıo en Rn y sea f : D −→ R
una funci´on, entonces f es c´oncava, si y s´olo si, el hyp(f ) es un conjunto convexo.
Demostraci´on:
La demostraci´on es an´aloga al lema 1.12. Diferenciabilidad de funciones c´oncavas
Definici´on 1.29 (Derivada direccional) Sea D un conjunto no vac´ıo en Rn, sea
f : D −→ R una funci´on, sea ¯x ∈ D y d es un vector no nulo tal que ¯x + λd ∈ D para λ > 0 suficientemente peque˜no. La derivada direccional de f en ¯x a lo largo del vector d, denotado por f0(¯x, d), se define por el siguiente limite
f0(¯x, d) = l´ım
λ→0
f (¯x + λd) − f (¯x) λ , si existe.
Lema 1.4 Sea f : Rn −→ R una funci´on c´oncava. Considerar cualquier punto
¯
x ∈ Rn y una direcci´on no nula d ∈ Rn, entonces la derivada direccional f0(¯x, d) de
f en ¯x en la direcci´on de d existe. Demostraci´on:
La demostraci´on es an´aloga al lema 3.1.5 en [3].
Definici´on 1.30 (Funci´on diferenciable) Sea D un conjunto no vac´ıo en Rn y
f : D −→ R una funci´on, entonces f se dice que es diferenciable en ¯x ∈ int D, si existe un vector ∇f (¯x), llamado el vector gradiente y una funci´on α : Rn −→ R tal
que f (x) = f (¯x) + ∇f (¯x)T(x − ¯x) + kx − ¯xkα(¯x; x − ¯x)
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
para cada x ∈ D , donde el l´ım
x→¯xα(¯x; x − ¯x) = 0.
La funci´on f se dice que es difereciable en el conjunto abierto D0 ⊆ D, si es diferenciable en cada punto en D0.
Teorema 1.14 Sea D un conjunto convexo abierto no vac´ıo en Rn y f : D −→ R
una funci´on diferenciable en D, entonces f es c´oncava, si y s´olo si, para todo ¯x ∈ D se tiene
f (x) − f (¯x) ≤ ∇f (¯x)T(x − ¯x), para cada x ∈ D.
Similarmente, f es estrictamente c´oncava, si y s´olo si, para cada ¯x ∈ D se tiene f (x) − f (¯x) < ∇f (¯x)T(x − ¯x), para cada x 6= ¯x en D. Demostraci´on:
La demostraci´on es an´aloga al teorema 3.3.3 en [3].
Teorema 1.15 Sea D un conjunto convexo abierto no vac´ıo en Rn y sea
f : D −→ R una funci´on diferenciable en D, entonces f es c´oncava, si y s´olo si, para todo x1, x2 ∈ D se tiene
[∇f (x2) − ∇f (x1)]T(x2− x1) ≤ 0.
Similarmente, f es estrictamente c´oncava, si y s´olo si, para cada x1, x2 ∈ D distintos
se tiene [∇f (x2) − ∇f (x1)]T(x2− x1) < 0. Demostraci´on:
La demostraci´on es an´aloga al teorema 3.3.4 en [3].
Matriz Hessiana definida negativa y semidefinida negativa
Definici´on 1.31 Sea H una matriz sim´etrica en Rn×n. La matriz H se dice ser definida negativa, si xTHx < 0, para todo vector x ∈ Rn no nulo. La matriz H se
dice ser semidefinida negativa, si xTHx ≤ 0 para todo vector x ∈ Rn no nulo.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Definici´on 1.32 (Funci´on dos veces diferenciable) Sea D un conjunto no vac´ıo en Rn y f : D −→ R una funci´on, entonces f se dice que es dos veces diferenciable
en ¯x ∈ int D, si existe un vector ∇f (¯x), una matriz sim´etrica H(¯x) de orden n × n llamada la matriz Hessiana y una funci´on α : Rn−→ R tal que
f (x) = f (¯x) + ∇f (¯x)T(x − ¯x) + 1
2(x − ¯x)
TH(¯x)(x − ¯x) + kx − ¯xk2α(¯x; x − ¯x)
para cada x ∈ D , donde el l´ım
x→¯xα(¯x; x − ¯x) = 0.
La funci´on f se dice que es dos veces difereciable en el conjunto abierto D0 ⊆ D, si es dos veces diferenciable en cada punto en D0.
Teorema 1.16 Sea D un conjunto convexo abierto no vac´ıo en Rn y f : D −→ R
una funci´on dos veces diferenciable en D, entonces f es c´oncava, si y s´olo si, la matriz Hessiana es semidefinida negativa en cada punto en D.
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.3.7 en [3].
Teorema 1.17 Sea D un conjunto convexo abierto no vac´ıo en Rn y f : D −→ R
una funci´on dos veces diferenciable en D, si la matriz Hessiana es definida negativa en cada punto en D, entonces f es estrictamente c´oncava.
Resiprocamente, si f es estrictamente c´oncava, entonces la matriz Hessiana es se-midefinida negativa en cada punto en D. Sinembargo, si f es estrictamente c´oncava y cuadr´atica, entonces la matriz Hessiana es definida negativa.
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.3.8 en [3]. Lema 1.5 Considerar una matriz sim´etrica H =
a b b c entonces H es semide-finida negativa, si y s´olo si, a ≤ 0, c ≤ 0 y ac − b2 ≥ 0, y es definida negativa, si y s´olo si, las desigualdad anteriores son todas estrictas.
Una matriz H es semidefinida negativa (definida negativa), si y s´olo si, −H es semidefinida positiva (definida positiva).
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.3.11 en [3].
Teorema 1.18 (F´ormula de Taylor infinitesimal) Sea f : I −→ R n-veces di-ferenciable en el punto a ∈ I. La funci´on r : J −→ R, definida en el intervalo J = {h ∈ R : a + h ∈ I} mediante la igualdad f (a + h) = f (a) + f0(a).h +f 00(a) 2! .h 2+ . . . + f(n)(a) n! .h n+ r(h), cumple l´ım h→0 r(h)
hn = 0. Resiprocamente, si p(h) es un polinomio de grado ≤ n tal que
r(h) = f (a + h) − p(h) cumple l´ım
h→0
r(h)
hn = 0, entonces p(h) es el polinomio de Taylor
de orden n de f en el punto a, esto es,
n X i=0 f(i)(a) i! .h i Demostraci´on:
La demostraci´on se encuentra en [9], capitulo 9, teorema 1.
Teorema 1.19 (F´ormula de taylor) Sea f : U −→ R una funci´on de clase C2 en un abierto U ⊂ Rn. Para a ∈ U fijo y para todo v = (α
1, α2, . . . , αn) ∈ Rn tal que a + v ∈ U , se tiene f (a + v) = f (a) + n X i=1 ∂f ∂xi .αi+ 1 2 n X i,j=1 ∂2f ∂xi∂xj .αiαj + r(v),
donde las derivadas parciales son calculadas en el punto a, entonces l´ım
v→0
r(v) kvk2 = 0.
La demostraci´on se encuentra en [10], capitulo 3, teorema 5.
1.3.
M´
aximo y m´ınimo de funciones c´
oncavas
Sea D un conjunto convexo cerrado no vac´ıo en Rn, f : D −→ R una funci´on
y considerar el problema de minimizar f (x) sujeto a x ∈ D. Entonces se tiene las siguientes definiciones:
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Definici´on 1.33 (Soluci´on factible) Un punto x ∈ D es llamada una soluci´on factible para el problema.
Definici´on 1.34 (M´ınimo local) Supongamos que x∗ ∈ D y que existe un > 0 tal que f (x) ≥ f (x∗) para todo x ∈ D tal que kx − x∗k < , entonces x∗ es un
m´ınimo local.
Definici´on 1.35 (M´ınimo local estricto) Supongamos que x∗ ∈ D y que existe un > 0 tal que f (x) > f (x∗) para todo x ∈ D tal que kx − x∗k < , entonces x∗ es
un m´ınimo local estricto.
Definici´on 1.36 (M´ınimo global) Supongamos que x∗ ∈ D y que f (x) ≥ f (x∗)
para todo x ∈ D, entonces x∗ es un m´ınimo global.
En varias aplicaciones pr´acticas, calcular el m´ınimo global exacto puede ser una tarea dif´ıcil computacionalmente. Con mayor frecuencia se tiene m´as inter´es en identificar el m´ınimo global con una tolerancia ≥ 0 dada.
Definici´on 1.37 (M´ınimo - global) Supongamos que x∗ ∈ D es una soluci´on factible, ≥ 0 es una peque˜na tolerancia dada y f (x) ≥ f (x∗) − para todo
x ∈ D tal que kx − x∗k < , entonces x∗ es un m´ınimo - global.
M´aximo de una funci´on c´oncava
El principal resultado aqu´ı es que todo m´aximo local de un problema de maximiza-ci´on c´oncava es tambien un m´aximo global.
Teorema 1.20 Sea D un conjunto convexo no vac´ıo en Rn, f : D −→ R una funci´on c´oncava sobre D y sea el problema de maximizar f (x) sujeto a x ∈ D, si x∗ ∈ D es una soluci´on ´optima local para el problema.
1. Entonces x∗ es una soluci´on ´optima global para el problema.
2. Si bien x∗ es un m´aximo local estricto o f es estrictamente c´oncava, entonces x∗ es la ´unica soluci´on ´optima global.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.4.2 en [3].
Teorema 1.21 Sea f : Rn −→ R una funci´on c´oncava, D un conjunto convexo no vac´ıo en Rny el problema de maximizar f (x) sujeto a x ∈ D. El punto x∗ ∈ D es
una soluci´on ´optima para el problema, si y s´olo si, f tiene un subgradiente ξ en x∗ tal que ξT(x − x∗) ≤ 0 para todo x ∈ D.
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.4.3 en [3].
Corolario 1.1 Bajo las suposiciones del teorema 1.21 si D es abierto, entonces x∗ ∈ D es una soluci´on ´optima para el problema, si y s´olo si, existe un subgradiente cero de f en x∗. En particular si D = Rn, entonces x∗ es un m´aximo global, si y s´olo
si, existe un subgradiente cero de f en x∗.
Demostraci´on:
La demostraci´on es an´aloga al corolario 1 del teorema 3.4.3 en [3].
Corolario 1.2 Adicionando a las suposiciones del teorema 1.21 suponer que f es diferenciable, entonces x∗ ∈ D es una solucion ´optima, si y s´olo si,
∇f (x∗)T(x − x∗) ≤ 0. Por otro lado, si D es abierto entonces x∗ es una soluci´on
´
optima, si y s´olo si, ∇f (x∗)T(x − x∗) = 0.
Demostraci´on:
La demostraci´on es an´aloga al corolario 2 del teorema 3.4.3 en [3].
M´ınimo de una funci´on c´oncava
Teorema 1.22 Sea f : Rn −→ R una funci´on c´oncava, D un conjunto convexo
no vac´ıo en Rn y sea el problema de minimizar f (x) sujeto a x ∈ D, si x∗ ∈ D es una soluci´on ´optima local para el problema, entonces ξT(x − x∗) ≥ 0 para todo
x ∈ D, donde ξ es cualquier subgradiente de f en x∗.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.4.6 en [3].
Corolario 1.3 Sea f : Rn −→ R una funci´on c´oncava diferenciable, D un con-junto convexo no vac´ıo en Rny sea el problema de minimizar f (x) sujeto a x ∈ D, si
x∗ ∈ D es una soluci´on ´optima local para el problema, entonces ∇f (x∗)T(x−x∗) ≥ 0 para todo x ∈ D.
La demostraci´on es an´aloga al corolario del teorema 3.4.6 en [3].
Teorema 1.23 Sea f : Rn −→ R una funci´on c´oncava, D un conjunto poli´edrico
compacto no vac´ıo en Rn y sea el problema de minimizar f (x) sujeto a x ∈ D,
entonces existe una soluci´on ´optima x∗ para el problema, donde x∗ es un punto extremo de D. Demostraci´on:
La demostraci´on es an´aloga al teorema 3.4.7 en [3].
1.4.
Generalizaciones de funciones c´
oncavas
Definici´on 1.38 (Funci´on cuasic´oncava) Sea f : D −→ R una funci´on, donde D es un conjunto convexo no vac´ıo en Rn. La funci´on f es llamada cuasic´oncava,
si para cada x1, x2 ∈ D, la siguiente desigualdad es valida
f (λx1 + (1 − λ)x2) ≥ m´ın{f (x1), f (x2)},
para cada λ ∈ (0, 1). Observaciones:
La funci´on f es cuasic´oncava, si −f es cuasiconvexa. Toda funci´on c´oncava es cuasic´oncava.
Teorema 1.24 Sea f : D −→ R una funci´on, donde D es un conjunto convexo no vac´ıo en Rn. La funci´on f es llamada cuasic´oncava, si y s´olo si, Uα = {x ∈ D /
f (x) ≥ α} es un conjunto convexo para cada n´umero real α.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.5.2 en [3].
Teorema 1.25 Sea D un conjunto poli´edrico compacto no vac´ıo en Rn y
f : Rn−→ R una funci´on cusic´oncava y continua en D. Si se considera el problema
de minimizar f (x) sujeto a x ∈ D, entonces existe una soluci´on ´optima x∗ para el problema, donde x∗ es un punto extremo de D.
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.5.3 en [3].
Teorema 1.26 Sea D un conjunto convexo abierto no vac´ıo en Rn y
f : D −→ R una funci´on diferenciable en D, entonces f es cuasic´oncava, si y s´olo si, una de las siguientes afirmaciones equivalentes es v´alida
1. Si x1, x2 ∈ D y f (x1) ≥ f (x2) ⇒ ∇f (x2)T(x1− x2) ≤ 0 2. Si x1, x2 ∈ D y ∇f (x2)T(x1− x2) < 0 ⇒ f (x1) > f (x2) Demostraci´on:
La demostraci´on es an´aloga al teorema 3.5.4 en [3].
Definici´on 1.39 (Funci´on cuasic´oncava estricta) Sea f : D −→ R una fun-ci´on, donde D es un conjunto convexo no vac´ıo en Rn. La funci´on f es llamada
cuasic´oncava estricta, si para cada x1, x2 ∈ D con f (x1) 6= f (x2), se satisface
f (λx1+ (1 − λ)x2) > m´ın{f (x1), f (x2)},
para cada λ ∈ (0, 1). Observaci´on:
La funci´on f es cuasic´oncava estricta, si −f es cuasiconvexa estricta. Toda funci´on c´oncava es cuasic´oncava estricta.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Teorema 1.27 Sea f : Rn −→ R una funci´on cusic´oncava estricta y sea el problema de maximizar f (x) sujeto a x ∈ D, donde D es un conjunto convexo no vac´ıo en Rn, si x∗ es una soluci´on ´optima local para el problema, entonces x∗ tambi´en es una soluci´on ´optima global para el problema.
Demostraci´on:
La demostraci´on es an´aloga al teorema 3.5.6 en [3].
Lema 1.6 Sea D un conjunto convexo no vac´ıo en Rn, f : Rn−→ R una funci´on
cusic´oncava estricta y semicontinua inferiormente, entonces f es cuasic´oncava.
Demostraci´on:
La demostraci´on es an´aloga al lema 3.5.7 en [3].
Condiciones de optimalidad global
Considerar el problema de minimizaci´on cuadr´atica c´oncava m´ın f (x) = 1
2x
TCx + dTx
s.a. x ∈ D,
donde f : Rn −→ R es una funci´on c´oncava y diferenciable, D es un conjunto
convexo no vac´ıo en Rn, d ∈ Rn y C ∈ Rn×n es una matriz sim´etrica semidefinida negativa.
La condici´on de optimalidad global para este problema es dada por el siguiente teorema.
Teorema 1.28 (Strekalovsky), ver [14]. Sea z ∈ D tal que −∞ ≤ ´ınf
Rn
f (x) < f (z). Entonces z es una soluci´on del problema anterior, si y s´olo si,
(x − y)T∇f (y) ≥ 0, ∀ y ∈ Ef (z)(f ), ∀ x ∈ D,
donde Ec(f ) = {y ∈ Rn/ f (y) = c} es el conjunto de nivel.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
1.5.
M´
etodos num´
ericos para solucionar
ecuacio-nes de una variable
Teorema 1.29 (Teorema del valor intermedio), ver [2]. Si f ∈ C[a, b] y k es cualquier n´umero entre f (a) y f (b), entonces existe un n´umero c en (a, b) tal que f (c) = k.
Teorema 1.30 (Teorema del valor medio), ver [2]. Si f ∈ C[a, b] y f derivable en (a, b), entonces existe un n´umero c en (a, b) tal que
f0(c) = f (b) − f (a) b − a .
Acontinuaci´on, se proponen algunos m´etodos num´ericos para resolver un proble-ma de b´usqueda de ra´ıces, de una ecuaci´on de la forma f (x) = 0 para una funci´on dada f .
M´etodo de bisecci´on
Suponer que f es una funci´on continua en el intervalo [a, b] con f (a) y f (b) con signos diferentes. De acuerdo con el teorema del valor intermedio, existe un n´umero p en (a, b) tal que f (p) = 0. Si bien el procedimiento se aplica aun que exista m´as de una ra´ız en el intervalo (a, b), por razones de simplicidad suponer que la ra´ız de este intervalo es ´unica. El m´etodo requiere dividir var´ıas veces a la mitad los subintervalos de [a, b] y en cada paso, localizar la mitad que contenga a p.
Para iniciar, suponer que a1 = a y b1 = b y sea p1 el punto medio de [a, b], es decir,
p1 =
a1+ b1
2 .
Si f (p1) = 0, entonces p = p1, de no ser as´ı, entonces f (p1) tiene el mismo signo que
f (a1) o f (b1). Si f (p1) y f (a1) tienen el mismo signo, entonces p ∈ (p1, b1) y se toma
a2 = p1 y b2 = b1. Si f (p1) y f (a1) tienen signos opuestos, entonces p ∈ (a1, p1) y se
toma a2 = a1y b2 = p1. Desp´ues se vuelve aplicar el proceso iterativo al [a2, b2]. Este
m´etodo que se basa en el teorema del valor intermedio recibe el nombre de bisecci´on o de b´usqueda binaria.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Observaci´on:
Para iniciar el algoritmo de bisecci´on hay que encontrar un intervalo [a, b], de modo que f (a) · f (b) < 0. En cada paso, la longitud del intervalo que contiene a la ra´ız de f se reduce en un factor de 2, por lo tanto es conveniente escoger un intervalo [a, b] lo m´as peque˜no posible, para que as´ı el n´umero de iteraciones sea menor. El m´etodo de bisecci´on tiene la importante propiedad de que siempre converge a una soluci´on.
Teorema 1.31 Suponer que f ∈ C[a, b] y f (a) · f (b) < 0. El m´etodo de bisecci´on que se usa en el algoritmo genera una sucesi´on {pn}∞n=o que aproxima a una ra´ız de
p de f , tal que |pn− p| = b − a 2n , donde n ≥ 1. Demostraci´on:
La demostraci´on se encuentra en [2], teorema 2.1. Iteraci´on del punto fijo
Definici´on 1.40 (Punto fijo) Un punto fijo de una funci´on g es un n´umero p, tal que g(p) = p.
Los problemas de b´usqueda de ra´ıces y los de punto fijo son equivalentes en el siguiente sentido: Dado un problema de buscar una ra´ız f (p) = 0, se puede definir una funci´on g con un punto fijo en p de la forma g(x) = x − f (x). Por lo contrario, si la funci´on g tiene un punto fijo en p, entonces la funci´on definida por f (x) = x−g(x) tiene una ra´ız en p.
En el siguiente teorema se presentan condiciones para la existencia y unicidad del punto fijo.
Teorema 1.32 Si g ∈ C[a, b] y g(x) ∈ [a, b], ∀x ∈ [a, b], entonces g tiene un punto fijo en [a, b]. Si adem´as g0(x) existe en (a, b) y existe una constante positiva 0 < k < 1 con |g0(x)| ≤ k, ∀ x ∈ (a, b), entonces el punto fijo en [a, b] es ´unico.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Demostraci´on:
La demostraci´on se encuentra en [2], teorema 2.2.
Para aproximar el punto fijo de una funci´on g, se elige una aproximac´ıon inicial p0 y
se genera la sucesi´on {pn}∞n=0 haciendo pn= g(pn−1), ∀ n ≥ 1. Si la sucesi´on converge
en p y si g es continua, entonces p = l´ım
n→∞pn = l´ımn→∞g(pn−1) = g( l´ımn→∞pn−1) = g(p)
y se obtiene una soluci´on con x = g(x). Este m´etodo recibe el nombre de iteraci´on del punto fijo o iteraci´on funcional.
Teorema 1.33 (Teorema del punto fijo) Sea g ∈ C[a, b] tal que g(x) ∈ [a, b], ∀x ∈ [a, b]. Adem´as suponer que existe g0(x) en (a, b) y una constante positiva 0 < k < 1 tales que |g0(x)| ≤ k, ∀ x ∈ (a, b), entonces para cualquier n´umero p0 en [a, b], la
sucesi´on definida por
pn= g(pn−1), ∀ n ≥ 1
converge al ´unico punto fijo p en [a, b].
Demostraci´on:
La demostraci´on se encuentra en [2], teorema 2.3.
Corolario 1.4 Si g satisface las hip´otesis del teorema anterior, las cotas del error que supone utilizar pn para aproximar a p est´an dadas por
|pn− p| ≤ knm´ax{p0− a, b − p0} y por |pn− p| ≤ kn 1 − k(p1− p0), ∀ n ≥ 1. Demostraci´on:
La demostraci´on se encuentra en [2], corolario 2.4.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Cap´ıtulo II
M´
etodo de aproximaci´
on para
minimizar problemas c´
oncavos
mediante problemas de
programaci´
on lineal
La siguiente Figura2.1 es la representaci´on geom´etrica del tipo de problemas de minimizaci´on de funciones objetivos c´oncavas diferenciables sobre una regi´on factible convexa y compacta, que se resuelven usando la programaci´on lineal.
Figura 2.1: Problema de minimizaci´on c´oncava.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
2.1.
Condici´
on de optimalidad global
Considerar el problema de minimizaci´on cuasic´oncava m´ın f (x)
s.a. x ∈ D,
(2.1) donde f : Rn −→ R es una funci´on cuasic´oncava diferenciable y D es un conjunto convexo en Rn, entonces el siguiente teorema generaliza el resultado de Strekalovsky,
ver [14].
Teorema 2.1 Sea z una soluci´on ´optima global del problema (2.1), y sea Ec(f ) = {y ∈ Rn/ f (y) = c},
entonces
(x − y)T∇f (y) ≥ 0, ∀ y ∈ Ef (z)(f ), ∀ x ∈ D. (2.2)
Si adem´as, ∇f (y) 6= 0, ∀ y ∈ Ef (z)(f ), entonces la condici´on (2.2) es suficiente
para afirmar que z ∈ D es una soluci´on ´optima global del problema (2.1).
Demostraci´on:
Necesaria. Suponer que z es un m´ınimo global del problema (2.1) y sea y ∈ Ef (z)(f )
y x ∈ D, entonces se tiene f (x) ≥ f (y), luego f (x) − f (y) ≥ 0. Dado que la funci´on f es cuasic´oncava, resulta que f (αx + (1 − α)y) ≥ m´ın{f (x), f (y)} = f (y) para todo α ∈ [0, 1], esto implica f (y + α(x − y)) ≥ f (y) para todo α ∈ [0, 1], luego f (y + α(x − y)) − f (y) ≥ 0 para todo α ∈ [0, 1]. Por la formula de Taylor, existe una vecindad en el punto y en el cual:
f (y + α(x − y)) = f (y) + (α(x − y))T∇f (y) + o(α(x − y)), ∀ α > 0, donde l´ım
kα(x−y)k→0
o(α(x − y))
kα(x − y)k2 = 0, pero esto es equivalente a escribir
f (y + α(x − y)) = f (y) + α(x − y)T∇f (y) + αo(αkx − yk)
α , ∀ α > 0,
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
con l´ım
α→0
o(αkx − yk)
α = 0, luego por ser f una funci´on cuasic´oncava se tiene f (y + α(x − y)) − f (y) = α
(x − y)T∇f (y) +o(αkx − yk) α ≥ 0, ∀ α > 0, y l´ım α→0 o(αkx − yk) α = 0, esto implica (x − y) T∇f (y) ≥ 0, ∀ y ∈ E f (z)(f ), ∀ x ∈ D.
Suficiente. Por contraposici´on, suponer que z no es un m´ınimo global del problema (2.1), es decir, existe un u ∈ D tal que f (u) < f (z). Dado que la funci´on es cuasi c´oncava, entonces el conjunto de nivel superior Uf (z)(f ) = {x ∈ Rn/ f (x) ≥ f (z)}
es un conjunto convexo y adem´as es cerrado . Tener en cuenta que int Uf (z)(f ) 6= ∅,
pues z ∈ Uf (z)(f ), de acuerdo con la hip´otesis del teorema1.4. Denotar la proyecci´on
de u sobre Uf (z)(f ) por y, es decir, P ry Uf (z)(f ) u = y, y se satisface
ky − uk = m´ın
x∈Uf (z)(f )
kx − uk. De donde, se tiene que
ky − uk > 0 (2.3) ya que u /∈ Uf (z)(f ). Adem´as, y es considerado una soluci´on del siguiente problema
de minimizaci´on convexa
m´ın g(x) = 1
2kx − uk
2
s.a. x ∈ Uf (z)(f ).
Como Uf (z)(f ) 6= ∅ y convexo, la restricci´on tiene la condici´on de cualificaci´on.
Bajo esta condici´on, y es una soluci´on para el problema anterior, si y s´olo si, existe un multiplicador de Lagrange λ tal que (y, λ) es soluci´on del siguiente problema complementario no lineal mixto:
∇g(y) − λ∇f (y) = 0 λ(f (z) − f (y)) = 0 f (z) − f (y) ≤ 0, λ > 0. (2.4)
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
Si λ = 0, entonces se tiene que ∇g(y) = y − u = 0, que contradice (2.3). Luego para λ > 0 en (2.4), se obtiene y − u − λ∇f (y) = 0, λ > 0, f (y) = f (z). Lo cual implica −ku − yk 2 λ = (u − y) T∇f (y), λ > 0, f (y) = f (z).
De esto, se concluye que (u − y)T∇f (y) < 0, lo cual contradice (2.2). Por lo tanto z es una soluci´on ´optima global del problema (2.1). Del teorema 2.1 se tiene que un punto z0 ∈ D no es soluci´on ´optima global del problema (2.1) si existen x, y ∈ Rn tal que
(x − y)T∇f (y) < 0, f (y) = f (z0), x ∈ D. En el siguiente ejemplo se muestra est´a afirmaci´on.
Ejemplo 2.1 Sea el problema de minimizaci´on cuasic´oncava m´ın f (x1, x2) = x2 1+ x22 1 − x1− x2 s.a. 0.6 ≤ x1 ≤ 7, 0.6 ≤ x2 ≤ 2.
donde f : R2 −→ R es una funci´on cuasic´oncava diferenciable y D = [0.6, 7]×[0.6, 2]
es un pol´ıtopo en R2.
Las Figuras 2.2 y 2.3 son las representaciones geom´etricas del problema de minimizaci´on cuasic´oncava.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Figura 2.2: Regi´on factible y curvas de nivel del problema.
Los puntos A = (0.6, 0.6)T, B = (0.6, 2)T, C = (7, 2)T y D = (7, 0.6)T son
los v´ertices de la regi´on factible D. Las curvas de nivel de la funci´on objetivo se obtienen de la ecuaci´on (x1+ k 2) 2 + (x2+ k 2) 2 = k 2+ 2k 2 , ∀ k ∈ R− < −2, 0 > y son circunferencias con centro en c = (−k2, −k2) y de radio r =
q
k2+2k
2 .
Figura 2.3: Funci´on objetivo cuasic´oncava del problema.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
de donde se observa lo siguiente:
1. La regi´on factible es un poliedro acotado (pol´ıtopo).
2. Las curvas de nivel de la funci´on objetivo son circunferencias. 3. El punto factible (0.6, 0.6)T es una soluci´on ´optima local.
4. El punto factible (7, 0.6)T es la soluci´on ´optima global.
5. La soluci´on ´optima local y global son puntos extremos. 6. La funci´on objetivo es cuasic´oncava.
Esta ´ultima afirmaci´on se puede demostrar usando la validez de una de las siguientes afirmaciones que son equivalentes:
1. Si x1, x2 ∈ D y f (x1) ≥ f (x2) ⇒ ∇f (x2)T(x1− x2) ≤ 0 2. Si x1, x2 ∈ D y ∇f (x2)T(x1− x2) < 0 ⇒ f (x1) > f (x2). El gradiente de la funci´on es ∇f (x) = x 2 2− 2x1x2− x21+ 2x1 (1 − x1− x2)2 ,x 2 1− 2x1x2− x22+ 2x2 (1 − x1− x2)2 T ,
para comprobar que el punto factible A = (0.6 , 0.6)T que es un v´ertice en D, es un m´ınimo local para el problema y no un m´ınimo global, entonces elegir un par de puntos x = (5, 2)T ∈ D y y = (3, 3)T ∈ E
f (A)(f ) tal que, se satisface
f (y) = f (A) = −3.6, adem´as se tiene (x − y)T∇f (y) = −12
15 < 0, por tanto el punto
A ∈ D no es una soluci´
BIBLIOTECA
on ´optima global para el problema.DE
CIENCIAS
FÍSICAS
2.2.
T´
ecnicas de aproximaci´
on del conjunto
de nivel
Para una mejor discusi´on, se considera s´olo el caso c´oncavo del problema (2.1), m´ın f (x)
s.a. x ∈ D,
(2.5) donde f : Rn −→ R es una funci´on c´oncava diferenciable y D es un conjunto convexo
y compacto en Rn.
Definici´on 2.1 El conjunto Ef (z)(f ) definido por
Ef (z)(f ) = {y ∈ Rn/ f (y) = f (z)},
es llamado conjunto de nivel de f en el punto z.
Tener en cuenta que la condici´on de optimalidad (2.2) para el problema (2.5) requiere resolver el problema de programaci´on lineal.
m´ın (x − y)T∇f (y) s.a. x ∈ D,
para todo y ∈ Ef (z)(f ). Este es un problema dif´ıcil de resolver, por lo tanto se
necesita encontrar un conjunto de aproximaci´on apropiado de tal manera que se pueda comprobar la condici´on de optimalidad en un n´umero finito de puntos.
En los siguientes lemas 2.1 y 2.2 se demuestra que encontrar un punto en el conjunto de nivel de f (x) es posible te´oricamente.
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Lema 2.1 Sea h ∈ Rn, z ∈ D el cual no es un maximizador global de f sobre Rn, x∗ una soluci´on ´optima del problema
m´ax f (x) s.a. x ∈ Rn
y el conjunto de todas las soluciones ´optimas es un conjunto acotado, entonces existe un unico n´umero real positivo α, tal que x∗ + αh ∈ Ef (z)(f ).
Demostraci´on:
Existencia. La existencia de un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f )
se demostrar´a por el absurdo. Suponer que no existe un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ), es decir, f (x∗+ αh) 6= f (z), ∀ α ≥ 0, entonces se tiene que
f (x∗+ αh) > f (z), ∀ α ≥ 0.
Tener en cuenta que el hip´ografo de una funci´on f denotada y definida por hyp(f ) = {(x, r) ∈ Rn+1/ f (x) ≥ r} es un conjunto convexo y adem´as es cerrado, ya que f es
una funci´on c´oncava, luego para α ≥ 0, se tiene que el punto (x∗+αh, f (z)) ∈ hyp(f ). A continuaci´on se demuestra que el vector (h, 0) es una direcci´on de hyp(f ), es decir, para todo vector y ∈ hyp(f ) y para todo n´umero real positivo β se tiene que (y + β(h, 0)) ∈ hyp(f ). Por el absurdo, suponer que existe un vector y ∈ hyp(f ) y un n´umero real positivo β tal que y+β(h, 0) ∈ Rn+1\hyp(f ). Ya que Rn+1\hyp(f ) es un
conjunto abierto, entonces existe un n´umero real µ tal que, satisface las siguientes condiciones:
µ(x∗, f (z)) + (1 − µ)(y + β(h, 0)) ∈ Rn+1\hyp(f ), 0 < µ < 1 (2.6) Por otro lado, se demuestra que µ(x∗, f (z)) + (1 − µ)(y + β(h, 0)) se encuentra en el segmento de recta que une algunos dos puntos de hyp(f ). Para los puntos (x∗, f (z)) + (1−µ)βµ (h, 0) y y se tiene la siguiente ecuaci´on
µ((x∗, f (z)) +(1 − µ)β µ (h, 0)) + (1 − µ)y = µ(x ∗ , f (z)) + (1 − µ)(y + β(h, 0)),
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
luego por la convexidad de hyp(f ), se tiene µ(x∗, f (z))+(1−µ)(y+β(h, 0)) ∈ hyp(f ), lo cual contradice (2.6). Por lo tanto (h, 0) es una direcci´on de hyp(f ). Luego ya que (x∗, f (x∗)) ∈ hyp(f ), entonces la siguiente afirmacion es verdadera
(x∗, f (x∗)) + α(h, 0) ∈ hyp(f ), ∀ α ≥ 0, esto implica
(x∗ + αh, f (x∗)) ∈ hyp(f ), ∀ α ≥ 0, es decir se tiene
f (x∗+ αh) ≥ f (x∗), ∀ α ≥ 0.
De esto, se concluye que x∗+ αh es tambien un maximizador global de f , ∀ α ≥ 0, porque x∗ es un maximizador global de f sobre Rn, lo cual contradice a la suposici´on
en el lema. Por lo tanto existe un n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ).
Unicidad. Para demostrar la propiedad de la unicidad, suponer que existen dos n´umeros reales positivos α1, α2 tal que x∗ + αih ∈ Ef (z)(f ) para todo i = 1, 2 es
decir, f (x∗ + α1h) = f (z) y f (x∗+ α2h) = f (z). Sin p´erdida de generalidad, se
puede asumir que 0 < α1 ≤ α2, esto implica 0 < αα12 ≤ 1. Luego por ser f una
funci´on c´oncava se tiene
f (z) = f (x∗ + α1h) = f (x∗− α1 α2 x∗+ α1 α2 x∗+ α1h) = f ((1 − α1 α2 )x∗+α1 α2 (x∗+ α2h)) ≥ (1 − α1 α2 )f (x∗) + α1 α2 f (x∗+ α2h) = (1 − α1 α2 )f (x∗) + α1 α2 f (z) ≥ f (z), esto implica f (z) ≥ (1 −α1 α2 )f (x∗) + α1 α2 f (z) ≥ f (z).
De esto, se concluye que la ´ultima desigualdad es valida si α1 = α2, por lo tanto el
n´umero real positivo α es ´unico. Bajo algunas condiciones, es posible calcular un punto en el conjunto de nivel. Esto se demuestra en la siguiente lema 2.2 .
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Lema 2.2 Sea un punto z ∈ D y un vector h ∈ Rn, tal que hT∇f (z) < 0 y sea x∗ el maximizador global de f sobre D. Entonces existe un ´unico n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ).
Demostraci´on:
Por el absurdo. Suponer que no existe un ´unico n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ), es decir, f (z) 6= f (x∗+ αh), ∀ α ≥ 0, entonces se tiene
f (z) < f (x∗+ αh), ∀ α ≥ 0, esto implica
0 < f (x∗+ αh) − f (z), ∀ α ≥ 0.
Por un lado, tener en cuenta que f (x∗) ≥ f (z), ∀ z ∈ D, esto implica f (x∗) − f (z) ≥ 0, ∀ z ∈ D.
Luego por ser f una funci´on c´oncava y diferenciable, se tine (x∗− z)T∇f (z) ≥ f (x∗
) − f (z) ≥ 0, esto implica
(x∗− z)T∇f (z) ≥ 0.
De la ´ultima desigualdad y de la suposici´on que hT∇f (z) < 0, se puede concluir
(x∗− z)T∇f (z)
hT∇f (z) ≤ 0.
Por otro lado, dado que f es una funci´on c´oncava y diferenciable, para todo α ≥ 0, se tiene 0 < f (x∗+ αh) − f (z) ≤ (x∗ + αh − z)T∇f (z) = (x∗− z)T∇f (z) + αhT∇f (z). Luego para α = −(x ∗− z)T∇f (z) hT∇f (z) ≥ 0, se obtiene que 0 < f (x∗+ αh) − f (z) ≤ 0,
BIBLIOTECA
DE
CIENCIAS
FÍSICAS
Y
MATEMÁTICAS
esto implica
f (x∗+ αh) = f (z),
lo cual es una contradicci´on a la suposici´on de que no existe un ´unico n´umero real positivo α tal que x∗+ αh ∈ Ef (z)(f ). Por lo tanto la afirmaci´on est´a demostrada.
En el siguiente ejemplo 2.2 se determina f´ormulas anal´ıticas de como encontrar un punto en el conjunto de nivel de f (x) para el problema (2.7), bajo ciertas condiciones.
Ejemplo 2.2 Sea el problema de minimizaci´on cuadr´atica c´oncava m´ın f (x) = 1
2x
TCx + dTx
s.a. x ∈ D,
(2.7) donde f : Rn −→ R es una funci´on c´oncava y diferenciable, D es un conjunto convexo en Rn, d ∈ Rn y C ∈ Rn×n es una matriz sim´etrica definida negativa.
Ya que C es una matriz definida negativa, se tiene que hTCh < 0 para todo h 6= 0. Por los lemas 2.1 y 2.2 existe un ´unico n´umero real positivo α tal que x∗ + αh ∈ Ef (z)(f ), es decir, f (x∗ + αh) = f (z), luego resolviendo la ecuaci´on
f (x∗+ αh) = f (z) con respecto a α, se tiene f (z) = 1 2(x ∗ + αh)TC(x∗+ αh) + dT(x∗+ αh) = 1 2(x ∗T Cx∗+ αx∗TCh + αhTCx∗+ α2hTCh) + dTx∗+ αdTh = 1 2x ∗T Cx∗+ dTx∗+1 2(αx ∗T Ch + αhTCx∗+ α2hTCh) + αdTh = f (x∗) + αhT(Cx∗+ d) + 1 2α 2 hTCh, esto implica f (x∗) + αhT(Cx∗+ d) + 1 2α 2hTCh = f (z).
Luego como x∗ es el maximizador global de f sobre Rn y C es una matriz definida
negativa, se tiene ∇f (x∗) = 0, entonces se satisface Cx∗ + d = 0, esto implica x∗ = −C−1d. Usando este resultado se tiene que
α = 2(f (z) − f (x ∗)) hTCh 12 .