R
ESTRICCIONES
P
ROBABIL´
ISTICAS
por
Lorenza V´elez Guti´errez
Asesor de Tesis Ph.D Mauricio Junca
Una tesis presentada para Pregrado en Matem´aticas Departamento de Matem´aticas
Facultad de Ciencias Universidad de los Andes
Colombia 2016
Abstract
En este trabajo se va a estudiar un m´etodo para resolver problemas de optimizaci´on con restricciones probabil´ısticas, llamado Sample Average Approximation. Para comenzar, se va a estudiar por qu´e el m´etodo arroja una soluci´on que se aproxima a la soluci´on optima del problema original.
Despu´es se va a estudiar una forma m´as eficiente de aplicar el m´etodo de Sample Av-erage Approximation, utilizando Importance Sampling para reducir la varianza de la dis-tribuci´on utilizada en el m´etodo. Se van a mostrar dos maneras diferentes de utilizar Im-portance Sampling.
Finalmente, se va a resolver un problema de seleccion de portafolio utilizando el m´etodo de Sample Average Approximation y Sample Average Approximation con Importance Sampling para verificar la efectividad de ´estos.
Introducci´on 3
1 Preliminares 5
2 Sample Average Approximation 9
2.1 Sample Average Approximation . . . 9
2.2 Importance Sampling . . . 13
2.2.1 Reducci´on de Varianza . . . 14
2.2.2 Consistencia . . . 15
2.3 Importance Sampling Extendido . . . 15
3 Ejemplo Num´erico 17 3.1 Problema Inicial . . . 17
3.2 Sample Average Approximation . . . 18
3.3 Sample Average Approximation con Importance Sampling . . . 19
3.4 Sample Average Approximation con Importance Sampling Extendido . . . 20
4 Conclusiones 22
5 Referencias 24
Introducci´on
Considere un problema de optimizaci´on en donde el problema depende de una variable aleatoria con una distribuci´on conocida y las restricciones se deben cumplir con una prob-labilidad espec´ıfica. Un problema de estos se puede escribir de la siguiente manera:
minx∈Xf(x), s.a.P r{G(x, ζ)≤0} ≥1−α
en dondeX ⊂Rn,ζes un vector aleatorio con distribuci´on de probabilidadP con soporte en E ⊂ Rd, α ∈ (0,1), f :
Rn → Res una funci´on evaluada en los reales y G : Rn×
E →Rm. Este tipo de problemas se llaman problemas de optimizaci´on con Restricciones Probab´ılisticas y el objetivo de este trabajo es estudiar un m´etodo para resolver programas de este tipo. En este trabajo se va a estudiar un m´etodo que se llama Sample Average Approximation (SAA) para encontrar una soluci´on aproximada. Adem´as se va a analizar un complemento de dicho m´etodo que se llama Importance Sampling (IS) para llegar a una soluci´on del problema original de una manera m´as eficiente.
Problemas de Restricciones Probab´ılisticas fueron introducidos por Charnes, Cooper y Symonds [3] hace aproximadamente 50 a˜nos. Aplicaciones de este tipo de problemas de optimizaci´on incluyen problemas de energ´ıa, manejo de poluci´on de agua y telecomuni-caciones. En este paper, Charnes, Cooper y Symond, buscaban encontrar la forma ´optima de programar la producci´on de aceite en una planta. La producci´on de ´este bien depende de condiciones clim´aticas y de incertidumbres en demanda. Para resolver este problema se propuso plantear las restricciones como condiciones de probabilidad que se imponen so-bre una variable aleatoria. Desde este momento se han estudiado maneras de encontrar la soluci´on ´optima a problemas de este tipo, pues a veces encontrar la soluci´on num´ericamente es extremadamente dif´ıcil.
Para encontrar la regi´on factible a un problema de Restricciones Probab´ılisticas es nece-sario hacer una integraci´on multidimensional. A veces, la ´unica manera de verificar si un x ∈ X es factible es haciendo una simulaci´on de Monte Carlo. Por otro lado, el conjunto de soluciones factibles puede resultar no convexo, a´un siXes convexo y la funci´onG(x, ζ)
es convexa. La idea del m´etodo de Sample Average Approximation (SAA) es reemplazar la distribucin de probabilidad de la variable aleatoria del problema verdadero, con una dis-tribuci´on emp´ırica que correponde a una muestra aleatoria.
SAA fue estudiado por Leudtke y Ahmed [4] en el 2008. Estudiaron algunas condi-ciones sobre el problema inicial que se deben cumplir para que la soluci´on obtenida usando el m´etodo sea factible en el problema inicial. Adem´as de esto, analizaron cu´al debe ser el tama˜no de la muestra aleatoria que se usa para encontrar la distribuci´on emp´ırica de tal manera que la soluci´on encontrada sea factible y est´e suficientemente cerca de la soluci´on del problema original.
El tama˜no estimado de la muestra aleatoria de SAA que es suficiente para lograr una precision deseada es relativamente grande. Adem´as, existe una cota inferior para el tama˜no de la muestra de tal manera que la soluci´on encontrada sea factible. Cuando las restric-ciones del problema original tienen un αmuy peque˜no, es decir, que el problema no per-mite muchos casos en los que no se cumpla la restricci´on, el tama˜no de la muestra aleatoria necesaria es relativamente grande. Para encontrar una soluci´on utilizando el m´etodo de SAA sin necesidad de utilizar una muestra aleatoria tan grande se hace una integraci´on del m´etodo IS a SAA.
IS es una t´ecnica usada en simulaci´on para estimar probabilidades de eventos poco probables, que fue estudiada por Khan y Harris [5] y Rosenbluth y Rosenbluth [6]. Cuando se genera una muestra aleatoria de una variable aleatoria que tiene probabilidad casi 0 en un conjunto, la muestra puede no incluir informaci´on de dicho conjunto. En aplicaciones de la vida real, estos eventos significan un accidente, o unas condiciones clim´aticas ex-tremas, que son muy importantes para encontrar soluciones ´optimas. Es importante obtener muestras de la regi´on en cuesti´on, y para esto se usa IS. Se genera una muestra sobre una distribuci´on que le asigna m´as peso a dichas regiones de eventos extremos poco probables. En este caso, IS se usa para encontrar una distribuci´on emp´ırica utilizada en SAA, que tiene en cuenta estos eventos extremos y la distribuci´on resultante tiene menor varianza. Esto permite encontrar una mejor aproximaci´on a la soluci´on ´optima del problema inicial de Restricciones Probabil´ısticas, pues el tama˜no de la muestra aleatoria requerida ser´a menor. Por ´ultimo, para verificar la efectividad de los m´etodos mencionados, se va a resolver un problema de selecci´on de portafolio, en donde los precios de los activos en cuesti´on siguen una distribuci´on normal. Es importante que el vector aleatorio siga esta distribuci´on, pues as´ı se puede encontrar una soluci´on del problema usando m´etodos numericos. Esto se hace calculando la integral que representa la regi´on factible. As´ı se va a comparar la soluci´on ´optima al problema verdadero con la soluci´on encontrada utilizando SAA y final-mente utilizando SAA con IS. Al final se van a compara la soluci´on verdadera (encontrada num´ericamente) con la soluci´on encontrada utilizando los m´etodos.
Chapter 1
Preliminares
El objetivo en este cap´ıtulo es introducir algunas definiciones elementales, terminolog´ıa y algunos resultados que se van a usar en el desarrollo del trabajo.
Un Problema de optimizaci´on con restricciones probabil´ısticas es un problema de la forma: M in c(x)
s.a.P r{gj(x, Z)≤0, j ∈J} ≥p, x∈X
DondeX ⊂Rnes un conjunto no vacio,c:
Rn →R,gj :Rn×Rs →R,j ∈J, dondeJ es un conjunto de ´ındices,Z es un vector aleatorio de dimensi´ons, ypes un par´ametro del modelo.
PZ es la medida de probabilidad inducida por el vector aleatorioZenRs.
El evento A(x) = {gj(x, Z) ≤ 0, j ∈ J} depende de la decisi´on del vectorx, y su probabilidadP r{A(x)}es calculada con respecto a la distribuci´on de probabilidadPZ. Ejemplo 1.1. Problema de Ruteo de Veh´ıculos Considere una red conmarcos en cual una demanda aleatoria de transporte surge. La matriz T describe un conjunto de nrutas en la red. T es una matrizm×ntal que:
tij =
1 si la ruta j contiene el arco i,
0 de lo contrario.
Se deben asignar veh´culos a las rutas para satisfacer una demanda. El objetivo es satisfacer la demanda con probabilidad alta p ∈ (0,1). Sea xj el n´umero de veh´ıculos asignado a la ruta j. La demanda de transporte en cada arco est´a dada por la variable
aleatoriaZi i= 1, ..., m. SeaZ = (Z1, ...Zm)T. El costocj corresponde al costo de operar un veh´ıculo en la ruta j. Entonces, conc= (c1, ..., cn)T el modelo puede ser formulado de la siguiente forma:
M in cTx s.a.P r{T x≥Z} ≥p,
x∈Zn +
Definici´on 1.2. Una restricci´on de la forma
P r{gj(x, Z)≤0, j ∈J} ≥p se llama una Restricci´on Probabil´stica Conjunta.
Definici´on 1.3. Una restricci´on de la forma
P r{gj(x, Z)≤0} ≥pj, j ∈J,dondepj ∈[0,1]. se llama una Restricci´on Probabil´ıstica Individual.
En el problema de Ruteo de Veh´ıculos tenemos una Restricci´on Probabil´ıstica conjunta. Si quisi´eramos, se podr´ıa cubrir la demanda de cada arco con una probabilidad espec´ıfica, y la restricci´on quedar´ıa formulada de la siguiente manera:
P r{Tix≥Zi} ≥pi, i= 1, ..., m. Aqu´ı,Ties la filaide matrizT.
Definici´on 1.4. Una variable aleatoria X es Integrable si su valor esperado existe y est´a bien definido.
Definici´on 1.5. Una funcionG(x, ζ)es Carath´eodory siG(x,·)es medible para todox∈R
yG(·, ζ)es continua para casi todoζ ∈E.
Definici´on 1.6. Una sucesi´onfk(x)de funciones reales extendidas epiconverge a una fun-cionf(x), denotado fk →e f, si para cualquier puntox las siguientes dos condiciones se cumplen:
1. Para cualquier sucesi´onxkque converge a x, se tiene: liminfk←∞fk(xk)≥f(x) 2. Existe una sucesi´onxkque converge axtal que:
7
Lema 1.7. [11] Seaf1, f2, f3, ...una sucesi´on de funciones medibles no-negativas en un
espacio de medida(S,Σ, µ). Defina la funci´onf :S →[0,∞]de la siguiente manera:
f(s) :=liminfn→∞fn(s), s∈S
Entonces,f es medible y
Z
S
f dµ≤liminfn→∞
Z
S fndµ.
Definici´on 1.8. Sea X1, , Xn una muestra iid de una variable aleatoria X. Considere el estimadoru(X1, , X2)un estimador de un par´ametroθ, si se cumple lo siguiente:
E[u(X1, , XN)] =θ
entonces el estadsticou(X1, , XN)es un estimador insesgado del parametroθ.
Teorema 1.9. Teorema de Convergencia Dominada [11] Sea ζ1, ..., ζnuna muestra
inde-pendiente identicamente distribuida de tama˜no n de la una variable aleatoria que tiene una distribuci´onP. Bajo las siguientes suposiciones:
1. La funcion
f(x, ζ) :X×E →(−∞,∞)
es medible enX×E(enXse toma la sigma-´algebra de Borel), yf(., ζ)paraζfijo es
semi continua por abajo enx, adem´as,xk →x0implicaliminf f(xk, ζ)≥f(x0, ζ).
2. Para cadax0 ∈ X existe un subconjunto abierto N0 ∈ X y una funcion integrable α0(ζ) : E → (−∞,∞) tal que x0 ∈ X y para casi todo ζ ∈ E la siguiente desigualdad vale para todox∈N0:
f(x, ζ)≥α0(ζ)
la sucesi´onF(˙ :ζ1, ..., ζn)casi siempre epi-converge a(Ef)(˙). En donde,
F(x:ζ1, ..., ζn) :=
1
N n
X
j=1
f(x, ζj)
(Ef)(x) := E[f(x, ζ)].
Teorema 1.10(11). Sea(X,Σ)un espacio medible, si una medidaσ-finitaνen(X,Σ)es absolutamente continua con respecto a una medida Σ-finita µen(X,Σ), entonces existe una funcin mediblef :X →0,∞)tal que para cualquier subconjunto medibleA⊂X,
ν(A) = Z
A f dµ.
Teorema 1.11. Sea{fn}n una sucesi´on de funciones evaluadas en los reales y medibles
en un espacio medible (S,Σ, µ). Suponga que la sucesi´on converge puntualmente a una funcionf y es dominada por una funcion integrableg, es decir:
|fn(x)|≤g(x)
para todonen el conjunto de ´ındices, y para todox∈S. Entonces,f es integrable y
limn→∞
Z
X
|fn−f |dµ= 0
, lo que tambi´en implica
limn→∞
Z
fndµ=
Z
S f dµ.
Definici´on 1.12. SeaA={ω :limnXn(ω) =X(ω)}yAc= Ω−A. SiP(Ac) = 0, para una sucesi´on Xn(ω), n ≥ 1, se dice queXnconverge a X con probabilidad 1, denotado w.p.1.
Teorema 1.13. Ley uniforme de Grandes N´umeros Supongaf(x, θ)es una funcion definida
para unθ∈Θ, y continua enθ. Entonces, para cualquierθfijo, la sucesi´on{(f(X1, θ), f(X2, θ), ...}
va a ser una sucesi´on de variables aleatorias i.i.d., tal que la media muestral de esta sucesi´on converge en probabilidad aE[f(X, θ]. La ley uniforme de grandes numeros dice que bajo las siguientes condiciones la convergencia es uniforme:
1. Θescompacto.f(x,Θ)escontinuaparacadaθ ∈ Θpara casi todox∈X, y medible para cadaθ.
2.
3. Existe una funcion dominanted(x)tal queE[d(X)]<∞, y
||f(x, θ)||≤d(x) ∀θ ∈Θ
Chapter 2
Sample Average Approximation
El objetivo de este cap´ıtulo es estudiar un m´etodo y unos complementos de ´este para re-solver problemas de optimizaci´on con restricciones probabil´ısticas. Primero se va a estudiar Sample Average Approximation, se va a explicar en qu´e consiste el m´etodo y por qu´e la soluci´on que se encuentra es factible y converge a la soluci´on del problema real.
2.1
Sample Average Approximation
Despu´es, se va a explicar una forma de implementar el m´etodo SAA de una manera m´as eficiente, usando Importance Sampling . Por ´ultimo, se va a estudiar una variaci´on del m´etodo SAA con IS, de manera que la estimaci´on de la soluci´on optima depende s´olo de algunas coordenadas de la variable aleatoria.
En este trabajo se van a considerar problemas de la forma:
minx∈Xf(x), s.t.prob{G(x, ζ)≤0} ≥1−α
dondeX ⊂ IRn,ζ es un vector aleatorio con distribuci´on de probabilidad P soportada en un conjunto E ⊂ Rd, α ∈ (0,1), f :
Rn → R es una funcion evaluada en los reales y
G:Rn×
E→Rm.
Para simplificar, se asume que la funci´on que define las restriccionesG : Rn×
E →
Rm es evaluada es los reales. Teniendo esto en cuenta, las restricciones Gi(x, ζ) ≤ 0, i= 1, ..., mpueden ser reemplazadas por una restriccion de la siguiente manera:
G(x, ζ) :=max1≤i≤mGi(x, ζ)≤0
Es importanet notar que tomar el m´aximo preserva convexidad si las funciones de restric-ciones son convexas. Se asume que el conjunto X es cerrado, que la funcion f(x) es continua y que la funcionG(x, ζ)es Carath´eodory.
Entonces, el problema planteado inicialmente es equivalente al siguiente problema: minx∈Xf(x), s.t.p(x)≤α,
dondep(x) :=P{G(x, ζ)>0}.
Ahora seaζ1, ..., ζN una muestra aleatoria independiente identicamente distribuida del vector aleatorioζ yPN = N−1PN
j=1δ(ζ
j)una medida emp´ırica que corresponde a dicha muestra aleatoria, donde δ(ζ) es la funcion de masa en un puntoζ. Es decir, PN es una medida discreta que asigna una probabilidad N1 a cada puntoζj,j = 1, ..., N.
La Sample Average Approximation (pNˆ (x)) de la funcionp(x)se obtiene reemplazando la verdadera distribuci´onP por la medida emp´ıricaPN. Es decir,pˆN(x) := PN{G(x, ζ)>
0}. Sea1(0,∞) :R→Rla funci´on indicadora de(0,∞), es decir: 1(0,∞)(t) :=
1 ift >0 0 ift ≤0
Entonces,p(x) =EpNˆ [1(0,∞)(G(x, ζ))]y
ˆ
pN(x) =EpNˆ [1(0,1)(G(x, ζ))] =
1
N N
X
j=1
1(0,∞)(G(x, ζj))
Es decir, la Sample Average Approximation es igual al n´umero de veces queG(x, ζj)>
0, divididoN. Entonces, el problema asociado a la muestraζ1, ...ζN es: minx∈Xf(x), s.t.pˆN(x)≤γ
Este es el Problema Sample Average Approximation que se va a resolver para llegar a una aproximaci´on de la soluci´on optima del problema inicial. Es importante notar que el nivel de significanciaγ ≥0del problema SAA puede ser diferente del nivel de significancia del problema inicial,α.
Ahora, se va a probar por qu´e la soluci´on aproximada al utilizar el m´etodo SAA con-verge a la soluci´on optima del problema inicial. Para esto se tomaN como el tama˜no de la muestra aleatoria y un nivel de significanciaγpara el problema SAA.
Proposici´on 2.1. SeaG(x, ζ)una funcion Carath´eodory. entonces las funcionesp(x)y
ˆ
pN(x)son semicontinuas por abajo, ypˆN(x)→cpcon probabilidad 1. A´un m´as, suponga
para todox¯∈Xel conjunto{ζ ∈E:G(¯x, ζ) = 0}tiene P-medida 0. Entonces la funcionp(x)es continua en todox∈XypˆN(x)converge uniformemente ap(x)con
probabilidad 1 en cualquier conjunto compactoC ⊂X, i.e.:
11
Proof. Considere una funci´onψ(x, ζ) :=1(0,∞)(G(x, ζ)), teniendo en cuenta que p(x) =EP[ψ(x, ζ)]ypˆN(x) =EPN[ψ(x, ζ)]. Como la funcion1(0,∞)(˙)es semicontinua por abajo yG(˙, ζ)es Carath´eodory, entoncesψ(x, ζ)es aleatoria semicontinua por abajo. Entonces, por elLemma 1.10se tiene que para todox¯∈R,
liminfx→x¯p(x) = liminfx→x¯
Z
E
ψ(x, ζ)dP(ζ)
≥
Z
E
liminfx→xψ¯ (x, ζ)dP(ζ)≥
Z
E
ψ(¯x, ζ)dP(ζ) = p(¯x)
Lo cual demuestra que p(x) es semi continua por abajo. Semi-continuidad por abajo de
ˆ
pN(x)se demuestra de la misma manera.
Ahora, para ver quepˆN →epcon probabilidad 1 usamos elTeorema 1.12de Artsein y Wets [9]. En el teorema es necesario que|ψ(x, ζ)|est´e dominada por una funcion integrable, y esto es verdad, pues|ψ(x, ζ)|≤1.
Ahora, suponga que para todox¯∈X,G(¯x, ζ)6= 0w.p.1., lo que implica queψ(˙,ζ)es continua enx¯w.p.1. Entonces, por el teorema de Convergencia Dominada de Lebesgue (Teorema 1.14) para cualquierx¯∈X:
limx→xp¯ (x) = limx→¯x
Z
E
ψ(x, ζ)dP(ζ)
= Z
E
limx→x¯ψ(x, ζ)dP(ζ) =
Z
E
ψ(¯x, ζ)dP(ζ) =d(¯x),
entonces podemos concluir quep(x)es continua enx.Ahora, la convergencia uniforme es¯
una consecuencia de la Ley Unforme de Grandes N´umeros (Teorema 1.13)
Comop(x)ypˆN(x)son semicontinuas por abajo, entonces los conjuntos factibles de los problemas son compactos. Por este motivo, si el conjunto X es acotado, entonces ser´a un conjunto compacto. Sean S y SˆN los conjuntos de soluciones optimas del problema inicial y del problema SAA, respectivamente. Entonces, si las regiones factibles de ambos problemas son no vac´ıas,SySˆN son no vac´ıos con probabilidad 1. Ahora, seanθ∗yθˆN los valores optimos del problema inicial y del problema SAA respectivamente. A continuaci´on se va a probar que paraγ =α,θˆN ySˆN convergen a su respectiva soluci´on en el problema real.
Para hacer la prueba, se va a asumir lo siguiente:
1. Existe una soluci´on optima x¯ del problema inicial tal que para todo > 0 existe x∈Xcon|x−x¯|≤yp(x)< α.
Es decir, existe una sucesi´on{xk} ⊂ X que converge a una soluci´on optimax¯ ∈ S tal quep(xk) < αpara todok, i.e. x¯es un punto de acumulaci´on del conjunto {x ∈ X :
Proposici´on 2.2. Suponga que el nivel de significancia del problema real y del problema SAA son iguales, i.e. γ =α, el conjuntoXes compacto, la funci´onf(x)es continua,
G(x, ζ)es Caratheodory, y la condici´on 1. vale. Entonces,θˆN →θ∗ y
D( ˆSN, S)→0 w.p.1 cuando N → ∞, en dondeD(A, B) :=supdist(x, B)x∈B.
Proof. Usando la condici´on 1, el conjuntoSes no vac´ıo. Entonces, existextal que p(x)< α. Por el teorema anterior,pNˆ (x)converge ap(x)w.p.1., entoncespN¯ (x)< α, y entonces, el problema SAA tiene una soluci´on factible w.p.1. para unN suficientemente grande. Ahora, por el teorema anterior, tambien tenemos quep¯N(˙)es semicontinua por abajo, entonces el conjunto factible del problema SAA es compacto, entoncesSNˆ es no vac´ıo w.p.1. para unN suficientemente grande. Seaxun punto factible en el problema SAA, entoncesf(x)≥θˆN. Por la condici´on 1, podemos escogerxtan cerca como queramos dex, y como¯ f(˙)es continua, tenemos:
limsupN→∞θˆN ≤f(¯x) =θ∗ w.p.1. (1)
Ahora, seaxˆN ∈SˆN, es decirxˆN ∈XypˆN(ˆxN)≤αyθˆN =f(ˆxN). Como probamos queXes compacto, entonces existe una subsucesi´on dexNˆ que converge a un punto
¯
x∈X w.p.1. Adem´as, tenemos quepˆN →e pw.p.1., y entonces por la definici´on de epiconvergencia,
liminfN→∞pNˆ (ˆxN)≥p(¯x) w.p.1.
ComopˆN(ˆxN)≤α, entoncesp(¯x)≤α, entoncesx¯es un punto factible del problema inicial, yf(¯x)≥θ∗. Adems,f(ˆxN)→f(¯x)w.p.1., entonces
liminfN→∞θˆN ≥θ∗ w.p.1. (2)
Entonces, por (1) y (2), tenemosθˆN →θ∗ w.p.1.. Entonces, el puntox¯es una soluci´on optima del problema original yD( ˆSN, S)→0, w.p.1..
La condicici´on 1. es muy importante para la existencia de θNˆ y SNˆ . Esto es porque, por ejemplo, en el caso que la condici´on p(x) ≤ α define solo un punto factible tal que p(¯x) = α. Entonces, cambios, por m´as peque˜nos que sean, en la restricci´onpˆN(x) ≤ α pueden hacer que el conjunto factible del problema SAA sea vac´ıo.
Suponga ahora queγ > α, entonces por la Proposici´on 2.2., mientras m´as grande sea N, una solucion optima del problema SAA se va a acercar a una soluci´on optima del problema inicial con nivel de significancia γ, y no α. Igualmente, aumentar el nivel de significancia hace que m´as puntos sean factibles, lo cual lleva a una regi´on factible con m´as elementos. Si este es el caso, el valor optimo aproximado que se encuentra usando SAA puede ser menor que el valor optimo del problema inicial. El nivel de significancia
13
del problema SAA es un par´ametro muy importante del m´etodo, pero no es la orientaci´on que toma este trabajo.
Ahora, vamos a analizar otro par´ametro del m´etodo. Consideremos cu´al debe ser el tama˜no de la muestra N tal que la soluci´on optima del problema SAA est´e lo suficiente-mente cerca de la soluci´on al problema inicial. Campi et al [6] probaron que si el nivel de significancia del problema SAA es 0 (γ = 0) y si el tama˜no de la muestra N satisface la siguiente desigualdad:
N ≥ 2
α(ln(
1
β) +d)
dondedes la dimensi´on del problemaβ∈(0,1), entonces la soluci´on optima del problema SAA viola las restricciones probabil´ısticas del problema inicial con probabilidad a lo sumo β. Ahora, es importante notar aqu´ı, que mientras m´as peque˜no seaα, m´as grande debe ser N, sin importar cu´al es el valor deβ. Para este resultado es importante que la funcionG sea convexa.
Teniendo esto en cuenta, el tama˜no de la muestra debe ser demasiado grande para que el m´etodo SAA encuentre una soluci´on que es factible en el problema inicial con un nivel de significancia espec´ıfico. Es por esto que se va a estudiar Importance Sampling, que es un m´etodo para encontrar la distribuci´on de probabilidad emp´ırica que arroja una soluci´on aproximada factible con un n´umero menor de muestraN.
2.2
Importance Sampling
Como se mencion´o anteriormente, IS es una t´ecnica utilizada para reducir varianza. La idea es encontrar la distribuci´on emp´ırica que se usa en SAA de una manera m´as eficiente. En esta secci´on se van a estudiar dos t´ecnicas de IS. Una en donde la distribuci´on emp´ırica s´olo depende de la distribuci´on de la variable aleatoriaζ, y en la otra t´ecnica, la distribuci´on de probabilidad que se encuentra depende de la distribuci´on de la variable aleatoriaζ y de la variable de decisi´onx.
Definici´on 2.3. Dado un subconjunto,J ⊂ I y unx ∈ X, decimos que la funcionG(x,˙)
esJ−determinadasi existe una funcionGJ :Rn×R|J| →Rtal que G(x,(zi)i∈I) = GJ(x,(zj)j∈Z)
para cualquier vetorz ∈ Rd. Es decir, s´olo las coordenadasz
j paraj ∈ J importan para calcularG(x, z).
Ahora, seaµ la medida en Rd inducida por el vector aleatorio ζ, es decirµ(A) =
P(ζ ∈ A). Ahora, la idea es estimarp(x)para todox ∈ X. Para esto, no se va a utilizar
nuevo con medida inducida ν, a la cual le vamos a decir medida IS. Ahora,ν es tal queµ es absolutamente continua con respecto aν, es decirµ(A) = 0siν(A) = 0.
Al igual que en el m´etodo SAA, seaζˆ1, ...,ζˆN una muestra deζˆindependiente iden-ticamente distribuida. Ahora, defina la siguiente distribuci´on de probabilidad emp´ırica:
ˆ
pIS(x) := 1
N N
X
j=1
1{G(x,ζˆj)>0}L(ˆζj)
donde L(˙) es el Cociente de Verosimilitud L(˙) = dµdν(˙). La funci´on L es la Radon-Nikodym derivative deµcon respecto aν, i.e. Les una funcionRd 7→ Rtal queµ(A) = R
AL(s)dν(s)para cualquier conjunto de BorelA ⊂ R
d. Note que para cualquier funcion mediblef :Rd7→
R, se tieneRRdf(s)dµ(s) =
R
Rdf(s)L(s)dν(s), es decir: Eζ[f(ζ)] =Eζˆ[f(ˆζ)L(ˆζ)].
Ahora, se va a hablar sobre la reducci´on de varianza y la consistencia de dicho esti-mador.
2.2.1
Reducci´on de Varianza
La manera como se escoge la medida IS es muy importante, pues puede que la varianza se reduzca en algunos puntos de X, pero que se aumente para otros puntos. Considere la siguiente definici´on:
Definici´on 2.4. Seapˆel estimador de p(x) usado en SAA sin IS y seapˆ0 otro estimador del mismo. Dado∈[0,1]se dice quepˆ0 tiene(, Y)-Reducci´on uniforme de varianza con respecto apˆ(x)si para cadax∈Y se tiene:
V ar(ˆp0(x))≤V ar(ˆp(x)).
La siguiente proposici´on da una condici´on suficiente para obtener estimadores con
(, Y)-Reducci´on uniforme de varianza. Antes de probar la proposici´on considere la sigu-iente definic´ıon:
Definici´on 2.5. Seatal quep(x)≤para todox∈Y, y considere el estimador ISpˆIS(x) definido anteriormente. Decimos que pˆIS(x) es un (, Y)-Estimador IS Uniformemente Acotado de p(x) si para todox∈Y se tiene:
1{G(x,ζ)>0ˆ }L(ˆζ)≤ w.p.1.
Proposici´on 2.6. SipˆIS(x)es un(, Y)Estimador IS Uniformemente Acotado dep(x)con ≤1entonces tiene(, Y)- Reducci´on de Varianza Uniforme con respecto ap¯(x).
15
2.2.2
Consistencia
Es importante que los estimadores usados sean consistentes, pues esto garantiza que el valor optimo y la solucion optima convergen a sus contra partes en el problema inicial. Se va a probar que la medida de probabilidad utilizada en SAA con IS es consistente si el nivel de significancia del problema inicial y el problema SAA son iguales.
Considere el problema SAA con IS:
minx∈Xh(x) t.q.pˆIS(x)≤γ
La prueba para verpˆIS →e p w.p.1. es la misma que se hizo para SAA usando la Proposici´on 2.1.. Con este resultado, tenemos que el estimador utilizando IS es efectiva-mente Consistente.
Es importante notar, que al escoger la medidaν y la nueva distribuci´on de probabili-dad emp´ırica, la varianza del nuevo estimador es m´as peque˜na. Esto pasa porque el evento 1{G(x,ζ)>0}tiene mayor probabilidad. Hay muchas maneras de escoger la medidaν, y sobre
esto hay muchos estudios, pero este trabajo no se va a enfocar en la escogencia de dicho par´ametro. A continuaci´on se va a estudiar otra forma de escoger el estimador usando IS, pero en el siguiente caso, la distribuci´on de probabilidad emp´ırica depende de la variable de decisi´on,x.
2.3
Importance Sampling Extendido
La idea de esta modificaci´on es obtener mejores estimaciones de la distribuci´on de proba-bilidad del problema inicial. La idea es que se aplique ´este m´etodo en problemas en donde el comportamiento de la funci´onGen unxdado depende s´olo de un subconjuntoIxde las variables aleatorias del problema. La idea es calular la distribuci´on emp´ırica IS a partir de Ixy no de todas las variables aleatorias.
Ahora, sea Ix una funci´on que asigna un subconjunto de I a cada x ∈ X. Dado x∈X existe una funcion de Borel medibleψxenR|Ix|tal que:
ψx((zi)i∈Ix) =Eˆζ[L(ˆζ)|(ˆζi)ı∈Ix = (zi)i∈Ix]. Ahora, defina una funcionLx :Rd→Rtal que:
Lx(ˆζ) = ψx((ˆζi∈Ix =E[L(ˆζ |(ˆζ)iinIx].
Por la forma como se construy´o, Lx es Ix −determinada. Ahora, vamos a probar que cuando la funcion G(x,˙)es Ix −determinada, el estimador IS de p(x)construido con la funcion de verosimilitud Lx es insesgado y su varianza es a lo sumo la varianza del estimadorpˆIS(x)que definimos en el m´etodo anterior.
Lema 2.7. Suponga que la funci´on de conjuntosIxdefinida anteriormente es tal queG(x,˙)
es Ix determinada para todo x ∈ X. Dada una muestra independiente identicamente
distribuida de(ˆζ1, ...,ζˆN)de la distribuci´ıon deζˆ, sea:
ˆ
PIS0(x) = 1
N N
X
j=1
1{G(x,ζˆj)>0}Lx(ˆζj) (2.1)
EntoncespˆIS0(x)tambi´en es un estimador insesgado de p(x). Adem´as,
V ar(ˆpIS0(x)) =V ar(ˆpIS(x)− 1
NEˆζ[V ar(1{G(x,ζ)>0ˆ } |(ˆζi)i∈Ix)]. (2.2)
Proof. Primero, vamos a probar que el estimadorpIS0(x) es insesgado. Para ver esto, es
necesario verificar queEˆζ[1{G(x,ζ)>0ˆ }Lx(ˆζ)] =p(x): Eˆζ[1{G(x,ζ)>0ˆ }Lx(ˆζ)]
=Eˆζ[1{G(x,ζ)>0ˆ }Eˆζ[L(ˆζ)|(ˆζi)i∈Ix]]
=Eˆζ[(Eˆζ[1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix]]
=Eˆζ[1{G(x,ζ)>0ˆ }L(ˆζ)] =p(x).
La segunda igualdad es porqueG(x,˙)esIx determinada, lo que implica queG(x,ζˆ) es medible con respecto a la sigma algebra generada por(ˆζi)i∈Ix. Ahora, vamos a probar la segunda parte, queremos ver que la varianza del nuevo estimador es a lo sumo la varianza depˆIS(x):
Eˆζ[1 2
{G(x,ζˆ}Lx(ˆζ)
2
] =E[1{G(x,ζ>0ˆ }(Eˆζ[L(ˆζ)|(ˆζi∈Ix])2]
=Eˆζ[(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix])2]
=Eζˆ[Eζˆ[1{G(x,ζ)>0ˆ }L(ˆζ)2 |(ˆζi)i∈Ix]−V ar(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)]
=Eˆζ[1{G(x,ζ)>0ˆ }L(ˆζ)
2
]−Eˆζ[V ar(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)] Entonces,
N V ar(ˆpIS0(x)) = Eˆ
ζ[1 2
{G(x,ζ)>0ˆ }Lx(ˆζ)
2]−p(x)2
=Eˆζ[1{G(x,ζ)>0ˆ }L(ˆζ)
2]−Eˆ
ζ[V ar(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)]−p(x)2
=N V ar(ˆpIS(x))−Eˆζ[V ar(1{G(x,ζ)>0ˆ } |(ˆζi)i∈Ix)].
Chapter 3
Ejemplo Num´erico
El objetivo de este cap´ıtulo es probar si el m´etodo SAA,con IS y sin IS, s´ı es efectivo para encontrar una soluci´on aproximada a un problema de optimizaci´on con restricciones proba-bil´ısticas. Se va a resolver un problema de selecci´on de portafolio en donde los retornos de los activos siguen una distribuci´on normal. Primero, se va a resolver el problema utilizando ´unicamente SAA. Despu´es, se va a resolver el problema usando SAA con IS. Por ´ultimo, se va a probar la efectividad del ´ultimo complemento de SAA con IS donde la distribuci´on emp´ırica depende de la variable de decisi´ıon. Para el ´ultimo caso, el problema inicial se va a modificar para que cumpla la suposici´on necesaria para implementar dicho m´etodo.
3.1
Problema Inicial
Considere el siguiente problema de maximizaci´on sujeto a una sola restricci´on proba-bil´ıstica:
maxx∈XE[rTx], t.q.P r{rTx≥v} ≥1−α En dondex∈R30es un vector de variables de decision,r ∈
R30es un vector aleatorio con
distribucion de probabilidad conocida, v ∈ Ry α ∈ (0,1)son constantes, ees un vector cuyos componenetes son todos igual a 1 y
X :=x∈R30:eTx= 1, x≥0.
Es decir, se quiere maximizar los retornos de un portafolio compuesto por 30 acciones. La idea es decidir la cantidad xi como porcentaje de una riqueza de 1 USD que se va a invertir en la accioni, donde i ∈ {1, ...,30}. Ahorar es el vector aleatorio que contiene informaci´on sobre los retornos de los activos. Se va a asumir que los retornos de los activos siguen una distribuci´on Normal con media 29 y varianza 11. Estos datos fueron tomados de Google Finance [10] como los valores correspondientes a la accion SP 500 en el 2011.
v es el retorno mnimo que se espera que tenga el portafolio, y en este caso va a ser0. Se espera, como m´ınimo que el portafolio tenga retornos positivos. Ahora, la idea es que esto se cumpla con una probabilidad de al menos95
Se va a resolver este problema utilizando Matlab para encontrar la soluci´on num´erica y comparar ´esta con las soluciones que se van a encontrar a continuaci´on.
Para resolver el problema en Matlab se debe expresar primero como un problema convexo:
max p¯T(x)
t.q. p¯T(x)≥Φ−1(1−α)||Σ12x||
2
1Tx= 1, x≥0
El resultado encontrado fue el siguiente: Valor funcion objetivo: 0.056. x∗=0.02,0.1,0.04,0,0,0.05,0.03,0.06,0,0.15,0.03,0.02,0.01,0.05,0,0.03,0.04,0.11,0.045,0.06,0.03,0.05,0,0.04,0,0.03,0.005,0,0,0
3.2
Sample Average Approximation
Para plantear el problema SAA es necesario escoger dos par´ametros N (el tama˜no de la muestra que se va a tomar de r) y γ el nivel de significancia del problema SAA. Ahora, vamos a tomarγ = α (para asegurarnos que el estimador sea consistente), y de esto de-pende la selecci´on del tama˜no de la muestra N que se debe seleccionar. No se sabe con certeza cu´al debe ser elN para garantizar que la soluci´on del problema SAA est´a lo sufi-cientemente cerca a la soluci´on del problema inicial. Se sabe que mientras mas grande sea N, m´as cercana es la soluci´on. La idea es resolver el problema SAA utilizando diferentes valores deN y analizar las respuestas en cada instancia.
Ahora, analicemos c´omo queda el problema SAA que se va a resolver en este caso: maxx∈X¯rTx, t.q.pˆN(x)≤0,05
en donde
ˆ
pN :=
1
N N
X
i=1
1(0,∞)(0−rTi x) y
¯
r=E[r]. Este problema es equivalente a:
maxx,z r¯Tx t.q. rTi x≥0
19
N
X
i=1
zi ≤N0,05 x∈X, z∈ {0,1}N
En donde hay una variable binaria para cada elemento de la muestra de la variable aleatoria (r).
Se resolvi´o el problema para diferentes tama˜nos de la muestra utilizando XPress. Los resultados de las diferentes corridas fueron los siguientes:
N Valor F.O. Distancia a x* 1320 0.051 0.0523 1400 0.049 0.0547 1500 0.053 0.0498 1600 0.054 0.0342
Table 3.1: Tabla Resultados SAA
Como se puede ver en la tabla anteriormente presentada, hay una tendencia clara. Mientras ms grande sea el tama˜no de la muestra, m´as se aproxima la soluci´on encontrada a la soluci´on del problema inicial. Esto se puede evidenciar tanto en la funcio objetivo, como en la distancia euclidea de la soluci´on aproximada a la soluci´on verdadera.
3.3
Sample Average Approximation con Importance
Sam-pling
Para resolver el problema inicial utilizando SAA con Importance Sampling es necesario escoger la medida inducida ν, llamada la medida IS. ν va a ser la medida inducida de la nueva variable aleatoriar. Para la escogencia deˆ νes necesario queµla medida inducida por la variable aleatoriar, sea aboslutamente continua con respecto a µ. M´as adelante, se va a explicar qu´eνse va a tomar.
Ahora, el problema SAA con IS que se va a resolver queda: maxx∈Xr¯ˆTx, t.q.pˆISN (x)≤0,05 en donde
ˆ
pISN := 1
N N
X
i=1
1(0,∞)L(ˆrj)
L(ˆrj) = dµ
dν(ˆr j).
Si traducimos esto a las condiciones del problema que tenemos, el modelo de optimizaci´on queda as´ı:
maxx,z r¯Tx t.q. rTi x+vzi ≥0
N
X
i=1
ziL(ri)≤N0,05 x≥0∈X, z ∈ {0,1}N
Elν que se us fue tal que los retornos de los activos siguen una distribuci´on normal, con media 35 y desviaci´on 5. µes claramente absolutamente continua con respecto aν. Por otro lado, la medidaνes ”menos riesgosa”, pues con menor probabilidad los activos tienen retornos negativos o bajitos. Adem´as, para facilitar los c´alculos se tomaron las covarianzas entre los retornos de los diferentes activos como 0.
Ahora, se va a tomar elN que se seleccion´o despu´es de analizar las soluciones cor-respondientes a diferentes valores deN en la parte de SAA sin IS. El problema se resolvi´o utilizando XPress MP y el resultado fue el siguiente:
N Valor F.O. Distancia a x* 1320 0.053 0.0458 Table 3.2: Tabla Resultados SAA con IS
Podemos ver, que al tomarN = 1320la soluci´on utilizando SAA con IS se aproxima m´as que la soluci´on utilizando solamente IS. Esto se evidencia tanto en el valor de la F.O. y en la distancia de la soluci´on aproximada a la soluci´on optima verdadera. Esto es importante, pues al agregar IS encontramos una soluci´on que converge m´as r´apido a la soluci´on real.
3.4
Sample Average Approximation con Importance
Sam-pling Extendido
Para utilizar SAA con IS Extendido es necesario que el valor de la restricci´on dependa s´olo de ciertos ´ındices para unxfijo. Es decir, que s´ı se cumplen o no las restricciones se pueda determinar utilizando un subconjunto de los ´ındices. Para lograr esto esto se va a plantear un cambio del problema inicial. La idea de este problema es que se va a agregar una restricci´on que dice que hay un n´umero m´aximo de activos en el portafolio. Se va a tomar dicho n´umero como 20 activos. El problema inicial queda de la siguiente forma:
21
maxx∈XE[(rTx, k)] t.q. P r{(rTx, k)≥v} ≥1−α
30
X
i=1
ki ≤20 k ∈ {0,1}30 donde(rTx, k)es el producto punto.
La idea es resolver este problema utilizando SAA con IS Extendido, tomandoγ =α y el mismoN que se utiliz´o para hacer SAA con IS.
Si se traduce el problema al problema de selecci´on de portafolio queda de la siguiente manera:
maxx,z,L r¯Tx t.q. rTi x+M zi ≥0 sik =
1 1 si el activo j est´a en el subconjunto k,
0 de lo contrario.
bk =
1 1 si se decidi invertir en el subconjunto k,
0 de lo contrario.
X
xi = 1
X
bk = 1
X
Li ≥N α Li ≥
X
k
Lk( ˆri)bk−(1−zi)M ∀i xi ≤M(sik−(1−bk))
x≥0∈X, zi ∈ {0,1}N, Li ≥0∈R
Ahora, el problema que resulta es dif´ıcil de resolver num´ericamente y esto se sale del alcance de este trabajo, pero es interesante ver c´omo quedar´ıan los resultados para ver si efectivamente la soluci´on converge eficientemente a la soluci´on optima verdadera.
Conclusiones
En este trabajo se estudi´o la forma de encontrar una soluci´on a un problema de optimizaci´on con restricciones probabil´ısticas. Primerio se analiz´o el m´etodo Sample Average Approx-imation. Se explic´o c´omo funciona el m´etodo, y te´oricamente por qu´e la soluci´on que arroja converge a la soluci´on ´optima del problema inicial. Este m´etodo depende de una muestra aleatoria de tama˜noN de la variable aleatoria del problema. Si se quiere un nivel de significancia alto, entonces esteN es un n´umero relativamente grande.
Para esto, se estudi´o c´omo utilizar IS para encontrar una variable aleatoria emp´ırica, y a partir de esta, construir una nueva muestra aleatoria para utilizar en el m´etodo SAA. Este m´etodo requiere de unN m´as peque˜no para estar lo suficientemente cerca de la soluci´on optima del problema inicial. Existe una forma diferente de utilizar IS en SAA para aproxi-marse a´un m´as efectivamente a la soluci´on ´optima del problema inicial, y esta es haciendo que la distribuci´ıon emp´ricia que se utiliza dependa de la variable de decisi´onx.
Se verific´o si el m´etodo SAA, con sus complementos funciona para encontrar una soluci´on ´optima. Primero, se resolvi´o un problema inicial de selecci´on de portafolio en donde se busca maximizar el retorno esperado del portafolio, teniendo en cuenta que todos los activos en los cuales se puede invertir tienen unos retornos que siguen una distribuci´on normal. Para encontrar la soluci´on a este problema se utiliz´o Matlab y se expres´o el prob-lema como un probprob-lema convexo. Despue´s se verificaron los m´etodos estudiados en este trabajo.
Se utiliz´o XPress para resolver el problema utilizando Sample Average Approxima-tion para diferentes tama˜nos de muestra. En esta parte se pudo concluir que mientras m´as grande es elN, m´as cerca estamos a la soluci´on optima verdadera. Es decir, el valor de la funcion objetivo es m´as cercano al valor verdadero, y la distancia euclidea de la soluci´on aproximada a la soluci´on verdadera es menor.
Despue´es se comprob´o la efectividad del m´etodo Sample Average Approximation con Importance Sampling para encontrar una soluci´on aproximada al problema de
23
lecci´on de portafolio. Se pudo concluir que utilizando un mismo N, agregar Importance Sampling a SAA arroja una soluci´on que es m´as cercana a la soluci´on original. Para la parte de SAA con IS extendido se formul´o el problema, pero no se resolvi´o, pues el problema resultante no es lineal y es computacionalmente m´as dif´ıcil de resolver.
Aunque problemas de optimizaci´on con restricciones probabil´ısticas se estudiaron por primera vez hace aproximadamente 50 a˜nos, los avances que existe sobre c´omo re-solver ´este tipo de problemas son muy recientes. Se puede estudiar c´omo discretizar la distribuci´on de probabilidad subyacente en el problema (como lo hace este trabajo), o se puede estudiar c´omo hacer una Aproximaci´on Convexa. Este segundo m´etodo consiste en buscar la manera de aproximar la regi´on factible de un problema de optimizaci´on con restricciones probabil´ısticas a una regi´on convexa, pues en la mayor´ıa de los casos no lo es. Adem´as de otros m´etodos para encontrar la soluci´on a este tipo de problemas se puede estudiar mucho m´as sobre el m´etodo de SAA. Por ejemplo, se puede explicar cu´al es el nivel de significancia del problema SAAγ que se debe escoger y c´omo se escoge ´este. Por otro lado, se puede estudiar a profunidad cu´al es el tama˜no de la muestra aleatoria,N suficientemente grande para encontrar una soluci´on suficientemente cercana a la soluci´on optima del problema verdadero. Es un campo de la optimizaci´on que todav´ıa tiene mucho por crecer, y en donde hay mucho m´as para estudiar.
Referencias
1. Pagnoncelli, B.K., Ahmed, S. y Shapiro, A. (2009). Sample Average Approximation Method for Chance Constrained Programming: Theory and Applications.Springer 2. Barrrera, J., Homem-de-Mello, T., Moreno, E., Pagnoncelli, B., y Canessa,G. (2015).
Chance-constrained problems and rare events: an importance sampling approach. Springer
3. Charnes, A., Cooper, W.W., Symmonds, G.H.(1958). Cost horizons and certainty equivalents: an approach to stochastic programming of heating oil. Manag. Sci 4, 235-263
4. Luedtke, J., Ahmed, S.(2008). A sample approximation approach for optimization with probabilistic constraints. SIAM J. Optim. 19, 674-699
5. Kahn, H. Harris, T.(1951). Estimation of particle transmission by random sampling. Nat. Bur. Stand. Appl. Math. Ser 12, 27-30
6. Rosenbluth, M.N., Rosenbluth, A.W.(2002). Monte Carlo calculation of the average extension of molecular chains. J. Chem. Phys. 23, 356
7. Campi, M.C., Garatti, S.(2011). A sampling-and-discarding approach to chance-constrained optimization: feasibility and optimality. J. Optim. theory Appl., 257-280.
8. Shapiro, A.: Monte Carlo sampling methods. En: Ruszczynski, A. , Shapiro, A. (eds.). (2003) Stochastic Programming. Handbooks in OR MS, vol. 10, pp. 353-425. North Holland, Amsterdam.
9. Arstein, Z., Wets, R.J-B. (1996). Consistency of minimizers and the SLLN for stochastic programs. J. Convex Anal. 2, 1-17.
25
10. Google Finance. Stock market quotes, news, currency conversions more. (n.d.) Google. Retrieved November 26, 2016, from http://www.google.com/finance
11. Chung, K.L. (1986). A Course in Probability Theory. Ann. Math. Statist. 41. pp. 103-267.