Sample Average Approximation para resolver problemas de optimización con restricciones probabílisticas

(1)

R

ESTRICCIONES

P

ROBABIL´

ISTICAS

por

Lorenza V´elez Guti´errez

Asesor de Tesis Ph.D Mauricio Junca

Una tesis presentada para Pregrado en Matem´aticas Departamento de Matem´aticas

Facultad de Ciencias Universidad de los Andes

Colombia 2016

(2)

Abstract

En este trabajo se va a estudiar un método para resolver problemas de optimización con restricciones probabil´ısticas, llamado Sample Average Approximation. Para comenzar, se va a estudiar por qué el método arroja una solución que se aproxima a la solución optima del problema original.

Después se va a estudiar una forma más eficiente de aplicar el método de Sample Av-erage Approximation, utilizando Importance Sampling para reducir la varianza de la dis-tribución utilizada en el método. Se van a mostrar dos maneras diferentes de utilizar Im-portance Sampling.

Finalmente, se va a resolver un problema de seleccion de portafolio utilizando el m´etodo de Sample Average Approximation y Sample Average Approximation con Importance Sampling para verificar la efectividad de ´estos.

(3)

Introducci´on 3

1 Preliminares 5

2 Sample Average Approximation 9

2.1 Sample Average Approximation . . . 9

2.2 Importance Sampling . . . 13

2.2.1 Reducci´on de Varianza . . . 14

2.2.2 Consistencia . . . 15

2.3 Importance Sampling Extendido . . . 15

3 Ejemplo Num´erico 17 3.1 Problema Inicial . . . 17

3.2 Sample Average Approximation . . . 18

3.3 Sample Average Approximation con Importance Sampling . . . 19

3.4 Sample Average Approximation con Importance Sampling Extendido . . . 20

4 Conclusiones 22

5 Referencias 24

(4)

Introducci´on

Considere un problema de optimizaci´on en donde el problema depende de una variable aleatoria con una distribuci´on conocida y las restricciones se deben cumplir con una prob-labilidad espec´ıfica. Un problema de estos se puede escribir de la siguiente manera:

minx∈Xf(x), s.a.P r{G(x, ζ)≤0} ≥1−α

en dondeX ⊂_Rn_,_ζ_{es un vector aleatorio con distribuci´on de probabilidad}_P _{con soporte} en E ⊂ _Rd_, _α _∈ ₍₀_,₁₎_, _f _:

Rn → Res una funci´on evaluada en los reales y G : Rn×

E →_Rm_{. Este tipo de problemas se llaman problemas de optimización con Restricciones} Probab´ılisticas y el objetivo de este trabajo es estudiar un método para resolver programas de este tipo. En este trabajo se va a estudiar un método que se llama Sample Average Approximation (SAA) para encontrar una solución aproximada. Además se va a analizar un complemento de dicho método que se llama Importance Sampling (IS) para llegar a una solución del problema original de una manera más eficiente.

Problemas de Restricciones Probab´ılisticas fueron introducidos por Charnes, Cooper y Symonds [3] hace aproximadamente 50 años. Aplicaciones de este tipo de problemas de optimización incluyen problemas de energ´ıa, manejo de polución de agua y telecomuni-caciones. En este paper, Charnes, Cooper y Symond, buscaban encontrar la forma óptima de programar la producción de aceite en una planta. La producción de éste bien depende de condiciones climáticas y de incertidumbres en demanda. Para resolver este problema se propuso plantear las restricciones como condiciones de probabilidad que se imponen so-bre una variable aleatoria. Desde este momento se han estudiado maneras de encontrar la solución óptima a problemas de este tipo, pues a veces encontrar la solución numéricamente es extremadamente dif´ıcil.

Para encontrar la región factible a un problema de Restricciones Probab´ılisticas es nece-sario hacer una integración multidimensional. A veces, la única manera de verificar si un x ∈ X es factible es haciendo una simulación de Monte Carlo. Por otro lado, el conjunto de soluciones factibles puede resultar no convexo, aún siXes convexo y la funciónG(x, ζ)

es convexa. La idea del m´etodo de Sample Average Approximation (SAA) es reemplazar la distribucin de probabilidad de la variable aleatoria del problema verdadero, con una dis-tribuci´on emp´ırica que correponde a una muestra aleatoria.

(5)

SAA fue estudiado por Leudtke y Ahmed [4] en el 2008. Estudiaron algunas condi-ciones sobre el problema inicial que se deben cumplir para que la solución obtenida usando el método sea factible en el problema inicial. Además de esto, analizaron cuál debe ser el tamaño de la muestra aleatoria que se usa para encontrar la distribución emp´ırica de tal manera que la solución encontrada sea factible y esté suficientemente cerca de la solución del problema original.

El tamaño estimado de la muestra aleatoria de SAA que es suficiente para lograr una precision deseada es relativamente grande. Además, existe una cota inferior para el tamaño de la muestra de tal manera que la solución encontrada sea factible. Cuando las restric-ciones del problema original tienen un αmuy pequeño, es decir, que el problema no per-mite muchos casos en los que no se cumpla la restricción, el tamaño de la muestra aleatoria necesaria es relativamente grande. Para encontrar una solución utilizando el método de SAA sin necesidad de utilizar una muestra aleatoria tan grande se hace una integración del método IS a SAA.

IS es una técnica usada en simulación para estimar probabilidades de eventos poco probables, que fue estudiada por Khan y Harris [5] y Rosenbluth y Rosenbluth [6]. Cuando se genera una muestra aleatoria de una variable aleatoria que tiene probabilidad casi 0 en un conjunto, la muestra puede no incluir información de dicho conjunto. En aplicaciones de la vida real, estos eventos significan un accidente, o unas condiciones climáticas ex-tremas, que son muy importantes para encontrar soluciones óptimas. Es importante obtener muestras de la región en cuestión, y para esto se usa IS. Se genera una muestra sobre una distribución que le asigna más peso a dichas regiones de eventos extremos poco probables. En este caso, IS se usa para encontrar una distribución emp´ırica utilizada en SAA, que tiene en cuenta estos eventos extremos y la distribución resultante tiene menor varianza. Esto permite encontrar una mejor aproximación a la solución óptima del problema inicial de Restricciones Probabil´ısticas, pues el tamaño de la muestra aleatoria requerida será menor. Por último, para verificar la efectividad de los métodos mencionados, se va a resolver un problema de selección de portafolio, en donde los precios de los activos en cuestión siguen una distribución normal. Es importante que el vector aleatorio siga esta distribución, pues as´ı se puede encontrar una solución del problema usando métodos numericos. Esto se hace calculando la integral que representa la región factible. As´ı se va a comparar la solución óptima al problema verdadero con la solución encontrada utilizando SAA y final-mente utilizando SAA con IS. Al final se van a compara la solución verdadera (encontrada numéricamente) con la solución encontrada utilizando los métodos.

(6)

Chapter 1 Preliminares

El objetivo en este cap´ıtulo es introducir algunas definiciones elementales, terminolog´ıa y algunos resultados que se van a usar en el desarrollo del trabajo.

Un Problema de optimizaci´on con restricciones probabil´ısticas es un problema de la forma: M in c(x)

s.a.P r{gj(x, Z)≤0, j ∈J} ≥p, x∈X

DondeX ⊂_Rn_{es un conjunto no vacio,}_c_:

Rn →R,gj :Rn×Rs →R,j ∈J, dondeJ es un conjunto de ´ındices,Z es un vector aleatorio de dimensi´ons, ypes un par´ametro del modelo.

PZ es la medida de probabilidad inducida por el vector aleatorioZenRs.

El evento A(x) = {gj(x, Z) ≤ 0, j ∈ J} depende de la decisi´on del vectorx, y su probabilidadP r{A(x)}es calculada con respecto a la distribuci´on de probabilidadPZ. Ejemplo 1.1. Problema de Ruteo de Veh´ıculos Considere una red conmarcos en cual una demanda aleatoria de transporte surge. La matriz T describe un conjunto de nrutas en la red. T es una matrizm×ntal que:

tij =

1 si la ruta j contiene el arco i,

0 de lo contrario.

Se deben asignar vehćulos a las rutas para satisfacer una demanda. El objetivo es satisfacer la demanda con probabilidad alta p ∈ (0,1). Sea xj el número de veh´ıculos asignado a la ruta j. La demanda de transporte en cada arco está dada por la variable

(7)

aleatoriaZi i= 1, ..., m. SeaZ = (Z1, ...Zm)T. El costocj corresponde al costo de operar un veh´ıculo en la ruta j. Entonces, conc= (c1, ..., cn)T el modelo puede ser formulado de la siguiente forma:

M in cTx s.a.P r{T x≥Z} ≥p,

x∈_Zn +

Definici´on 1.2. Una restricci´on de la forma

P r{gj(x, Z)≤0, j ∈J} ≥p se llama una Restricci´on Probabil´stica Conjunta.

Definici´on 1.3. Una restricci´on de la forma

P r{gj(x, Z)≤0} ≥pj, j ∈J,dondepj ∈[0,1]. se llama una Restricci´on Probabil´ıstica Individual.

En el problema de Ruteo de Veh´ıculos tenemos una Restricción Probabil´ıstica conjunta. Si quisiéramos, se podr´ıa cubrir la demanda de cada arco con una probabilidad espec´ıfica, y la restricción quedar´ıa formulada de la siguiente manera:

P r{Tix≥Zi} ≥pi, i= 1, ..., m. Aqu´ı,Ti_{es la fila}_i_{de matriz}_T_.

Definici´on 1.4. Una variable aleatoria X es Integrable si su valor esperado existe y est´a bien definido.

Definici´on 1.5. Una funcionG(x, ζ)es Carath´eodory siG(x,·)es medible para todox∈_R

yG(·, ζ)es continua para casi todoζ ∈_E.

Definici´on 1.6. Una sucesi´onfk(x)de funciones reales extendidas epiconverge a una fun-cionf(x), denotado fk →e f, si para cualquier puntox las siguientes dos condiciones se cumplen:

1. Para cualquier sucesi´onxkque converge a x, se tiene: liminfk←∞fk(xk)≥f(x) 2. Existe una sucesi´onxkque converge axtal que:

(8)

7

Lema 1.7. [11] Seaf1, f2, f3, ...una sucesi´on de funciones medibles no-negativas en un

espacio de medida(S,Σ, µ). Defina la funci´onf :S →[0,∞]de la siguiente manera:

f(s) :=liminfn→∞fn(s), s∈S

Entonces,f es medible y

Z

S

f dµ≤liminfn→∞

Z

S fndµ.

Definici´on 1.8. Sea X1, , Xn una muestra iid de una variable aleatoria X. Considere el estimadoru(X1, , X2)un estimador de un par´ametroθ, si se cumple lo siguiente:

E[u(X1, , XN)] =θ

entonces el estadsticou(X1, , XN)es un estimador insesgado del parametroθ.

Teorema 1.9. Teorema de Convergencia Dominada [11] Sea ζ1, ..., ζnuna muestra

inde-pendiente identicamente distribuida de tama˜no n de la una variable aleatoria que tiene una distribuci´onP. Bajo las siguientes suposiciones:

1. La funcion

f(x, ζ) :X×E →(−∞,∞)

es medible enX×E(enXse toma la sigma-´algebra de Borel), yf(._{, ζ}₎_para_ζ_{fijo es}

semi continua por abajo enx, adem´as,xk →x0implicaliminf f(xk, ζ)≥f(x0, ζ).

2. Para cadax0 ∈ X existe un subconjunto abierto N0 ∈ X y una funcion integrable α0(ζ) : E → (−∞,∞) tal que x0 ∈ X y para casi todo ζ ∈ E la siguiente desigualdad vale para todox∈N0:

f(x, ζ)≥α0(ζ)

la sucesi´onF(˙ :ζ1, ..., ζn)casi siempre epi-converge a(Ef)(˙). En donde,

F(x:ζ1, ..., ζn) :=

1

N n

X

j=1

f(x, ζj)

(Ef)(x) := E[f(x, ζ)].

Teorema 1.10(11). Sea(X,Σ)un espacio medible, si una medidaσ-finitaνen(X,Σ)es absolutamente continua con respecto a una medida Σ-finita µen(X,Σ), entonces existe una funcin mediblef :X →0,∞)tal que para cualquier subconjunto medibleA⊂X,

ν(A) = Z

A f dµ.

(9)

Teorema 1.11. Sea{fn}n una sucesi´on de funciones evaluadas en los reales y medibles

en un espacio medible (S,Σ, µ). Suponga que la sucesi´on converge puntualmente a una funcionf y es dominada por una funcion integrableg, es decir:

|fn(x)|≤g(x)

para todonen el conjunto de ´ındices, y para todox∈S. Entonces,f es integrable y

limn→∞

Z

X

|fn−f |dµ= 0

, lo que tambi´en implica

limn→∞

Z

fndµ=

Z

S f dµ.

Definici´on 1.12. SeaA={ω :limnXn(ω) =X(ω)}yAc= Ω−A. SiP(Ac) = 0, para una sucesi´on Xn(ω), n ≥ 1, se dice queXnconverge a X con probabilidad 1, denotado w.p.1.

Teorema 1.13. Ley uniforme de Grandes N´umeros Supongaf(x, θ)es una funcion definida

para unθ∈Θ, y continua enθ. Entonces, para cualquierθfijo, la sucesi´on{(f(X1, θ), f(X2, θ), ...}

va a ser una sucesi´on de variables aleatorias i.i.d., tal que la media muestral de esta sucesi´on converge en probabilidad aE[f(X, θ]. La ley uniforme de grandes numeros dice que bajo las siguientes condiciones la convergencia es uniforme:

1. Θescompacto.f(x,Θ)escontinuaparacadaθ ∈ Θpara casi todox∈X, y medible para cadaθ.

2.

3. Existe una funcion dominanted(x)tal queE[d(X)]<∞, y

||f(x, θ)||≤d(x) ∀θ ∈Θ

(10)

Chapter 2 Sample Average Approximation

El objetivo de este cap´ıtulo es estudiar un método y unos complementos de éste para re-solver problemas de optimización con restricciones probabil´ısticas. Primero se va a estudiar Sample Average Approximation, se va a explicar en qué consiste el método y por qué la solución que se encuentra es factible y converge a la solución del problema real.

2.1 Sample Average Approximation

Después, se va a explicar una forma de implementar el método SAA de una manera más eficiente, usando Importance Sampling . Por último, se va a estudiar una variación del método SAA con IS, de manera que la estimación de la solución optima depende sólo de algunas coordenadas de la variable aleatoria.

En este trabajo se van a considerar problemas de la forma:

minx∈Xf(x), s.t.prob{G(x, ζ)≤0} ≥1−α

dondeX ⊂ IRn,ζ es un vector aleatorio con distribuci´on de probabilidad P soportada en un conjunto _E ⊂ _Rd_, _α _∈ ₍₀_,₁₎_, _f _:

Rn → R es una funcion evaluada en los reales y

G:_Rn_×

E→Rm.

Para simplificar, se asume que la funci´on que define las restriccionesG : _Rn_×

E →

Rm es evaluada es los reales. Teniendo esto en cuenta, las restricciones Gi(x, ζ) ≤ 0, i= 1, ..., mpueden ser reemplazadas por una restriccion de la siguiente manera:

G(x, ζ) :=max1≤i≤mGi(x, ζ)≤0

Es importanet notar que tomar el m´aximo preserva convexidad si las funciones de restric-ciones son convexas. Se asume que el conjunto X es cerrado, que la funcion f(x) es continua y que la funcionG(x, ζ)es Carath´eodory.

(11)

Entonces, el problema planteado inicialmente es equivalente al siguiente problema: minx∈Xf(x), s.t.p(x)≤α,

dondep(x) :=P{G(x, ζ)>0}.

Ahora seaζ1_{, ..., ζ}N _{una muestra aleatoria independiente identicamente distribuida del} vector aleatorioζ yPN = N−1PN

j=1δ(ζ

j₎_{una medida emp´ırica que corresponde a dicha} muestra aleatoria, donde δ(ζ) es la funcion de masa en un puntoζ. Es decir, PN es una medida discreta que asigna una probabilidad _N1 a cada puntoζj_,_j _{= 1}_{, ..., N}_.

La Sample Average Approximation (pNˆ (x)) de la funcionp(x)se obtiene reemplazando la verdadera distribuci´onP por la medida emp´ıricaPN. Es decir,pˆN(x) := PN{G(x, ζ)>

0}. Sea1(0,∞) :R→Rla funci´on indicadora de(0,∞), es decir: 1(0,∞)(t) :=

1 ift >0 0 ift ≤0

Entonces,p(x) =_EpNˆ [1(0,∞)(G(x, ζ))]y

ˆ

pN(x) =EpNˆ [1(0,1)(G(x, ζ))] =

1

N N

X

j=1

1(0,∞)(G(x, ζj))

Es decir, la Sample Average Approximation es igual al n´umero de veces queG(x, ζj₎_>

0, divididoN. Entonces, el problema asociado a la muestraζ1_{, ...ζ}N _es: minx∈Xf(x), s.t.pˆN(x)≤γ

Este es el Problema Sample Average Approximation que se va a resolver para llegar a una aproximaci´on de la soluci´on optima del problema inicial. Es importante notar que el nivel de significanciaγ ≥0del problema SAA puede ser diferente del nivel de significancia del problema inicial,α.

Ahora, se va a probar por qué la solución aproximada al utilizar el método SAA con-verge a la solución optima del problema inicial. Para esto se tomaN como el tamaño de la muestra aleatoria y un nivel de significanciaγpara el problema SAA.

Proposici´on 2.1. SeaG(x, ζ)una funcion Carath´eodory. entonces las funcionesp(x)y

ˆ

pN(x)son semicontinuas por abajo, ypˆN(x)→cpcon probabilidad 1. A´un m´as, suponga

para todox¯∈Xel conjunto{ζ ∈_E:G(¯x, ζ) = 0}tiene P-medida 0. Entonces la funcionp(x)es continua en todox∈XypˆN(x)converge uniformemente ap(x)con

probabilidad 1 en cualquier conjunto compactoC ⊂X, i.e.:

(12)

11

Proof. Considere una funci´onψ(x, ζ) :=1(0,∞)(G(x, ζ)), teniendo en cuenta que p(x) =_EP[ψ(x, ζ)]ypˆN(x) =EPN[ψ(x, ζ)]. Como la funcion1(0,∞)(˙)es semicontinua por abajo yG(˙, ζ)es Carath´eodory, entoncesψ(x, ζ)es aleatoria semicontinua por abajo. Entonces, por elLemma 1.10se tiene que para todox¯∈_R,

liminfx→x¯p(x) = liminfx→x¯

Z

E

ψ(x, ζ)dP(ζ)

≥

Z

E

liminfx→xψ¯ (x, ζ)dP(ζ)≥

Z

E

ψ(¯x, ζ)dP(ζ) = p(¯x)

Lo cual demuestra que p(x) es semi continua por abajo. Semi-continuidad por abajo de

ˆ

pN(x)se demuestra de la misma manera.

Ahora, para ver quepˆN →epcon probabilidad 1 usamos elTeorema 1.12de Artsein y Wets [9]. En el teorema es necesario que|ψ(x, ζ)|est´e dominada por una funcion integrable, y esto es verdad, pues|ψ(x, ζ)|≤1.

Ahora, suponga que para todox¯∈X,G(¯x, ζ)6= 0w.p.1., lo que implica queψ(˙,ζ)es continua enx¯w.p.1. Entonces, por el teorema de Convergencia Dominada de Lebesgue (Teorema 1.14) para cualquierx¯∈X:

limx→xp¯ (x) = limx→¯x

Z

E

ψ(x, ζ)dP(ζ)

= Z

E

limx→x¯ψ(x, ζ)dP(ζ) =

Z

E

ψ(¯x, ζ)dP(ζ) =d(¯x),

entonces podemos concluir quep(x)es continua enx.Ahora, la convergencia uniforme es¯

una consecuencia de la Ley Unforme de Grandes N´umeros (Teorema 1.13)

Comop(x)ypˆN(x)son semicontinuas por abajo, entonces los conjuntos factibles de los problemas son compactos. Por este motivo, si el conjunto X es acotado, entonces será un conjunto compacto. Sean S y SˆN los conjuntos de soluciones optimas del problema inicial y del problema SAA, respectivamente. Entonces, si las regiones factibles de ambos problemas son no vac´ıas,SySˆN son no vac´ıos con probabilidad 1. Ahora, seanθ∗yθˆN los valores optimos del problema inicial y del problema SAA respectivamente. A continuación se va a probar que paraγ =α,θˆN ySˆN convergen a su respectiva solución en el problema real.

Para hacer la prueba, se va a asumir lo siguiente:

1. Existe una soluci´on optima x¯ del problema inicial tal que para todo > 0 existe x∈Xcon|x−x¯|≤yp(x)< α.

Es decir, existe una sucesión{xk} ⊂ X que converge a una solución optimax¯ ∈ S tal quep(xk) < αpara todok, i.e. x¯es un punto de acumulación del conjunto {x ∈ X :

(13)

Proposici´on 2.2. Suponga que el nivel de significancia del problema real y del problema SAA son iguales, i.e. γ =α, el conjuntoXes compacto, la funci´onf(x)es continua,

G(x, ζ)es Caratheodory, y la condici´on 1. vale. Entonces,θˆN →θ∗ y

D( ˆSN, S)→0 w.p.1 cuando N → ∞, en dondeD(A, B) :=supdist(x, B)x∈B.

Proof. Usando la condición 1, el conjuntoSes no vac´ıo. Entonces, existextal que p(x)< α. Por el teorema anterior,pNˆ (x)converge ap(x)w.p.1., entoncespN¯ (x)< α, y entonces, el problema SAA tiene una solución factible w.p.1. para unN suficientemente grande. Ahora, por el teorema anterior, tambien tenemos quep¯N(˙)es semicontinua por abajo, entonces el conjunto factible del problema SAA es compacto, entoncesSNˆ es no vac´ıo w.p.1. para unN suficientemente grande. Seaxun punto factible en el problema SAA, entoncesf(x)≥θˆN. Por la condición 1, podemos escogerxtan cerca como queramos dex, y como¯ f(˙)es continua, tenemos:

limsupN→∞θˆN ≤f(¯x) =θ∗ w.p.1. (1)

Ahora, seaxˆN ∈SˆN, es decirxˆN ∈XypˆN(ˆxN)≤αyθˆN =f(ˆxN). Como probamos queXes compacto, entonces existe una subsucesi´on dexNˆ que converge a un punto

¯

x∈X w.p.1. Adem´as, tenemos quepˆN →e pw.p.1., y entonces por la definici´on de epiconvergencia,

liminfN→∞pNˆ (ˆxN)≥p(¯x) w.p.1.

ComopˆN(ˆxN)≤α, entoncesp(¯x)≤α, entoncesx¯es un punto factible del problema inicial, yf(¯x)≥θ∗. Adems,f(ˆxN)→f(¯x)w.p.1., entonces

liminfN→∞θˆN ≥θ∗ w.p.1. (2)

Entonces, por (1) y (2), tenemosθˆN →θ∗ w.p.1.. Entonces, el puntox¯es una soluci´on optima del problema original yD( ˆSN, S)→0, w.p.1..

La condicición 1. es muy importante para la existencia de θNˆ y SNˆ . Esto es porque, por ejemplo, en el caso que la condición p(x) ≤ α define solo un punto factible tal que p(¯x) = α. Entonces, cambios, por más pequeños que sean, en la restricciónpˆN(x) ≤ α pueden hacer que el conjunto factible del problema SAA sea vac´ıo.

Suponga ahora queγ > α, entonces por la Proposición 2.2., mientras más grande sea N, una solucion optima del problema SAA se va a acercar a una solución optima del problema inicial con nivel de significancia γ, y no α. Igualmente, aumentar el nivel de significancia hace que más puntos sean factibles, lo cual lleva a una región factible con más elementos. Si este es el caso, el valor optimo aproximado que se encuentra usando SAA puede ser menor que el valor optimo del problema inicial. El nivel de significancia

(14)

13

del problema SAA es un parámetro muy importante del método, pero no es la orientación que toma este trabajo.

Ahora, vamos a analizar otro parámetro del método. Consideremos cuál debe ser el tamaño de la muestra N tal que la solución optima del problema SAA esté lo suficiente-mente cerca de la solución al problema inicial. Campi et al [6] probaron que si el nivel de significancia del problema SAA es 0 (γ = 0) y si el tamaño de la muestra N satisface la siguiente desigualdad:

N ≥ 2

α(ln(

1

β) +d)

dondedes la dimensión del problemaβ∈(0,1), entonces la solución optima del problema SAA viola las restricciones probabil´ısticas del problema inicial con probabilidad a lo sumo β. Ahora, es importante notar aqu´ı, que mientras más pequeño seaα, más grande debe ser N, sin importar cuál es el valor deβ. Para este resultado es importante que la funcionG sea convexa.

Teniendo esto en cuenta, el tamaño de la muestra debe ser demasiado grande para que el método SAA encuentre una solución que es factible en el problema inicial con un nivel de significancia espec´ıfico. Es por esto que se va a estudiar Importance Sampling, que es un método para encontrar la distribución de probabilidad emp´ırica que arroja una solución aproximada factible con un número menor de muestraN.

2.2 Importance Sampling

Como se mencionó anteriormente, IS es una técnica utilizada para reducir varianza. La idea es encontrar la distribución emp´ırica que se usa en SAA de una manera más eficiente. En esta sección se van a estudiar dos técnicas de IS. Una en donde la distribución emp´ırica sólo depende de la distribución de la variable aleatoriaζ, y en la otra técnica, la distribución de probabilidad que se encuentra depende de la distribución de la variable aleatoriaζ y de la variable de decisiónx.

Definici´on 2.3. Dado un subconjunto,J ⊂ I y unx ∈ X, decimos que la funcionG(x,˙)

esJ−determinadasi existe una funcionGJ :Rn×R|J| →Rtal que G(x,(zi)i∈I) = GJ(x,(zj)j∈Z)

para cualquier vetorz ∈ _Rd_{. Es decir, s´olo las coordenadas}_z

j paraj ∈ J importan para calcularG(x, z).

Ahora, seaµ la medida en _Rd _{inducida por el vector aleatorio} _{ζ, es decir}_µ₍_A_{) =}

P(ζ ∈ A). Ahora, la idea es estimarp(x)para todox ∈ X. Para esto, no se va a utilizar

(15)

nuevo con medida inducida ν, a la cual le vamos a decir medida IS. Ahora,ν es tal queµ es absolutamente continua con respecto aν, es decirµ(A) = 0siν(A) = 0.

Al igual que en el método SAA, seaζˆ1, ...,ζˆN una muestra deζîndependiente iden-ticamente distribuida. Ahora, defina la siguiente distribución de probabilidad emp´ırica:

ˆ

pIS(x) := 1

N N

X

j=1

1{G(x,ζˆj_)>0_}L(ˆζj)

donde L(˙) es el Cociente de Verosimilitud L(˙) = dµ_dν(˙). La funci´on L es la Radon-Nikodym derivative deµcon respecto aν, i.e. Les una funcion_Rd 7→ _Rtal queµ(A) = R

AL(s)dν(s)para cualquier conjunto de BorelA ⊂ R

d_{. Note que para cualquier funcion} mediblef :_Rd_7→

R, se tieneR_Rdf(s)dµ(s) =

R

Rdf(s)L(s)dν(s), es decir: Eζ[f(ζ)] =E_ζˆ[f(ˆζ)L(ˆζ)].

Ahora, se va a hablar sobre la reducci´on de varianza y la consistencia de dicho esti-mador.

2.2.1 Reducci´on de Varianza

La manera como se escoge la medida IS es muy importante, pues puede que la varianza se reduzca en algunos puntos de X, pero que se aumente para otros puntos. Considere la siguiente definici´on:

Definición 2.4. Seapêl estimador de p(x) usado en SAA sin IS y seapˆ0 otro estimador del mismo. Dado∈[0,1]se dice quepˆ0 tiene(, Y)-Reducción uniforme de varianza con respecto apˆ(x)si para cadax∈Y se tiene:

V ar(ˆp0(x))≤V ar(ˆp(x)).

La siguiente proposici´on da una condici´on suficiente para obtener estimadores con

(, Y)-Reducci´on uniforme de varianza. Antes de probar la proposici´on considere la sigu-iente definic´ıon:

Definición 2.5. Seatal quep(x)≤para todox∈Y, y considere el estimador ISpÎS₍_x₎ definido anteriormente. Decimos que pÎS(x) es un (, Y)-Estimador IS Uniformemente Acotado de p(x) si para todox∈Y se tiene:

1{G(x,ζ)>0ˆ }L(ˆζ)≤ w.p.1.

Proposición 2.6. SipÎS₍_x₎_{es un}₍_{, Y}₎_{Estimador IS Uniformemente Acotado de}_p₍_x₎_con ≤1entonces tiene(, Y)- Reducción de Varianza Uniforme con respecto ap¯(x).

(16)

15

2.2.2 Consistencia

Es importante que los estimadores usados sean consistentes, pues esto garantiza que el valor optimo y la solucion optima convergen a sus contra partes en el problema inicial. Se va a probar que la medida de probabilidad utilizada en SAA con IS es consistente si el nivel de significancia del problema inicial y el problema SAA son iguales.

Considere el problema SAA con IS:

minx∈Xh(x) t.q.pˆIS(x)≤γ

La prueba para verpˆIS _→e _p _w.p.₁_. _{es la misma que se hizo para SAA usando la} Proposici´on 2.1.. Con este resultado, tenemos que el estimador utilizando IS es efectiva-mente Consistente.

Es importante notar, que al escoger la medidaν y la nueva distribución de probabili-dad emp´ırica, la varianza del nuevo estimador es más pequeña. Esto pasa porque el evento 1{G(x,ζ)>0}tiene mayor probabilidad. Hay muchas maneras de escoger la medidaν, y sobre

esto hay muchos estudios, pero este trabajo no se va a enfocar en la escogencia de dicho parámetro. A continuación se va a estudiar otra forma de escoger el estimador usando IS, pero en el siguiente caso, la distribución de probabilidad emp´ırica depende de la variable de decisión,x.

2.3 Importance Sampling Extendido

La idea de esta modificación es obtener mejores estimaciones de la distribución de proba-bilidad del problema inicial. La idea es que se aplique éste método en problemas en donde el comportamiento de la funciónGen unxdado depende sólo de un subconjuntoIxde las variables aleatorias del problema. La idea es calular la distribución emp´ırica IS a partir de Ixy no de todas las variables aleatorias.

Ahora, sea Ix una funci´on que asigna un subconjunto de I a cada x ∈ X. Dado x∈X existe una funcion de Borel medibleψxenR|Ix|tal que:

ψx((zi)i∈Ix) =Eˆ_ζ[L(ˆζ)|(ˆζi)ı∈Ix = (zi)i∈Ix]. Ahora, defina una funcionLx :Rd→Rtal que:

Lx(ˆζ) = ψx((ˆζi∈Ix =E[L(ˆζ |(ˆζ)iinIx].

Por la forma como se construyó, Lx es Ix −determinada. Ahora, vamos a probar que cuando la funcion G(x,˙)es Ix −determinada, el estimador IS de p(x)construido con la funcion de verosimilitud Lx es insesgado y su varianza es a lo sumo la varianza del estimadorpÎS₍_x₎_{que definimos en el método anterior.}

(17)

Lema 2.7. Suponga que la funci´on de conjuntosIxdefinida anteriormente es tal queG(x,˙)

es Ix determinada para todo x ∈ X. Dada una muestra independiente identicamente

distribuida de(ˆζ1, ...,ζˆN)de la distribuci´ıon deζˆ, sea:

ˆ

PIS0₍_x_{) =} 1

N N

X

j=1

1{G(x,ζˆj_)>0_}Lx(ˆζj) (2.1)

EntoncespÎS0₍_x₎_{también es un estimador insesgado de p(x). Además,}

V ar(ˆpIS0₍_x_{)) =}_{V ar}_(ˆ_pIS₍_x₎₋ 1

NEˆζ[V ar(1{G(x,ζ)>0ˆ } |(ˆζi)i∈Ix)]. (2.2)

Proof. Primero, vamos a probar que el estimadorpIS0₍_x₎ _{es insesgado. Para ver esto, es}

necesario verificar queEˆ_ζ[1_{_G(x,_ζ)>0ˆ }Lx(ˆζ)] =p(x): Eˆζ[1{G(x,ζ)>0ˆ }Lx(ˆζ)]

=Eˆ_ζ[1_{_G(x,_ζ)>0ˆ _}Eˆ_ζ[L(ˆζ)|(ˆζi)i∈Ix]]

=Eˆ_ζ[(Eˆ_ζ[1_{_G(x,_ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix]]

=Eˆ_ζ[1_{_G(x,_ζ)>0ˆ }L(ˆζ)] =p(x).

La segunda igualdad es porqueG(x,˙)esIx determinada, lo que implica queG(x,ζˆ) es medible con respecto a la sigma algebra generada por(ˆζi)i∈Ix. Ahora, vamos a probar la segunda parte, queremos ver que la varianza del nuevo estimador es a lo sumo la varianza depˆIS₍_x₎_:

Eˆζ[1 2

{G(x,ζˆ}Lx(ˆζ)

2

] =E[1_{_G(x,_ζ>0ˆ }(Eˆζ[L(ˆζ)|(ˆζi∈Ix])2]

=Eˆ_ζ[(1_{_G(x,_ζ)>0ˆ _}L(ˆζ)|(ˆζi)i∈Ix])2]

=E_ζˆ[E_ζˆ[1_{_G(x,_ζ)>0ˆ _}L(ˆζ)2 |(ˆζi)i∈Ix]−V ar(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)]

=Eˆ_ζ[1_{_G(x,_ζ)>0ˆ }L(ˆζ)

2

]−Eˆ_ζ[V ar(1_{_G(x,_ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)] Entonces,

N V ar(ˆpIS0₍_x_{)) =} Eˆ

ζ[1 2

{G(x,ζ)>0ˆ }Lx(ˆζ)

2_]₋_p₍_x₎2

=Eˆ_ζ[1_{_G(x,_ζ)>0ˆ }L(ˆζ)

2_]₋_Eˆ

ζ[V ar(1{G(x,ζ)>0ˆ }L(ˆζ)|(ˆζi)i∈Ix)]−p(x)2

=N V ar(ˆpIS(x))−Eˆ_ζ[V ar(1_{_G(x,_ζ)>0ˆ _} |(ˆζi)i∈Ix)].

(18)

Chapter 3 Ejemplo Num´erico

El objetivo de este cap´ıtulo es probar si el método SAA,con IS y sin IS, s´ı es efectivo para encontrar una solución aproximada a un problema de optimización con restricciones proba-bil´ısticas. Se va a resolver un problema de selección de portafolio en donde los retornos de los activos siguen una distribución normal. Primero, se va a resolver el problema utilizando únicamente SAA. Después, se va a resolver el problema usando SAA con IS. Por último, se va a probar la efectividad del último complemento de SAA con IS donde la distribución emp´ırica depende de la variable de decisi´ıon. Para el último caso, el problema inicial se va a modificar para que cumpla la suposición necesaria para implementar dicho método.

3.1 Problema Inicial

Considere el siguiente problema de maximizaci´on sujeto a una sola restricci´on proba-bil´ıstica:

maxx∈XE[rTx], t.q.P r{rTx≥v} ≥1−α En dondex∈_R30_{es un vector de variables de decision,}_r _∈

R30es un vector aleatorio con

distribucion de probabilidad conocida, v ∈ _Ry α ∈ (0,1)son constantes, ees un vector cuyos componenetes son todos igual a 1 y

X :=x∈_R30:eTx= 1, x≥0.

Es decir, se quiere maximizar los retornos de un portafolio compuesto por 30 acciones. La idea es decidir la cantidad xi como porcentaje de una riqueza de 1 USD que se va a invertir en la accioni, donde i ∈ {1, ...,30}. Ahorar es el vector aleatorio que contiene informaci´on sobre los retornos de los activos. Se va a asumir que los retornos de los activos siguen una distribuci´on Normal con media 29 y varianza 11. Estos datos fueron tomados de Google Finance [10] como los valores correspondientes a la accion SP 500 en el 2011.

(19)

v es el retorno mnimo que se espera que tenga el portafolio, y en este caso va a ser0. Se espera, como m´ınimo que el portafolio tenga retornos positivos. Ahora, la idea es que esto se cumpla con una probabilidad de al menos95

Se va a resolver este problema utilizando Matlab para encontrar la solución numérica y comparar ésta con las soluciones que se van a encontrar a continuación.

Para resolver el problema en Matlab se debe expresar primero como un problema convexo:

max p¯T(x)

t.q. p¯T(x)≥Φ−1(1−α)||Σ12x||

2

1Tx= 1, x≥0

El resultado encontrado fue el siguiente: Valor funcion objetivo: 0.056. x∗=0.02,0.1,0.04,0,0,0.05,0.03,0.06,0,0.15,0.03,0.02,0.01,0.05,0,0.03,0.04,0.11,0.045,0.06,0.03,0.05,0,0.04,0,0.03,0.005,0,0,0

3.2 Sample Average Approximation

Para plantear el problema SAA es necesario escoger dos parámetros N (el tamaño de la muestra que se va a tomar de r) y γ el nivel de significancia del problema SAA. Ahora, vamos a tomarγ = α (para asegurarnos que el estimador sea consistente), y de esto de-pende la selección del tamaño de la muestra N que se debe seleccionar. No se sabe con certeza cuál debe ser elN para garantizar que la solución del problema SAA está lo sufi-cientemente cerca a la solución del problema inicial. Se sabe que mientras mas grande sea N, más cercana es la solución. La idea es resolver el problema SAA utilizando diferentes valores deN y analizar las respuestas en cada instancia.

Ahora, analicemos c´omo queda el problema SAA que se va a resolver en este caso: maxx∈X¯rTx, t.q.pˆN(x)≤0,05

en donde

ˆ

pN :=

1

N N

X

i=1

1(0,∞)(0−rTi x) y

¯

r=E[r]. Este problema es equivalente a:

maxx,z r¯Tx t.q. rT_i x≥0

(20)

19

N

X

i=1

zi ≤N0,05 x∈X, z∈ {0,1}N

En donde hay una variable binaria para cada elemento de la muestra de la variable aleatoria (r).

Se resolvi´o el problema para diferentes tama˜nos de la muestra utilizando XPress. Los resultados de las diferentes corridas fueron los siguientes:

N Valor F.O. Distancia a x* 1320 0.051 0.0523 1400 0.049 0.0547 1500 0.053 0.0498 1600 0.054 0.0342

Table 3.1: Tabla Resultados SAA

Como se puede ver en la tabla anteriormente presentada, hay una tendencia clara. Mientras ms grande sea el tamaño de la muestra, más se aproxima la solución encontrada a la solución del problema inicial. Esto se puede evidenciar tanto en la funcio objetivo, como en la distancia euclidea de la solución aproximada a la solución verdadera.

3.3 Sample Average Approximation con Importance

Sam-pling

Para resolver el problema inicial utilizando SAA con Importance Sampling es necesario escoger la medida inducida ν, llamada la medida IS. ν va a ser la medida inducida de la nueva variable aleatoriar. Para la escogencia deˆ νes necesario queµla medida inducida por la variable aleatoriar, sea aboslutamente continua con respecto a µ. M´as adelante, se va a explicar qu´eνse va a tomar.

Ahora, el problema SAA con IS que se va a resolver queda: maxx∈Xr¯ˆTx, t.q.pˆISN (x)≤0,05 en donde

ˆ

pIS_N := 1

N N

X

i=1

1(0,∞)L(ˆrj)

L(ˆrj) = dµ

dν(ˆr j₎_.

(21)

Si traducimos esto a las condiciones del problema que tenemos, el modelo de optimizaci´on queda as´ı:

maxx,z r¯Tx t.q. rT_i x+vzi ≥0

N

X

i=1

ziL(ri)≤N0,05 x≥0∈X, z ∈ {0,1}N

Elν que se us fue tal que los retornos de los activos siguen una distribución normal, con media 35 y desviación 5. µes claramente absolutamente continua con respecto aν. Por otro lado, la medidaνes ”menos riesgosa”, pues con menor probabilidad los activos tienen retornos negativos o bajitos. Además, para facilitar los cálculos se tomaron las covarianzas entre los retornos de los diferentes activos como 0.

Ahora, se va a tomar elN que se seleccionó después de analizar las soluciones cor-respondientes a diferentes valores deN en la parte de SAA sin IS. El problema se resolvió utilizando XPress MP y el resultado fue el siguiente:

N Valor F.O. Distancia a x* 1320 0.053 0.0458 Table 3.2: Tabla Resultados SAA con IS

Podemos ver, que al tomarN = 1320la solución utilizando SAA con IS se aproxima más que la solución utilizando solamente IS. Esto se evidencia tanto en el valor de la F.O. y en la distancia de la solución aproximada a la solución optima verdadera. Esto es importante, pues al agregar IS encontramos una solución que converge más rápido a la solución real.

3.4 Sample Average Approximation con Importance

Sam-pling Extendido

Para utilizar SAA con IS Extendido es necesario que el valor de la restricción dependa sólo de ciertos ´ındices para unxfijo. Es decir, que s´ı se cumplen o no las restricciones se pueda determinar utilizando un subconjunto de los ´ındices. Para lograr esto esto se va a plantear un cambio del problema inicial. La idea de este problema es que se va a agregar una restricción que dice que hay un número máximo de activos en el portafolio. Se va a tomar dicho número como 20 activos. El problema inicial queda de la siguiente forma:

(22)

21

maxx∈XE[(rTx, k)] t.q. P r{(rTx, k)≥v} ≥1−α

30

X

i=1

ki ≤20 k ∈ {0,1}30 donde(rT_{x, k}₎_{es el producto punto.}

La idea es resolver este problema utilizando SAA con IS Extendido, tomandoγ =α y el mismoN que se utiliz´o para hacer SAA con IS.

Si se traduce el problema al problema de selecci´on de portafolio queda de la siguiente manera:

maxx,z,L r¯Tx t.q. rT_i x+M zi ≥0 sik =

1 1 si el activo j est´a en el subconjunto k,

0 de lo contrario.

bk =

1 1 si se decidi invertir en el subconjunto k,

0 de lo contrario.

X

xi = 1

X

bk = 1

X

Li ≥N α Li ≥

X

k

Lk( ˆri)bk−(1−zi)M ∀i xi ≤M(sik−(1−bk))

x≥0∈X, zi ∈ {0,1}N, Li ≥0∈R

Ahora, el problema que resulta es dif´ıcil de resolver numéricamente y esto se sale del alcance de este trabajo, pero es interesante ver cómo quedar´ıan los resultados para ver si efectivamente la solución converge eficientemente a la solución optima verdadera.

(23)

Conclusiones

En este trabajo se estudió la forma de encontrar una solución a un problema de optimización con restricciones probabil´ısticas. Primerio se analizó el método Sample Average Approx-imation. Se explicó cómo funciona el método, y teóricamente por qué la solución que arroja converge a la solución óptima del problema inicial. Este método depende de una muestra aleatoria de tamañoN de la variable aleatoria del problema. Si se quiere un nivel de significancia alto, entonces esteN es un número relativamente grande.

Para esto, se estudió cómo utilizar IS para encontrar una variable aleatoria emp´ırica, y a partir de esta, construir una nueva muestra aleatoria para utilizar en el método SAA. Este método requiere de unN más pequeño para estar lo suficientemente cerca de la solución optima del problema inicial. Existe una forma diferente de utilizar IS en SAA para aproxi-marse aún más efectivamente a la solución óptima del problema inicial, y esta es haciendo que la distribuci´ıon emp´ricia que se utiliza dependa de la variable de decisiónx.

Se verificó si el método SAA, con sus complementos funciona para encontrar una solución óptima. Primero, se resolvió un problema inicial de selección de portafolio en donde se busca maximizar el retorno esperado del portafolio, teniendo en cuenta que todos los activos en los cuales se puede invertir tienen unos retornos que siguen una distribución normal. Para encontrar la solución a este problema se utilizó Matlab y se expresó el prob-lema como un probprob-lema convexo. Despue´s se verificaron los métodos estudiados en este trabajo.

Se utilizó XPress para resolver el problema utilizando Sample Average Approxima-tion para diferentes tamaños de muestra. En esta parte se pudo concluir que mientras más grande es elN, más cerca estamos a la solución optima verdadera. Es decir, el valor de la funcion objetivo es más cercano al valor verdadero, y la distancia euclidea de la solución aproximada a la solución verdadera es menor.

Despueés se comprobó la efectividad del método Sample Average Approximation con Importance Sampling para encontrar una solución aproximada al problema de

(24)

23

lección de portafolio. Se pudo concluir que utilizando un mismo N, agregar Importance Sampling a SAA arroja una solución que es más cercana a la solución original. Para la parte de SAA con IS extendido se formuló el problema, pero no se resolvió, pues el problema resultante no es lineal y es computacionalmente más dif´ıcil de resolver.

Aunque problemas de optimización con restricciones probabil´ısticas se estudiaron por primera vez hace aproximadamente 50 años, los avances que existe sobre cómo re-solver éste tipo de problemas son muy recientes. Se puede estudiar cómo discretizar la distribución de probabilidad subyacente en el problema (como lo hace este trabajo), o se puede estudiar cómo hacer una Aproximación Convexa. Este segundo método consiste en buscar la manera de aproximar la región factible de un problema de optimización con restricciones probabil´ısticas a una región convexa, pues en la mayor´ıa de los casos no lo es. Además de otros métodos para encontrar la solución a este tipo de problemas se puede estudiar mucho más sobre el método de SAA. Por ejemplo, se puede explicar cuál es el nivel de significancia del problema SAAγ que se debe escoger y cómo se escoge éste. Por otro lado, se puede estudiar a profunidad cuál es el tamaño de la muestra aleatoria,N suficientemente grande para encontrar una solución suficientemente cercana a la solución optima del problema verdadero. Es un campo de la optimización que todav´ıa tiene mucho por crecer, y en donde hay mucho más para estudiar.

(25)

Referencias

1. Pagnoncelli, B.K., Ahmed, S. y Shapiro, A. (2009). Sample Average Approximation Method for Chance Constrained Programming: Theory and Applications.Springer 2. Barrrera, J., Homem-de-Mello, T., Moreno, E., Pagnoncelli, B., y Canessa,G. (2015).

Chance-constrained problems and rare events: an importance sampling approach. Springer

3. Charnes, A., Cooper, W.W., Symmonds, G.H.(1958). Cost horizons and certainty equivalents: an approach to stochastic programming of heating oil. Manag. Sci 4, 235-263

4. Luedtke, J., Ahmed, S.(2008). A sample approximation approach for optimization with probabilistic constraints. SIAM J. Optim. 19, 674-699

5. Kahn, H. Harris, T.(1951). Estimation of particle transmission by random sampling. Nat. Bur. Stand. Appl. Math. Ser 12, 27-30

6. Rosenbluth, M.N., Rosenbluth, A.W.(2002). Monte Carlo calculation of the average extension of molecular chains. J. Chem. Phys. 23, 356

7. Campi, M.C., Garatti, S.(2011). A sampling-and-discarding approach to chance-constrained optimization: feasibility and optimality. J. Optim. theory Appl., 257-280.

8. Shapiro, A.: Monte Carlo sampling methods. En: Ruszczynski, A. , Shapiro, A. (eds.). (2003) Stochastic Programming. Handbooks in OR MS, vol. 10, pp. 353-425. North Holland, Amsterdam.

9. Arstein, Z., Wets, R.J-B. (1996). Consistency of minimizers and the SLLN for stochastic programs. J. Convex Anal. 2, 1-17.

(26)

25

10. Google Finance. Stock market quotes, news, currency conversions more. (n.d.) Google. Retrieved November 26, 2016, from http://www.google.com/finance

11. Chung, K.L. (1986). A Course in Probability Theory. Ann. Math. Statist. 41. pp. 103-267.