• No se han encontrado resultados

3. MARCO TEORICO

3.2. Ranking y Selecci´ on

3.2.3. M´ etodos Completamente Secuenciales

Los m´etodos de dos etapas en una primera instancia realizan una estimaci´on de los momentos de la distribuci´on de probabilidades del desempe˜no de un individuo, y a partir de ellas estiman el n´umero de r´eplicas totales que deben realizarse, las cuales ser´an completadas en la segunda etapa. Si las estimaciones realizadas en la primera

etapa son poco precisas, las estimaciones del n´umero de r´eplicas totales tambi´en lo ser´an y esto probablemente se traducir´a en la utilizaci´on de m´as recursos de los necesarios.

Para lograr mejores estimaciones, y as´ı evitar este derroche de recursos, se puede extender la primera etapa (i.e. utilizar un valor mayor den0) de manera de que las

estimaciones sean realizadas a partir de muestras m´as grandes. Sin embargo, se debe lograr un balance, ya que si se buscan estimaciones demasiado precisas se deber´a utilizar un valor den0 muy grande, que puede llegar a ser m´as grande que el n´umero total de r´eplicas necesarias, y nuevamente se estar´a incurriendo en un desperdicio de recursos.

Algunos autores han enfrentado este problema desarrollando m´etodos que utilizan m´as de dos etapas (generalmente tres) para ir refinando gradualmente las estimaciones (ver Hochberg y Marcus (1981)). Estos procedimientos de dos o tres etapas hac´ıan mucho sentido antiguamente, cuando las simulaciones eran realizadas manualmente por el modelador o en situaciones en que se asocia alg´un costo al detener una simu- laci´on y reiniciar una nueva. Sin embargo, en la actualidad lossoftwaresde simulaci´on son desarrollados en modernos ambientes computacionales y, de esta forma, se han disminuido las dificultades para programar softwares que permitan alternar entre di- versas simulaciones para obtener datos de manera incremental. Esto ha permitido el desarrollo de m´etodos con m´ultiples etapas, que toman tan s´olo una muestra de cada individuo por etapa y eliminan a aquellos con un desempe˜no inferior tan pronto como esta inferioridad se hace latente.

Estos m´etodos, conocidos comom´etodos completamente secuenciales, han probado ser altamente eficientes. Varios autores han establecido su superioridad por sobre los m´etodos de dos etapas (Bechhofer, Goldsman, Dunnett & Hartmann, 1990; Kim & Nelson, 2001). Paulson (1964) present´o uno de los primeros procedimientos secuen- ciales para elegir el mejor individuo de un grupo de individuos con varianzas conocidas e iguales. Hartmann (1991) entreg´o algunas mejoras a este procedimiento. Kim y

Nelson (2001) extendieron estos m´etodos para el caso de varianzas desconocidas y distintas, poniendo ´enfasis en el contexto de optimizaci´on discreta v´ıa simulaci´on.

Todos estos m´etodos, al igual que los m´etodos de dos etapas revisados anterior- mente, suponen que en un principio no se cuenta con muestras de ninguno de los individuos y que por lo tanto, en la primera etapa se deben obtener n0 muestras (n0

igual para todos los individuos) de cada uno para realizar las estimaciones de los momentos. Sin embargo, considerando la aplicaci´on que se le dar´a a estos m´etodos en este trabajo, este supuesto es poco real. En una iteraci´on cualquiera del algoritmo gen´etico, existir´an individuos dentro de la poblaci´on para los cuales se cuenta con un gran n´umero de muestras provenientes de iteraciones anteriores. Es m´as, probable- mente el n´umero de muestras disponibles por individuo ser´a distinto a lo largo de la poblaci´on. Extrapolando los resultados obtenidos en la secci´on anterior, es esperable que se tengan un gran n´umero de muestras de los mejores individuos y relativamente pocas de los individuos con un desempe˜no inferior.

Afortunadamente, Pichitlamken, Nelson y Hong (2006) desarrollaron un procedi- miento completamente secuencial, llamado selecci´on secuencial con memoria (SSM), que permite manejar un n´umero de muestras iniciales distinto para cada individuo. En otras palabras, se defineni0como el n´umero de muestras disponibles para eli–´esimo individuo de la poblaci´on. Sin embargo, si existen algunos individuos de los cuales se tienen muy pocas muestras, como por ejemplo individuos nuevos en la poblaci´on, el m´etodo esta dise˜nado para tomar m´as muestras de ellos hasta completar el n´umero m´ınimo de muestras (n0) requeridas por individuo.

Este m´etodo toma una muestra, a lo m´as, de cada individuo vigente de la poblaci´on e inmediatamente realiza una etapa de eliminaci´on. Esta etapa elimina a los individuos cuyo valor de la funci´on objetivo acumulado excede al valor del mejor individuo m´as una cierta tolerancia positiva. Mientras m´as muestras sean tomadas, m´as peque˜na se hace esta tolerancia. Los autores introducen el concepto de regi´on

Figura 3.7. Regi´on de continuaci´on de SSM

de continuaci´on para ilustrar esta etapa de eliminaci´on. La figura 3.7 muestra al- gunas instancias posibles del proceso de eliminaci´on cuando solamente se tienen dos individuos vigentes, x(i) y x(j). El procedimiento continua mientras la suma de las

diferencias entre las muestras del individuo iy el individuo j,

r X p=1 ˆ fp x(i) −fˆp x(j) (donde ˆfp x(i)

es el valor obtenido para la funci´on objetivo del individuo i en la r´eplica p), permanezca en el ´area triangular que define la regi´on de continuaci´on.

Existen tres maneras de que la suma abandone la regi´on de continuaci´on: primero, si la suma se hace muy grande y sobrepasa el l´ımite superior de la regi´on de contin- uaci´on, como el gr´afico de la izquierda de la figura 3.7. En ese caso se elimina el individuox(i). Segundo, si la suma se hace muy peque˜na y cae bajo el l´ımite inferior

de la regi´on de continuaci´on, como en el gr´afico de la derecha de la figura 3.7. En ese caso se elimina el individuox(j). Por ´ultimo, si la suma abandona la regi´on triangular

muy similar y se alcanza el n´umero m´aximo de iteraciones sin lograr encontrar evi- dencia suficiente como para elegir a alguno de ellos. En este caso se selecciona al individuo cuya funci´on objetivo promedio es menor.

A continuaci´on se presenta formalmente el algoritmo del m´etodo SSM (Pichit- lamken et al., 2006):

(i) Inicializaci´on: Se toma una poblaci´on de N individuos. Seani

0 el n´umero

inicial de muestras disponibles del individuo i y n0 el n´umero m´ınimo de muestras requeridas por individuo. Se realizan n0−ni0 r´eplicas adicionales

de cada individuo cuyo n´umero inicial de muestrasni

0 sea menor quen0.

Se establecen adem´as la probabilidad de elecci´on correcta P∗ = 1−α y el valor del par´ametro de indiferencia δ.

(ii) Estimaci´on de la varianza: Se definen los siguientes par´ametros:

n0 = min

1≤i≤N{n i

0} (3.8)

nij = min{ni0, nj0} ∀ i6=j. (3.9) Posteriormente se estiman las varianzasσ2

ij =Var

f x(i)

−f x(j) , para

todas las parejas posibles de individuos (i 6= j), a partir de los siguientes estimadores: Sij2 = 1 nij −1 nij X p=1 ˆ fp x(i) −fˆp x(j) −¯ˆ fnij x (i) −f¯ˆnij x (j)2 ∀ i6=j. (3.10) En donde ˆfp x(i)

es el valor obtenido para la funci´on objetivo del individuo

i en la p–´esima r´eplica del modelo de simulaci´on y f¯ˆn x(i)

es el promedio den de esas r´eplicas.

Se definen adem´as los grados de libertad para cada uno de los estimadores

Sij2 definidos anteriormente. Estos grados de libertad est´an dados por:

(iii) Definici´on de la regi´on de continuaci´on: Se definen los siguientes par´ametros de la regi´on de continuaci´on:

λ= δ

2c (3.12)

aij =

η fij Sij2

4(δ−λ) ∀ i6=j (3.13)

donde η satisface (para alguna constante c∈Z+)

c X `=1 (−1)`+1 1− I(`=c) 2 1 + (2c−`)`η 2c−1 −fij 2 = α N −1, (3.14) que para c= 1 (recomendado por los autores) se reduce a

η = N −1 2α fij2 −1. (3.15)

Se definen tambi´en los siguientes par´ametros del m´etodo:

Nij = jaij λ k (3.16) Ni = max i6=j {Nij} (3.17) Nmax= max{Ni} (3.18)

El procedimiento termina sin0 > Nmaxy se retorna el individuo con menor

valor promedio de la funci´on objetivo. En otro caso se define la iteraci´on actual r = n0 y el n´umero de r´eplicas acumuladas en la iteraci´on r como

ni,r =ni0 para todos los individuos.

(iv) Etapa de eliminaci´on: Sea I el conjunto de las soluciones vigentes. Definir

I0 =I y actualizar I seg´un I =ni:i∈I0 y rf¯ˆni,r x (i) ≤min j∈I0 j6=i rf¯ˆnj,r x (j) +aij −rλo (3.19) (v) Criterio de parada: El procedimiento termina si |I| = 1 y se retorna el

´

(a) Realizar una r´eplica adicional y definir ni,r+1 = ni,r + 1 para cada

individuoi que a´un est´a vigente (i.e. i∈I) y queni,r< r+ 1.

(b) Definir ni,r+1 = ni,r para cada individuo i que a´un est´a vigente y que

ni,r ≥r+ 1.

(c) Actualizar r =r+ 1. El procedimiento termina si r =Nmax+ 1 y se

retorna el individuo con menor valor promedio de la funci´on objetivo. En otro caso se vuelve al paso 4 (etapa de eliminaci´on).

Una ventaja de este m´etodo es que no s´olo se puede utilizar para elegir al mejor de los individuos, sino que adem´as, mediante una simple modificaci´on, permite encontrar el grupo de losk mejores individuos. Para ello basta con detener la b´usqueda cuando se tenga que |I| = k en el paso 5 del algoritmo presentado anteriormente. Otra ventaja es que los autores demostraron que este procedimiento conduce a la elecci´on correcta con una probabilidad mayor queP∗.

Un elemento central del m´etodo SSM es la regi´on de continuaci´on, que queda definida por las pendientes (λ) y los interceptos (aij) de la familia de rectas que la

forman. Es por esto que estos dos elementos merecen un poco de atenci´on. Obser- vando la ecuaci´on (3.12) es claro que la pendiente es la misma para todas las rectas y que queda completamente definida por par´ametros que son fijados por el modelador. En cambio, la ecuaci´on (3.13) hace ver que los interceptos son distintos para todas las rectas y que dependen de variables que no son determinadas por el modelador, como la estimaci´on de las varianzas (S2

ij) y sus grados de libertad (fij). Es importante hacer

notar que estas dos variables son fijadas al comienzo del algoritmo y no se cambian durante todo su desarrollo, sin importar que estas estimaciones sean mejores mientras m´as iteraciones del m´etodo se hayan realizado. Esto abre la posibilidad de realizar algunas modificaciones intuitivas al m´etodo, que permitan mejorar su desempe˜no.

Sin duda, si el m´etodo actualizara la regi´on de continuaci´on en todas las itera- ciones con una estimaci´on de la varianza m´as robusta2 se podr´ıan obtener mejores

2En el sentido de que es realizada a partir de todas las muestras de las que se dispone, incluyendo

resultados. Esto se debe a que la regi´on de continuaci´on se ir´a haciendo cada vez m´as ajustada (ya que las estimaciones se hacen cada vez m´as precisas) y las decisiones de eliminaci´on ser´an cada vez m´as estrictas y fundamentadas, llevando a la elecci´on correcta con un menor esfuerzo computacional.

En este trabajo se experimentar´a con una versi´on modificada del m´etodo SSM, que busca corregir la deficiencia presentada anteriormente. Este nuevo m´etodo ser´a conocido comoSSM modificado y consiste en reiniciar el m´etodo SSM en cada itera- ci´on con el conjunto de individuos que quedaron vigentes en la iteraci´on anterior. A continuaci´on se presenta una descripci´on m´as formal del m´etodo:

(i) Llamar a la primera iteraci´on del m´etodo SSM, entreg´andole la poblaci´on completa de individuos.

(ii) Definir I como el conjunto de individuos que sobrevivieron la etapa de eliminaci´on de la iteraci´on de SSM que se realiz´o.

(iii) Realizar nuevamente la primera iteraci´on del m´etodo SSM, entreg´andole la poblaci´on definida por el conjunto I. Volver al paso 2 mientras el criterio de parada de SSM no se cumpla.

Si bien no se cuenta con una desarrollo formal que demuestre que este m´etodo modificado llevar´a a la elecci´on correcta con una probabilidad mayor queP∗, intuiti- vamente se puede prever que si lo har´a.

Para comparar el desempe˜no de los m´etodos ETSS, SSM y SSM modificado, se realizaron en una primera instancia los mismos experimentos que en la secci´on anterior (ver tabla 3.2). Si bien estos experimentos no permiten apreciar una de las mayores caracter´ısticas de las dos versiones del m´etodo SSM (manejar poblaciones con distinto n´umero de muestras iniciales), son muy ´utiles para comparar los desempe˜nos de los tres m´etodos y sacar algunas conclusiones interesantes. La tabla 3.4 muestra los resultados obtenidos.

Tabla 3.4. Desempe˜no de los m´etodos ETSS, SSM y SSM modificado

(SSM2) para el conjunto de experimentos de la tabla 3.2. Cada valor corres- ponde a un promedio de 1000 r´eplicas del experimento.

Dise˜no M´etodo Elecci´on Correcta R´eplicas Totales Reducci´on

1 ETSS 97.7% 248 SSM 100% 265 -16 (-6.6%) SSM2 92.7% 111 137 (55.2%) 2 ETSS 99.4% 92 SSM 99.9% 87 5 (5.0%) SSM2 98.4% 73 19 (21.0%) 3 ETSS 89.0% 993 SSM 98.9% 1274 -281 (-28.3%) SSM2 93.1% 439 555 (55.8%) 4 ETSS 99.2% 115 SSM 100% 135 -20 (-17.5%) SSM2 98.3% 86 29 (25.4%) 5 ETSS 100% 71 SSM 100% 70 1 (0.9%) SSM2 100% 70 1 (1.3%) 6 ETSS 96.5% 528 SSM 99.3% 624 -95 (-18.0%) SSM2 95.7% 264 265 (50.1%) 7 ETSS 96.0% 370 SSM 99.5% 394 -24 (-6.5%) SSM2 93.4% 143 227 (61.4%) 8 ETSS 99.1% 117 SSM 99.9% 111 6 (5.4%) SSM2 95.5% 76 41 (35.1%) 9 ETSS 84.0% 1405 SSM 99.2% 1903 -499 (-35.5%) SSM2 93.4% 608 797 (56.7%)

Lo primero que se puede observar es que SSM realiza m´as r´eplicas que ETSS en 6 de los 9 experimentos utilizados, lo que se traduce en que requiera en promedio un 11.24% m´as de esfuerzo computacional que el m´etodo de dos etapas. Sin embargo, SSM cumple con la condici´on de que la probabilidad de elecci´on correcta sea mayor a

1 2 3 4 5 6 7 8 9 10 0 20 40 60 80 100 Individuo Réplicas

Diseño #1 (Varianzas iguales)

1 2 3 4 5 6 7 8 9 10 0 8 16 24 32 40 Individuo Réplicas

Diseño #4 (Varianzas crecientes)

1 2 3 4 5 6 7 8 9 10 0 30 60 90 120 Individuo Réplicas

Diseño #6 (Varianzas crecientes)

1 2 3 4 5 6 7 8 9 10 0 40 80 120 160 200 Individuo Réplicas

Diseño #7 (Varianzas decrecientes) SSM SSM2 ETSS SSM SSM2 ETSS SSM SSM2 ETSS SSM SSM2 ETSS

Figura 3.8. Resultados de 4 experimentos que muestran el desempe˜no de

los m´etodos ETSS, SSM y SSM modificado (SSM2)

P∗ = 0.9 en todos los experimentos; condici´on que, como se vio anteriormente, ETSS no cumple.

Por otro lado, se puede observar que el m´etodo SSM modificado tiene un de- sempe˜no notable, realizando tan s´olo un 55.75% y un 59.77% de las r´eplicas utilizadas por SSM y ETSS respectivamente. Adem´as este m´etodo cumple con la condici´on de realizar la elecci´on correcta en m´as del 90% de los casos para todos los experimentos realizados.

La figura 3.8 muestra el detalle, individuo a individuo, de las r´eplicas realizadas por cada m´etodo en cuatro experimentos seleccionados. Observando dicha figura es posible notar que SSM modificado realiza pr´acticamente el mismo n´umero de r´eplicas

Tabla 3.5. N´umero inicial de muestras por individuo de los experimentos

para comparar el desempe˜no de t´ecnicas de ranking y selecci´on.

n0 crecientes

Dise˜no n0por individuo (1 →10)

1 7 9 11 13 15 17 19 21 23 25

2 7 11 15 19 23 27 31 35 39 43

n0 decrecientes

Dise˜no n0por individuo (1 →10)

3 25 23 21 19 17 15 13 11 9 7

4 43 39 35 31 27 23 19 15 11 7

que ETSS en los individuos que tienen un valor esperado de la funci´on objetivo alto (individuos 5 en adelante). En cambio, en el caso de los individuos que tienen un valor esperado de la funci´on objetivo bajo (individuos 1 a 4) SSM modificado logra un ahorro sustancial en el n´umero de r´eplicas necesarias, que explica el notable desempe˜no exhibido por este m´etodo. Este resultado no se consigue con el m´etodo SSM y por lo tanto puede ser atribuido a la modificaci´on introducida en este trabajo. Para valorar la capacidad de SSM y SSM modificado de trabajar con poblaciones de individuos que cuentan con distinto n´umero inicial de muestras se desarroll´o el siguiente experimento. Nuevamente se supondr´a que se cuenta con una poblaci´on de 10 individuos, cuyos valores de la funci´on objetivo pueden ser modelados a trav´es de una distribuci´on normal (i.i.d. entre los individuos). Las medias de estas distribu- ciones est´an dadas por µ={1,2,3,4,5,6,7,8,9,10} y las varianzas son iguales para todos los individuos y se mueven dentro del intervalo [0,7]. Se considerar´a adem´as que el n´umero inicial de muestras es distinto para cada individuo. Para probar a los algoritmos en distintas situaciones, se dise˜naron 4 escenarios posibles para el n´umero inicial de muestras. La tabla 3.5 muestras estos dise˜nos.

Como se muestra en la tabla 3.5, existen 2 dise˜nos en que el n´umero inicial de muestras es proporcional a la media del valor de la funci´on objetivo de cada individuo, y 2 dise˜nos en que el n´umero inicial de muestras es inversamente proporcional a la media del valor de la funci´on objetivo de cada individuo. Adem´as en cada caso (n0

creciente y decreciente) se consideraron 2 intensidades para la tendencia exhibida por

n0, siendo suave en los dise˜nos 1 y 3, y fuerte en los dise˜nos 2 y 4. Adem´as, como se

mencion´o anteriormente, para cada uno de los dise˜nos se utilizar´an varianzas dentro del intervalo [0,7].

Para todos los experimentos se considerar´a una probabilidad de elecci´on correcta

P∗ = 0.9 y un par´ametro de indiferencia δ = 0.9. Cada experimento ser´a repetido 5000 veces de manera de poder eliminar cualquier efecto aleatorio.

Dado que ETSS no puede manejar poblaciones con distinto n´umero inicial de muestras se utilizar´a una adaptaci´on intuitiva del m´etodo, basada en el m´etodo de- sarrollado por Boesel, Nelson y Kim (2003). Esta adaptaci´on ser´a conocida como

ETSS m´ınimo y consiste en realizar las siguientes modificaciones al m´etodo ETSS: (i) Calcular h a partir de la ecuaci´on (3.5) reemplazando n0 por el m´ınimo

n´umero de muestras iniciales (i.e. min{ni

0}).

(ii) Utilizar todas las muestras disponibles para cada individuo en la estimaci´on de la media y la varianza muestral de la primera etapa (ecuaciones (3.2) y (3.3) respectivamente).

(iii) En la segunda etapa se realizan Ni−ni0 r´eplicas adicionales, y no Ni−n0

como se postula originalmente.

Estas peque˜nas modificaciones permiten al m´etodo ETSS manejar poblaciones con distinto n´umero de muestras iniciales sacando el mejor provecho posible al n´umero extra de r´eplicas de las que se dispone.

La figura 3.9 muestra el desempe˜no conseguido por cada m´etodo en los 4 expe- rimentos realizados. Es importante mencionar que en este caso el n´umero total de r´eplicas (eje de ordenadas en los gr´aficos) se refiere al n´umero total de r´eplicas que el algoritmo necesit´o por sobre el n´umero inicial de muestras. Es por esto que las figuras indican que todos los algoritmos no requieren r´eplicas cuando la varianza es nula, ya que en ese caso todos los algoritmos son capaces de tomar la elecci´on correcta considerando exclusivamente las muestras con se cuenta inicialmente.

0 1 2 3 4 5 6 7 0 50 100 150 200 250 Diseño #1 (n0 creciente) Varianza (σ2) Réplicas Totales 0 1 2 3 4 5 6 7 0 50 100 150 200 250 Diseño #2 (n0 creciente) Varianza (σ2) Réplicas Totales 0 1 2 3 4 5 6 7 0 40 80 120 160 200 Diseño #3 (n 0 decreciente) Varianza (σ2) Réplicas Totales 0 1 2 3 4 5 6 7 0 30 60 90 120 150 Diseño #4 (n 0 decreciente) Varianza (σ2) Réplicas Totales ETSS min SSM SSM2 ETSS min SSM SSM2 ETSS min SSM SSM2 ETSS min SSM SSM2

Figura 3.9. Desempe˜no de los m´etodos ETSS m´ınimo, SSM y SSM modi- ficado (SSM2) para el conjunto de experimentos de la tabla 3.5 (varianzas iguales yn0 distintos). Cada punto de las curvas corresponde a un promedio

de 5000 r´eplicas del experimento.

Como es de esperarse, todos los algoritmos necesitan un mayor n´umero de r´eplicas mientras mayor es la varianza de los individuos, ya que se requieren m´as r´eplicas para eliminar el efecto aleatorio y as´ı poder realizar la elecci´on correcta. Sin embargo, se puede observar que el n´umero de r´eplicas que requiere el m´etodo SSM modificado crece mucho m´as lentamente que los dem´as, siendo el algoritmo que mejor desempe˜no presenta en los cuatro experimentos. Adem´as, ahora es posible justificar el desempe˜no del m´etodo SSM por sobre el m´etodo ETSS, que en el experimento anterior hab´ıa

quedado en duda. SSM obtiene mejores resultados que ETSS m´ınimo en los cuatro experimentos.

Finalmente, vale la pena destacar el notable desempe˜no logrado por el m´etodo SSM modificado en los dise˜nos con un n´umero de muestras iniciales decrecientes (dise˜nos 3 y 4), que es el escenario que m´as t´ıpicamente se enfrentar´a en una iteraci´on cualquiera del algoritmo gen´etico que se presentar´a en el siguiente cap´ıtulo. En ambos dise˜nos el m´etodo pr´acticamente no necesit´o de r´eplicas adicionales para realizar la elecci´on correcta.

3.3. Discusi´on

En este cap´ıtulo se present´o el marco te´orico necesario para sustentar el desarrollo del algoritmo propuesto en este trabajo, que se introduce formalmente en el cap´ıtulo siguiente.

En una primera parte se introdujeron los algoritmos gen´eticos como t´ecnica de optimizaci´on, poniendo especial ´enfasis en los algoritmos de codificaci´on real y sus variantes que permiten resolver problemas de variables continuas. Adem´as se present´o

Documento similar