5.3 Resultados experimentales
5.3.1 Evaluación de método de variación de temperatura
A continuación, se muestran los resultados sobre algunas de las instancias más re- presentativas de los grupos B y X. Aquí, se puede apreciar de manera más directa cómo funciona el control adaptativo del parámetro de temperatura mediante el ajus- te dinámico propuesto, en relación con un ajuste no dinámico más tradicional. Cada gráfico muestra como varía la temperatura en función del tiempo de ejecución. En las imágenes, los valoresScyScLB representan el puntaje en base al mejor valor de la com- petencia ROADEF y el puntaje en base al límite inferior de la función de costo total, respectivamente. Estos valores son los que fueron logrados antes del recalentamiento de temperatura. La temperatura dinámica se calculó usando la ecuación (Sección 4.3.4.1):
Ti+1 =Ti+Taumento·P untajeROADEFLB(SolucionActual´ )2
En el caso del ajuste de temperatura no dinámico, la función de cálculo de temperatura se redujo a una más simple, buscando eliminar el efecto amplificador (o simplificador) que tiene el límite inferior del puntaje ROADEF sobreTaumento:
Ti+1 =Ti+Taumento
Se estableció para ambas ecuaciones el valor de temperatura en T=810.000, que fue el obtenido por el sintonizador de parámetros. Las figuras han sido agrupadas de acuerdo a la similaridad del comportamiento del algoritmo, tomando en cuenta las caracterís- ticas de las instancias. Los casos que se presentan son representativos de las instancias dos grupos (B y X).
En general, se puede ver que el primer recalentamiento se hace a una temperatura mucho mayor usando el enfoque dinámico. Esto se debe a que el puntaje en el primer recalentamiento, generalmente, es superior a 1, por lo que el puntaje elevado al cua- drado aumenta varias veces la temperatura en la fórmula de recalentamiento dinámico. En los siguientes recalentamientos, el enfoque dinámico buscará adaptar la tempera- tura en base a cuán distante se esté del puntaje calculado en base al límite inferior, buscando diversificar cuando esté lejos e intensificar cuando esté más cerca.
Figura 5.1: Variación de la temperatura respecto del tiempo de ejecución. Instancia
B_1.
En la Figura 5.1 y la Figura 5.2 se muestran los resultados en las instancias B_1 y X_1, las cuales tienen características muy similares. En este caso, el límite inferior de la función de costo y el mejor valor ROADEF están en el mismo orden de magnitud, por lo que las temperaturas de ambos ajustes se mantienen en el mismo número de cifras significativas. Puede verse en ambas instancias, que aproximadamente en el segundo 20 es cuando terminó de ejecutarse HC2, ya que es aquí cuando se realiza el primer recalentamiento. Se aprecia que el primer incremento de temperatura es muy elevado en el caso del ajuste dinámico. Luego de esto, el puntaje respecto del límite inferior señala que se está muy cerca de los valores mínimos de la función objetivo, por lo que es más conveniente seguir intensificando. Así, en los siguientes recalentamientos se realizan pequeños aumentos de temperatura que permiten al algoritmo intensificar, y encontrar mejores valores de función objetivo. Por otro lado, si bien el ajuste no dinámico logra obtener un puntaje negativo, este no es tan bueno como el obtenido por el enfoque dinámico, diferencia que se acentúa mucho más si se observa la figura Figura 5.2.
Figura 5.2: Variación de la temperatura respecto del tiempo de ejecución. Instancia
X_1.
En la Figura 5.3, de manera similar a lo ocurrido en las instancias anteriores, puede verse que hasta el segundo 80, aproximadamente, el algoritmo HC2 estuvo en ejecu- ción. Luego de esto, el valor de los puntajes en base al límite inferior y ROADEF era aproximadamente 0,27. En el caso del ajuste no dinámico, el incremento de tempera-
tura es demasiado grande y lleva al algoritmo a explorar demasiado, por lo que entre el segundo 80 y 300 sólo logra mejorar el valor de los puntajes en 0,01, aproximada-
mente. Por otro lado en el ajuste dinámico, al tenerse un puntaje SCLB menor que 1, la temperatura se multiplicará por (SCLB)2 1, llevando al algoritmo a incrementos de temperatura muy pequeños que le ayudarán a tratar de explotar. Como resultado de esto, puede verse que los incrementos de temperatura del ajuste dinámico son cada vez más pequeños, y el Puntaje ROADEF logra mejorar desde 0,27 en el segundo 80
Figura 5.3: Variación de la temperatura respecto del tiempo de ejecución. Instancia
B_2.
En la Figura 5.4 puede verse que, esta vez, el algoritmo HC2 ha terminado en el segundo 250 aproximadamente. Este comportamiento ocurre en 12 de las instancias más grandes del conjunto de instancias BX (con entre 20.000 y 50.000 procesos), en las cuales la combinación HC1+HC2 consume casi la totalidad del tiempo, y cuyos puntajes en cada una de estas 10 instancias no supera el valor 0,001. Es más, la suma de los puntajes promedio de 31 semillas de todas las instancias de la fase final fue sólo de 6,45, con lo cual se hubiese obtenido el 13° lugar.
La razón de que esta combinación de algoritmos obtenga buenos resultados, es debido a que el algoritmo HC1 logra una rápida mejora de la función objetivo, lo cual ayuda a HC2 a partir desde un valor mucho menor y contrarresta la lenta convergencia de este en las instancias más grandes.
En este tipo de casos, al terminar el algoritmo HC1+HC2 el valor de la función objetivo es muy bajo y cercano a los límites inferiores. En la Figura 5.4 se aprecia que tanto el ajuste dinámico como el no dinámico obtienen los mismos resultados.
Figura 5.4: Variación de la temperatura respecto del tiempo de ejecución. Instancias
B_5