Inteligencia Computacional (IA 013) Recocido Simulado: Algoritmo Básico

(1)

Recocido Simulado: Algoritmo B´ asico

c M. Valenzuela 1996–2003 (19 de enero de 2004)

1. Idea b´ asica de recocido simulado

Cuando un material se somete a un calentamiento a temperatura muy alta, y después se le deja enfriar lentamente, sus moléculas se acomandan de tal forma que la energ´ıa potencial de la configu- ración de las moléculas es m´ınima; a este proceso f´ısico le llamaremos recocido.¹A cada temperatura del materal, el estado determinado por la configuración de las moléculas sigue la distribución de Boltzmann.

1.1. Algoritmo de Metropolis

La forma en que se visitan los estados posibles de configuraciones de las moléculas de un material a una temperatura fija puede simularse mediante el algoritmo de Metropolis definido de la siguiente manera. Se tiene un material en algún estado inicial u con energ´ıa Eû; se genera un nuevo estado v con energ´ıa E^v aplicando una perturbación pequeña (como el movimiento de una molécula). Si el estado v tiene una energ´ıa menor, se acepta como el nuevo estado. Si no, se acepta con una probabilidad de

exp −E^v− E^u k^BT

!

, (1)

donde k^B es la constante de Boltzmann y T es la temperatura. El ciclo se repite. El algoritmo de Metropolis hace que los estados se visiten con la misma distribución de probabilidad con la que en el proceso f´ısico se tienen las configuraciones de moléculas. La distribución de probabilidad con la que se visitan los diferentes estados es la distribución de Boltzmann.

1.2. Distribuci´ on de Boltzmann

En equilibrio térmico, es decir, después que el material ha estado a una temperatura constante por un tiempo suficientemente largo, la probabilidad de que el material se encuentre en el estado u con energ´ıa Eû a la temperatura T está dada por

P^T{X = u} =

exp − E^u k^BT

!

X

v

exp − E^v k^BT

! , (2)

donde la suma se extiende sobre todos los estados posibles. La figura ?? muestra la distribuci´on de probabilidad de Boltzmann.

1.3. Aplicaci´ on del algoritmo de Metropolis

Para utilizar el algoritmo de Metropolis para optimización combinatoria donde se desea minimizar una función de costo f se hacen las siguientes substituciones. Se toma el estado u como una solución posible del problema de optimización; f (u) como la energ´ıa del estado u; se define un parámetro de control c = t^BT que tiene la función de la temperatura en el algoritmo de Metropolis. El criterio de aceptación es ahora

P{Aceptar nueva soluci´on v} =







1, si f (v) ≤ f (u);

exp

−f (v) − f (u) c

, si f (v) > f (u). (3)

1En metalurgia se utiliza el t´ermino de revenido.

(2)

0 10 20 30 40 50 60 0

0.05 0.1 0.15 0.2 0.25

Energia

Probabilidad

Distribucion de Bolztmann

kBT = 512.00 kBT = 128.00 kBT = 32.00 k_BT = 8.00 kBT = 2.00

Figura 1: Distribuci´on de probabilidad de Boltzmann.

2. Algoritmo b´ asico de recocido simulado

Sea ckel par´ametro de control y Lkel n´umero de transiciones generadas en el ciclo k del algoritmo de Metropolis. El algoritmo simple de recocido simulado puede ser descrito de la siguiente forma:

Recocido Simulado Inicializar (u0, c0, L0) k ← 0

u ← u0

repetir

para` ← hasta L^k hacer Generar vecino v de u sif (v) ≤ f (u)

entoncesu ← v sino

sialeatorio[0, 1) < exp

−f (v) − f (u) c^k

entoncesu ← v

fin-si fin-si fin-para k ← k + 1

Calcular longitud L(k) Calcular control c(k)

hastaque se cumpla criterio de terminaci´on

(3)

3. Aplicaci´ on pr´ actica de recocido simulado

Para aplicar el algoritmo de recocido simulado es necesario especificar algunos puntos que no se describen en el algoritmo. A continuaci´on se da describen estos detalles de implementaci´on y una forma sencilla de decidirlos.

Valor incial del par´ametro de control c0

Se inicializa c con un valor pequeño y se multiplica por una constante β mayor que 1 hasta que la razón de aceptación sea cercana a 1.

Decremento del par´ametro de control

Es usual un decremento exponencial definido por la siguiente ecuaci´on:

ck+1= αc^k, (4)

donde α es una constante tal que 0 < α < 1.

Valor final del par´ametro de control

Se termina la ejecución del algoritmo cuando el valor de la función de costo de la solución obtenida en el último intento de una cadena de Markov permanece sin cambio por un número determinado de cadenas consecutivas.

Longitud de cada cadena de Markov

Se termina cada cadena cuando se llega a un n´umero de transiciones aceptadas. Para evitar que se tengan cadenas excesivamente grandes al final de la corrida, se limita L^ka no ser mayor que una constante dada L.

Funci´on de vecindad

La función de vecindad es dependiente del problema y de la forma de los parámetros de la función objetivo. Por ejemplo, para parámetros reales se obtiene un vecino sumando a cada parámetro un número aleatorio pequeño con distribución uniforme en el intervalo [−ν/2, ν/2], donde ν es la tamaño de la vecindad.

4. Implementaci´ on del algoritmo b´ asico

A continuación se lista la implementación en MATLAB del algoritmo básico de recocido simulado.²

function [intentos,mejorEv] = recocido(x0, varargin)

% [intentos,mejorEv] = recocido(x0)

% [intentos,mejorEv] = recocido(x0, semilla)

%

% Implementa el algoritmo basico de recocido simulado

%

% x0: punto inicial

% semilla: semilla del generador de numeros aleatorios

% M. Valenzuela (1 de septiembre de 2000)

% Revision 1: 31 de enero de 2001

% Errores varios

% Revision 2: 28 de abril de 2001

2En el URL http://www-cia.mty.itesm.mx/~mvalenzu/Software se encuentran varias implementaciones del algoritmo b´asico de recocido simulado en Python, MATLAB, Modula-3, Pascal, y C.

(4)

% Variables globales

global temp totalIntentos mejor salida

% Parametros del algoritmo

global pMax pMin longCadena maxIntentos minIntentos ...

minRazonAceptacion alfa beta maxCadenas frecImpresion ...

tamanoVecindad intentos mejorEv pMax = 10;

pMin = -10;

longCadena = 50;

maxIntentos = 100;

minIntentos = 20;

minRazonAceptacion = 0.8;

alfa = 0.5;

beta = 1.2;

maxCadenas = 3;

frecImpresion = 40;

tamanoVecindad = 0.1;

nomSalida = ’salida’;

if length(varargin)>=1 sem = varargin{1};

else

sem = sum(100*clock);

end

% Programa principal intentos = [];

mejorEv = [];

InicializarRand(sem);

salida = fopen(nomSalida, ’w’);

fprintf(’*** Inicio del programa ***\n’);

punto = InicializaPunto(x0);

[temp, punto] = Inicializar(punto);

punto = Recocido(punto, temp);

fprintf(1, ’Ultimo punto encontrado: ’);

ImprimePunto(1, punto);

fprintf(1, ’\n’)

fprintf(1, ’Mejor punto encontrado: ’);

ImprimePunto(1, mejor);

fprintf(1, ’\n’) fclose(salida);

% Fin del programa principal function ImprimePunto(archivo, u)

%*********************

% Imprime un punto u *

%*********************

fprintf(archivo, ’f(%5.2f,%5.2f) = %8.2f’, ...

u.x, u.y, u.evaluacion);

function f = FcnObjetivo(punto)

%*********************************

% Implementa la funcion objetivo *

% En este ejemplo implementa la *

% funcion f(x,y) = x^2 + y^2 *

%*********************************

(5)

f = punto.x^2 + punto.y^2;

%f = cos(sqrt(10*punto.x))*exp(-punto.x/100);

function uEvaluada = EvaluaPunto(u)

%*******************************************

% Evalua un punto u y guarda su evaluacion *

%*******************************************

global totalIntentos frecImpresion salida mejor intentos ...

mejorEv

u.evaluacion = FcnObjetivo(u);

if (u.evaluacion < mejor.evaluacion) mejor = u;

end

if ( mod(totalIntentos,frecImpresion)==0 )

fprintf(salida, ’Intentos =%6d ’, totalIntentos);

ImprimePunto(salida, mejor);

fprintf(salida, ’\n’);

intentos = [intentos totalIntentos];

mejorEv = [mejorEv mejor.evaluacion];

end

totalIntentos = totalIntentos + 1;

uEvaluada = u;

function u = InicializaPunto(x0)

%************************

% Inicializa el punto u *

%************************

global mejor totalIntentos u = x0;

totalIntentos = 0;

% Se evalua directamente para evitar comparacion

% con mejor que todavia no contiene nada u.evaluacion = FcnObjetivo(u);

mejor = u;

% Se llama a EvaluaPunto para permitir

% impresion del primer punto u = EvaluaPunto(u);

fprintf(1, ’punto inicial: ’);

ImprimePunto(1, u) fprintf(1, ’\n’)

function vecino = GeneraVecino(punto)

%*****************************

% Regresa un vecino de punto *

%*****************************

global tamanoVecindad pMax pMin aux = punto;

aux.x = aux.x + tamanoVecindad * (rand - 0.5);

aux.y = aux.y + tamanoVecindad * (rand - 0.5);

if (aux.x > pMax) aux.x = pMax;

else

if (aux.x < pMin) aux.x = pMin;

end end

if (aux.y > pMax) aux.y = pMax;

(6)

else

if (aux.y < pMin) aux.y = pMin;

end end

aux = EvaluaPunto(aux);

vecino = aux;

function b = AceptaIntento(u, v, c)

%*******************************************

% Regresa verdadero (1) si se debe aceptar *

% un punto nuevo v dado un punto viejo u *

%*******************************************

if (v.evaluacion <= u.evaluacion) b = 1;

return else

if ( rand < exp(-(v.evaluacion-u.evaluacion)/c) ) b = 1;

return else

b = 0;

return end end

function uFinal = CadenaMarkov(u, c)

%*******************************

% Ejecuta una cadena de Markov *

% a una temperatura fija c *

%*******************************

global maxIntentos longCadena intentos = 0;

intentosAceptados = 0;

while ( (intentosAceptados < longCadena) & ...

(intentos < maxIntentos) ) v = GeneraVecino(u);

intentos = intentos + 1;

if (AceptaIntento(u, v, c)) u = v;

intentosAceptados = intentosAceptados + 1;

end end

uFinal = u;

function uFinal = Recocido(u, c)

%**********************************************

% Implementa el algoritmo basico de recocido; *

% regresa el ultimo punto visitado *

%**********************************************

global totalIntentos maxCadenas alfa cadenasSinMejora = 0;

anterior = u;

fprintf(1, ’temp. =%4.1f ’, c);

fprintf(1, ’intentos =%5d ’, totalIntentos);

ImprimePunto(1, u);

fprintf(’\n’);

while (cadenasSinMejora < maxCadenas);

(7)

u = CadenaMarkov(u, c);

if ( (u.evaluacion) >= anterior.evaluacion ) cadenasSinMejora = cadenasSinMejora + 1;

else

cadenasSinMejora = 0;

end

fprintf(1, ’temperatura =%4.1f ’, c);

fprintf(1, ’intentos =%5d ’, totalIntentos);

ImprimePunto(1, u);

fprintf(1, ’ sin mejora =%3d\n’, cadenasSinMejora);

anterior = u;

c = c*alfa;

end

uFinal = u;

function [c, u0] = Inicializar(u)

%**********************************

% Regresa una temperatura inicial *

%**********************************

global beta minIntentos minRazonAceptacion intentos = 0;

intentosAceptados = 0;

c=1.0;

while ( (intentos <= minIntentos) | ...

((1.0*intentosAceptados)/intentos <= minRazonAceptacion) ) v = GeneraVecino(u);

intentos = intentos + 1;

if ( AceptaIntento(u, v, c) ) u = v;

intentosAceptados = intentosAceptados + 1;

end

c = c*beta;

end

fprintf(1, ’temp inicial =%4.1f’, c);

fprintf(1, ’ intentos =%5d’, intentos);

fprintf(1, ’ intentos aceptados =%5d\n’, intentosAceptados);

u0 = u;

function InicializarRand(semilla)

%***********************************************

% Inicializa el generador de numero aleatorios *

%***********************************************

rand(’seed’, semilla);

fprintf(1, ...

’Semilla del generador de numeros aleatorios: %d\n’, ...

semilla);

5. Mejoras al algoritmo b´ asico

Las siguientes son las modificaciones m´as sencillas al algoritmo b´asico de recocido simulado:

Enfriamiento de la funci´on de vecindad

La función de vecindad toma como parámetro la temperatura; a mayor temperatura más grande es la vecindad. De esta manera, el algoritmo tiende a buscar en regiones cercanas al punto donde se encuentra a medida que la temperatura tiende a cero.

Modificaciones de la temperatura dentro de la cadena de Markov

(8)

Al inicio de la i´esima cadena de Markov la temperatura se varia de acuerdo a

c(i) = αc(i − 1) (5)

donde c(i − 1) es la temperatura a la que se terminó la cadena de Markov anterior. Adicional- mente, la temperatura dentro de cada cadena de Markov var´ıa de acuerdo a la evaluación de la función objetivo:

cnueva= fse acaba de aceptar

fanterior aceptada

canterior (6)

donde fse acaba de aceptar es la evaluación que se acaba de aceptar, fanterior aceptada es la evalau- ción de la transición anterior que se haya aceptado, y canteriores la temperatura anterior.