Estudio de algunos algoritmos aspectos teóricos de los algoritmos genéticos

(1)

de los Algoritmos Genetios

Tesis que para obtener el grado de Maestro en Inteligenia Artiial

Presenta

Mara Margarita Reyes Sierra

Maestra en Inteligenia Artiial

Universidad Veraruzana

Asesores:

Dr. Carlos A. Coello Coello

Dr. Onesimo Hernandez Lerma

CINVESTAV-IPN

Revisores:

Dr. Jose Rigoberto Gabriel Arguelles

Dr. Manuel Martnez Morales

Universidad Veraruzana

(2)

(3)

En este trabajo se hae un estudio de los resultados teorios que se han

obtenido hasta el momento relaionados prinipalmente on la

onvergen-ia de los AlgoritmosEvolutivos,en partiular,de los AlgoritmosGenetios

(AGs).

Los modelos estudiados son prinipalmenteaquellos basados en adenas

de Markov.

Se presenta la demostraion de la onvergenia del Algoritmo Genetio

Elitista (AGE), realizada por Rudolph en 1994. En diho trabajo, se

de-muestraquelamatrizde transiionde laadenade Markov orrespondiente

al Algoritmo Genetio Simple (AGS) es primitiva, ondiion suiente para

onluir que tal algoritmono es apaz de onverger al optimode la funion

objetivo.Sin embargo,alonstruirlamatrizdetransiionorrespondienteal

AGE se muestra queesta es reduible, por loque este algoritmo ses apaz

de onverger al optimode lafunion.

Posteriormente, se extiende el modelo orrespondiente on el n de

es-timar el tiempo esperado de onvergenia de diho algoritmo.Se detallan y

ejemplian las araterstias generales de lamatriz de transiiondel AGE

menionadas por Rudolph en 1994. El modelo desarrollado es usado para

predeir eltiempoesperado de onvergenia de un AGon parametrosm

ni-mos. Los resultados obtenidos son omparados on los que presentan los

experimentos orrespondientes.

Por otra parte, se estudia la onvergenia de los algoritmos evolutivos

multiobjetivo. Se presentan y disuten losalgoritmosde este tipo uya

on-vergenia hasidodemostrada.Despuesde presentar talesdemostraiones,se

disute la analoga entre tales algoritmos y los usados en la pratia,

pro-poniendo omo resultado nuevos esquemas de algoritmos que se apegan un

poo mas a aquellos que se usan atualmente, pero uya onvergenia no

(4)

A mis padres Margarita y Roberto por haberme dado la vida y la fuerza

suientepara vivir.

A ti madre portu innito amor, por haer tuyos mis desvelos y por elgran

entusiasmo on el que siempre me has apoyado en todas las faetas de mi

vida.

A tipadre por haber sembrado en mel instintode luha otidianae

inan-sable por ser siempre mejor ada da y por siempre haerme ver las

diul-tades de lavida omo retos a miapaidad humana einteletual.

A ambosporque a ustedes debo todolo quesoy.

A mi esposo Efren, porque su presenia ambio mi vida llenandola on la

(5)

A mi esposo Efren, porque aminar por la vida es mejor y mas fail

des-de que voy de su mano. Graias por aeptarme tal omo soy, apoyarme y

darme la dihade vernos reer juntos ada da mas.

A mispadres,porsus palabrasde animoy apoyo.Graias porestar siempre

pendientes de m.

A mi amigo, maestro y sobrino, Julio Aguilar, por su amistad y apoyo

in-ondiional. Graias por todas las horas de estudio que me dediaste y que

hiieron de m lamatematia quesoy.

A mis tos Mara Luisa Ortiz y Jorge Sierra, por ser omo mis segundos

padres y darme a las tres mejores hermanas que pude tener: Ale, Gina y

Mary. Graiasporestar siempreah.

A mis hermanas de alma: Alejandra Zurita y AnelKlee.

AlDr. CarlosA. CoelloCoello,pordarmelaoportunidaddetrabajaronel,

porlaamistadquemehabrindadoyportodalaonanzaquehadepositado

siempre en m.

AlDr.OnesimoHernandezLerma,porabrirunespaioen suapretada

agen-dadetrabajoparaesuharmeyasesorarmeenlarealizaiondeestetrabajo.

Al Laboratorio Naional de Informatia Avanzada (LANIA), por el apoyo

y todas las failidades reibidas durante la realizaiondel primer a~node la

Maestra en Inteligenia Artiial. Graias a todos los amigos que

enon-tre ah y que me ense~naron tantas osas.

Agradezoelapoyoparalarealizaiondeestatesisdemaestraproporionado

por CONACyT a traves de una bea terminal proveniente del proyeto

ti-tulado\Nuevos Paradigmas enOptimizaionEvolutivaMultiobjetivo"(Ref.

(6)

(7)

Indie general

Resumen 3

Introduion 9

1. Computaion Evolutiva 11

1.1. Anteedentes Historios . . . 11

1.2. Algoritmos Evolutivos . . . 14

1.3. Paradigmas . . . 16

1.3.1. Estrategias Evolutivas . . . 16

1.3.2. ProgramaionEvolutiva . . . 17

1.3.3. Algoritmos Genetios . . . 19

1.4. Coneptos Basios . . . 20

1.4.1. Fundamentos Biologios . . . 20

1.4.2. Coneptos de ComputaionEvolutiva . . . 21

2. Elementos de Probabilidad 27 2.1. Deniiones Basias. . . 27

2.1.1. Espaios de Probabilidad . . . 27

2.1.2. VariablesAleatorias. . . 29

2.2. Cadenas de Markov Finitas . . . 31

2.2.1. Deniiones Basias. . . 31

2.2.2. Clasiaionde Estados y Cadenas . . . 35

2.2.3. Cadenas Absorbentes . . . 36

3. Algoritmo Genetio Simple 39 3.1. Estudios de Convergenia . . . 39

3.1.1. Algoritmo Genetio sinElitismo . . . 39

(8)

4. Tiempo de Convergenia 45

4.1. Anteedentes . . . 45

4.1.1. Modelo Basado en Convergenia de Alelos . . . 45

4.1.2. Modelo Basado en Distaniasde Hamming . . . 48

4.2. Modelo Basado en Cadenas de Markov . . . 51

4.2.1. Estudiode laMatriz del AGE (P + ) . . . 52

4.2.2. TiempoEsperado de Convergenia . . . 61

4.2.3. Experimentos . . . 64

4.3. Conlusiones. . . 68

5. Algoritmos Evolutivos Multi-Objetivo (AEMO) 71 5.1. Introduion . . . 71

5.2. El Primer AEMO . . . 72

5.3. AEMO's de Primera Generaion . . . 73

5.4. AEMO's de Segunda Generaion . . . 77

6. Teora de AEMO 83 6.1. Espaios Parialmente Ordenados . . . 83

6.2. Primera Generaion . . . 84

6.2.1. Nihos . . . 86

6.3. Segunda Generaion . . . 92

6.3.1. ElitismoMedianteel Usode una PoblaionExterna . . 92

6.3.2. Elitismo+. . . 97

(9)

Existen problemas de optimizaion uyos espaios de busqueda son tan

grandes que los algoritmoslasios mas eientes disponibles para

resolver-los requieren un tiempo exponenial. Es preisamente en estos asos en los

que las heurstias tienen espeial relevania. La tenias evolutivas, omo

heurstias en s, han demostrado su apaidad para enontrar soluiones

asi optimas en diho tipo de problemas. Sin embargo, por su misma

natu-raleza, su omportamientono es del todo onoido, es deir, no se onoen

a ienia ierta las ondiiones bajo las uales tendranexitoo fraaso. Este

es el aso, en partiular, de los AlgoritmosGenetios (AG) sobre los uales

trata fundamentalmenteel presente trabajo de tesis.

ElAGesun tenia heurstia basadaen la evoluionnatural,uya

apli-aion en el ampo de la optimizaion surge de la presenia de la seleion

natural en diha teora, que impone la supervivenia del mas apto. En sus

iniios, el AG (llamado ahora \lasio") fue apliado a problemas de

opti-mizaion de funiones on un solo objetivo. En 1994, fue publiada la

de-mostraion de la onvergenia de diho algoritmo al optimo global de la

funionen uestion,bajoiertasondiiones.Deestamanera,apesardeque

existen multiples variantes del AG lasio, on diho trabajo se pudo tener

una garantadel exitode esta tenia en suversion mas simple.

Sinembargo,dadoqueesomunenfrentarnosenlavidaotidianaa

prob-lemas en los que nos interesa optimizar mas de un objetivo (p. ej. repartir

el mayornumerode objetos on elmenor osto posible),omo era de

esper-arse, se trabajoen numerosas extensiones del AGlasio para darlugar a lo

que ahora se onoe omo AG Multiobjetivo. Atualmente existen tambien

multiplesvariantesdeestenuevoalgoritmo,ysehanhehoalgunosesfuerzos

pormodelarloteoriamente, aunqueestos han sido de alane muy limitado

hasta ahora.

(10)

optimizaion, en partiular, de losAGs.

Enelaptulo1sepresentaunaintroduionalaComputaionEvolutiva

a traves de sus orgenes y se proporionanalgunos oneptos basios. Dado

quelosmodelosteoriosqueseabordanen estetrabajoestanprinipalmente

basados en Cadenas de Markov, en el aptulo 2 se veran los elementos de

probabilidadneesarios para introduir tal herramienta teoria.

Enelaptulo3seestudia elAG lasio osimple;se introdueelmodelo

teorio orrespondiente y se demuestra su onvergenia. Una vez

demostra-da la onvergenia del AG lasio, en el aptulo 4 se extiende el modelo

teorio del aptulo 3 para estudiar la posibilidad de estimar el tiempo de

onvergenia neesario de diho algoritmo.

En el aptulo 5 se presentan los oneptos basios de la optimizaion

multiobjetivo as omo los prinipales algoritmos evolutivos multiobjetivo

desarrolladoshasta elmomento. Finalmente, en el aptulo 6se estudian los

(11)

Computaion Evolutiva

1.1. Anteedentes Historios

LaTeoradel Creaionismodie que Diosreo elielo y latierra y todas

las espeies que en ella habitan, ada una por separado. El desontento de

algunosientosonesta teoradiolugaraldesarrollodelosprinipiosque

fungen omo los orgenes de laComputaionEvolutiva.

AmediadosdelsigloXIXelzoologofranesLamarkreosupropiateora

de laevoluion en laqueargumentaba quelasaraterstiasadquiridaspor

un organismo omo resultado de un proeso de adaptaiona lo largo de su

vida son heredadas a las siguientes generaiones [34℄. El iento aleman

August Weismann demostro que la teora de Lamark estaba equivoada:

orto la ola de un grupo de ratas porvarias generaiones y observo que la

longitudde laolade lasnuevasgeneraionesnoseveaafetada.Weismann

formulo una teora denominada del germoplasma, segun laual eluerpose

divideen elulas\germinales"quepuedentransmitirinformaionhereditaria

yenelulas\somatias",quenopuedenhaerlo.ParaWeismann,laseleion

naturaleralounioapazdealterarlaomposiiongenetiadeunorganismo

[54℄.

En 1859, Charles Darwin publio un libro titulado: \El origen de las

espeies" [11℄ en el que argumento que la similitud entre padres e hijos se

debealahereniadeiertasaraterstiasyquelosambiosqueseobservan

de unageneraionaotra tienen omon haer alosnuevosorganismos mas

aptos para sobrevivir.

(12)

(13)

binaionsegunlaual lospadres heredabanaloshijosiertasaraterstias

que se mezlaban oreombinabande alguna maneraen ellos, pero no

expli-aba la apariionen nuevos individuosde araterstias quenohabansido

observadas en sus anestros. Esta teora quedo desehada uando el

mon-je austriao Gregor Mendel desubrio, omo resultado de experimentos on

hharos,tresleyesbasiasquegobiernanlaherenia:laLeyde Segregaion,

la Ley de Independenia y la Ley de la Uniformidad. Esta ultima establee

quelasaraterstiasheredadasde padresahijosdepende de silosgenes de

los padresson dominanteso reesivos[37℄.

Posterior al trabajo de Mendel, el botanio danes Hugo De Vries

re-desubrio sus leyes de la herenia pero ademas, motivado al desubrir una

or rojaentre unagranantidadde oresamarillas,desarollolateorade las

mutaionesespontaneas quesi bien noera del todoorreta haservido para

omplementar lateoraevolutiva de Darwin.Segun DeVries, losambios en

lasespeies noeran graduales sino masbien abruptos y,de heho, aleatorios

[53℄.

Hoy en da, se onoe omo Neo-Darwinismoal paradigma resultado de

unir las ideas de Darwin, Weismann y Mendel. La teora Neo-Darwiniana

estableequelavidaenelplanetapuedeserexpliadamediantelossiguientes

uatro proesos:

Reproduion

Mutaion

(14)

Espreisamenteen esta teoraen laqueestaninspiradas lasteniasque

englobala ComputaionEvolutiva.

1.2. Algoritmos Evolutivos

Aunque existen diversas variantes de tenias onsideradas evolutivas, a

ontinuaionse presentala deniionformalde un AlgoritmoEvolutivo [3℄:

Deniion 1.2.1 Un Algoritmo Evolutivo (AE) esta denido omo una

8-tupla:

AE =(I;;;;; ;s;i)

donde:

1. I es elespaio de individuos.

2. :I ! IR denota una funion de aptitud que asigna valores reales

a los individuos.

3. y son enteros positivos; 6= esta permitido.

4. es un onjunto de funiones aleatorias ! : I

! I

, llamadas

\op-eradores geneetios", que obtienen individuos a partir de . Cada

elemento !2 esta ontrolado por alg un parametro 2IR.

5. s:I

!I

denotaeloperadordeseleionqueobtieneindividuos

a partir de .

6. La funion de transiion : I

! I

desribe el proeso de

trans-formaion ompleto de una poblaion P mediante la apliaion de los

operadores genetios y la seleion, por ejemplo, para n jo:

(P)=s(!

1 (:::(!

n

(P)))):

7. i:I

(15)

del problema en uestion, pero no neesariamente. Esto mas bien depende

del AE utilizado y del problema a resolverse. Por otra parte, mientras los

operadores genetiossonsiempreprobabilstios,laseleionpuedeser

prob-abilstia oompletamente determinstia.

El riterio de terminaionpuede variar desde algo arbitrariamente

om-plejohasta algo tan simpleomo ompletarun ierto numeropreestableido

de generaiones.

Deniion 1.2.2 Dado unAEonfunionde transiion :I

!I

y una

poblaioniniial P(0)2I

, la seuenia P(0);P(1);P(2);:::es llamada una

seuenia de poblaiones o evoluion de P(0) y se obtiene iterativamente:

8t 0:P(t+1)= (P(t))

LareaiondeP(0) dependeen partiularde lainstaniadel AE.

Usual-mente elAE se iniializade manera aleatoria,pero no neesariamente.

Con eln de lasiar losoperadores genetios de auerdo alnumero de

individuos a losque son apliados, se presentala siguiente:

Deniion 1.2.3 Un operador genetio ! :I p

!I q

es llamado:

asexual , ! :I !I

sexual , ! :I 2

!I

panmtio , !:I p

!I, para alg un p>2.

La mutaion es un ejemplo de un operador asexual, mientras que la

re-ombinaion o ruza es tpiamente sexual (es deir, que la reombinaion

se efetua entre 2 padres), pero algunos AEs la extienden a una version

panmtia(osea,queintervienenvariospadresparagenerarunoomashijos).

Enlosiguiente, lossmbolosmy r seranusadospara denotar losoperadores

de mutaiony reombinaionrespetivamente.

Elsiguienteesquema representa un AE general:

Algoritmo Evolutivo

t :=0

iniializa P(t)2I

(16)

reombina:P 0

(t):=r(P(t))

muta:P 00

(t):=m(P 0

(t))

evalua: P 00

(t):= (P 00

(t))

seleiona: P(t+1):=s(P 00

(t))

t:=t+1

Como ya se meniono anteriormente, existen diversas variantes de las

tenias evolutivas. Sin embargo, estas suelen lasiarse segun los

prini-pales paradigmasdenidos dentro de laComputaionEvolutiva y queseran

desritos en la siguiente seion:

ProgramaionEvolutiva

Estrategias Evolutivas

AlgoritmosGenetios

1.3. Paradigmas

1.3.1. Estrategias Evolutivas

Las Estrategias Evolutivas(EEs) son un desarrolloonjunto de Bienert,

Rehenberg y Shwefel, quienes hiieron el trabajo preliminardentro de

es-ta area en los 1960's en la Universidad Tenia de Berln en Alemania [3℄.

Las primeras apliaiones de las EEs fueron de arater experimental y se

efetuaron en el area de hidrodinamia.

Laversionoriginaldeuna EE,denominada(1+1)-EE,reabaun padrey

apartir de el(mediante un operador de mutaion) seprodua un solohijo.

De losdos se onservaba solo almejory as suesivamente.

Demanerageneral,lapoblaiondeunaEEpuedeonstardeindividuos.

Enla atualidadse usa toda una variedadde meanismosde reombinaion

en lasEEs, entre losqueseuentatantoon operadores sexuales omoon

operadores panmtios. As pues, de manera general:

r:I

!I.

La mutaionen este aso es un operador asexual

(17)

LanotaionN(0;1)seusaparadenotar laevaluaiondeuna variable

aleato-ria normalmentedistribuida on mediaero y desviaionestandaruno.

Losoperadoresde seleionusadosson ompletamentedeterminstios.

Shwefel introdujo una elegante notaion para estos meanismos,

arateri-zando el metodoy elnumero de individuospadres e hijos, respetivamente.

Ademas,distinguiolos proesos de seleion:

seleio n (+):I +

!I

Este meanismo seleiona los mejores individuos a partir de la union de

los padresy loshijos para formar lasiguientegeneraion de padres.

seleio n (;):I

!I

Este meanismo seleiona los mejores individuos a partir de los hijos

uniamente para formar lasiguiente generaion de padres.

ElesquemadeunaEEoinideonelesquemadelAEgeneralpresentado

en la seion 1.2, la direrenia esa en las araterstias de los operadores

genetios.

Las EE han sigo apliadas a problemas de ruteo y redes, bioqumia,

optia, dise~no de ingenieray magnetismo, por ejemplo[48℄.

1.3.2. Programaion Evolutiva

En 1964 Lawrene J. Fogel desarrollo la Programaion Evolutiva (PE).

Suteniaonsistaprinipalmenteenevoluionarautomatasdeestadonito

(18)

Fogelusounmodelodemutaionparairalterandotantolosestadosomo

lastransiionesdelosautomatas.Sinembargo,puestoquepretendamodelar

laevoluionaniveldelasespeies,nousoningunoperadordereombinaion,

pues diferentes espeies nose ruzanentre s.

El operador de mutaion usado en la programaion evolutiva es

asex-ual y orresponde on el operador Gaussiano. Puesto que no hay

reombi-naion, el operador de seleion se aplia sobre la union de padres e hijos:

seleion (+). La seleion normalmente se lleva a abo mediante un

torneoestoastio para deidir que soluiones seranretenidas.

Eneste aso, elesquema orrespondiente alaPE sevealteradorespeto

alde un AE generaldebido a laausenia de lareombinaion:

Programaion Evolutiva

t:=0

iniializaP(t)2I

evaluaP(t)

while (i(P(t))6=true) do

muta:P 00

(t):=m(P 0

(t))

evalua: P 00

(t):= (P 00

(t))

seleiona: P(t+1):=s(P 00

(t))

t:=t+1

Originalmente la PE fue apliada a problemas de prediion.

Atual-mente, ha sido extendidapara apliaiones en las que existen problemas de

optimizaion ontinua de parametros, planeaion de rutas, reonoimiento

(19)

1.3.3. Algoritmos Genetios

Los Algoritmos Genetios (AGs) son muy probablemente el tipo mas

onoido deAE. Elmasantiguopredeesor deestos algoritmossurgioon el

trabajo deFraser,un biologoquequerasimularlaevoluiononun espeial

enfasis en el estudio de la epstasis, es deir, el impatoque puede tener un

ierto gene sobre otro en una posiion distinta [20℄.

Sin embargo, el AG mas usual fue desarrollado por Holland, un

om-putologo y psiologo de la Universidad de Mihigan. Mientras los bi

olo-gos intentaban usar los AGs para simular los sistemas biologios, Holland

noto omo el algoritmo de busqueda natural poda ser usado para resolver

problemas que ourranen apliaiones pratias [3, 26℄.

Lamutaionen losAGsesunoperadorasexual queseapliaon

proba-bilidad p

m

y que generalmente onsisteen alterarparte de larepresentaion

del individuo.

Por otra parte, la reombinaion es un operador sexual que, on

prob-abilidad p

, esoge dos individuos padres y los reombina para dar lugar

a dos individuos nuevos (apliando dos vees el operador). El operador de

reombinaiones eloperador de busqueda masimportantedel AG.

AligualqueenlaProgramaionEvolutivaeloperadorde seleionusado

en este aso es probabilstio.

Como en el aso de las EEs, el esquema de un AG oinide on el

es-quema del AE general presentado en la seion 1.2, la direrenia esa en las

araterstias de los operadores genetios.

(20)

movimientos, bases de datos, reonoimiento de patrones, et. [23℄.

1.4. Coneptos Basios

1.4.1. Fundamentos Biologios

Para omenzar,reordemosquetodoslosseresvivosestamosompuestos

delmaterialgenetio onoido omoADN(AidoDesoxirribonuleio,

gu-ra1.7). Dentro de las elulas existen adenas de ADN queson responsables

delatransmisiongenetia;estasadenasreibenelnombrederomosomas.

Si una elula ontiene un solo romosoma o onjunto de romosomas se le

llama haploide, y se le denomina diploide en el aso de que ontenga 2

opiasde ada romosoma.

Un gene es una seion de ADN que odia una ierta funion y solo

puedeouparun ierto lugardentro del romosoma.A losdiferentes valores

queun gene puedetomar se lesda elnombre de alelos.

Reiben el nombre de gametos aquellas elulas que llevan informaion

genetia de los padres on eln de llevar a abo la reproduion sexual. Al

onjunto total de genes de un organismo sele llama genoma.

Lareproduionsexual onsistedemanerageneralen lareombinaiono

ruza de los genes de uno (asexual) o dos (sexual) padres para dar lugar al

genomade unnuevoindividuo.Duranteeste proeso eventualmenteourren

erroresde opiadoonoidos omo mutaiones.

(21)

man-1

0

1

0

1

0

Figura1.8:Representaionbinariadeunromosoma.EnCEadaromosoma

orresponde on un individuo.

era queuna poblaionesun onjuntode individuosapaes derelaionarse

e interatuar juntos. Cada individuo esta determinado por su omposiion

genetia,la ual reibeel nombre de genotipo. Posteriormente, elgenotipo

dalugaralosrasgosespeosuobservablesdelindividuo,losualesreiben

el nombre de fenotipo.

Unindividuose desarrolladentro de un iertoambientey este ultimo a

suvez atuasobreelindividuoalterandosuapaidaddereproduirse,mejor

onoidaomoaptitud.Conbaseenlaaptituddeadaindividuo,elproeso

de seleiondeterminarauales son losindividuosquesereproduiranpara

dar lugar anuevas generaiones.

Atravesde lasgeneraiones,lasfreueniasdelosalelosorrespondientes

alosindividuosdeuna poblaionvanambiandoomoresultadodel proeso

de seleion. Sin embargo, este ambio puede tambien ser un resultado de

mutaiones odel azar;a este fenomeno se lellama desvo genetio.

Unnihoeolologiosearaterizaporestaronstitudopororganismos

delamismaespeie,esdeir,individuossimilaresquesereproduenentresy

que ademas omparten la misma estrategia de supervivenia. Dos espeies

que oupan nihos diferentes pueden oexistir de una manera estable. Sin

embargo, dos espeies que oupan el mismo niho eologio ompiten hasta

que la mas debil terminapor extinguirse.

1.4.2. Coneptos de Computaion Evolutiva

Dadounproblemaaresolver,enComputaionEvolutiva(CE)un

romo-soma serepresentaon una estrutura de datos queodia losparametros

de una posible soluion adihoproblema.

Cada romosoma orresponde a un individuode la poblaion. Los

ro-mosomas usualmente son representados por adenas binarias (gura 1.8).

Dado que un gene es una subseion de un romosoma, odiara el valor

de un soloparametro(gura 1.9).

As pues, elgenotipo orresponde on laodiaion(digamos binaria)

(22)

1

0

1

0

1

0

1

0

Figura 1.9: Un gene esuna subadena del romosoma.

1

0

0 decodificación

genotipo

fenotipo

3

Figura1.10: El genotipo determinadiretamenteel fenotipo.

Losalelossonlosvaloresposiblesquepuedetomaradaposiiongenetia.

Por ejemplo, si la odiaion es binaria, un alelo puede valer 0 o 1

(gu-ra1.11).

La aptitudde un individuoes un valorquese le asignay que denota la

alidaddeesteonrespetoalosdemas.Porejemplo,elvalororrespondiente

de la funionobjetivo.

Se llamarageneraion ala reaionde una poblaionnueva apartir de

laexistente, previo alulo de aptitudes.

En elaso en el queun individuopuede reombinarse on ualquierotro

de la poblaion,esta reibeel nombre de poblaion panmtia.

Como ya se haba menionado antes, la epstasis se reere el impato

que puede tener un ierto gene sobre otro en una posiion distinta. Cuando

un sistema tiene poa epstasis (o ninguna) estrivial enontrar su soluion.

Sinembargo,en elaso ontrario,elproblema puederesultarbastantedifil

oinlusoimposiblede resolverparaun AE.Aestosproblemasseleshadado

1

0

1

alelo

(23)

1

1 1 1

1

1 1 1

1

0

0 Punto de cruza

Punto de cruza

Descendientes

Figura1.12: Cruza de un punto.

1

1 1 1

1

0

0 Descendientes

Puntos de cruza

0

1

0

1

0

1

0

Figura1.13: Cruza de 2 puntos.

el nombre de deeptivos.

Enuantoalaseleion, lasteniasusadasen losAlgoritmosGenetios,

porejemplo, pueden ser:

Probabilstias (de auerdo a la aptitud de ada individuo [26℄).

Ejemplos:laruleta[31℄,sobranteestoastio[5,6℄,universalestoastia

[4℄, muestreodeterminstio[31℄.

Mediantetorneo(omparaionesdiretasdelosindividuos).Setienen

dos versiones: determinstia y probabilstia[55, 6℄.

De estado uniforme. Se usa en AGs en los que solo unos uantos

(24)

1

1 Hijo 2

Hijo 1

Padre 2

Padre 1

Padre 2

Padre 1

0

1

Figura1.14: CruzaUniforme. Cada padre aporta un gene on una

probabil-idad dada (de 0.5 en este aso).

Los operadores de reproduion usados en CE son lasiados en tres

grupos:

Cruza.Forma un nuevo individuoombinandolos romosomasde los

padres.Ejemplos:

Cruza de n-puntos. Los padres interambian parte de su adena

romosomiapara generaruna nuevaalternandose basadosen los

puntos de ruza (guras1.12, 1.13).

Cruzauniforme.Lospadresaportanadaunodesusalelosonuna

probabilidaddadaparadarlugaraunanuevaadena(gura1.14).

Mutaion. Obtiene un nuevo romosoma alterando los genes del

ro-mosomapadre. Ejemplo:

Mutaion uniforme. Se va reorriendo laadena y on una ierta

probabilidad sealtera elgene en turno (gura1.15).

Reordenamiento.Cambiaelordendelosgenesdelromosomapadre.

Ejemplo:

Inversion. Los genes entre dos puntos elegidos al azar son

(25)

1

1 Cadena mutada

Cadena original

Mutar posición 6

1

0

1

0

1

0

1

0

Figura 1.15:La mutaion onsisteen alterarel valordel gene.

1

0

1

0 Cadena original:

Cadena resultante:

Puntos de inversión:

1

0

1

0

1

0

1

Figura1.16: Ejemplo de inversion.

Se ha onsiderado que los operadores de ruza ayudan a explotar el

espaio de busqueda; es deir, a atravesar el espaio de busqueda mediante

movimientos peque~nos en la direionque segun lainformaionobtenida de

losindividuosparezapromisoria.Porotraparte,losoperadoresdemutaion

olaboran a explorar el espaio de busqueda, es deir, a realizar saltos a

regiones no explotadas on el n de loalizar mejores regiones y a la vez

evitar quedar atrapados en optimos loales.

En onordania on la seleion natural de los mas aptos, en los AE

existe unmeanismoquepermitequelosindividuosonmejoraptitudpasen

intatosduranteelproesodegeneraiondeunanuevapoblaion;este

mean-ismo reibeelnombrede elitismo.Elelitismoaseguraquelamejorsoluion

enontrada hasta el momentono sea perdida aausa del proeso evolutivo.

En un aptulo posterior se demostrara que el elistimo es neesario para la

(26)

(27)

Elementos de Probabilidad

ElanalisisquesepresentaradelosAlgoritmosGenetiostieneomobase

la teora de la probabilidad, espeamente las adenas de Markov nitas,

porlo que en este aptulo se proporionanlos preliminares neesarios para

diho desarrollo.

2.1. Deniiones Basias

Elmaterial quese presenta en esta seion fue tomadode las referenias

[42, 7℄.

2.1.1. Espaios de Probabilidad

Deniion 2.1.1 Un onjunto A 6= , uyos elementos son subonjuntos

de un onjunto , es llamado una algebra si:

(i) A 2 A ) A

2 A, donde A

= A denota el omplemento del

onjunto A, y

(ii) S

1

n=1 A

n

2A para ada suesion (A

n )

n2IN A.

Por ejemplo,sea =fa;b;;dg y onsideremos:

A

1

=f;;fag;fb;;dgg

A

2 =A

1

[ffbg;fa;bg;f;dg;fa;;dggy

A

3

(28)

1 2 3

Deniion 2.1.2 El par (;A), en donde A es una algebra de

subon-juntosde , es llamadoun espaio medible.Una funion que asignaun

n umero (A) 2 [0;1℄ a ada subonjunto A 2 A, es llamada una medida

sobre (;A) si () = 0 y ([ 1

n=1 A

n ) =

P

1

n=1 (A

n

) para ada suesion

(A

i )

i2IN

de subonjuntosde A disjuntos por pares.La teria (;A;) es l

la-mada un espaio de medida.

Deniion 2.1.3 Sea(;A)unespaiomedibleyPunamedidasobre(;A)

on P() = 1. Entones P es llamada una medida de probabilidad, los

onjuntos A 2 A son llamados eventos, es el espaio muestral, el

n umero P(A) on A 2 A es llamado la probabilidad del evento A, y la

terna (;A;P) es llamado espaio de probabilidad. Si P(A) = 1 para

alg un evento A, entones se die que elevento ourre on probabilidad 1.

Dadoun experimentoen partiular, elonjuntode resultados posibles es

un espaiomuestral. Porejemplo, si tiramosdos dados tenemos que,

impor-tandoel orden:

= ff1;1g;f1;2g;f1;3g;f1;4g;f1;5g;f1;6g;

f2;1g;f2;2g;f2;3g;f2;4g;f2;5g;f2;6g;

f3;1g;f3;2g;f3;3g;f3;4g;f3;5g;f3;6g;

f4;1g;f4;2g;f4;3g;f4;4g;f4;5g;f4;6g;

f5;1g;f5;2g;f5;3g;f5;4g;f5;5g;f5;6g;

f6;1g;f6;2g;f6;3g;f6;4g;f6;5g;f6;6gg

Enesteaso podemosdeniruna algebra A de subonjuntos de omo

A=2

,esdeir,elonjuntopoteniade. Cadaunode losresultadostiene

la misma probabilidad: P(A) = 1

36

, para ada A 2 . Los eventos, es deir,

los elementos de A, onstan de uno o mas de los posibles resultados. Por

ejemplotenemos lossiguientes eventos y su probabilidad:

A

1

=ff1;1g;f6;4g;f4;5gg P(A

1 )=

1

12

A

2

=ff4;1gg P(A

2 )=

1

36

A

3

=ff2;2g;f6;3gg P(A

4 )=

1

18

A

4

= P(A

4 )=1

(29)

Deniion 2.1.4 Sean (;A) y ( 0

;A 0

) espaios medibles. La funion X :

!

0

esllamadaunafunionmediblesiX 1

(A 0

)2AparatodoA 0

2A 0

.

Deniion 2.1.5 Sea (;A;P) un espaio de probabilidad y ( 0

;A 0

) un

espaio medible. En este aso, una funion medible X : ! 0

es l

la-mada una variable aleatoria. La funion P

X : A

0

! [0;1℄ IR on

P

X (A

0

) := P(X 1

(A 0

)) para todo A 0

2 A 0

es llamada la distribuion de

probabilidad de X.

En otras palabras, se die que hemos denido una variable aleatoria

paraun experimentoaleatoriouandohemosasoiadounvalorgeneralmente

numerio a ada resultado del experimento. A ontinuaionse presentan

al-gunos ejemplos de variablesaleatorias:

Consideremoselexperimentoaleatorioqueonsisteen lanzartres

mon-edas. Supongamos que a ada elemento de su espaio muestral E =

f;x;x;x;xx;xx;xx;xxxgleasignamosunnumeroreal,que

es elorrespondienteal numerode aras.

Enelexperimentoaleatorioqueonsisteenlanzardosdados,asignamos

a ada resultado la suma de lospuntos apareidos en ada dado.

En el experimentoque onsiste en elegir al azar 500 personas y medir

su estatura, la funion que asoia a ada persona on su talla es una

variablealeatoria.

Consideremos elexperimentoqueonsisteen elegiralazar 100sandas

de una plantaiony pesarlas.La funion queasoia aada sanda on

su peso es una variable aleatoria.

Si una variable aleatoria solo toma valores enteros, ya sea, un numero

nitooinnitonumerabledevaloresdiremosqueesdisreta(losdosprimeros

ejemplos). Siteoriamente, puede tomartodos los valores de un intervalode

IR,diremosqueesontinua(losdosultimos ejemplos).Enelpresentetrabajo

(30)

un variable aleatoriadisreta on valores en el onjunto fx

1 ;x

2

;g. Si

X

i jg(x

i

)jPfX =x

i

g<1

entones

E[g(X)℄:= X

i g(x

i

)PfX =x

i g

sellamavaloresperadodelavariablealeatoriag(X).Siademas, P

i jg

2

(x

i

)jPfX =

x

i

g<1, entones

V [g(X)℄:=E[g(X) E[g(X)℄ 2

℄

D[g(X)℄:=V [g(X)℄ 1=2

son llamados la varianza y la desviaion estandar, respetivamente,

de g(X).

Lema 2.1.1 Sean X y Y dos variables aleatorias y a y b onstantes.

En-tones:

(a) E[a℄=a

(b) E[aX+b℄=aE[X℄+b

() E[X+Y℄=E[X℄+E[Y℄.

Demostraion [7℄.

Lema 2.1.2 Sea X una variablealeatoria:

V [X℄:=E[X 2

℄ E[X℄ 2

(31)

1

2

0

9

8

Figura 2.1: La rana puede brinar on igual probabilidad haia las hojas

adyaentesobienbrinarperoquedarseendondeestaatualmente.Suestado

dene una adena de Markov.

2.2. Cadenas de Markov Finitas

2.2.1. Deniiones Basias

El materialpresentado en esta seion fue tomadode lasreferenias [45,

29℄.

Deniion 2.2.1 Si S 6= es un onjunto nito y fX

t

: t 2 IN g es una

suesion de variables aleatorias on valores en S on la propiedad de que:

PfX

t+1

=jjX

t

=i;X

t 1 =i

t 1 ;:::;X

0 =i

0 g=

PfX

t+1

=jjX

t

=ig=:p

ij

para todo t 0 y para todo i;j 2 S, entones la suesion fX

t

: t 2 INg es

llamada una adena de Markov nita on espaio de estados S.

El n umero p

ij

se llama probabilidad de transiion del estado i al

estado j en un paso. Como estamos suponiendo que dihas probabilidades

son independientes de t2IN , deimos quela adena es homogenea.

Consideremos una rana que se enuentra parada sobre una hoja en un

haro. La hoja en la que esta parada forma parte de un rulo de 10

ho-jas numeradas del 0 al 9, y la rana se enuentra atualmente en la hoja 0

(32)

un brinodespues del ual tiene tres opiones igualmenteposibles: quedarse

donde esta o bien brinar haia una de las dos hojas adyaentes a su hoja

atual.

Sea R

t

lavariablealeatoriaquerepresentalaposiionde nuestrarana en

el tiempo t. Al iniio, nuestra rana esta en la posiion 0, es deir R

0 = 0.

Posteriormente, el valor de la variable se regira por las probabilidades de

transiiondenidas omo:

p ij = ( 1 3

si i=j o sii y j son adyaentes,

0 de loontrario.

Claramente, el valor de R

t

depende solo de R

t 1

. De esta manera, R

t

determinauna adenade Markov nita homogenea.

En elaso de nuestra rana:

S =f0;1;2;3;:::;9g

PuestoqueSesnito,lasprobabilidadesdetransiionpuedenserpuestas

en una matriz de transiion P = (p

ij )

i;j2S

. Notese que P

j p

ij

= 1 para

todoi2S.

LasprobabilidadesdetransiiondelavariableR

t

puedenseraomodadas

de la siguientemanera.

0 1 2 3 4 5 6 7 8 9

P = 0 1 2 3 4 5 6 7 8 9 0 B B B B B B B B B B B B B B B B B B 1 3 1 3

0 0 0 0 0 0 0 1 3 1 3 1 3 1 3

0 0 0 0 0 0 0

0 1 3 1 3 1 3

0 0 0 0 0 0

0 0 1 3 1 3 1 3

0 0 0 0 0

0 0 0 1 3 1 3 1 3

0 0 0 0

0 0 0 0 1 3 1 3 1 3

0 0 0

0 0 0 0 0 1 3 1 3 1 3 0 0

0 0 0 0 0 0 1 3 1 3 1 3 0

0 0 0 0 0 0 0 1 3 1 3 1 3 1 3

0 0 0 0 0 0 0 1 3 1 3 1 C C C C C C C C C C C C C C C C C C A

El vetor la Æ(t) on omponentes Æ

i

(t) = PfX

t

= ig para todo i 2

S, denota la distribuion de la adena de Markov en el paso t 0. Esta

(33)

Æ(t)=Æ(t 1)P =Æ(0)P , para todo t0.

Por ejemplo,en elproeso de nuestra rana:

Æ(0)=f1;0;0;0;0;0;0;0;0;0g

Æ

0

(0)=1

De maneraque:

Æ(1) =Æ(0)P =f 1

3 ;

1

3

;0;0;0;0;0;0;0; 1

3 g

Æ(2)=Æ(1)P =Æ(0)P 2

=f 1

3 ;

2

9 ;

1

9

;0;0;0;0;0; 1

9 ;

2

9 g

As pues, una adena de Markov nita homogenea esta ompletamente

de-terminada porsu distribuioniniial Æ(0) y sumatriz de transiionP.

Deniion 2.2.2

Una matriz P : nm es llamada no negativa (P 0) si p

ij

0 y

positiva (P >0) sip

ij

>0 para todo i=1;:::;n y j =1;:::;m.

Una matriz uadrada no negativa es llamada estoastia si la suma

de ada una de sus las es igual a 1. As, las matries de transiion

son estoastias.

Una matriz estoastia P es primitivasi

9k2IN :P k

es positiva (P k

>0)

Es irreduiblesi

8i;j 2S :9k 2IN:p

ij

(k)>0,

en donde p

ij

(k) denota al elemento (i;j) de P k

. Por lo tanto, toda

matriz positiva P es primitiva y toda matriz primitivaes irreduible.

Una matriz P es reduible (por supuesto si no es irreduible y) si

puede ser aomodada en la forma:

C 0

R T

!

(34)

mentoensudiagonales positivo, esolumna-permisiblesial menos

un elemento en ada olumna es positivo y es estable si tiene las

identias.

A ontinuaionse presentan algunos resultados que serande utilidad en

aptulos posteriores.

Lema 2.2.1 Sean P, Q y R matries estoastias, donde Q es positiva y R

es olumna-permisible. Entones la matriz produto PQR es positiva.

Demostraion [29℄.

Lema 2.2.2 Sean P, Q y R matries estoastias,donde Q es irreduible y

P, R son diagonal positivas. Entones el produto PQR es irreduible.

Demostraion [29℄.

Teorema 2.2.1 Sea P una matriz estoastia primitiva. Entones P k

on-verge uando k ! 1 a una matriz estoastia positiva estable P 1 = 1 0 p 1 , donde1 0

es un vetor olumna de unos y p 1

=p 0

lm

k!1 P k =p 0 P 1 tiene

entradas positivas y es unia independientemente de la distribuion iniial

p 0

.

Demostraion [29℄.

Teorema 2.2.2 SeaP

nn

unamatriz estoastiareduible,dondeC :mm

es una matriz estoastia primitiva y R , T 6=0. Entones:

P 1

= lm

k!1 P

k

= lm

k!1 C k 0 P k 1 i=0 T i R C k i T k ! = C 1 0 R 1 0 !

es una matriz estoastia estable on P 1

= 1 0

p 1

, donde 1 0

es un vetor

olumna de unos y p 1

=p 0

P 1

es unia independientemente de la

distribu-ion iniial y, ademas, p 1

satisfae: p 1

i

>0 para 1i m y p 1

i

=0 para

m<in.

(35)

Considerese una adenade Markov on espaiode estadosnito S 6=.

En esta seion se lasiaran los estados de una adena de Markov de

auerdoasiesposibleirdeundeterminadoestadoaotroestadodeterminado

[32℄.

Deniion 2.2.3 Deimosqueelestadoiinduealestadoj ylodenotamos

por i!j siy solo sip k

ij

>0para alg un k 1. Si tenemos quei!j y j !i

deimos queel estado i esta omuniado on elestado j (o quelos estados

i, j son omuniantes) y lo denotamos por i$j.

A partir de ladeniionanterior, los estados son divididos en \lases de

equivalenia". Dos estados estan en la misma lase de equivalenia si estan

\omuniados",esdeir,sielproesopuedeirdeunestadoaotroyvieversa.

Las lases de equivalenia son lasiadas omo onjuntos ergodios

(tambien llamadosreurrentes)o onjuntos transitorios.De esta manera

los estados perteneientes a ellas seran llamados estados ergodios y

transi-torios, respetivamente.

Para ada adena de Markov nita debe existir siempre al menos un

onjuntoergodio;sinembargo,losonjuntos transitoriosnoneesariamente

existen.

Una vez que una adena abandona un onjunto transitorio nuna

regre-sara a el, mientras que una vez que entra en un onjunto ergodio nuna

podraabandonarlo.

Enpartiular,siunonjuntoergodioontienesolounestado,estereibe

el nombre de estado absorbente pues una vez estando en el, la adena de

Markov se quedara allpor siempre.De lo anteriortenemos elsiguiente:

Teorema 2.2.3 Un estado i es absorbente si y solo sip

ii =1.

Demostraion[32℄.

Losonjuntos ergodios pueden ser lasiados de dos maneras:

1. Regular:Enesteaso,elonjuntoonstade unilounio de estados,

por lo que no importa ual sea el estado en el que la adena iniie,

despuesde untiemposuientementegrandelaadenapodraestar en

(36)

ilos distintos de manera que dado un estado de iniio determinado,

laadena ira reorriendo losdiferentes ilos hasta regresar al ilo en

elque iniio despues de exatamente d pasos.

Las adenas de Markov pueden lasiarse segun siestas ontienen o no

onjuntos transitorios:

I Cadenas sin Conjuntos Transitorios

Sinperdidade generalidadsupondremosqueenesteasoexiste soloun

onjunto ergodio, es deir, todo el onjunto de estados de la adena

esun onjunto ergodio. Unaadena queonsiste de un unio

onjun-to ergodio es llamada una adena ergodia, y puede oinidir on

algunosde los siguientes dos asos:

I-A El onjunto ergodio es regular.

I-B El onjunto ergodio es lio.

II Cadenas on Conjuntos Transitorios

Enesteaso,laadenasemuevehaialosonjuntosergodios.La

prob-abilidadde queelproeso seenuentre dentro de unonjuntoergodio

tiende a 1. En este aso nuevamente podemos lasiar este tipo de

adenas on base en lasaraterstias de sus onjuntos ergodios.

II-A Todoslosonjuntosergodiossononjuntosunitarios.Estetipode

adenassonllamadasadenasabsorbentes,pueseventualmente

quedaran atrapadas en un estadoabsorbente.

II-B Todos losonjuntos ergodios son regulares, pero nounitarios.

II-C Todos losonjuntos ergodios son lios.

II-D Existen tanto onjuntos ergodios regulares omo lios.

2.2.3. Cadenas Absorbentes

Son de nuestro espeial interes en este trabajo las adenas absorbentes,

por lo que en esta seion se presentaran algunas propiedades importantes

(37)

porta elestado enelqueelproeso iniie,la probabilidad dequeel proeso se

enuentre en un estado absorbente despues de n pasos tiende a 1 onforme

n tiende a innito.

Demostraion[32℄.

Es importante onsiderar la forma anonia de la matriz de transiion de

una adena de Markov. Supongamos que tenemos s estados transitorios y

r s estadosergodios yque reunimosa todos losonjuntos transitorios ya

todos losonjuntos ergodios,la formaes lasiguiente:

r s s

P =

S O

R Q !

gr s

gs

LaregionO onsisteompletamentede eros.Lamatriz Q

ss

representa

a la adena mientras esta se enuentre en estados transitorios, la matriz

R

s(r s)

representa la transiionde estados transitorios a estados ergodios

y la matriz S

(r s)(r s)

representa la adena una vez que ha alanzado un

estado ergodio.

Sionsideramos una adenaabsorbente, tenemos que por deniion S =

I

(r s)(r s)

, assu formaanonia es:

r s s

P =

I O

R Q !

gr s

gs

Por elTeorema 2.2.2 podemosverque las poteniasde Qtienden aO.

Teorema 2.2.5 Para ualquier adena de Markov absorbente, I Q tiene

una inversa y,

(I Q) 1

=I+Q+Q 2

+= 1

X

k=0 Q

k

Demostraion[32℄.

Deniion 2.2.4 Para una adenade Markov absorbente denimosla

ma-triz fundamental omo N =(I Q) 1

(38)

j

total de vees que el proeso esta en el estado s

j

. (Esta deniion solo es

valida para estados transitorios s

j

). Denimos a u k

j

omo una funion que

toma el valorde 1 siel proeso esta en el estado s

j

en el paso k, y 0 de otra

manera.

Es failver que:

n j = 1 X k=0 u k j

Sea T el onjunto de estados transitorios de la adena de Markov, si

denotamos on E

i [n

j

℄ al valor esperado de n

j

suponiendo que el proeso

iniiaen elestado s

i

, tenemos elsiguiente:

Teorema 2.2.6 fE

i [n

j

℄g=N

Demostraion [32℄.

Deniion 2.2.6 Sea t una funion uyo valor esta dado por el n umero de

pasos (inluyendo la posiionoriginal) en los que elproeso se enuentra en

un estado transitorio.

Si el proeso iniia en un estado ergodio entones t = 0. Si el proeso

iniia en un estado transitorio, entones t nos da el numero total de pasos

neesarios para alanzarun estadoergodio. Enuna adenaabsorbente este

esel tiempo de absorion.

Sea un vetor olumnauyas entradas son todas 1.

Teorema 2.2.7 fE

i

[t℄g=N

Demostraion Esfailverque

t= X

sj2T n

j

As,

fE

i

[t℄g=fE

i [ X sj2T n j ℄g=f

X sj2T E i [n j

℄g=N:

Teorema 2.2.8 fV

i

[t℄g=(2N I)N (N) 2

(39)

Algoritmo Genetio Simple

Los Algoritmos Genetios se usan a menudo para resolver problemas de

optimizaiondel tipo:maxff(b)jb 2IB l

=f0;1g l

g(elonjuntoIB l

ontienea

todaslasadenasdeerosyunosdelongitudl)suponiendoque0<f(b)<1

para todob2IB l

y f(b)6=onst.

Enesteaptulo iniiamosnuestro estudiodelaonvergeniade losAGs.

Consideraremos prinipalmentedosasos, elAGsinelitismo,tambien

ono-ido omo AG Simple(AGS) y el AG on elitismo(AGE).

3.1. Estudios de Convergenia

3.1.1. Algoritmo Genetio sin Elitismo

En [41℄ Rudolph modela el Algoritmo Genetio Simple (AGS) mediante

una adenade Markov nita homogenea.

CadaestadoidelaadenadeMarkovorrespondeaunaposiblepoblaion

del AGS de tal manera que el espaio de estados es S = IB nl

donde n es el

numero de individuos de la poblaion y l es la longitud de ada individuo.

Denimos a t

k

(i) omo elindividuo k de lapoblaioni en el paso t.

Dadala naturaleza del AGS, lamatriz de transiionP quelo representa

queda denida omo

P=CMS;

donde C, M y S son las matriesde transiion de los operadores de ruza,

(40)

m

ij =p

H

ij

m

(1 p

m )

N H

ij

>0;

en donde p

m

es la probabilidadde mutaiondel AGS, H

ij

esla distaniade

Hammingentre los estados i y j, y N =nl (la distaniade Hamming entre

dos adenas binariassedene omo elnumerode posiiones en lasquetales

adenas son distintas). De lo anterioronlumos que M es positiva.

Por otra parte, dado que el operador de seleion lo que hae es

propor-ionarnospares de individuoson nesde queyasea que pasenintatos ala

poblaion siguiente o que on una ierta probabilidad mediante el operador

de ruza puedan dar lugar a otros dos individuosnuevos,la matriz de

tran-siionde este operadorloque hae esdejar\ordenados" alos individuostal

y omo seirantomando para dar lugar ala poblaionsiguiente.

Elusodeunoperadordeseleionproporionalodetorneo[45℄determina

laexistenia de una probabilidadestritamentepositivade quela poblaion

quedeintata,loualaseguraqueloselementosdeladiagonals

ii

delamatriz

detransiiondel operadorsonpositivos,porloqueseonluyequelamatriz

S es olumna-permisible.

EnresumentenemosquelamatrizMespositivaySesolumna-permisible.

Luego,porelLema2.2.1,lamatrizP=CMSespositivaypor lotanto

prim-itiva.

Para poder hablar de onvergenia a ontinuaion se presenta la deniion

orrespondiente para elAGS[41℄:

Deniion 3.1.1 SeaZ

t

=maxff( t

k

(i))jk =1;:::;ng unasuesionde

vari-ablesaleatoriasquedenotanla mejoraptitud dentrodela poblaion

represen-tada por el estado i en el paso t. Un algoritmo genetio onverge al optimo

global si y solo si:

lim

t!1 PfZ

t =f

g=1 (3.1.1)

donde f

=maxff(b)jb 2IB l

g.

DeestamaneraentenderemosqueelAGSonverge aloptimoglobalde la

funion objetivo si la probabilidad de que este se enuentre en la poblaion

(41)

demuestra que elAGSno onverge:

Teorema 3.1.1 El AGS on matriz de transiion primitiva no onverge al

optimo global.

Demostraion Sea i 2 S ualquier estado en el que maxff( t

k

(i))jk =

1;:::;ng<f

y p

i

(t)laprobabilidad de queelAGSesteen talestado ien el

paso t. Claramente, PfZ

t 6=f

g p

i

(t) , PfZ

t =f

g 1 p

i

(t). Por el

Teorema 2.2.1 la probabilidad de que el AGS este en el estado i onverge a

p

i

(1)>0. Por lotanto:

lim

t!1 PfZ

t =f

g1 p

i

(1)<1;

es deir, laondiion(3.1.2) nose satisfae.

El Teorema 3.1.1 muestra que dado que segun el Teorema 2.2.1 la matriz

de transiionP del AGS onverge a una matriz positiva,la probabilidad de

estar en un estado no-optimo es estritamente positiva onforme el numero

de iteraiones seinrementaporloque laprobabilidadde permaneer en un

estado optimo noes 1en ellmite.

3.1.2. Algoritmo Genetio Elitista

En [41℄ Rudolph argumenta que en las apliaiones del mundo real el

AGSomunmentemantiene atraves del proeso evolutivo la mejorsoluion

enontrada hasta el momento por lo que lo orreto es modelar el AGS de

tal manera.

Aspues, onsideraremos ahora agregarala poblaiondel AGSun s uper

individuoque notomaraparteen elproeso evolutivoy queporfailidad en

la notaion sera oloado en la primera posiiona la izquierda, es deir, se

podraaesaraelmediante

0

(i).LlamaremosaestanuevaversionAlgoritmo

Genetio Elitista (AGE).

La ardinalidad del espaio de estados de la adena de Markov

orre-spondiente ree ahora de 2 nl

a 2 (n+1)l

debido a que tenemos 2 l

posibles

s uper individuosy porada uno de ellos tenemos 2 nl

poblaiones posibles.

El operador de elitismo estara representado por la matriz E que lo que

haraseraatualizarunestadodetalmaneraquesiesteontieneun individuo

(42)

i=( 0 (i); 1 (i); 2 (i);:::; n

(i)) 2S

0

(i) es el super individuo de la poblaion (estado) i. Ahora bien, sea

b =argmaxff(

k

(i))jk = 1;:::;ng 2 IB l

el mejor individuo de la poblaioni

exluyendo els uper individuoy:

j def = (b; 1 (i); 2 (i);:::; n

(i))2S

entones:

e

ij =

(

1 si f(

0

(i))<f(b)

0 de otra manera.

La nueva matriz de transiion para el AGE resulta del produto de una

matrizqueestaompuestapor2 l

matriesP,unaporada posibles uper

in-dividuo aomodadas de manera que entre mejor sea susuper individuo mas

altasera suposiion, y la matriz E del operador de elitismo:

P + = 0 B B B B P P . . . P 1 C C C C A 0 B B B B E 11 E 21 E 22 . . . . . . . . . E 2 l ;1 E 2 l ;2 E 2 l ;2 l 1 C C C C A = 0 B B B B PE 11 PE 21 PE 22 . . . . . . . . . PE 2 l ;1 PE 2 l ;2 PE 2 l ;2 l 1 C C C C A

La estrutura mostrada de la matriz P +

se debe a que, omo ya se

men-iono, laspoblaiones estan ordenadas de maneradesendente de auerdo a

laalidadde susuperindividuo.De talmaneralosespaiosenblano

repre-sentan erospuesto quenoesposible pasarde unestadoaotro onun super

individuode menoralidad.

De lo anterior se onluye que PE

11

=P puesto que tales matries

or-responden on las poblaiones que tienen omo super individuo al optimo

f

(43)

R= 0 B B PE 21 . . . PE 2 l ;1 1 C C A T= 0 B B PE 22 . . . . . . PE 2 l ;2 PE 2 l ;2 l 1 C C A

onluimos que lamatriz P +

es reduible a laforma:

P + = P 0 R T ! :

Comoonlusiontenemos elsiguienteteorema:

Teorema 3.1.2 El AGE onverge al optimo global.

DemostraionLasubmatrizPontienelasprobabilidadesde transiionde

estados optimos globales. Puesto que P es una matriz estoastia primitiva

y R, T 6= 0, el Teorema 2.2.2 garantiza que la probabilidad de permaneer

en un estadono-optimoonverge aero.Porlotantolaprobabilidadde

per-maneer en un estado optimo globalonverge a 1.

As pues, se ha demostrado la onvergenia del AGE, es deir, de un

Al-goritmo Genetio que usa elitismo.

3.2. Condiiones Mnimas de Convergenia

Posterior al trabajo de Rudolph, Alexandru Agapie [1℄realizo un par de

modiaionesalasondiionesimpuestasenelmodelodelAGSdesarrollado

en laseion anterior.

Alexandru hae notar que la ondiionde que lamatriz del operador de

mutaion(M) sea positivaes demasiado fuerte y que, de heho, esun tanto

inadeuadaparalosAGsomunes.Porejemplo,supongamosquesetieneuna

poblaionde tama~no20 on individuos de longitud20 y p

m

= 0.1. Entones

la probabilidad de pasar del estado i = (111:::1) al estado j = (000:::0)

es aproximadamente m

ij 10

400

. Como podemos ver, tal probabilidad de

transiiones tan peque~na quepodra ser onsiderada omo ero.

Portalrazon,en estetrabajosedemuestraqueaunquelamatrizde

(44)

reordamos,era arbitraria.

Laprinipalidea del trabajo de Agapie esla siguiente: el permitir

muta-ionesdeun solobitessuienteparahaerqueelAGEonverjapuestoque

mutaiones de varios bits pueden ser llevadas a abo\por partes" mediante

mutaiones de un solo bit a la vez. De esta manera, la ondiion de que la

matrizM sea positiva puedeser relajadaa quela matrizM sea irreduible.

Demanerageneral,supongamosqueun AGE tieneuna matrizde

transi-ion del operador de mutaiontalque solopermite mutar omo maximoun

numerojo de bits, digamos T,menor que lalongituddel romosoma.

Denotemos on H

ij

ladistania de Hamming entre laspoblaionesi y j.

Lo que queremos demostrar ahora es que la matriz de mutaion desrita es

irreduible.

Lema 3.2.1 Sean T, 1 T 2 nl

, un entero y M la matriz estoastia

orrespondiente al operador de mutaion de un AG que satisfae: m

ij

=0 si

H

ij

>T y m

ij

>0 de otra manera. Entones M es irreduible.

Demostraionm

ij

>0paraadapar (i;j)talqueH

ij

1.Ahora, seaniy

j dos poblaiones on H

ij

=k, 1 k 2 nl

. Es laro que puede enontrarse

una adena(i;i

1 ;i

2 ;:::;i

k 1

;j) talque H

i;i

1 =H

i

1 ;i

2

=;:::;=H

i

k 1 ;j

=1y

m

i;i1 m

i1;i2 :::m

i

k 1 ;j

=m

ij

>0.As, M es irreduible.

Si reordamos, en la seion anterior se meniono que la matriz de

tran-siionde un operador de seleion proporional esolumna-permisible,pero

de hehose onluyo que esdiagonalpositiva.Por otra parte, eluso de una

probabilidadde ruzap

<1daalamatrizde transiionlapropiedadde ser

tambien diagonal positiva[1℄.

En resumen, tenemos en este aso que la matriz M es irreduible y las

matries C y S son olumna-permisibles; por tanto por el Lema 2.2.3 la

matriz P=CMS es nuevamente irreduible. As pues, todos los resultados

de la seion anterior siguen siendo validos (reordemos que en la seion

(45)

Tiempo de Convergenia

ElproblemadearaterizarelomportamientodelosAGenvarios

domin-iosesomplejopuestoquevaraonlaapliaionasomoonlosparametros

de implementaion.

Eneste aptulosemostraraeltrabajobasadoenadenas deMarkovque

se llevoa abopara estimarel tiempo de onvergenia de un AG.

4.1. Anteedentes

Comoanteedentesaestetrabajo,aontinuaionsepresentanlosmodelos

desarrollados por Carol A. Ankenbrandt [2℄ y Sushil J. Louis & Gregory J.

E. Rawlins [35℄.

4.1.1. Modelo Basado en Convergenia de Alelos

En [2℄, Carol A. Ankenbrandt obtieneuna ota para el tiempode

ejeu-ionneesario para laonvergenia del AG medianteuna senillaprueba de

induionmatematia.

Aunque en el trabajo de Ankenbrandt se obtienen resultados para

al-goritmos binarios y no binarios, nos limitaremos a presentar los resultados

orrespondientes a los binarios. Sin embargo, abe menionar que los

resul-tados para los algoritmos no binarios son analogos y representan el mismo

grado de diultad.

En este trabajo se analiza la onvergenia en funion de los valores que

(46)

soloeltiempoque le tomaa un alelo onverger.

Sea t el tiempo y P

i

la proporion de alelos que han tomado el valor 1

en el tiempo t = i en una posiion partiular j. Sea f

1

la aptitud de todos

losindividuosque han tomadoel valor1en laposiionj y sea f

0

laaptitud

de todos los organismos que han tomado el valor 0 en esa misma posiion.

Sea r =f

1 =f

0

la razon de aptitud y asumamos que se mantiene onstante a

traves del tiempo.

De lo anterior,se tiene lasiguienterelaionde reurrenia:

P t+1 = f 1 P t f 1 P t

+(1 P

t )f 0 = rP t

1+(r 1)P

t

A partir de la formula anterior se pueden obtener los terminos P

1 , P

2 y P

3

en terminosde P

0

(omitiendo lasoperaiones intermedias):

P

1 =

rP

0

1+(r 1)P

0 P 2 = r 2 P 0 1 P 0 +r 2 P 0 P 3 = r 3 P 0 1 P 0 +r 3 P 0

De loanterior se intuye laformulageneral:

P t = r t P 0 1 P 0 +r t P 0

laual serademostrada por induion:

1. Elaso base eslaramentevalido (P

1 ).

2. Elsiguientepaso es demostrar:

P t = r t P 0 1 P 0 +r t P 0 )P t+1 = r t+1 P 0 1 P 0 +r t+1 P 0

3. Demostraion:

Relaionde reurrenia:

P

t+1 =

rP

t

1+(r 1)P

(47)

t P t+1 = r h r t P0 1 P 0 +r t P 0 i

1+(r 1) h r t P0 1 P 0 +r t P 0 i P t+1 = r (t+1) P 0 (1 P 0 )+r

t

P

0

+(r 1)(r t P 0 ) P t+1 = r (t+1) P 0 (1 P 0

)+(1+r 1)r t P 0 P t+1 = r (t+1) P 0 (1 P 0 )+r

t+1

P

0

De esta manera ha sido demostrado que la proporion de alelos que han

tomado el valor de 1 en el tiempo t en una posiion partiular j puede ser

alulada on laformula:

P t = r t P 0 1 P 0 +r t P 0 Sea t

eltiemponeesario paraqueelsistemaonverjayP

f

elvalorde P

t en

tal instante. Tenemosentones:

P f = r t P 0 1 P 0 +r t P 0 Despejando t

(se omitenlas operaiones):

t = ln h P f (1 P 0 ) P 0 (1 P f ) i lnr

As pues, asumiendo que el tama~no de la poblaion es m proederemos a

obtener elvalorde t

en elpeor aso y en elaso promedio. Enambosasos

se asume una onvergenia on tolerania de tal maneraque P

f

(48)

orreto por loque en este aso: P

0

=1=m. Por lo quese obtiene:

t

=

ln((m 1) 2

)

lnr

2. Enel aso promedio setiene que P

0

=0.5. Porlo tanto:

t

=

ln(m 1)

lnr

Enestetrabajonalmentesealaraqueparaobtenerunaotamasrealen

unaiertaapliaionesneesariomultipliarelordende losvaloresobtenidos

anteriormente por el orden orrespondiente del proeso de evaluaion segun

sea el aso.

4.1.2. Modelo Basado en Distanias de Hamming

Dadoquelaseleionnaturalusaladiversidadenunapoblaionparadar

lugar a la adaptaion, en [35℄ Louis & Rawlins argumentan que ignorando

los efetos de la mutaion, si no existe diversidad no hay nada en lo que la

seleionnatural puedatrabajar, porlo que usan una medida de diversidad

para estimarel tiempo de onvergenia neesario.

Aspues,segun[35℄,unAGonvergeuandotodalapoblaionesidentia

ouando la diversidad esmnima. Usando un promedio de las distanias de

Hamming entre todos los miembros de una poblaion omo una medida de

diversidad, los autores derivan una ota superior para el tiempo neesario

para llegar aun estado de diversidadmnima en el ual el AG posiblemente

no pueda ya progresar de manera signiativa. Sin embargo, el analisis que

se va a presentar no predie de ninguna manera la alidad de la soluion a

laque seha onvergido.

Elmodeloasume un AG on seleionproporional,ruza de n-puntos y

sinmutaion.Seal lalongitudde losindividuosdelapoblaion.Elpromedio

dedistaniasdeHammingenlapoblaioniniialsepuedeaproximarbastante

bien on un distribuionnormalon mediah

0 :

h

0 =l=2

y desviaionestandar s

0 :

s

0 =

p

(49)

distanias de Hamming de una poblaion que ya onvergio es ero. Por lo

tanto seproedera aanalizar losefetos de laseleion y laruza.

Respeto alos efetos ausados porla ruza,se tiene losiguiente:

Lema 4.1.1 Los operadores de ruza tradiionales, omo la ruza de

n-puntos,noambianelpromediodelasdistaniasdeHammingdeunapoblaion

dada.

Demostraion Se probara que el promedio de las distanias de Hamming

en la generaion t+1 es el mismo que en la generaion t bajo el efeto de

la ruza. Asumiendo un alfabeto binario, podemos expresar el promedio de

distanias de Hammingde la poblaion en la generaion t omo lasuma de

lospromediospara adaunode losl genes.Sea h

i;t

elpromediode Hamming

del gene i:

h

t =

l

X

i=1 h

i;t

Entones el promedio de Hamming en la siguiente generaiones:

h

t+1 =

l

X

i=1 h

i;t+1

En la ausenia de seleion y mutaion, la ruza solo ambia el orden en el

ual se suman lasontribuiones de ada gene. Esto es:

h

i;t =h

i;t+1

Porlo tanto:

h

t =h

t+1

HabiendovistoquelaruzanoafetaelpromediodeHammingse

proed-eraaanalizarelefeto de laseleion.La seleioneslaparte de un AGque

depende del dominioen uestion. Obtener una ota superior para el tiempo

de onvergenia es asumir el peor aso y estimarlo, por lo que se usara la

funion:

f(x)=onstante

esta funion no ontiene ningun tipo de informaion util para un

(50)

onvergera graiasal desvogenetio [35℄.

As pues, una expresionpara eltiempo de onvergenia en este aso nos

dauna ota superior para el AG en ualquier funionestatia.

Siunapoblaiondetama~noN ontieneunaproporionp

i

delalelobinario

i, entones la probabilidad de que se produzan k opias del alelo i en la

siguientegeneraiones:

N

k !

p k

i (1 p

i )

N k

Usando esta distribuionsetiene que alularlaprobabilidadde queourra

una ierta freuenia del alelo i en las generaiones siguientes. Sea f(p;t) la

probabilidaddeque elalelotengauna freuenia pen lageneraiont, donde

0<p<1, entones[12℄:

f(p;t)= 6p

0 (1 p

0 )

N

1 2

N

t

dondep

0

eslafreueniadel aleloien t=0.Lafunionanteriorespeiala

probabilidaddequeunalelonohayaonvergido,porloquelaprobabilidadde

queelvalordel alelo este jo,esdeir, quehayaonvergidoen la generaion

t es:

P(t)=1 f(p;t)

Apliando esto a un AG y asumiendo que los alelos onvergen de manera

independiente, la probabilidad de que todos los alelos hayan onvergido en

lageneraiont es:

P(t)= "

1 6p

0 (1 p

0 )

N

1 2

N

t #

l

Aspues, laeuaionanteriornos daeltiempode onvergenia del AGpara

ualquier funion estatia. Sin embargo, predeir el omportamiento en el

aso de una funion arbitraria es mas difil debido a las propiedades no

linealesque introdue laseleion.

Demanerageneraly asumiendoquelasimilaridaden lasadenas implia

similaridaden losvaloresde aptitud,podemosplantearlasiguienteeuaion

para elambioen elpromedio de Hammingpor generaion:

h

t+1

=f(h

(51)

t h t+1 =ah t b

2. En la ausenia de mutaion el promedio de Hamming nal es ero, lo

ual implia que b=0.

Lo anterior nos da larelaion:

h

t+1 =ah

t

Resolviendo porreurrenia obtenemos la soluiongeneral:

h

t =

(

l=2 t =0

a t

h

0

t >0

De esta manera,en ualquierapliaionespea esposibleestimar elvalor

de a midiendoel promedio de Hammingduranteuna orrida del AG.

4.2. Modelo Basado en Cadenas de Markov

EnelCaptulo2sepresentaronalgunosresultadosaeradelamatriz

fun-damentalorrespondientealamatrizdetransiiondeunaadenadeMarkov.

Como vimos, talmatrizpuedeusarse para alularlostiemposesperados de

onvergenia de laadena. Eneste aptulo apliaremostales resultadosa la

orrespondientematriz de transiiondel AGE.

Rudolph[41℄ mostroque lamatriz del AGEtiene la forma:

P + = P 0 R T !

dondeP es lamatriz de transiiondel AGS y:

R= 0 B B PE 21 . . . PE 2 l ;1 1 C C A T= 0 B B PE 22 . . . . . . PE 2 l ;2 PE 2 l ;2 l 1 C C A dondeE ij

son los orrespondientes bloques de la matriz de elitismoE.

Puesto que en el modelo de Rudolph la matriz P orresponde on las

(52)

ualquierambioen lapoblaionpuede ignorarsepues el superindividuono

semodiara.As pues, podemos reesribir lamatriz omo:

P + = I 0 R T !

Podemosverlaramenteahoraquela adenade Markovorrespondiente

alAGEesabsorbente.DeauerdoalaDeniion2.2.4,lamatrizfundamental

quenos interesa en este aso es:

N=(I T) 1

4.2.1. Estudio de la Matriz del AGE (P +

)

Puesto que nuestro objetivo es onoer la matriz fundamental N, en

primerlugar proederemos a estudiarla estruturade lamatriz bloque T.

Comoreordaremos,unavezteniendo lamatrizPseproedioaonstruir

lamatriz P +

de la siguiente manera:

P + = 0 B B B B P P . . . P 1 C C C C A 0 B B B B E 11 E 21 E 22 . . . . . . . . . E 2 l ;1 E 2 l ;2 E 2 l ;2 l 1 C C C C A = 0 B B B B PE 11 PE 21 PE 22 . . . . . . . . . PE 2 l ;1 PE 2 l ;2 PE 2 l ;2 l 1 C C C C A Matriz P

En esta seion estudiaremos los elementos de la matriz P. Como

sabe-mos, dihamatriz esresultado del produto:

P=CMS

por loque a ontinuaionse espeiaranlos elementos de las matries

(53)

0

1

0

1

0

1 Padre 1

Padre 2

0

1 Hijo

(

)

1 )

(

1)

= 0

( 0

0.5)

(

Probabilidad=

= 0.5 (0 x 0 + 1 x 0) 0.5 (1 x 0 + 1 x 0)

= 0.5 (1+0) 0.5(0+0) 0.5(1+1) 0.5(1+1)

= 0.5 (1) 0.5(0) 0.5(2) 0.5(2)

= (0.5) ( 0 ) ( 1 ) ( 1) = 0

0.5 (0 x 0 + 0 x 0) 0.5 (1 x 1 + 1 x 1)

Figura 4.1: Ejemplo del alulo de la probabilidad de ruza uniforme. El

smbolo serepresento on laletra x.

Elementos de la Matriz de Cruza

Se modelaronloselementos de 2tiposde ruza: uniformey de un punto.

Para ellose deniola siguiente operaion:

0 1

0 1 0

1 0 1

Laoperaionnoesmasquelanegaiondelo exlusivo,yseapliara

en-tre losbitsorrespondientes auna posiionjadeun padreyun posiblehijo.

Demaneraquesilosbitssoniguales,elresultadoes1yes0enasoontrario.

I Cruza uniforme:

Cuando se lleva a abo la ruza uniforme (suponiendo un porentaje

de ruza de 0.5)ada bitde unnuevohijotiene 0.5 de probabilidadde

ser igualal orrespondiente bitde ada uno de losdos padres.Usando