• No se han encontrado resultados

Confecci´on de la muestra de entrenamiento utilizando simulacio-

3.2. El algoritmo MeSsI ( Merging Systems Identification )

3.2.1. Confecci´on de la muestra de entrenamiento utilizando simulacio-

ciones cosmol´ogicas.

Como se especifico en la secci´on 2el primer paso a la hora de trabajar con algorit- mos de aprendizaje autom´atico supervisado es construir una muestra de entrenamiento representativa de los objetos que luego se clasificar´an. En nuestro caso, el objetivo final es clasificar un c´umulo de galaxias utilizando datos fotom´etricos (magnitudes y colores), astrom´etricos (posiciones angulares) y espectrosc´opicos (redshift).

3.2. El algoritmoMeSsI(Merging Systems Identification). 73

cosmol´ogicaMillenium[88] y del modelo semi-anal´ıtico deGuo et al.[42].

La simulaci´on Millenium[88] utiliza21603 part´ıculas que evolucionan en un cubo de

500 MPc de lado, lo que resulta en que cada part´ıcula tiene una masa de mp = 8.61∗

108M. Las condiciones iniciales fueron generadas utilizando el c´odigo CMBFAST [82]

para computar un espectro de potencias lineal con un modelo ΛCDM con par´ametros cosmol´ogicos consistentes con los datos de WMAP 2003 (Ωb,0 = 0.045; Ωm,0 = 0.25;

ΩΛ,0 = 0.75;H0 = 73) [86].

Los datos de la simulaci´on est´an organizados en diferentes salidas (snapshots) que representan la evoluci´on temporal de las part´ıculas, siendo elsnapshot0, el comienzo de la simulaci´on y elsnapshot63el tiempo actual (z = 0).

Con el objetivo de identificar conjuntos de part´ıculas de materia oscura gravitacional- mente ligadas (halos de materia oscura) utilizaron el algoritmoFriends-of-Friends (FOF)

[45]. Dicho algoritmo construye los halos de materia oscura presentes en un dadosnaps- hotagrupando part´ıculas seg´un un criterio de proximidad espacial. Luego, aplicando una adaptaci´on del algoritmoSUBFIND[35], identificaron los subhalos que est´an en el interior de otros halos. Una vez que identificaron todos los halos y subhalos, se pueden calcular diferentes propiedades f´ısicas como ser el momento angular, la dispersi´on de velocidades, las masas y radios viriales, etc.

Teniendo en cuenta que en un universoΛCDM la formaci´on de estructuras se produce de manera jer´arquica, es decir que primero se forman las estructuras m´as chicas y luego, mediante fusiones de estas, se forman las estructuras m´as grandes, es necesario estudiar la evoluci´on temporal de los halos de materia oscura. Una vez identificados los halos y subhalos en las diferentes salidas de una dada simulaci´on, el siguiente paso es obtener las historias de fusiones de los mismos. Construir un ´arbol de fusiones consiste en averiguar cuando y como los (sub)halos se fueron fusionando hasta llegar a formar los (sub)halos presentes en elsnapshot63correspondiente az = 0.

Cada part´ıcula posee un n´umero identificador, o ID, que nos permite encontrarla en las diferentes salidas de la simulaci´on, de esta manera, tomando pares consecutivos de salidas temporales, se puede analizar qu´e part´ıculas pertenecen a cada (sub)halo en cadasnapshot

y, as´ı, estudiar qu´e (sub)halos se fusionaron para dar lugar a los subhalos presentes en el siguientesnapshot[89].

mos la evoluci´on de dicho objeto a lo largo de toda la simulaci´on. Como esta simulaci´on es solo de materia oscura, para poder construir un cat´alogo de galaxias comparable a los cat´alogos reales, es necesario relacionar los halos de materia oscura con objetos reales (ga- laxias, c´umulos de galaxias, etc.). Uno de los m´etodos m´as eficientes para poblar los halos con galaxias son los llamados modelos semi-anal´ıticos. Dichos m´etodos pueblan los halos mediante diferentes recetas que modelan los procesos f´ısicos que no se pueden simular debido a la resoluci´on de la simulaci´on [42].

Para realizar este trabajo, utilizamos los datos del modelo semi-anal´ıtico de Guo et al. [42] aplicados a la simulaci´on cosmol´ogica Millenium. Vale aclarar que este modelo nos provee de informaci´on fotom´etrica (magnitudes absolutas en las bandas del SDSS), posici´on3Dy velocidades 3Dpara cada galaxia. Finalmente, para construir un cat´alogo similar al SDSS, es necesario elegir una posici´on para el observador y desde ah´ı estimar la posici´on angular, redshift y magnitudes aparentes de cada galaxia. Con el objetivo de aprovechar al m´aximo los datos de la simulaci´on, construimos8cat´alogos eligiendo como posici´on para el observador cada uno de los 8 nodos del cubo de la simulaci´on. Luego, a cada uno de estos cat´alogos le aplicamos los mismos criterios de selecci´on fotom´etrica

(14.5< z < 17.77) y la misma m´ascara angular que el SDSS espectrosc´opico.

Para reproducir los mismos procedimientos que se realizan en cat´alogos reales, utili- zamos un algoritmoFOFcon el objetivo de identificar c´umulos de galaxias en cada uno de nuestros 8cat´alogos simulados. Finalmente, relacionamos cada c´umulo identificado con un halo de la simulaci´on teniendo en cuenta cual es el halo que comparte mayor n´umero de galaxias con el c´umulo identificado.

Estudiando los arboles de fusi´on de los halos asociados a los c´umulos identificados, definimos como c´umulo en proceso de interacci´on a un c´umulo cuyo halo asociado haya sufrido una fusi´on mayor (definimos como fusi´on mayor a una fusi´on en la cual el cociente entre los halos interactuantes es mayor a 0.25) y cuyas subestructuras hayan sobrevivido hasta elsnapshot63como subhalos diferentes dentro del mismo halo. En la figura3.3se puede ver un esquema representativo de un halo que tuvo una fusi´on mayor en elsnapshot

61 y cuyo halo sobrevivi´o como un subhalo hasta el snapshot 63. La muestra final de c´umulos cuenta con1447c´umulos az = 0con masas mayores a1013M

y con m´as de30

galaxias1, de los cuales132est´an en proceso de interacci´on. En la figura3.4se muestra la 1Como se explica en la secci´on3.2.2establecemos un m´ınimo en el n´umero de galaxias miembros debido a que el test deDressler & Shectmansolo puede ser aplicados a c´umulos con m´as de 30 galaxias.

3.2. El algoritmoMeSsI(Merging Systems Identification). 75

distribuci´on de los tiempos en el que se produjeron las fusiones para los c´umulo que est´an en un proceso de interacci´on. Se puede ver que dicha distribuci´on presenta un m´aximo en t 3Gyr consistente con lo encontrado por otros autores que estudiaron el tiempo que tardan las subestructuras producidas por una fusi´on en desaparecer seg´un el test de

Dressler-Shectman[69].

Figura 3.3: Esquema de un halo que tuvo una fusi´on mayor en elsnapshot61y cuyo halo sobrevivi´o como un subhalo hasta elsnapshot63.