Aplicación de redes neuronales para la separación de gammas y hadrones en HAWC

(1)

Aplicaci´on de redes neuronales para la

separaci´on de gammas y hadrones en

HAWC

Por

Tom´as Capistr´an Rojas

Ing. en Comunicaciones y Electr´onica

Presentado como requisito parcial para la obtenci´on del grado de:

MAESTRO EN CIENCIAS CON

ESPECIALIDAD EN ASTROF´ISICA

en el

Instituto Nacional de Astrof´ısica ´Optica y Electr´onica

Julio 2014 Tonantzintla, Puebla

Supervisada por:

Dr. Ibrahim Torres Aguilar, INAOE.

Dr. Leopoldo Altamirano Robles, INAOE.

c

INAOE 2014

El autor otorga al INAOE el permiso de reproducir copias totales o parciales de esta tesis.

(2)

(3)

Agradecimientos

“La inteligencia más carácter es el objetivo de una verdadera eduación”

Martin Luther King.

Quiero agradecer a mi familia, maestros y doctores por las enseñanzas que me han brindado, pero dando un especial reconocimiento a los Dres. Ibrahim Torres y Leopoldo Altamirano por su gran labor como directores de esta tesis. En el transcurso brindando consejos de como mejorar el trabajo y la organización de la misma, pero que tambiénson aplicados en la vida personal.

A la colaboraci´on de HAWC por el gran trabajo en el desarrollo del experimento y el trabajo que han realizado para el procesamiento de datos.

Al Conacyt por la beca-crédito, con el número de registro de CVU 48075, que me otorgó para la realización durante el periodo de maestr´ıa.

Al Instituto Nacional de Astrof´ısica, ´Optica y Electr´onica por abrir sus puertas para que pudiera realizar la maestr´ıa.

(4)

(5)

Resumen

El observatorio de gran altura Cherenkov en agua (HAWC, por sus siglas en inglés) es un observatorio de rayos gammas ubicado a una altitud de 4,100 metros sobre el nivel del mar, en las faldas del volcán Sierra Negra en el estado de Puebla, México. Diseñado para detectar cascadas producidas por rayos gammas de energ´ıas entre 100 GeV y 100 TeV. Al finalizar su construcción tendrá 300 detectores Cherenkov de agua (WCD, por sus siglas en inglés), además, cada WCD tiene uno tubo fotomultiplicador (PMT, por sus siglas en inglés) de 10 pulgadas y 3 PMT’s de 8 pulgadas. Por el tipo de detección, también es capaz de detectar las cascadas generadas por rayos cósmicos; debido a que estos últimos no se desean detectar para el estudio de fuentes de rayos gammas, es por eso la importancia de la implementación de métodos de separación de part´ıculas primarias.

Actualmente, HAWC cuenta un método de separación de part´ıculas, heredado por su antecesor MILAGRO, llamado “Compactness”, el cual fue elaborado de forma emp´ırica, donde la identificación de cada part´ıcula depende del valor calculado del Compactness

y del valor de separación que depende del número de PMT’s con señal en el evento (nHit), si el valor de Compactness es mayor a es clasificado como un evento tipo gamma, si no es un hadrón; por lo cual en este trabajo se desarrolló un nuevo método, donde se aplicó una red neuronal multicapa perceptrón capaz de identificar las cascadas producidas por las part´ıculas siempre y cuando nHit sea mayor a 30, aplicando un solo valor de separación.

De los eventos generados de las simulaciones del experimento HAWC, se tomó un conjunto para el entrenamiento de la red y otro grupo para la verificación, donde de cada evento se extraen 5 caracter´ısticas para la entrada, dependiendo del contenido de cada caracter´ıstica, la red proporciona un valor de salida a la cual se pregunta si es mayor o igual al valor de separaciónpara definir el tipo de part´ıcula: gamma o hadrón.

Para comparar los métodos se utilizaron dos parámetros, factor Q y curvas ROC que indican el nivel de confianza del método empleado en la separación de gamma/hadrón, es decir, se observa el comportamiento de la señal y el ruido en cada método. Por ´

ultimo se emplearon los datos tomados del observatorio para localizar a la nebulosa del Cangrejo, NGC1952 y se gener´o su mapa de significancia.

Cuando es 0.96, el factor Q se incrementó aproximadamente un 36 % con respecto al método , debido a que el método desarrollado tuvó un incremento en la clasificación de gammas de aproximadamente un 13 % y un decremento del 30 % en la mala clasifica-ción de protones. Cuando ambos métodos de separación se introducen los datos reales,

(6)

raci´on de las part´ıculas aplicando redes neuronales.

• En el cap´ıtulo 3 se aborda la información teórica de los procesos f´ısicos de las cascadas atmosféricas extendidas, as´ı como el funcionamiento del Observatorio HAWC y las herramientas utilizadas para obtener los datos simulados y datos reales. Además se explica la téoria de las redes neuronales y la implementación de una biblioteca en ROOT, continuando con la explicación del método utilizado en HAWC y finalizando el cap´ıtulo con la explicación de los parámetros para la comparación de los métodos.

• En el cap´ıtulo 4 se explica la selección de los eventos y su extracción de carac-ter´ısticas para el entrenamiento, verificación y usó de la red. Después se describe la manera de como obtener los mapas de la fuente con ambos métodos.

• En el cap´ıtulo 5 se presentan los resultados obtenidos en la red y se compara con el m´etodo utilizado actualmente en HAWC. Se muestran los mapas de la nebulosa del Cangrejo que se generaron con ambos m´etodos.

• En el cap´ıtulo 6 se concluye con los resultados y las mejoras que se obtuv´o con el m´etodo desarrollado en la tesis.

(7)

´

_{Indice general}

Resumen v

1 Introducci´on 1

1.1 Antecedentes . . . 1

1.2 Planteamiento del problema . . . 3

1.3 Justificaci´on . . . 4

1.4 Objetivo general . . . 4

1.5 Objetivos particulares . . . 4

2 Estado del Arte 5 2.1 ARGO-YBJ . . . 5

2.2 MAGIC . . . 7

2.3 HESS . . . 10

3 Marco Te´orico 13 3.1 Part´ıculas primarias . . . 13

3.1.1 Rayos gamma . . . 13

3.1.2 Rayos c´osmicos . . . 14

3.2 Cascadas Atmosf´erica Extendidas . . . 15

3.2.1 Cascadas Electromagn´eticas . . . 15

3.2.2 Cascadas Hadr´onicas . . . 16

3.2.3 Caracter´ısticas en ambas cascadas . . . 17

3.3 Luz Cherenkov . . . 18

3.4 HAWC . . . 20

3.4.1 Detectores Cherenkov en Agua (WCD) . . . 21

3.4.2 Tubo Fotomultiplicador (PMT) . . . 21

3.5 Corsika . . . 23

3.6 AERIE . . . 23

3.6.1 XCDF . . . 25

3.6.2 HAWCSim . . . 25

3.6.3 HAWCSim-reco . . . 26

3.6.4 Offline-reconstructor . . . 28

3.7 Redes Neuronales (NN’s) . . . 30

3.7.1 Modelos neuronales biol´ogicos . . . 32

3.7.2 Modelo est´andar de la neurona . . . 32

3.7.3 Arquitectura de la red neuronal . . . 33

3.7.4 M´etodos de aprendizaje . . . 33

3.8 ROOT . . . 35

(8)

4.2 Selecci´on de eventos . . . 52

4.2.1 Simulaciones . . . 52

4.2.2 Datos reales . . . 55

4.3 Obtenci´on de caracter´ısticas . . . 57

4.4 Entrenamiento de la Red . . . 60

4.5 Funcionamiento de la Red . . . 62

5 Resultados y An´alisis 71 5.1 Entrenamiento de la red . . . 71

5.2 Comparaci´on en las simulaciones . . . 74

5.2.1 Comportamiento con todos los datos . . . 74

5.2.2 Comportamiento entre los intervalos . . . 76

5.3 Comparaci´on en datos reales . . . 78

5.3.1 Significancia m´axima . . . 79

6 Conclusiones y Trabajo Futuro 83 6.1 Trabajo Futuro . . . 84

Ap´endice 85 A Modelo est´andar 87 B Variables de salida de HAWCSim-reco 89 C Variables de TRIG 91 D Variables de salida de Offline-reconstructor 93 D.1 XCDF . . . 93

D.2 ROOT . . . 94

´_{Indice de figuras} ₉₇ ´_{Indice de tablas} ₁₀₃

(9)

´_{INDICE GENERAL} _ix

(10)

(11)

Cap´ıtulo 1

Introducci´

on

“El verdadero conocimiento est´a escrito en un enorme libro abierto continuamente ante nuestros ojos, me refiero al Universo, . . . ”

Galileo Galilei.

1.1 Antecedentes

El avance tecnológico del siglo XX abrió las puertas a los astrónomos a observar en otras longitudes de onda; como es el caso de las observaciones en altas energ´ıas. Estas observaciones comenzaron desde el tiempo de Henry Coulomb quien notó que una esfera cargada suspendida sobre un hilo de seda gradualmente perd´ıa su carga eléctrica. Este fenómeno fue relacionado con la ionización en el aire por C.T.R Wilson. Después del descubrimiento de la radioactividad, se pensó que la ionización es debida a materiales en la Tierra, si ésto es verdad, debe decrementar conforme se aumente su altitud. En los experimentos de T. Wulf y A. Gockel, utilizando un espectroscopio a diferentes altitudes, observaron que la ionización decrementaba con respecto a la altitud, pero su disminución fue más pequeña de lo que esperaban. En 1912, Victor Hess llegó a la conclusión que la ionización es de origen extraterrestre. Hoy se sabe que esta radiación no solo es extraterrrestre sino también extra solar llamada radiación cósmica por Millikan en 1925. Además el campo magnético de la Tierra influye en las mediciones ya que incrementa conforme se aumenta la latitud [27].

La radiación cósmica tiene dos componentes: La componente “ primaria” inicia cuan-do una part´ıcula colisiona con los núcleos de aire de la atmósfera (Nitrógeno, Ox´ıgeno, entre otras) y producen un gran número de piones, kaones, etcétera, esta part´ıcula que colisiona es llamada part´ıcula primaria (En la Figura 1.1 se muestra un ejemplo de un protón como part´ıcula primaria, después de su colisión produce piones). La componente “secundaria” son todas las part´ıculas producidas después de la primera colisión como son los piones, kaones, éstos siguen cayendo e interaccionan con otros núcleos de ai-re y producen otras part´ıculas. Todo este proceso es llamado “Cascadas atmosféricas extendidas, en inglés Extensive Air Showers (EAS)”. Hay dos tipos de cascadas: elec-tromagnéticas y hadrónicas, en la primera la part´ıcula primaria es un rayo gamma (γ) y en la segunda es un rayo cósmico, en inglésCosmic Ray (CR) [27].

Orellana [24] menciona que por cada segundo penetran a la atm´osfera 10,000 part´ıcu-las por metro cuadrado, donde el 90 % de ´estas son protones, tan solo un 9 % de

(12)

Figura 1.1: Interacción de un protón con la atmosféra, produciendo algunos piones. Imagen obtenida de [24].

Figura 1.2:Una posible trayectoria de un rayo c´osmico desde la fuente hasta la Tierra. Imagen modificada de [24].

las alfa y el resto son núcleos más pesados que el hidrógeno (como los núcleos de carbón, ox´ıgeno, hierro, calcio, entre otros). Cuando éstas son sometidas a un campo magnético, ya sea de la Tierra o dentro de la galaxia, su trayectoria cambia (como se muestra en la Figura 1.2), lo que impide conocer su dirección de origen. Por otro lado, aunque con un porcentaje muy pequeño, los rayos γ son part´ıculas que no cambian su dirección al interaccionar con cualquier tipo de campo magnético, por ende indican su origen.

Actualmente, existen diferentes observatorios que detectan las EAS, en particular se menciona el caso del Observatorio de Gran Altura Cherenkov en Agua, en ingl´es

High-Altitude Water Cherenkov (HAWC), éste detecta part´ıculas primarias dentro de un rango de 100 GeV hasta 100 TeV. Por su técnica de detección, es capaz de percibir las cascadas con part´ıculas primarias de rayos γ y CR’s, pero no diferenciarlas. Es por eso que se emplean algoritmos especiales que procesan la información e indican el tipo de part´ıcula a la que pertenecen. Una vez seleccionadas las cascadas electromagnéticas, se

(13)

1.2. PLANTEAMIENTO DEL PROBLEMA 3

pueden realizar mapas del cielo para conocer la fuente de donde proviene. Se piensa que las fuentes productoras de eventos de rayos γ son las remanentes de supernova (SNR, por sus siglas en inglés), y los núcleos activos de galaxias (AGN, por sus siglas en inglés). Por ejemplo las fuentes MGROJ1908+06 y MGROJ2019+17 que fueron detectadas por el observatorio MILAGRO, que es una generación anterior al observatorio HAWC [39].

1.2 Planteamiento del problema

Actualmente, en el campo de altas energ´ıas del espectro electromagnético, se estudia la naturaleza fundamental de la materia y energ´ıa. Afortunadamente, existen diversas interrogantes como por ejemplo ¿cómo está compuesto nuestro universo? ¿Cómo se producen las part´ıculas de muy alta energ´ıa? ¿De dónde provienen?, entre otras, debido a esto, se construyen observatorios como HAWC [19], Pierre Auger [34], HESS [17], MAGIC [23] y VERITAS [36], con los datos observados se pretende dar explicación a estas interrogantes.

Si se realiza una búsqueda de una fuente sin utilizar un discriminador de part´ıculas, se obtiene como resultado la misma cantidad de eventos en todas las direcciones, sin importar la coordenada a estudiar, ya que la llegada de los CR’s a la atmósfera es isotrópica y su porcentaje es aproximadamente el 90 % de todas las part´ıculas que arriban. Otro conflicto es la incertidumbre del cálculo de la dirección de la cual proviene, debido a la deflexión que sufren los CR’s al pasar por un campo magnético. Por el momento las únicas part´ıculas que no cambian su trayectoria son los rayos γ, pero la cantidad de arribo a la Tierra es mucho menor. Es por eso que se realizan métodos de separación de part´ıculas.

En el caso del observatorio HAWC, se cuenta con un m´etodo de separaci´on llamado

Compactness, pero se divide en 10 intervalos que depende de la variable nHit1, cada intervalo tiene su propio valor de corte para identificar los rayos γ de los CR’s, por lo que cuando se realiza un análisis con los datos, implique más tiempo de cómputo, ya que separa los datos en grupos y después los unen. Por otro lado el observatorio, actualmente, se encuentra en la fase de construcción, por lo que el número de detectores incrementa conforme avanzan en la instalación esto implica que los intervalos y sus valores de corte deban ser recalculados. Entre cada cálculo, el valor m´ınimo de nHit incrementa, por ejemplo para HAWC-95 el número de nHit es 20, para HAWC-111 es 22 [40] y para HAWC-300 serán 55. Otro inconveniente es que en cada cálculo se presenta diferentes valores de corte en los diferentes intervalos, es decir, si se tiene un evento con un nHit de 55, si se usa HAWC-95 el valor de corte es 3.2, para HAWC-111 es de 3.9 y para HAWC-300 es de 4.6 (ver las Tablas 3.1, 3.2 y 3.3), lo cual representa que en los eventos con un mismo nHit se cambia la condición de separación de gammas y hadrones, y puede dar el caso de que se introduzca más hadrones clasificados como gammas.

(14)

en otras variables, localizando un nuevo valor de separaci´on y/o cambiando el rango en cada intervalo [26]. Principalmente, para aumentar el rendimiento del separador se busca dos cosas: la primera disminuir la cantidad de eventos que pasan como rayos γ

cuando en realidad son CR’s y segundo aumentar la cantidad de una correcta seleccion de eventos en rayos γ.

Por todo lo anterior se propone un nuevo método de separación aplicando una Red Neuronal, en inglés Neural Network (NN), capaz de separar las part´ıculas sin realizar intervalos que dependan del número de PMT activos en el evento, siempre y cuando nHit sea mayor o igual a 30. Por lo que conlleva a tener un solo umbral para diferenciar entre las part´ıculas gammas de los hadrones.

1.4 Objetivo general

Dise˜nar un m´etodo para distingir las part´ıculas primarias que formaron las cascadas detectadas por el observatorio HAWC.

1.5 Objetivos particulares

• Identificar y seleccionar las caracter´ısticas de entrada de la red neuronal.

• Entrenar una red neuronal para llevar a cabo la clasificaci´on de part´ıculas y com-parar el resultado con el m´etodo actualmente utilizado en HAWC.

• Obtener el mapa de la nebulosa del Cangrejo (NGC1952) con los datos recolecta-dos con el experimento aplicando el nuevo m´etodo.

(15)

Cap´ıtulo 2

Estado del Arte

“Si otros pudieron, yo tambi´en puedo. Si otros no pudieron yo puedo ser el primero”

Maktub.

En este cap´ıtulo se abordarán algunos trabajos realizados en distintos observatorios donde se aplicarón las NN para la separación de gamma/hadrón.

2.1 ARGO-YBJ

Astrophysical Radiation with Ground-based Observatory at YangBaJing (ARGO-YBJ), es un experimento para el estudio de la radiación cósmica, principalmente radia-ción en rayos γ de energ´ıas, aproximadamente, de cientos de GeV a pocas decenas de TeV. Se localiza en el laboratorio de rayos cósmicos de YangBaJing en el Tibet, China, con una altitud de 4,300 metros sobre nivel del mar (msnm). El observatorio consiste en un arreglo matricial de 120 clusters y un anillo con 24 clusters, como se muestra en la Figura 2.1. Un cluster es un areglo de 12 cámaras de plato resistivo (RPC’s, por sus siglas en ingles). La señal de un RPC es obtenida por medio de 80 tiras de lectura (strips). Un conjunto de 8 strips es llamado pad, el cual es utilizado para medir el tiem-po de arribo de la casacada. Un RPC es un detector gaseoso que detecta el paso de las part´ıculas cargadas por la pérdida de ionización en el gas [2,10].

Kong et al. [20] reportan un clasificador de part´ıculas primarias de rayosγ y protones en el experimento ARGO-YBJ utilizando una NN. Los eventos para el entrenamiento y verificación de la red son simulaciones en Monte Carlo de part´ıculas primarias con energ´ıa entre 100 GeV y 10 TeV, un ´ındice espectral de₋2.7 y un ángulo zenital entre 0◦ y 30◦, el nivel de observación en profundidad atmósferica es 606 g/cm2 (altitud del experimento). Se realizó una seleccion de los eventos simulados que cumplian con un m´ınimo de detección de 50 pads activos y que la posición del núcleo de la cascada se localizaran dentro de un cuadrado de 25 m apartir del centro del arreglo. En la Figura 2.2 se presenta la distribución de carga de dos cascada inducidas por un rayo γ y la otra por un protón. Se notá que la distribución en las cascadas electromagnéticas se concentrá en el núcleo en comparación a las cascadas hadrónicas.

La estructura de la red Feed Forward es 9-12-1, 9 neuronas de entrada, 12 neuronas en la capa oculta y una neurona en la capa de salida. En la etapa de entrenamiento se

(16)

Figura 2.1: Arreglo de detectores RPC’s en el experimento de ARGO-YBJ. Imagen obtenida de [20].

(a) Evento tipo gamma. (b) Evento tipo prot´on.

Figura 2.2: Se muestra las distribuciones de carga que fuer´on producidas por dos part´ıculas

primarias, en la cual se diferencian por la cantidad de n´ucleos. En (a) se muestra la distribuci´on

de un rayo γ, donde la mayor´ıa de las cargas se concentran en un punto, es decir, un n´ucleo,

mientras que en (b) se observa la distribuci´on de un prot´on, la cual tiene varios grupos de carga,

por lo tanto multin´ucleos. Imagen obtenida de [20].

usaron 3,000 cascadas, donde se especifican con un valor de cero, las cascadas producidas por los rayosγ y un valor de uno, las cascadas producidas por los protones.

En la etapa de verificación se usaron 7,000 cascadas, la salida de la red se muestra en la Figura 2.3a, donde su salida es continua, por lo cual se encontró un valor óptimo

(17)

2.2. MAGIC 7

(a) Salida de la NN. (b) Factor Q en funci´on del valor de corte.

Figura 2.3: Se muestra en (a), el histograma de la salida de la NN cuando se introducen los

eventos del archivo de verificaci´on, y en (b), los histogramas del factor Q, Ef icacia en γ y

Rechazo de protonesen función del corte de separación, se localiza el valor máximo del factor

Q en 2.5 cuandoes 0.15. Im´agenes obtenidas de [20].

para identificar los tipos de part´ıculas. El valor de se hall´o maximizando el factor Q definido como “Ef icacia en γ / √1₋Rechazo de protones” donde la Ef icacia en γ

es el porcentaje de eventos tipoγ clasificados correctamente y Rechazo de protoneses el porcentaje de eventos tipo protón clasificados correctamente. En la Figura 2.3b, se muestra un histograma del factor Q en función del valor de corte aplicadó en la salida de la red. Cuandotiene el valor de 0.15, se presenta un máximo en el factor Q de 2.5, lo que implica que si el valor de salida de la red cuando se ingreso un evento es mayor o igual a 0.15 es clasificado como protón mientras que si es menor a 0.15 es considerando como un rayoγ, dando como resultado la clasificación correcta de rayosγ del 69.5 % y la mayor´ıa de los protones clasificados correctamente, con un 92.8 % [20].

2.2 MAGIC

Major Atmospheric Gamma-ray Imaging Cherenkov Telescopes (MAGIC) es un siste-ma de dos telescopios Cherenkov de isiste-magen atmosf´erica, en ingl´esImaging Atmospheric Cherenkov Telescope(IACT) (Figura 2.4a) situado en el observatorio Roque de los Mu-chachos a 2,200 msnm, con una superficie efectiva de 236m2_{, para detectar rayos}_γ _con

energ´ıas entre 50 GeV y 30 TeV. MAGIC-I comenzó su operación en el año del 2004 y MAGIC-II a principios del 2009 [23].

IACT son detectores de rayosγ de alta energ´ıa instalados en la superficie de la Tierra, compuestos por un espejo de captación de luz y una cámara (Figura 2.4b), por lo que se asemeja a un telescopio óptico, pero éste detecta luz azul que es producida por efecto Cherenkov (ver la sección 3.3). El espejo de captación de luz esta hecho con 974 elementos cuadrados de 49.5 x 49.5 cm de aluminio-diamante molido con revestimento de cuarzo, con una Razón focal,f /D, de 1.03, su montura es Alta-Azimutal. La cámara tiene 576 PMT’s, en el área hexagonal interna con 396 PMT’s de 100 de diámetro, los

(18)

(a) Observatorio Roque de los Muchachos. (b) IACT.

Figura 2.4: Se muestra el observatorio MAGIC, en (a), los dos IACT y el centro de control, y

en (b), los elementos que estan conformado un IACT. Im´agenes obtenidas de [23].

pixeles exteriores con 180 PMT’s de 1.500 de di´ametro [23].

Bock et al. [5] reportarón el uso de diferentes métodos de clasificación de part´ıculas con los telescopios IACT, como son: funciones de kernel, árbol de decisión, redes neu-ronales, máquinas de soporte vectorial, análisis de discriminador lineal. A cada método se introducen 10 caracter´ısticas que son obtenidas de las simulaciones en Monte Carlo, teniendo dos clases: gammas (señal) y hadrónes (ruido), estas simulaciones son genera-das con energ´ıas entre 10 GeV hasta 30 TeV y un ángulo zenital entre 0◦ y 20◦. Para la extracción de las caracter´ısticas, con las imágenes de las cascadas después de un proce-samiento previó se presenta un grupo alargado en la imagen; el eje más largo se orienta hacia el centro de la cámara, es decir, si el eje del telescopio se dirige hacia una fuente puntual, por lo cual un análisis de componentes principales se lleva acabo en el plano de la cámara, lo que resulta una elipse (Figura 2.5), éstos son llamados parámetros de Hilla.

La estructura de la red neuronal usada es feed forward 10-10-1, 10 neuronas de entra-da, 1 capa oculta con 10 neuronas y una neurona en la capa de salida. Se inicializaron los pesos aleatoriamente y la función de transferencia en las neuronas es sigmoidea, ver ecuación 3.13. El método utilizado para la minimización del error en la etapa del entrenamiento es el back propagation. En la Figura 2.6 se muestra del lado izquierdo el proceso de evolución del aprendizaje, donde indica el incremento o decremento del desempeño de la red en cada ciclo1 y del lado derecho la salida de la red neuronal, teniendo un valor cercano a uno para eventos tipoγ y cercanos a cero para los protones [5].

Bock et al. [5] concluyen que los mejores resultados son los clasificadores de árboles de decisión, funciones kerner y vecindades cercanas. Las peores son las máquinas de

(19)

2.2. MAGIC 9

Figura 2.5: En el lado izquierdo se muestra la detecci´on de luz en los detectores de la c´amara

de los IACT, donde en la detecci´on se extraen los par´ametros Hilla de la imagen (mostrados del

lado derecho). Imagen obtenida de [5].

(a) Curva de evoluci´on. (b) Salida de la NN.

Figura 2.6: En (a) se muestra la evoluci´on del aprendizaje de la red por cada ciclo. En (b) se muestra el histograma de la salida de la red neuronal con diferentes eventos al del entrenamiento. Im´agenes obtenidas de [5].

soporte vectorial y selección directa. En medio, se encuentran las NN y se necesita un mayor entendimiento de ellas, ya que existen diferentes métodos y se deben realizar un análisis más profundo para su uso.

Boinee et al. [6] explican que se entrenó una red Perceptrón multicapa, en inglés Mul-tiLayer Perceptron(MLP), con 12,332 eventos, cada uno extrayendo 10 caracter´ısticas. La estructura de la red es 10-10-1, 10 neuronas de entrada, 1 capa oculta con 10 neuro-nas y en la capa de salida una neurona se definió un cero, si representa un hadrón y un

(20)

(a) Usando una red:MLP. (b) Usando dos redes: MLP + SOTA.

Figura 2.7:En (a) se muestra el histograma de la salida de una red MLP. En (b) se muestra el histograma de la salida de combinar dos redes neuronales (MLP+ SOTA), usando la salida de

la red SOTA como entrada de la red MLP. En (a) se preseta menores eventos tipo prot´on con

valor cercano a uno. Im´agenes obtenidas de [6].

uno, si es un gamma. La función de transferencia de las neuronas de la capa de entrada y salida es lineal mientras que en las capas ocultas se usó una función sigmoidea, ver ecuación 3.13. En la Figura 2.7a se muestra el resultado de salida de la red. Además se aplicó una red Self-Organizing Tree Algorithm (SOTA)2 _{donde su salida se introduce a}

una red MLP reportando mejores resultados que si solo se usara la MLP (Figura 2.7b).

2.3 HESS

High Energy Stereoscopic System (HESS) es un arreglo de telescopios Cherenkov situado en la zona montañosa Khomas de Namibia a 1,800 msnm, ver Figura 2.8. Es el sitio perfecto para detecciones astronómicas por que el medio ambiente es árido. Además la localización en el hemisferio sur es óptimo para detecciones del plano galáctico. HESS se compone de dos fases: fase I tiene 4 IACT ordenado en un cuadrado de 120m. Cada telescopio tiene una área reflectora de 107 m2 con 382 espejos de 60 cm2 de diámetro ordenados con un diseño de Davies-Cotton y su montura es Alta-Azimutal, la cual puede seguir fuentes de elevacion entre 20◦ to 89.9◦. La cámara contiene 960 pixeles compuestos por conos de Winston colectando la luz incidente y enfocándolo dentro de un PMT con eficiencia cuántica de aproximadamente 15 %, cada pixel tiene un campo de vision de 0.16◦. En la fase II se instaló un quinto IACT con 600m2 _{de ´}_{area reflectora,}

se localiza en el centro de los telescopios existentes en HESS fase I [17,18].

Hupfer [18] implementó una red neuronal MLP donde se usaron 6 caracter´ısticas de entrada, sólo trabajó con eventos de rayos γ y protones. El archivo de entrenamiento

2

Es una red neuronal no supervisada que implementa una agrupación jerárquica, basada en una red de autoorganización

(21)

2.3. HESS 11

Figura 2.8:Observatorio HESS fase I. Imagen obtenida de [17].

tiene 10,000 eventos de cada part´ıcula y un archivo de verificaci´on de 140,000 eventos de rayos γ y 61,947 eventos de protones. En la etapa de entrenamiento de la red se especifican 550 ciclos de entrenamiento y una raz´on de entrenamiento de 0.023_{. En la}

Figura 2.9a, se muestra el resultado de la red neuronal después de ingresar los eventos del entrenamiento. Con los resultados de la gráfica anterior se genera la Figura 2.9b, que se muestra el factor Q (Quality Factor) en función del valor de corte, donde se localiza el valor máximo de 4.44 y corresponde a 0.8868 de la salida de la red neuronal, es decir, si esta salida es mayor o igual a 0.8868 se clasifica como un γ y cuando sea menor, es clasificado como protón. Donde su eficacia en gammas es del 56 % y del 1.6 % en eficacia en protones.

Además Hupfer [18] reporta el usó de otros 2 métodos de clasificación, Fisher y árbol de desiciones Boosted, en inglés Boosted Desicion Trees (BDT) que se muestran en la Figura 2.10, y menciona que el método que tiene mayor área bajo la curva , es un mejor clasificador, y la red MLP tiene mayor área.

(22)

(a) Salida de la NN. (b) Factor Q o Quality Factor.

Figura 2.9:En (a) se muestra el histograma de la salida de la red neuronal, para archivos de

entrenamiento y verificaci´on. En (b) se encuentra los histogramas para el c´alculo del factor Q y

en 4.4 se encuentra el valor m´aximo, cuando el corte es 0.8868. Im´agenes obtenidas de [18].

Figura 2.10:Se muestran las curvas ROC de tres m´etodos de separaci´on (MLP, BDT y Fisher),

donde la red MLP presenta mejores resultados debido a que tiene mayor ´area bajo su curva.

(23)

Cap´ıtulo 3

Marco Te´

orico

“Aprender una t´ecnica no es el final en si mismo. Simplemente, indica donde necesitas comenzar”

Dr. Masaaki Hatsumi.

En este cap´ıtulo comenzaremos con la teor´ıa de las EAS, seguido con las simulaciones de las part´ıculas pasando a través de la atmósfera hasta llegar al nivel de observación, continuando con las simulaciones del paso de las part´ıculas en los materiales, prosi-guiendo con la reconstrucción de los eventos simulados. Por otro lado abordanremos la teor´ıa de redes neuronales y una implementación en ROOT, después con la explicación de dos métodos para la separación en HAWC, una aplicación de una red neuronal y segundo el método que se usa actualmente, y se finaliza con dos parámetros que indican el comportamiento del método de separación para poder comparar los métodos.

3.1 Part´ıculas primarias

La unidades de energ´ıa de la part´ıcula primaria están dadas eneV, la cual equivale a 1.6×10−19J oules, que es la energ´ıa cinética ganada por un electrón que pasa por una diferencia de potencial de 1 V.

3.1.1 Rayos gamma

Los rayos γ es radiación electromagnética como la luz visible. Estos rayos pueden ser tratados como part´ıculas o como ondas. Si se describen como part´ıculas, su energ´ıa está dada por la ecuación de Plank-Einstein [9]:

E = hf (3.1)

dondef es la frecuencia de la luz y h es la constante de Plank.

Por otro lado si se describen a los rayosγ como ondas, se caracteriza por su velocidad de la onda, definida como:

v = f λ (3.2)

dondeλes la longitud de onda.

(24)

Figura 3.1:Se muestra el espectro electromagn´etico, donde existen rangos de energ´ıa en la que

la atm´osfera es opaca, como es el caso de los rayosγ.

La velocidad de la luz en el vacio (c) es aproximadamente igual a 3 × 108 m/s. Cuando viaja en diferentes medios su velocidad de fase (vf ase) cambia y es directamente

proporcional a c e inversamente proporcional al ´ındice de refracci´on del medio (η). Si

η > 1 implica quevf ase de las part´ıculas puedan ser m´as grandes que la de la luz en

el medio:

vf ase =

c

η (3.3)

La atmósfera de la Tierra es opaca para algunas longitudes de onda como se muestra en la Figura 3.1. En el caso de los rayos γ, éstos no son capaces de penetrar, una alternativa para su detección es enviar satélites, pero éstos tienen un l´ımite de detección de energ´ıa aproximadamente de 1 GeV - 300 GeV, otra forma es mediante detectores en la Tierra, pero eso implica entender las interacciones generadas en la atmósfera (ver sección 3.2) [9].

3.1.2 Rayos c´osmicos

Los CR’s son definidos como part´ıculas cargadas que llegan a la Tierra del espacio interestelar. El espectro de energ´ıaN(E) cubre un rango de energ´ıas entre 109 eV hasta 1021 eV y sigue una ley de potencias:

d N(E)

d E ∝ E

Γ _(3.4)

donde Γ es el ´ındice espectral.

En la Figura 3.2, se muestra el espectro de energ´ıas de rayos c´osmicos observados en la Tierra. Los CR con energ´ıas cercanas a 109 eV son provenientes del Sol y de otras

(25)

3.2. CASCADAS ATMOSF ´ERICA EXTENDIDAS 15

Figura 3.2:Se muestra el espectro de los rayos c´osmicos. Hay tres puntos en el cual cambia el ´ındice espectral: la rodilla en 1015.5eV, la segunda rodilla en 1017.5eV y el tobillo en 1018.6eV,

despu´es de 1020 _{por el limite GZK existe poca probabilidad de detectar a los CR’s. Imagen}

obtenida de [38].

fuentes de nuestra Galaxia en este punto se curva por la acción del campo magnético del Sol y son desviados cuando intentan ingresar al sistema solar. Los CR con energ´ıas entre 109 hasta 1015.5 tienen un ´ındice espectral de ₋2.7, su posible explicación al cambio en el exponente es por el l´ımite de aceleración de fuentes de rayos cósmicos galacticos, en inglésGalactic Cosmic Rays(GCRs). Entre 1015.5 y 1018.6 eV tiene un ´ındice espectral de ₋3.0, es debido al limite de confinamiento de los GCRs en el campo magnético galáctico, es decir, por la transición entre los CR’s galácticos y extragalácticos. Por ´

ultimo, a energ´ıas mayores de 1018.6 eV se encuentra un aplanamiento [38].

3.2 Cascadas Atmosf´

erica Extendidas

Cuando una part´ıcula primaria llega a la atmósfera de la Tierra, ésta genera otros tipos de part´ıculas, llamadas part´ıculas secundarias. El tipo de part´ıculas secundarias generadas depende de la part´ıcula primaria. Hay dos tipos de cascadas: electromagnética y hadrónica (Figuras 3.3).

3.2.1 Cascadas Electromagn´eticas

La cascada inicia cuando el fotón llega a la atmósfera de la Tierra e interacciona con sus núcleos de aire y producen un par electrón-positrón (producción de pares), des-pués estos leptones emiten un fotón cuando atraviezan un campo magnético (radiación Bremsstrahlung), por consiguiente estos fotones decaen de nuevo en un par electr´ on-positron y éstos a su vez en fotones y de nuevo se repite la cadena hasta que su energ´ıa sea menor a la energ´ıa m´ınima de produción de pares (ver ecuación 3.5). En la Figura

(26)

(a) Cascada electromagn´etica. (b) Cascada Hadr´onica.

Figura 3.3:Se describen las EAS. En (a) se muestra el desarrollo de una cascada generada por

un rayo γ que coliciona con un n´ucleo de aire, se generan part´ıculas secundarias (electrones,

positrones), ´estas generan m´as rayosγy se reinicia el proceso. En (b) se observa el desarrollo de

una cascada generada por un CR que interacciona con los n´ucleos de aire y se generan piones,

que decaen en muones, neutrinos y rayosγ. Im´agenes obtenidas de [21].

3.3a se muestra el desarrollo de una cascada electromagn´etica [27].

Producci´on de pares

La producción de pares es el proceso por el cual un fotón interactúa con el campo eléctrico de un núcleo. En esta interacción, el fotón desaparece y crea un par electr´ on-positrón. La energ´ıa m´ınima, Emin, que debe de tener el fotón para producir un par

electr´on-positr´on es:

Emin= 2mec2(1 +

me

M) ≈ 1.02M eV (3.5)

dondeme y M son las masas del electr´on y del n´ucleo.

En caso que la energ´ıa del fotón sea mayor a 1.02 MeV, el excedene se reparte entre el electrón y positrón como energ´ıa cinética.

Bremsstrahlung

Radiacción de frenado o Bremsstrahlung es el proceso por el cual un electrón de alta energ´ıa emite un fotón cuando interacciona con el campo magnético de un núcleo en el medio.

3.2.2 Cascadas Hadr´onicas

Cuando un CR penetra la atmósfera de la Tierra e interacciona con un núcleo de aire, parte de la energ´ıa de la part´ıcula primaria se pierde en la producción de part´ıculas

(27)

3.2. CASCADAS ATMOSF ´ERICA EXTENDIDAS 17

secundarias, a esta fracci´on de p´erdida es llamada inelasticidad.

El número de part´ıculas secundarias generadas es llamado multiplicidad total, lenta-mente se incrementa conforme se dan más interacciones cuando viajan a través de la atmósfera. Las part´ıculas secundarias se constituyen de piones, kaones, muones, neutri-nos, entre otras [27].

La mayor´ıa de las part´ıculas secundarias en la primera interacción son piones. En pequeñas cantidades se producen los kaones, bariones y antibariones si la energ´ıa es lo suficientemente grande, estas part´ıculas interaccionan en el aire conforme viajan. En el caso de los piones neutros,π0, su tiempo de vida es_≈ 10−6 sy por lo tanto decaen en dos gammas (ver ecuación 3.6). Estos gammas inician las cascadas electromagnéticas, ver sección 3.2.1.

π0 _→ γ + γ (3.6)

Los mesones cargados dan lugar a los muones (µ) y neutrinos (νµ); los decaimientos

dominantes son:

π± → µ± + νµ (3.7)

K± → µ± + νµ (3.8)

K± _→ π± + π0 (3.9)

La probabilidad del decaimiento de los kaones,K±, es del 63.5 % para la ecuaci´on 3.8 y un 21.2 % en la ecuaci´on 3.9. El resultado de estos decaimientos son, principalmente,

µyνµ. Losµsolo pierden su energ´ıa por ionización y una pequeña fracción de ellos por

decaimiento. El resultado de est´a decaimiento es descrito por:

µ± _→ e± + ¯νµ + ¯µe (3.10)

En la Figura 3.3b se muestra el desarrollo de una cascada cuando un CR colisiona con los núcleos de la atmósfera, generando piones neutros y cargados, y éstos generan gammas, neutrinos, muones, electrones y positrones [27].

3.2.3 Caracter´ısticas en ambas cascadas

Hay algunas caracter´ısticas que se definen en las EAS como son el desarrollo longitu-dinal y lateral. El primero es el aumento de las part´ıculas secundarias a través del paso por la atmósfera, la segunda es la distribución de part´ıculas a un nivel de observación. Otras caracter´ısticas importantes se mencionan a continuación:

• Tamaño de la cascada (N) es el número total de part´ıculas secundarias que son producidas en el desarrollo de la cascada a un nivel de observación. Ésta como función de la energ´ıa de la part´ıcula primaria, el ángulo de incidencia de la part´ıcula primaria (θ o ángulo zenital) y la altitud de la primera interacción (Figura 3.4).

• Profundidad de máximo desarrollo (Xmax) es la localización de máxima

generación de part´ıculas en la atmósfera, ésta depende de la energ´ıa de la part´ıcula primaria ya que a mayor energ´ıa mayor profundidad, generalmente las unidades se indican eng cm−2

(28)

Figura 3.4: Cuando una part´ıcula primaria colisiona con la atm´osfera, ´este viaja en un eje,

llamado eje de la cascada y con respecto al zenit se forma un ´anguloθ, conforme va viajando en

la atm´osfera se van creando part´ıculas y produce un plano con una peque˜na curvatura. Imagen

obtenida de [13].

• Eje de la cascadase define como la extensión del vector del momento inicial de la part´ıcula incidente en la dirección de propagación (Figura 3.4).

• Nucleo de la cascada es el centro de la distribución de carga, otra manera de definirla es la intersección del eje de la cascada a un nivel de observación. En la Figura 3.5, se muestra la distribución de cargas en 3D a un nivel de observación, en la Figura 3.5a, se muestra que existe un máximo, generalmente el núcleo, y decrece conforme se aleja de él, éste es un caso t´ıpico de una part´ıcula primaria de rayo γ, en la Figura 3.5b se presentan varios picos, es decir, mutinúcleos, éste es el caso de un CR como part´ıcula primaria [13].

• Plano de la cascadatiene la forma de un disco que presenta una ligera curvatura, como se muestra en la Figura 3.4. El espesor del disco se ensancha ligeramente si se aleja del n´ucleo de la cascada

3.3 Luz Cherenkov

Una pequeña fracción de pérdida de energ´ıa es emitida como radiación Cherenkov. La luz Cherenkov se emite cuando una part´ıcula se mueve en un medio con una velocidad,

v = βc, más grande que la velocidad de fase de la luz (ecuación 3.3). Esta emisión depende del ´ındice de refracción y el umbral de energ´ıa, Etr. Para el caso del aire este

umbral de energ´ıa es 21 M eV y para el agua es 1 M eV, ´este cambio se debe al valor del ´ındice de refracci´on en el medio (ηaire = 1.0003 y ηagua = 1.33) [33].

Etr =

moc2

p

1₋η2 (3.11)

(29)

3.3. LUZ CHERENKOV 19

(a) Gamma. (b) Prot´on.

Figura 3.5:Se muestran las distribuciones de densidad de part´ıculas. En (a) es un ejemplo t´ıpico

de un rayoγ como part´ıcula primaria, donde se genera un cono. En (b) se muestra un prot´on,

donde existen diversos conos de diferentes tama˜nos, lo cual indica la existencia de multin´ucleos.

Im´agenes obtenidas de [13].

La luz Cherenkov se emite en un cono alrededor de la trayectoria de la part´ıcula (Figura 3.6). El ´angulo de apertura del cono (θ), se expresa como:

cosθ = 1

βη +q (3.12)

donde q es el factor de corrección cuántico con poca importancia para nuestro caso. La máxima apertura se alcanza a altas energ´ıas cuandoβ = 1, para el caso del agua se tiene un ángulo de 41◦ y para el aire es 1◦, ésto da una ventaja a los detectores Cherenkov en agua, en inglés Water Cherenkov Detector(WCD) [33].

(30)

(a) Localizaci´on de HAWC, vista satelital. (b) WCD instalados actualmente.

Figura 3.7:En (a) se muestra la localizaci´on del observatorio de HAWC. En (b) se muestran

los WCD instalados. Im´agenes obtenidas de [15].

3.4 HAWC

El observatorio HAWC es un experimento que capta las EAS, entre un rango de energ´ıa de 100 GeV hasta 100 TeV. Se localiza dentro del parque nacional Pico de Orizaba a 4,097 msnm (equivalente a 625.6 mbar, 638 g/cm2) en una meseta entre el pico de Orizaba y el volcán Sierra Negra como se muestra en la Figura 3.7a. Su latitud es 18.99◦ y su longitud es 97.31◦ similar a muchos observatorios en México, Estados Unidos y el Sur de América, teniendo exposiciones diarias de fuentes como nebulosa del Cangrejo (NGC1952), Mkr 421 y 501. Actualmente, se encuentra bajo construcción (Figura 3.7b) [37].

HAWC aprovecha toda la experiencia en detección con la técnica de Cherenkov en agua del Observatorio MILAGRO, pero usando tecnolog´ıa actual. Las mejoras en el diseño permiten tener mayor área de detección y mayor altitud (de 2,650 msnm a 4,100 msnm), por lo que la sensibilidad se incrementa por un orden de magnitud, HAWC tiene un área de 22,000 m2 con 12,000m2 de superficie activa. Además puede realizar observaciones simultáneas con IceCube y VERITAS [11].

HAWC consiste en un arreglo de 300 WCD, cada uno con un tubo fotomultiplicador, en inglésPhotoMultiplier tube(PMT) de 1000 y 3 PMT’s de 800(ver las secciones 3.4.1 y 3.4.2), su desempeño se basa en el tiempo de arribo y amplitud de la señal de los 1,200 PMT’s, El tiempo de cada PMT en un evento se reconstruye la dirección de la part´ıcula primaria y con su señal se estima su energ´ıa [30].

En las dos siguientes secciones se describen las caracter´ısticas de los WCD y PMT, como sus dimensiones, materiales y las posiciones de los PMT’s en el WCD.

(31)

3.4. HAWC 21

3.4.1 Detectores Cherenkov en Agua (WCD)

El WCD es un tanque cil´ındrico galvanizado de láminas de acero corrugado de di´ ame-tro 7.3 m y altura de 5 m. En su interior se almacena la membrana plástica a la cual le llaman bladder1 (la Figura 3.8a), esta membrana contiene agua ultrapura e impide el paso de la luz, su altura es de 4.5 m para contener aproximadamente 188,000 litros de agua. En la Figura 3.8c se muestra el plano de las dimensiones del tanque e indica el nivel del agua, es decir, la altura del bladder y además la altura en la que se encuentran los PMT’s [14].

En el fondo del bladder se anclan los 4 PMT’s mirando hacia arriba para detectar los fotones cherenkov de cascadas de part´ıculas relativistas dentro del volumen del agua. Uno de los cuatro PMT’s es de alta eficiencia (Hamamatsu R7081 de 10” de diámetro) y es colocando en el centro del bladder. Los otros tres PMT’s son de baja eficiencia (Hamamatsu R5912 de 8” de diámetro), son reutilizados del Observatorio MILAGRO, y se localizan a 1.85 m del centro formando un triángulo entre ellos. En la Figura 3.8b se presenta una simulación de un muon (µ) que incidió en el WCD produciendo radiación Cherenkov en el agua, además se aprecia el cono de luz producido, debido al ´ındice de refracción en el agua es de 1.33 por lo que el ángulo de apertura es de 41◦. Ésto implica que por lo menos un PMT debe observar esta radiación [22, sección de tanques de agua Cherenkov].

3.4.2 Tubo Fotomultiplicador (PMT)

Un PMT es un dispositivo de detección de luz en el rango del ultravioleta, visible e infrarrojo que convierten los fotones en una señal eléctrica, Figura 3.9a. El principio básico de un PMT depende del efecto fotoeléctrico y de las emisiones secundarias, es decir, la luz (fotones) expulsa electrones del fotocátodo que se conecta a un alto voltaje negativo (del orden de 1500 V con respecto al ánodo), los electrones son acelerados y enfocados hasta el primer d´ınodo, con la ayuda de un campo eléctrico con electrodos adicionales, la superficie esta hecha de un material que emité un número de electro-nes cuando es golpeado por un electrón de alta energ´ıa, estos electrones secundarios son acelerados dentro de la superficie del segundo d´ınodo, Figura 3.9b. y produce más electrones, este proceso de aceleración y emisión de electrones se repite hasta el último d´ınodo, y el pulso amplificado o corriente es colectado en el ánodo. El ancho del pulso de salida es del orden de nanosegundos, permitiendo que un fotón pueda ser contado con una resolución en tiempo extremadamente alta [28].

Algunos inconvenientes al usar este tipo de dispositivos son:

• Las propiedades del fotocátodo determinan la sensbilidad del PMT, es decir, cuan-do los electrones liberacuan-dos por el cátodo cuando golpea un fotón, éste debe ser enfocado hacia el primer d´ınodo, el cual no siempre es capáz de caer en el cátodo por eso se reduce la eficiencia cuántica.

• La raz´on de se˜nal a ruido es reducida, si los d´ınodos tienen una inadecuada ga-nancia.

1

Se usar´a este nombre para refererirnos a la membrana pl´astica que contiene el agua ultra pura dentro de cada WCD

(32)

(a) Bladder. (b) Localizaci´on de los PMT’s en el blad-der.

(c) Diagrama del WCD.

Figura 3.8: Se muestran los elementos de un WCD (bladder (a) y los PMT’s (b)), as´ı como

su localización, además en (b) se muestra una simulación de un muon cuando interactúan con

elWCD. En (c) se observa las dimensiones f´ısicas del tanque, blader y posici´on de cada

PMT. Im´agenes obtenidas de [14]

Para almacenar estos pulsos, en HAWC, se utiliza el convertidor de tiempo a palabra digital, en inglésTime to Digital Converter(TDC). Primero, se tienen que convertir los pulsos de corriente a voltaje, después con el TDC se convierte a una señal cuadrada, el ancho de cada pulso depende de los umbrales que cruzó (Figura 3.10, donde se muestra dos señales t´ıpicas de la salida de un PMT). Hay dos umbrales: el primero a 0.25 foto-electron, en inglésPhotoElectron(PE)’s (es un ajuste para que el ruido no se considere en la detección del PMT) y el segundo a 4 PE’s (para considerar valores altos en energ´ıa manifestada en el PMT). Con la onda cuadrada digitalizada se reconstruye la carga de-positada en el PMT, el método es conocido como tiempo por encima del umbral, en inglés Time Over Threshold (TOT), donde se utiliza la diferencia de trancisión y los filos de subida y bajada del pulso. Un pulso corto consiste en “2-filos” porque cruza un solo umbral, 0.25 PE’s, dos veces, mientras un pulso largo tiene “4-filos” por que cruza dos umbrales, 0.25 PE’s y 4 PE’s, dos veces, como se muestra en la Figura 3.10 [9].

(33)

3.5. CORSIKA 23

(a) Vista real. (b) Descripci´on de los elementos del PMT.

Figura 3.9:Se muestra un PMT. En (a) se observan varios PMT en su estado f´ısico. En (b) se

muestran los elementos que contiene el PMT para la detecci´on de la luz.

3.5 Corsika

COsmic Ray SImulation KAscade (CORSIKA) es un programa para la simulación detallada de las EAS inicializada por part´ıculas muy energéticas como protones, núcleos ligeros hasta pesados, fotones y part´ıculas que pueden ser tratadas como primarias. Se simula el paso de las part´ıculas a través de la atmósfera y sus colisiones con los núcleos de aire que producen otras part´ıculas mendiante decaimientos o procesos radiactivos. La inteacción a altas energ´ıas, del orden de TeV, puede ser descrita por diversos modelos alternativos como VENUS, QGSJET y DPMJET basados en la teor´ıa de Gribov-Regge y las interacciones a bajas energ´ıas, del orden de GeV, son descritos por rutinas de interacción como GHEISHA, FLUKA o UrQMD [16].

Se definen algunas especificaciones en el momento de la instalación, como es el caso de selecionar el modelo de interacción, pero muchas otras se especifican en un archivo de texto de entrada donde los parámetros más sobresalientes son el número de corrida, número de cascadas a simular, el tipo de part´ıcula primaria, el rango de energ´ıas, el ´ındice espectral, el rango de los ángulos θ y φ, nivel de observación, entre otras cosas. Su salida es una base de datos de todas las cascadas simuladas. En la Figura 3.11 se muestra el resultado de simular tres part´ıculas primaria (fotón, protón y núcleo de hierro), estas simulaciones comienzan desde su primera interacción con la atmósfera generando part´ıculas secundarias y estas cuando van viajando a través de la atmósfera siguen produciendo más part´ıculas hasta llegar al nivel de energ´ıa m´ınimo para continuar produciendo part´ıculas.[16]

3.6 AERIE

Analysis and Event Reconstructor Integrated Environment (AERIE), es una plata-forma que cuenta con un conjunto de clases para procesar, trabajar y manejar los datos en HAWC, por ejemplo las simulaciones y la generaci´on de mapas utilizando los datos

(34)

Figura 3.10: Conversi´on del pulso de salida de un PMT a una se˜nal cuadada, mediante dos umbrales, del lado izquierdo se muestra un pulso corto (2-filos) y del lado derecho un pulso largo (4-filos).

(a) Fotón. (b) Protón. (c) Núcleo de Hierro.

Figura 3.11:Simulaciones de las EAS con diferentes part´ıculas primarias a trav´es de la atm´ osfe-ra.

reales, las herramientas b´asicas para la simulaci´on de eventos y el manejo de sus archivos de salida de HAWCSim, HAWCSim-reco y Offline-reconstructor.

(35)

3.6. AERIE 25

3.6.1 XCDF

El formato de datos expl´ıcitamente compactado, en ingléseXplicitly-Compacted Data Format (XCDF), es un formato de datos binarios diseñado para guardar los campos con una exactitud espec´ıfica definida por el usuario. Utiliza un empaquetamiento de bit para almacenar los campos con una precisión dada, para el conjunto de valores dados y proporciona una compresión sustancial.

El empaquetamiento de bit es el proceso de compresi´on de datos para reducir el n´umero de bits necesarios para representar los valores de los datos, es decir, empaqueta estos bits en serie por cada dato, ignorando el l´ımite de la palabra digital.

Los archivos XCDF almacenan un conjunto de campos que tienen un ´ındice en común, cada ´ındice se refiere a un evento, cada campo tiene: un nombre, una resolución y el tipo de la variable (enteros positivos, enteros o puntos flotantes). Los datos son escritos dentro de cada campo y los eventos son escritos en el archivo [15, sección de Explicitly Compacted Data Format].

El manejo de estos archivos se realiza mediante algunos comandos. A continuaci´on se describen los m´as utilizados:

• xcdf-utility info $Nom Arch Despliega la informaci´on de los campos del ar-chivo de entrada ($Nom Arch).

• xcdf-utility count $Nom Arch(s) Retorna el valor del n´umero de eventos en el o los archivos ($Nom Arch(s)).

• xcdf-utility select “Expresion Boleana” $Nom Arch(s)Selecciona los even-tos que cumplan las condiciones de la expresion boleana. El nombre del archivo de salida, es opcional, colocando “-o $Nom Salida.xcd”.

• xcdf-utility dump “Campos” $Nom Arch(s)Muestra los valores de los cam-pos indicados del archivo “$Nom Salida.xcd”.

• xcdf-root -- input $Nom Arch(s).xcd - o $Arch salida.rootConvierte un archivo XCDF a un archivo ROOT.

3.6.2 HAWCSim

HAWCSim es una aplicación de GEANT-4 para la simulación en Monte Carlo del arreglo de HAWC. Éste toma la información de las part´ıculas generadas en Corsika y simula los eventos hasta el punto de producir PE’s en el PMT (la colección de PE’s por el fotocátodo no es simulado en este punto de la cadena). Es capáz de producir dos tipos de salida: un archivo ASCII con el formato especifico de MILAGRO o una lista de PE’s y las part´ıculas que interactúan con el WCD almacenando en un archivo XCDF.

Actualmente, el formato ASCII es obsoleto por lo tanto se utiliza el formato XCDF. Para ejecutar HAWCSim es necesario indicar 8 archivos de configuraci´on:

(36)

centro de HAWC, adem´as se coloca un identificador a cada PMT y WCD.

• ChannelStatus.xml. Se define el estado de los PMT’s colocados en el archivo

Survey.xml, es decir, si estan activados o desactivados. Este archivo es ´util si se requiere simular solo una parte del observatorio.

• Materials. Se define las propiedades f´ısicas de los materiales que son utilizados. Los archivos XML, Survey.xml y ChannelStatus.xml, necesitan de tres archivos de esquema XML, en ingl´esXML schema files (XCD) que son DetectorLayout.xsd,

HAWCStatusMap.xsdy HAWCSchemaTypes.xsd.

Antes de ejecutar este programa, se declara la variable “HAWCSIM CONFIG” asig-nandole la ruta del directorio donde se localizan los archivos de configuraci´on. Con el comando “./hawcsim-exe -h” se despliega la ayuda del programa, Figura 3.12, donde se muestran los argumentos de entrada del programa, los m´as importantes son:

• -i $ARGdonde $ARG es la direcci´on y nombre del archivo de entrada (salida de Corsika, DAT####).

• -- itype $ARGdonde $ARG es el formato del archivo de entrada: ascii o corsika. • -o $ARGdonde $ARG es la direcci´on y nombre del archivo de salida.

• -- otype $ARGdonde $ARG es el formato del archivo de salida: xcdf o ascii. La siguiente instrucci´on es un ejemplo de como se ejecuta el comando:

./hawcsim-exe --input ./DAT000001 --itype corsika --output ./hawcsim dat000001.xcd --otype xcdf --seed 128129479

3.6.3 HAWCSim-reco

HAWCSim-reco es un programa que simula la colección de PE’s, el Sistema de adqui-sición de datos, en inglésData Acquisition System (DAQ), la reconstrucción del núcleo y el ángulo de arribo de los eventos. Toda esta información se almacenada en un archivo ROOT (ver apéndice C), para generar esta salida es necesario colocar 6 archivos de configuración, que son:

• Survey.xml. Es el mismo archivo de configuraci´on que utiliza el programa HAWC-Sim (ver secci´on 3.6.2).

(37)

3.6. AERIE 27

(38)

argumentos necesarios para su ejecuci´on son:

• -- input $ARGdonde $ARG es la direcci´on y el nombre del archivo de entrada (salida de HAWCSim).

• - o $ARG$ARG es la direcci´on y nombre del archivo de salida, algunas variables se describen en el ap´endice C.

• - C $ARGdonde $ARG es la direcci´on y el nombre del archivopeCurves.dat. • - s $ARGdonde $ARG es la direcci´on y el nombre del archivoSurvey.xml

• - t $ARG donde $ARG es la direcci´on y el nombre del archivo ChannelSta-tus.xml

La siguiente intrucci´on es un ejemplo de como utilizar el programa:

./aerieappshawcsimreco input ./hawcsim dat000001.xcd o ./hawcsimreco dat000001.root -C ./config/pe-Curves.dat -s ./config/Survey.xml -r ./config/-ChannelStatus.xml

3.6.4 Offline-reconstructor

Offline-reconstructor es un programa que realiza la reconstrucción de los eventos que son detectados por HAWC. La entrada es el archivo “TRIG File”, que es un archivo en formato XCDF producido por el sistema de DAQ/Online que contiene los eventos detectados por el observatorio. La información que almacena este archivo son: los identi-ficadores de cada evento, el número de part´ıculas que detectó, los pulsos cortos (2-filos) y largos (4-filos) y el identificador del PMT que las detectó (en el apéndice C se reporta las variables del archivo).

Existe dos tipos de salida:

1. El archivo “REC FILE” que es un archivo en formato XCDF y contiene un resu-men del proceso de reconstrucción. Este archivo es usado para un análisis f´ısico, como ejemplo la obtención de mapas.

2. El archivo “Full Hits File” es un archivo en formato ROOT y contiene la informa-ción de varios pasos en la reconstrucción, como del núcleo y el plano de la cascada, además la carga de cada PMT y el tiempo en que se detectó.

(39)

3.6. AERIE 29

(40)

la instrucción “./offline-reconstructor -h” se despliega la ayuda del programa, Figura 3.14, en esta Figura se muestra los parámetros del programa, los más importantes se enumeran a continuación:

• -- input $ARG donde $ARG es la direcci´on y salida del archivo de entrada (TRIG FILE).

• - o $ARGdonde $ARG es la direcci´on y salida del archivo de salida. El formato depende de la informaci´on que se desea, como predefinido se generan archivos

REC FILE.

• -- r. Se coloca esta opci´on si se requiere el archivo Full Hits File.

• -- g. Se coloca esta opción si se requiere que utilice en la reconstrucción del núcleo el método Gauss. La opción predefinida es el método NKG.

Las siguientes instrucciones son ejemplos de la manera de ejecutar el programa.

• Para obtener un archivo ROOT, es decir, el archivo FULL HIT FILE y utilizando el método Gauss en la reconstrucción del núcleo:

./offline-reconstructor -- g -- r -o ./rectrig 000001.root --input ./trig 0001.xcd

• Usando los valores predefinidos, es decir, el archivo de salida en formato XCDF (REC FILE) y el uso del método NKG para la reconstrucción del núcleo

./offline-reconstructor -o ./rectrig 000001.xcd --input ./trig 0001.xcd

3.7 Redes Neuronales (NN’s)

Las redes neuronales son modelos matem´aticos basados en sistemas neuronales biol´ ogi-cos, desde una perspectiva matem´atica, una red neuronal es simplemente un mapeo de

Rn _→ _Rm _donde _Rn _{son las variables de entrada de la red y} _Rm _{es la dimensi´}_{on de}

salida de la red [6]. Una NN no se programa, ella aprende por ejemplos, dicho de otra forma, se le especifica la salida de cada entrada que fue introducida, para que la red identifique las diferencias de los grupos de entrada para su clasificación. Antes de seguir definiendo a una NN se explica los sistemas neuronales biológicos con el fin de enten-der su paralelismo, as´ı sera más facil entender el modelo de una neurona para llegar a describir a una red.

(41)

3.7. REDES NEURONALES (NN’S) 31

(42)

Figura 3.15:Estrucura de una neurona biol´ogica t´ıpica: dendritas (obtenci´on de las entradas),

soma (procesamiento de las entradas y la generación de una salida) y axión (env´ıa la información

de salida). Imagen obtenida de [31].

3.7.1 Modelos neuronales biol´ogicos

El cient´ıfico aragonés Santiago Ramón y Cajal establece que el sistema nervioso esta compuesto por cien mil millones de neuronas interconectadas entre s´ı. La comunicación entre neuronas se realiza a través de la sinapsis. En la sinapsis más común no existe contacto f´ısico pero la distancia entre neuronas es del orden de 0.2 micras. La comu-nicación es direccional, dicho de otra manera, las sinapsis solo envián información en una sola dirección. Las neuronas que envian las señales son llamadas presinápticas y las neuronas que reciben la información postsinápticas. Hay tres tipos de neuronas: inter-neuronas (comunicación neurona-neurona), motoras (comunicación neurona-musculo) y receptoras o sensoras (comunicación exterior-neurona) [31].

El flujo de información se divide en tres bloques: entrada de información, procesa-miento y salida, las dendritas se encargan de la recepción de información, la soma de procesar la información y el axón de enviar una salida (Figura 3.15) [31].

Un sistema neuronal biológico está constituido por diversos conjuntos, estos conjuntos están compuestos por miles de neuronas y una neurona es el elemento básico. La misma jerárquia se cumple para las redes neuronales artificiales, se tiene como elemento básico la neurona artificial, un conjunto de ellas le llamamos capas, al conjunto de capas le llamamos red neuronal artificial, un grupo de redes neuronales con sus interfases de entradas y salidas construyen un sistema global (Figura 3.16) [31].

3.7.2 Modelo est´andar de la neurona

Una neurona artificial es una unidad elemental encargada de procesar un n´umero de entradas y producir una salida, ´esta consiste en tres elementos, Figura 3.17.

• Entradas. Es un conjunto de entradasxj(t) (enviadas de las neuronas presin´

apti-cas o una se˜nal externa), y sus pesos sin´apticos,wij2.

(43)

3.7. REDES NEURONALES (NN’S) 33

Figura 3.16: Estrutura jer´arquica de un sistema basado en redes neuronales. Un conjunto de

neuronas forman una capa, muchas capas conforman una red y una red m´as las interfases de

entrada-salida forman un sistema neuronal. Imagen obtenida de [31].

• Regla de propagaci´on. A partir de las entradas se obtiene un valor hi

jun-tando los valores de las neuronas postsin´apticas, hi = σi(wij, xj(t)). El

proce-so m´as com´un es en una suma ponderada de la entrada y sus pesos, es decir,

hi = Pj wij xj(t).

• Funci´on de transferencia. Se aplica una funci´on de transferencia al valorhi, que

es la salida de la neurona artificial (yi(t) =fi(hi(t))). Existen diferentes funciones

de transferencia, las m´as habituales son las mostradas en la Figura 3.18.

3.7.3 Arquitectura de la red neuronal

Una NN tiene tres capas: entrada, oculta y salida. En la capa de entrada o sensorial, se definen la misma cantidad de neuronas como caracter´ısticas. En la capa de salida, la cantidad de neuronas declaradas depende de la configuración de salida (por ejemplo activar o desactivar uno o varios equipos). En la capa oculta, las capas no tienen comu-nicación con el medio exterior, solo procesan la información de la capa de entrada a la de salida, Figura 3.19.

3.7.4 M´etodos de aprendizaje

La manera de educar a una NN depende del tipo de aprendizaje que se utiliza, por la forma del aprendizaje se puede dividir en 4 grupos que son:

• Supervisado. Se pretende estimar una funci´on desconocida f : Rn _→ Rm pro-porcionando ejemplos (x, y), para todo x _∈ Rn _{(entradas), y} _y _∈ _Rm _(salidas).

En cada ejemplo se calcula el error en la operación E[W], es decir, que tanto se aproximó o se alejó del valor de salida real. Dependiendo E[W] sera el aumento o disminución del valor de los pesos sipnáticos, dicho de otra forma, se presentan ejemplos a la entrada de la red y se espec´ıfica el valor de su salida si este valor es igual a la respuesta de la red, no se modifican los pesos, pero si es diferente, son modificados.

(44)

Figura 3.17: Modelo de una neurona est´andar, donde las entradas xj se multiplican con sus

pesos wij, despues son sumadas y pasan por una funci´on de transferencia para generar una

salida (yi). Imagen obtenida de [31].

(45)

3.8. ROOT 35

Figura 3.19:Arquitectura de la red, formada por tres capas: entrada(sensorial), oculta

(proce-samiento) y salida. Imagen obtenida de [31].

• No supervisado o autoorganizado. Es una estimación de la función de densi-dad de probabilidap(x) que describe la distribución de patronesxpertenecientes al espacio de entrada,Rn_{, es decir, va generando grupos dependiendo de la}

infor-maci´on de entrada

• H´ıbrido. Es la utilizaci´on del aprendizaje supervisado y el no supervisado. • Reforzado. Se ubica entre el aprendizaje supervizado y el no supervisado. Ya

que en el supervisado se indica la clase de cada ejemplo que se introduce, en comparación con el método reforzado que existe un parámetro donde indica lo bien o mal que funciona.

En la Figura 3.20 se muestra una clasificación de redes neuronales dependiendo del método de aprendizaje, y hablando de los supervisados y no supervisados, existe otra subdivision dependiendo si son realimentados o unidireccionales. La elección de una red neuronal depende del tipo de aplicación que se usará, por lo general las redes unidirec-cionales se utilizan para ser clasificadores, para la reconstrucción de una imagen dañada, un archivo, entre otras cosas se usan las redes unidireccionales.

3.8 ROOT

ROOT es un infraestructura orientada a objetos para el procesamiento de datos, hecho en CERN. Un archivo ROOT es capáz de guardar etiquetas (pueden ser utilizadas para colocar los detalles la información almacenada), histogramas, clases árbol o TTree3, entre otras cosas. La clase TTree contienen ramas o TBranch4, donde se especifican el nombre y tipo de variable (caracter, entero, entero positivo, flotante o doble flotante)

3

As´ı son llamados en ROOT y de aqui en adelante se utilizar´a este nombre 4_{As´ı son llamados en ROOT y de aqui en adelante se utilizar´}_{a este nombre}

(46)

Figura 3.20: Clasificaci´on de las redes neuronales dependiendo del m´etodo de aprendizaje. En

el caso de los m´etodos supervisados y no supervisados existen una subclasificaci´on que depende

de la direcci´on del flujo de informaci´on: realimentado o unidireccional. Imagen obtenida de [31].

de cada evento. Por analog´ıa se puede comparar a losTBranchcon objetos, a losTTree

como cajas y a los archivos ROOT con un almacen, los objetos se guardan en cajas y estas cajas se guardan en un almacén. Es por eso que se crea un archivo ROOT que puede contener de una a variasTTree, en cada TTree se coloca unaTBranch por cada variable o parámetro a almacenar. A continuación se describen algunos procesos que se pueden realizar [35].

• Almacenamiento. Es posible colocar diferentes datos de información en un ar-chivo ROOT, además la creación de imagenes o archivos PDF de la información procesada.

• Accesar.La facilidad de consultar la informaci´on en los archivos ROOT.

• Procesamiento.Las herramientas matem´aticas y estad´ısticas para el apoyo en el manejo de los datos.

• Desplegar resultados.Los datos de las variables del archivo ROOT pueden ser desplegadas en histogramas, gr´aficas, ajustar funciones, etc´etera.

• Aplicación interactiva. La utilización del interprete de CINT C++ o Python para la generación de códigos para la obtención de datos, procesamiento y salida de información. Estos códigos pueden ser compilados para crear un ejecutable y disminuir el tiempo de cómputo.

Una de las tantas herramientas que dispone ROOT es una clase para la red neuronal MLP descrita a continuaci´on.

(47)

3.8. ROOT 37

3.8.1 Biblioteca Perceptr´on multicapa (MLP)

En ROOT, existe una biblioteca que contiene una clase con la implementaci´on de una red MLP (TMultiLayerPerceptron) (Figura 3.21a). La funci´on de transferencia en las neuronas de entrada y salida son lineales, en cambio las funciones de las neuronas de la capa oculta son sigmoidea.

σ(x) = 1

1 +e−_x (3.13)

Para llegar a que una NN indique el tipo de salida dependiendo de los valores de entra-da, ésta necesita pasar por una etapa de entrenamiento y de verificación. A continuación se enumeran los pasos básicos para aplicar una red MLP en ROOT.

1. Se crea unTTreeque contenga en susTBranchel valor de las variables de entrada y salida.

2. Se declara un objeto, definiendo su estructua, mediante el siguiente comando:

T M ultilayerP erceptron(”$Entradas: $CapOcu: $Salidas”,$N om T T ree)

Donde las neuronas de entradas ($Entradas) son los nombres de las TBranch

que contiene los valores de las variables de entrada, cada una separada por una coma. En la capa oculta ($CapOcu) se describe el número de neuronas por cada capa, cada capa se separa por dos puntos (:). Por último, en la capa de salida (Salidas) se escriben los nombres de las TBranchque contienen los valores de las variables de salida, cada una separada por comas. Si en las neuronas de entrada se coloca un @ indica que se normaliza. La siguiente instrucción es un ejemplo de la declaración de la red y especificación de su estructura (3,2,3) con tres neuronas en la capa de entrada cada una normalizada, 2 neuronas en la capa oculta y tres neuronas en la etapa de salida (Figura 3.21a).

TMultiLayerPerceptron *mlp =

new TMultiLayerPerceptron(“@P1,@P2,@P3:2:S1,S2,S3”,simu)

3. Para seleccionar el método de aprendizaje de la red se usa la función miem-bro “TMultiLayerPerceptron::SetLearningMethod()”, se env´ıa como argumento el nombre del método de aprendizaje (TMultiLayerPerceptron::kStochastic, TMul-tiLayerPerceptron::kBatch, TMultiLayerPerceptron::kBFGS, entre otras). La ma-yor´ıa de estos métodos se basan en introducir un ejemplo o un grupo de ejemplos, obtener el valor de error y dependiendo de este valor se modifican los pesos, como se observa en la Figura 3.21b.

4. Para indicar que comienze el proceso de aprendizaje, se usa la función miembro TMultiLayerPerceptron::Train(), donde se env´ıan en los argumentos: el número de ciclos, indicando si se desea la curva de evolución (opcional), cada cuantos ciclos imprime el valor de evolución (sólo si se define que tenga la curva de evolución). La siguiente instrucción es un ejemplo del uso de esta función indicando el número máximo de ciclos igual a 200 y cada 10 ciclos imprimirá el valor de aprendizaje en la curva de evolución y se obtiene un archivo de texto con estos valores.