Aplicaci´on de redes neuronales para la
separaci´on de gammas y hadrones en
HAWC
Por
Tom´as Capistr´an Rojas
Ing. en Comunicaciones y Electr´onica
Presentado como requisito parcial para la obtenci´on del grado de:
MAESTRO EN CIENCIAS CON
ESPECIALIDAD EN ASTROF´ISICA
en el
Instituto Nacional de Astrof´ısica ´Optica y Electr´onica
Julio 2014 Tonantzintla, Puebla
Supervisada por:
Dr. Ibrahim Torres Aguilar, INAOE.
Dr. Leopoldo Altamirano Robles, INAOE.
c
INAOE 2014
El autor otorga al INAOE el permiso de reproducir copias totales o parciales de esta tesis.
Agradecimientos
“La inteligencia m´as car´acter es el objetivo de una verdadera eduaci´on”
Martin Luther King.
Quiero agradecer a mi familia, maestros y doctores por las ense˜nanzas que me han brindado, pero dando un especial reconocimiento a los Dres. Ibrahim Torres y Leopoldo Altamirano por su gran labor como directores de esta tesis. En el transcurso brindando consejos de como mejorar el trabajo y la organizaci´on de la misma, pero que tambi´enson aplicados en la vida personal.
A la colaboraci´on de HAWC por el gran trabajo en el desarrollo del experimento y el trabajo que han realizado para el procesamiento de datos.
Al Conacyt por la beca-cr´edito, con el n´umero de registro de CVU 48075, que me otorg´o para la realizaci´on durante el periodo de maestr´ıa.
Al Instituto Nacional de Astrof´ısica, ´Optica y Electr´onica por abrir sus puertas para que pudiera realizar la maestr´ıa.
Resumen
El observatorio de gran altura Cherenkov en agua (HAWC, por sus siglas en ingl´es) es un observatorio de rayos gammas ubicado a una altitud de 4,100 metros sobre el nivel del mar, en las faldas del volc´an Sierra Negra en el estado de Puebla, M´exico. Dise˜nado para detectar cascadas producidas por rayos gammas de energ´ıas entre 100 GeV y 100 TeV. Al finalizar su construcci´on tendr´a 300 detectores Cherenkov de agua (WCD, por sus siglas en ingl´es), adem´as, cada WCD tiene uno tubo fotomultiplicador (PMT, por sus siglas en ingl´es) de 10 pulgadas y 3 PMT’s de 8 pulgadas. Por el tipo de detecci´on, tambi´en es capaz de detectar las cascadas generadas por rayos c´osmicos; debido a que estos ´ultimos no se desean detectar para el estudio de fuentes de rayos gammas, es por eso la importancia de la implementaci´on de m´etodos de separaci´on de part´ıculas primarias.
Actualmente, HAWC cuenta un m´etodo de separaci´on de part´ıculas, heredado por su antecesor MILAGRO, llamado “Compactness”, el cual fue elaborado de forma emp´ırica, donde la identificaci´on de cada part´ıcula depende del valor calculado del Compactness
y del valor de separaci´on que depende del n´umero de PMT’s con se˜nal en el evento (nHit), si el valor de Compactness es mayor a es clasificado como un evento tipo gamma, si no es un hadr´on; por lo cual en este trabajo se desarroll´o un nuevo m´etodo, donde se aplic´o una red neuronal multicapa perceptr´on capaz de identificar las cascadas producidas por las part´ıculas siempre y cuando nHit sea mayor a 30, aplicando un solo valor de separaci´on.
De los eventos generados de las simulaciones del experimento HAWC, se tom´o un conjunto para el entrenamiento de la red y otro grupo para la verificaci´on, donde de cada evento se extraen 5 caracter´ısticas para la entrada, dependiendo del contenido de cada caracter´ıstica, la red proporciona un valor de salida a la cual se pregunta si es mayor o igual al valor de separaci´onpara definir el tipo de part´ıcula: gamma o hadr´on.
Para comparar los m´etodos se utilizaron dos par´ametros, factor Q y curvas ROC que indican el nivel de confianza del m´etodo empleado en la separaci´on de gamma/hadr´on, es decir, se observa el comportamiento de la se˜nal y el ruido en cada m´etodo. Por ´
ultimo se emplearon los datos tomados del observatorio para localizar a la nebulosa del Cangrejo, NGC1952 y se gener´o su mapa de significancia.
Cuando es 0.96, el factor Q se increment´o aproximadamente un 36 % con respecto al m´etodo , debido a que el m´etodo desarrollado tuv´o un incremento en la clasificaci´on de gammas de aproximadamente un 13 % y un decremento del 30 % en la mala clasifica-ci´on de protones. Cuando ambos m´etodos de separaci´on se introducen los datos reales,
raci´on de las part´ıculas aplicando redes neuronales.
• En el cap´ıtulo 3 se aborda la informaci´on te´orica de los procesos f´ısicos de las cascadas atmosf´ericas extendidas, as´ı como el funcionamiento del Observatorio HAWC y las herramientas utilizadas para obtener los datos simulados y datos reales. Adem´as se explica la t´eoria de las redes neuronales y la implementaci´on de una biblioteca en ROOT, continuando con la explicaci´on del m´etodo utilizado en HAWC y finalizando el cap´ıtulo con la explicaci´on de los par´ametros para la comparaci´on de los m´etodos.
• En el cap´ıtulo 4 se explica la selecci´on de los eventos y su extracci´on de carac-ter´ısticas para el entrenamiento, verificaci´on y us´o de la red. Despu´es se describe la manera de como obtener los mapas de la fuente con ambos m´etodos.
• En el cap´ıtulo 5 se presentan los resultados obtenidos en la red y se compara con el m´etodo utilizado actualmente en HAWC. Se muestran los mapas de la nebulosa del Cangrejo que se generaron con ambos m´etodos.
• En el cap´ıtulo 6 se concluye con los resultados y las mejoras que se obtuv´o con el m´etodo desarrollado en la tesis.
´
Indice general
Resumen v
1 Introducci´on 1
1.1 Antecedentes . . . 1
1.2 Planteamiento del problema . . . 3
1.3 Justificaci´on . . . 4
1.4 Objetivo general . . . 4
1.5 Objetivos particulares . . . 4
2 Estado del Arte 5 2.1 ARGO-YBJ . . . 5
2.2 MAGIC . . . 7
2.3 HESS . . . 10
3 Marco Te´orico 13 3.1 Part´ıculas primarias . . . 13
3.1.1 Rayos gamma . . . 13
3.1.2 Rayos c´osmicos . . . 14
3.2 Cascadas Atmosf´erica Extendidas . . . 15
3.2.1 Cascadas Electromagn´eticas . . . 15
3.2.2 Cascadas Hadr´onicas . . . 16
3.2.3 Caracter´ısticas en ambas cascadas . . . 17
3.3 Luz Cherenkov . . . 18
3.4 HAWC . . . 20
3.4.1 Detectores Cherenkov en Agua (WCD) . . . 21
3.4.2 Tubo Fotomultiplicador (PMT) . . . 21
3.5 Corsika . . . 23
3.6 AERIE . . . 23
3.6.1 XCDF . . . 25
3.6.2 HAWCSim . . . 25
3.6.3 HAWCSim-reco . . . 26
3.6.4 Offline-reconstructor . . . 28
3.7 Redes Neuronales (NN’s) . . . 30
3.7.1 Modelos neuronales biol´ogicos . . . 32
3.7.2 Modelo est´andar de la neurona . . . 32
3.7.3 Arquitectura de la red neuronal . . . 33
3.7.4 M´etodos de aprendizaje . . . 33
3.8 ROOT . . . 35
4.2 Selecci´on de eventos . . . 52
4.2.1 Simulaciones . . . 52
4.2.2 Datos reales . . . 55
4.3 Obtenci´on de caracter´ısticas . . . 57
4.3.1 Simulaciones . . . 57
4.3.2 Datos reales . . . 60
4.4 Entrenamiento de la Red . . . 60
4.5 Funcionamiento de la Red . . . 62
4.5.1 Simulaciones . . . 62
4.5.2 Datos reales . . . 63
5 Resultados y An´alisis 71 5.1 Entrenamiento de la red . . . 71
5.2 Comparaci´on en las simulaciones . . . 74
5.2.1 Comportamiento con todos los datos . . . 74
5.2.2 Comportamiento entre los intervalos . . . 76
5.3 Comparaci´on en datos reales . . . 78
5.3.1 Significancia m´axima . . . 79
6 Conclusiones y Trabajo Futuro 83 6.1 Trabajo Futuro . . . 84
Ap´endice 85 A Modelo est´andar 87 B Variables de salida de HAWCSim-reco 89 C Variables de TRIG 91 D Variables de salida de Offline-reconstructor 93 D.1 XCDF . . . 93
D.2 ROOT . . . 94
´Indice de figuras 97 ´Indice de tablas 103
´INDICE GENERAL ix
Cap´ıtulo 1
Introducci´
on
“El verdadero conocimiento est´a escrito en un enorme libro abierto continuamente ante nuestros ojos, me refiero al Universo, . . . ”
Galileo Galilei.
1.1
Antecedentes
El avance tecnol´ogico del siglo XX abri´o las puertas a los astr´onomos a observar en otras longitudes de onda; como es el caso de las observaciones en altas energ´ıas. Estas observaciones comenzaron desde el tiempo de Henry Coulomb quien not´o que una esfera cargada suspendida sobre un hilo de seda gradualmente perd´ıa su carga el´ectrica. Este fen´omeno fue relacionado con la ionizaci´on en el aire por C.T.R Wilson. Despu´es del descubrimiento de la radioactividad, se pens´o que la ionizaci´on es debida a materiales en la Tierra, si ´esto es verdad, debe decrementar conforme se aumente su altitud. En los experimentos de T. Wulf y A. Gockel, utilizando un espectroscopio a diferentes altitudes, observaron que la ionizaci´on decrementaba con respecto a la altitud, pero su disminuci´on fue m´as peque˜na de lo que esperaban. En 1912, Victor Hess lleg´o a la conclusi´on que la ionizaci´on es de origen extraterrestre. Hoy se sabe que esta radiaci´on no solo es extraterrrestre sino tambi´en extra solar llamada radiaci´on c´osmica por Millikan en 1925. Adem´as el campo magn´etico de la Tierra influye en las mediciones ya que incrementa conforme se aumenta la latitud [27].
La radiaci´on c´osmica tiene dos componentes: La componente “ primaria” inicia cuan-do una part´ıcula colisiona con los n´ucleos de aire de la atm´osfera (Nitr´ogeno, Ox´ıgeno, entre otras) y producen un gran n´umero de piones, kaones, etc´etera, esta part´ıcula que colisiona es llamada part´ıcula primaria (En la Figura 1.1 se muestra un ejemplo de un prot´on como part´ıcula primaria, despu´es de su colisi´on produce piones). La componente “secundaria” son todas las part´ıculas producidas despu´es de la primera colisi´on como son los piones, kaones, ´estos siguen cayendo e interaccionan con otros n´ucleos de ai-re y producen otras part´ıculas. Todo este proceso es llamado “Cascadas atmosf´ericas extendidas, en ingl´es Extensive Air Showers (EAS)”. Hay dos tipos de cascadas: elec-tromagn´eticas y hadr´onicas, en la primera la part´ıcula primaria es un rayo gamma (γ) y en la segunda es un rayo c´osmico, en ingl´esCosmic Ray (CR) [27].
Orellana [24] menciona que por cada segundo penetran a la atm´osfera 10,000 part´ıcu-las por metro cuadrado, donde el 90 % de ´estas son protones, tan solo un 9 % de
Figura 1.1: Interacci´on de un prot´on con la atmosf´era, produciendo algunos piones. Imagen obtenida de [24].
Figura 1.2:Una posible trayectoria de un rayo c´osmico desde la fuente hasta la Tierra. Imagen modificada de [24].
las alfa y el resto son n´ucleos m´as pesados que el hidr´ogeno (como los n´ucleos de carb´on, ox´ıgeno, hierro, calcio, entre otros). Cuando ´estas son sometidas a un campo magn´etico, ya sea de la Tierra o dentro de la galaxia, su trayectoria cambia (como se muestra en la Figura 1.2), lo que impide conocer su direcci´on de origen. Por otro lado, aunque con un porcentaje muy peque˜no, los rayos γ son part´ıculas que no cambian su direcci´on al interaccionar con cualquier tipo de campo magn´etico, por ende indican su origen.
Actualmente, existen diferentes observatorios que detectan las EAS, en particular se menciona el caso del Observatorio de Gran Altura Cherenkov en Agua, en ingl´es
High-Altitude Water Cherenkov (HAWC), ´este detecta part´ıculas primarias dentro de un rango de 100 GeV hasta 100 TeV. Por su t´ecnica de detecci´on, es capaz de percibir las cascadas con part´ıculas primarias de rayos γ y CR’s, pero no diferenciarlas. Es por eso que se emplean algoritmos especiales que procesan la informaci´on e indican el tipo de part´ıcula a la que pertenecen. Una vez seleccionadas las cascadas electromagn´eticas, se
1.2. PLANTEAMIENTO DEL PROBLEMA 3
pueden realizar mapas del cielo para conocer la fuente de donde proviene. Se piensa que las fuentes productoras de eventos de rayos γ son las remanentes de supernova (SNR, por sus siglas en ingl´es), y los n´ucleos activos de galaxias (AGN, por sus siglas en ingl´es). Por ejemplo las fuentes MGROJ1908+06 y MGROJ2019+17 que fueron detectadas por el observatorio MILAGRO, que es una generaci´on anterior al observatorio HAWC [39].
1.2
Planteamiento del problema
Actualmente, en el campo de altas energ´ıas del espectro electromagn´etico, se estudia la naturaleza fundamental de la materia y energ´ıa. Afortunadamente, existen diversas interrogantes como por ejemplo ¿c´omo est´a compuesto nuestro universo? ¿C´omo se producen las part´ıculas de muy alta energ´ıa? ¿De d´onde provienen?, entre otras, debido a esto, se construyen observatorios como HAWC [19], Pierre Auger [34], HESS [17], MAGIC [23] y VERITAS [36], con los datos observados se pretende dar explicaci´on a estas interrogantes.
Si se realiza una b´usqueda de una fuente sin utilizar un discriminador de part´ıculas, se obtiene como resultado la misma cantidad de eventos en todas las direcciones, sin importar la coordenada a estudiar, ya que la llegada de los CR’s a la atm´osfera es isotr´opica y su porcentaje es aproximadamente el 90 % de todas las part´ıculas que arriban. Otro conflicto es la incertidumbre del c´alculo de la direcci´on de la cual proviene, debido a la deflexi´on que sufren los CR’s al pasar por un campo magn´etico. Por el momento las ´unicas part´ıculas que no cambian su trayectoria son los rayos γ, pero la cantidad de arribo a la Tierra es mucho menor. Es por eso que se realizan m´etodos de separaci´on de part´ıculas.
En el caso del observatorio HAWC, se cuenta con un m´etodo de separaci´on llamado
Compactness, pero se divide en 10 intervalos que depende de la variable nHit1, cada intervalo tiene su propio valor de corte para identificar los rayos γ de los CR’s, por lo que cuando se realiza un an´alisis con los datos, implique m´as tiempo de c´omputo, ya que separa los datos en grupos y despu´es los unen. Por otro lado el observatorio, actualmente, se encuentra en la fase de construcci´on, por lo que el n´umero de detectores incrementa conforme avanzan en la instalaci´on esto implica que los intervalos y sus valores de corte deban ser recalculados. Entre cada c´alculo, el valor m´ınimo de nHit incrementa, por ejemplo para HAWC-95 el n´umero de nHit es 20, para HAWC-111 es 22 [40] y para HAWC-300 ser´an 55. Otro inconveniente es que en cada c´alculo se presenta diferentes valores de corte en los diferentes intervalos, es decir, si se tiene un evento con un nHit de 55, si se usa HAWC-95 el valor de corte es 3.2, para HAWC-111 es de 3.9 y para HAWC-300 es de 4.6 (ver las Tablas 3.1, 3.2 y 3.3), lo cual representa que en los eventos con un mismo nHit se cambia la condici´on de separaci´on de gammas y hadrones, y puede dar el caso de que se introduzca m´as hadrones clasificados como gammas.
en otras variables, localizando un nuevo valor de separaci´on y/o cambiando el rango en cada intervalo [26]. Principalmente, para aumentar el rendimiento del separador se busca dos cosas: la primera disminuir la cantidad de eventos que pasan como rayos γ
cuando en realidad son CR’s y segundo aumentar la cantidad de una correcta seleccion de eventos en rayos γ.
Por todo lo anterior se propone un nuevo m´etodo de separaci´on aplicando una Red Neuronal, en ingl´es Neural Network (NN), capaz de separar las part´ıculas sin realizar intervalos que dependan del n´umero de PMT activos en el evento, siempre y cuando nHit sea mayor o igual a 30. Por lo que conlleva a tener un solo umbral para diferenciar entre las part´ıculas gammas de los hadrones.
1.4
Objetivo general
Dise˜nar un m´etodo para distingir las part´ıculas primarias que formaron las cascadas detectadas por el observatorio HAWC.
1.5
Objetivos particulares
• Identificar y seleccionar las caracter´ısticas de entrada de la red neuronal.
• Entrenar una red neuronal para llevar a cabo la clasificaci´on de part´ıculas y com-parar el resultado con el m´etodo actualmente utilizado en HAWC.
• Obtener el mapa de la nebulosa del Cangrejo (NGC1952) con los datos recolecta-dos con el experimento aplicando el nuevo m´etodo.
Cap´ıtulo 2
Estado del Arte
“Si otros pudieron, yo tambi´en puedo. Si otros no pudieron yo puedo ser el primero”
Maktub.
En este cap´ıtulo se abordar´an algunos trabajos realizados en distintos observatorios donde se aplicar´on las NN para la separaci´on de gamma/hadr´on.
2.1
ARGO-YBJ
Astrophysical Radiation with Ground-based Observatory at YangBaJing (ARGO-YBJ), es un experimento para el estudio de la radiaci´on c´osmica, principalmente radia-ci´on en rayos γ de energ´ıas, aproximadamente, de cientos de GeV a pocas decenas de TeV. Se localiza en el laboratorio de rayos c´osmicos de YangBaJing en el Tibet, China, con una altitud de 4,300 metros sobre nivel del mar (msnm). El observatorio consiste en un arreglo matricial de 120 clusters y un anillo con 24 clusters, como se muestra en la Figura 2.1. Un cluster es un areglo de 12 c´amaras de plato resistivo (RPC’s, por sus siglas en ingles). La se˜nal de un RPC es obtenida por medio de 80 tiras de lectura (strips). Un conjunto de 8 strips es llamado pad, el cual es utilizado para medir el tiem-po de arribo de la casacada. Un RPC es un detector gaseoso que detecta el paso de las part´ıculas cargadas por la p´erdida de ionizaci´on en el gas [2,10].
Kong et al. [20] reportan un clasificador de part´ıculas primarias de rayosγ y protones en el experimento ARGO-YBJ utilizando una NN. Los eventos para el entrenamiento y verificaci´on de la red son simulaciones en Monte Carlo de part´ıculas primarias con energ´ıa entre 100 GeV y 10 TeV, un ´ındice espectral de−2.7 y un ´angulo zenital entre 0◦ y 30◦, el nivel de observaci´on en profundidad atm´osferica es 606 g/cm2 (altitud del experimento). Se realiz´o una seleccion de los eventos simulados que cumplian con un m´ınimo de detecci´on de 50 pads activos y que la posici´on del n´ucleo de la cascada se localizaran dentro de un cuadrado de 25 m apartir del centro del arreglo. En la Figura 2.2 se presenta la distribuci´on de carga de dos cascada inducidas por un rayo γ y la otra por un prot´on. Se not´a que la distribuci´on en las cascadas electromagn´eticas se concentr´a en el n´ucleo en comparaci´on a las cascadas hadr´onicas.
La estructura de la red Feed Forward es 9-12-1, 9 neuronas de entrada, 12 neuronas en la capa oculta y una neurona en la capa de salida. En la etapa de entrenamiento se
Figura 2.1: Arreglo de detectores RPC’s en el experimento de ARGO-YBJ. Imagen obtenida de [20].
(a) Evento tipo gamma. (b) Evento tipo prot´on.
Figura 2.2: Se muestra las distribuciones de carga que fuer´on producidas por dos part´ıculas
primarias, en la cual se diferencian por la cantidad de n´ucleos. En (a) se muestra la distribuci´on
de un rayo γ, donde la mayor´ıa de las cargas se concentran en un punto, es decir, un n´ucleo,
mientras que en (b) se observa la distribuci´on de un prot´on, la cual tiene varios grupos de carga,
por lo tanto multin´ucleos. Imagen obtenida de [20].
usaron 3,000 cascadas, donde se especifican con un valor de cero, las cascadas producidas por los rayosγ y un valor de uno, las cascadas producidas por los protones.
En la etapa de verificaci´on se usaron 7,000 cascadas, la salida de la red se muestra en la Figura 2.3a, donde su salida es continua, por lo cual se encontr´o un valor ´optimo
2.2. MAGIC 7
(a) Salida de la NN. (b) Factor Q en funci´on del valor de corte.
Figura 2.3: Se muestra en (a), el histograma de la salida de la NN cuando se introducen los
eventos del archivo de verificaci´on, y en (b), los histogramas del factor Q, Ef icacia en γ y
Rechazo de protonesen funci´on del corte de separaci´on, se localiza el valor m´aximo del factor
Q en 2.5 cuandoes 0.15. Im´agenes obtenidas de [20].
para identificar los tipos de part´ıculas. El valor de se hall´o maximizando el factor Q definido como “Ef icacia en γ / √1−Rechazo de protones” donde la Ef icacia en γ
es el porcentaje de eventos tipoγ clasificados correctamente y Rechazo de protoneses el porcentaje de eventos tipo prot´on clasificados correctamente. En la Figura 2.3b, se muestra un histograma del factor Q en funci´on del valor de corte aplicad´o en la salida de la red. Cuandotiene el valor de 0.15, se presenta un m´aximo en el factor Q de 2.5, lo que implica que si el valor de salida de la red cuando se ingreso un evento es mayor o igual a 0.15 es clasificado como prot´on mientras que si es menor a 0.15 es considerando como un rayoγ, dando como resultado la clasificaci´on correcta de rayosγ del 69.5 % y la mayor´ıa de los protones clasificados correctamente, con un 92.8 % [20].
2.2
MAGIC
Major Atmospheric Gamma-ray Imaging Cherenkov Telescopes (MAGIC) es un siste-ma de dos telescopios Cherenkov de isiste-magen atmosf´erica, en ingl´esImaging Atmospheric Cherenkov Telescope(IACT) (Figura 2.4a) situado en el observatorio Roque de los Mu-chachos a 2,200 msnm, con una superficie efectiva de 236m2, para detectar rayosγ con
energ´ıas entre 50 GeV y 30 TeV. MAGIC-I comenz´o su operaci´on en el a˜no del 2004 y MAGIC-II a principios del 2009 [23].
IACT son detectores de rayosγ de alta energ´ıa instalados en la superficie de la Tierra, compuestos por un espejo de captaci´on de luz y una c´amara (Figura 2.4b), por lo que se asemeja a un telescopio ´optico, pero ´este detecta luz azul que es producida por efecto Cherenkov (ver la secci´on 3.3). El espejo de captaci´on de luz esta hecho con 974 elementos cuadrados de 49.5 x 49.5 cm de aluminio-diamante molido con revestimento de cuarzo, con una Raz´on focal,f /D, de 1.03, su montura es Alta-Azimutal. La c´amara tiene 576 PMT’s, en el ´area hexagonal interna con 396 PMT’s de 100 de di´ametro, los
(a) Observatorio Roque de los Muchachos. (b) IACT.
Figura 2.4: Se muestra el observatorio MAGIC, en (a), los dos IACT y el centro de control, y
en (b), los elementos que estan conformado un IACT. Im´agenes obtenidas de [23].
pixeles exteriores con 180 PMT’s de 1.500 de di´ametro [23].
Bock et al. [5] reportar´on el uso de diferentes m´etodos de clasificaci´on de part´ıculas con los telescopios IACT, como son: funciones de kernel, ´arbol de decisi´on, redes neu-ronales, m´aquinas de soporte vectorial, an´alisis de discriminador lineal. A cada m´etodo se introducen 10 caracter´ısticas que son obtenidas de las simulaciones en Monte Carlo, teniendo dos clases: gammas (se˜nal) y hadr´ones (ruido), estas simulaciones son genera-das con energ´ıas entre 10 GeV hasta 30 TeV y un ´angulo zenital entre 0◦ y 20◦. Para la extracci´on de las caracter´ısticas, con las im´agenes de las cascadas despu´es de un proce-samiento previ´o se presenta un grupo alargado en la imagen; el eje m´as largo se orienta hacia el centro de la c´amara, es decir, si el eje del telescopio se dirige hacia una fuente puntual, por lo cual un an´alisis de componentes principales se lleva acabo en el plano de la c´amara, lo que resulta una elipse (Figura 2.5), ´estos son llamados par´ametros de Hilla.
La estructura de la red neuronal usada es feed forward 10-10-1, 10 neuronas de entra-da, 1 capa oculta con 10 neuronas y una neurona en la capa de salida. Se inicializaron los pesos aleatoriamente y la funci´on de transferencia en las neuronas es sigmoidea, ver ecuaci´on 3.13. El m´etodo utilizado para la minimizaci´on del error en la etapa del entrenamiento es el back propagation. En la Figura 2.6 se muestra del lado izquierdo el proceso de evoluci´on del aprendizaje, donde indica el incremento o decremento del desempe˜no de la red en cada ciclo1 y del lado derecho la salida de la red neuronal, teniendo un valor cercano a uno para eventos tipoγ y cercanos a cero para los protones [5].
Bock et al. [5] concluyen que los mejores resultados son los clasificadores de ´arboles de decisi´on, funciones kerner y vecindades cercanas. Las peores son las m´aquinas de
2.2. MAGIC 9
Figura 2.5: En el lado izquierdo se muestra la detecci´on de luz en los detectores de la c´amara
de los IACT, donde en la detecci´on se extraen los par´ametros Hilla de la imagen (mostrados del
lado derecho). Imagen obtenida de [5].
(a) Curva de evoluci´on. (b) Salida de la NN.
Figura 2.6: En (a) se muestra la evoluci´on del aprendizaje de la red por cada ciclo. En (b) se muestra el histograma de la salida de la red neuronal con diferentes eventos al del entrenamiento. Im´agenes obtenidas de [5].
soporte vectorial y selecci´on directa. En medio, se encuentran las NN y se necesita un mayor entendimiento de ellas, ya que existen diferentes m´etodos y se deben realizar un an´alisis m´as profundo para su uso.
Boinee et al. [6] explican que se entren´o una red Perceptr´on multicapa, en ingl´es Mul-tiLayer Perceptron(MLP), con 12,332 eventos, cada uno extrayendo 10 caracter´ısticas. La estructura de la red es 10-10-1, 10 neuronas de entrada, 1 capa oculta con 10 neuro-nas y en la capa de salida una neurona se defini´o un cero, si representa un hadr´on y un
(a) Usando una red:MLP. (b) Usando dos redes: MLP + SOTA.
Figura 2.7:En (a) se muestra el histograma de la salida de una red MLP. En (b) se muestra el histograma de la salida de combinar dos redes neuronales (MLP+ SOTA), usando la salida de
la red SOTA como entrada de la red MLP. En (a) se preseta menores eventos tipo prot´on con
valor cercano a uno. Im´agenes obtenidas de [6].
uno, si es un gamma. La funci´on de transferencia de las neuronas de la capa de entrada y salida es lineal mientras que en las capas ocultas se us´o una funci´on sigmoidea, ver ecuaci´on 3.13. En la Figura 2.7a se muestra el resultado de salida de la red. Adem´as se aplic´o una red Self-Organizing Tree Algorithm (SOTA)2 donde su salida se introduce a
una red MLP reportando mejores resultados que si solo se usara la MLP (Figura 2.7b).
2.3
HESS
High Energy Stereoscopic System (HESS) es un arreglo de telescopios Cherenkov situado en la zona monta˜nosa Khomas de Namibia a 1,800 msnm, ver Figura 2.8. Es el sitio perfecto para detecciones astron´omicas por que el medio ambiente es ´arido. Adem´as la localizaci´on en el hemisferio sur es ´optimo para detecciones del plano gal´actico. HESS se compone de dos fases: fase I tiene 4 IACT ordenado en un cuadrado de 120m. Cada telescopio tiene una ´area reflectora de 107 m2 con 382 espejos de 60 cm2 de di´ametro ordenados con un dise˜no de Davies-Cotton y su montura es Alta-Azimutal, la cual puede seguir fuentes de elevacion entre 20◦ to 89.9◦. La c´amara contiene 960 pixeles compuestos por conos de Winston colectando la luz incidente y enfoc´andolo dentro de un PMT con eficiencia cu´antica de aproximadamente 15 %, cada pixel tiene un campo de vision de 0.16◦. En la fase II se instal´o un quinto IACT con 600m2 de ´area reflectora,
se localiza en el centro de los telescopios existentes en HESS fase I [17,18].
Hupfer [18] implement´o una red neuronal MLP donde se usaron 6 caracter´ısticas de entrada, s´olo trabaj´o con eventos de rayos γ y protones. El archivo de entrenamiento
2
Es una red neuronal no supervisada que implementa una agrupaci´on jer´arquica, basada en una red de autoorganizaci´on
2.3. HESS 11
Figura 2.8:Observatorio HESS fase I. Imagen obtenida de [17].
tiene 10,000 eventos de cada part´ıcula y un archivo de verificaci´on de 140,000 eventos de rayos γ y 61,947 eventos de protones. En la etapa de entrenamiento de la red se especifican 550 ciclos de entrenamiento y una raz´on de entrenamiento de 0.023. En la
Figura 2.9a, se muestra el resultado de la red neuronal despu´es de ingresar los eventos del entrenamiento. Con los resultados de la gr´afica anterior se genera la Figura 2.9b, que se muestra el factor Q (Quality Factor) en funci´on del valor de corte, donde se localiza el valor m´aximo de 4.44 y corresponde a 0.8868 de la salida de la red neuronal, es decir, si esta salida es mayor o igual a 0.8868 se clasifica como un γ y cuando sea menor, es clasificado como prot´on. Donde su eficacia en gammas es del 56 % y del 1.6 % en eficacia en protones.
Adem´as Hupfer [18] reporta el us´o de otros 2 m´etodos de clasificaci´on, Fisher y ´arbol de desiciones Boosted, en ingl´es Boosted Desicion Trees (BDT) que se muestran en la Figura 2.10, y menciona que el m´etodo que tiene mayor ´area bajo la curva , es un mejor clasificador, y la red MLP tiene mayor ´area.
(a) Salida de la NN. (b) Factor Q o Quality Factor.
Figura 2.9:En (a) se muestra el histograma de la salida de la red neuronal, para archivos de
entrenamiento y verificaci´on. En (b) se encuentra los histogramas para el c´alculo del factor Q y
en 4.4 se encuentra el valor m´aximo, cuando el corte es 0.8868. Im´agenes obtenidas de [18].
Figura 2.10:Se muestran las curvas ROC de tres m´etodos de separaci´on (MLP, BDT y Fisher),
donde la red MLP presenta mejores resultados debido a que tiene mayor ´area bajo su curva.
Cap´ıtulo 3
Marco Te´
orico
“Aprender una t´ecnica no es el final en si mismo. Simplemente, indica donde necesitas comenzar”
Dr. Masaaki Hatsumi.
En este cap´ıtulo comenzaremos con la teor´ıa de las EAS, seguido con las simulaciones de las part´ıculas pasando a trav´es de la atm´osfera hasta llegar al nivel de observaci´on, continuando con las simulaciones del paso de las part´ıculas en los materiales, prosi-guiendo con la reconstrucci´on de los eventos simulados. Por otro lado abordanremos la teor´ıa de redes neuronales y una implementaci´on en ROOT, despu´es con la explicaci´on de dos m´etodos para la separaci´on en HAWC, una aplicaci´on de una red neuronal y segundo el m´etodo que se usa actualmente, y se finaliza con dos par´ametros que indican el comportamiento del m´etodo de separaci´on para poder comparar los m´etodos.
3.1
Part´ıculas primarias
La unidades de energ´ıa de la part´ıcula primaria est´an dadas eneV, la cual equivale a 1.6×10−19J oules, que es la energ´ıa cin´etica ganada por un electr´on que pasa por una diferencia de potencial de 1 V.
3.1.1 Rayos gamma
Los rayos γ es radiaci´on electromagn´etica como la luz visible. Estos rayos pueden ser tratados como part´ıculas o como ondas. Si se describen como part´ıculas, su energ´ıa est´a dada por la ecuaci´on de Plank-Einstein [9]:
E = hf (3.1)
dondef es la frecuencia de la luz y h es la constante de Plank.
Por otro lado si se describen a los rayosγ como ondas, se caracteriza por su velocidad de la onda, definida como:
v = f λ (3.2)
dondeλes la longitud de onda.
Figura 3.1:Se muestra el espectro electromagn´etico, donde existen rangos de energ´ıa en la que
la atm´osfera es opaca, como es el caso de los rayosγ.
La velocidad de la luz en el vacio (c) es aproximadamente igual a 3 × 108 m/s. Cuando viaja en diferentes medios su velocidad de fase (vf ase) cambia y es directamente
proporcional a c e inversamente proporcional al ´ındice de refracci´on del medio (η). Si
η > 1 implica quevf ase de las part´ıculas puedan ser m´as grandes que la de la luz en
el medio:
vf ase =
c
η (3.3)
La atm´osfera de la Tierra es opaca para algunas longitudes de onda como se muestra en la Figura 3.1. En el caso de los rayos γ, ´estos no son capaces de penetrar, una alternativa para su detecci´on es enviar sat´elites, pero ´estos tienen un l´ımite de detecci´on de energ´ıa aproximadamente de 1 GeV - 300 GeV, otra forma es mediante detectores en la Tierra, pero eso implica entender las interacciones generadas en la atm´osfera (ver secci´on 3.2) [9].
3.1.2 Rayos c´osmicos
Los CR’s son definidos como part´ıculas cargadas que llegan a la Tierra del espacio interestelar. El espectro de energ´ıaN(E) cubre un rango de energ´ıas entre 109 eV hasta 1021 eV y sigue una ley de potencias:
d N(E)
d E ∝ E
Γ (3.4)
donde Γ es el ´ındice espectral.
En la Figura 3.2, se muestra el espectro de energ´ıas de rayos c´osmicos observados en la Tierra. Los CR con energ´ıas cercanas a 109 eV son provenientes del Sol y de otras
3.2. CASCADAS ATMOSF ´ERICA EXTENDIDAS 15
Figura 3.2:Se muestra el espectro de los rayos c´osmicos. Hay tres puntos en el cual cambia el ´ındice espectral: la rodilla en 1015.5eV, la segunda rodilla en 1017.5eV y el tobillo en 1018.6eV,
despu´es de 1020 por el limite GZK existe poca probabilidad de detectar a los CR’s. Imagen
obtenida de [38].
fuentes de nuestra Galaxia en este punto se curva por la acci´on del campo magn´etico del Sol y son desviados cuando intentan ingresar al sistema solar. Los CR con energ´ıas entre 109 hasta 1015.5 tienen un ´ındice espectral de −2.7, su posible explicaci´on al cambio en el exponente es por el l´ımite de aceleraci´on de fuentes de rayos c´osmicos galacticos, en ingl´esGalactic Cosmic Rays(GCRs). Entre 1015.5 y 1018.6 eV tiene un ´ındice espectral de −3.0, es debido al limite de confinamiento de los GCRs en el campo magn´etico gal´actico, es decir, por la transici´on entre los CR’s gal´acticos y extragal´acticos. Por ´
ultimo, a energ´ıas mayores de 1018.6 eV se encuentra un aplanamiento [38].
3.2
Cascadas Atmosf´
erica Extendidas
Cuando una part´ıcula primaria llega a la atm´osfera de la Tierra, ´esta genera otros tipos de part´ıculas, llamadas part´ıculas secundarias. El tipo de part´ıculas secundarias generadas depende de la part´ıcula primaria. Hay dos tipos de cascadas: electromagn´etica y hadr´onica (Figuras 3.3).
3.2.1 Cascadas Electromagn´eticas
La cascada inicia cuando el fot´on llega a la atm´osfera de la Tierra e interacciona con sus n´ucleos de aire y producen un par electr´on-positr´on (producci´on de pares), des-pu´es estos leptones emiten un fot´on cuando atraviezan un campo magn´etico (radiaci´on Bremsstrahlung), por consiguiente estos fotones decaen de nuevo en un par electr´ on-positron y ´estos a su vez en fotones y de nuevo se repite la cadena hasta que su energ´ıa sea menor a la energ´ıa m´ınima de produci´on de pares (ver ecuaci´on 3.5). En la Figura
(a) Cascada electromagn´etica. (b) Cascada Hadr´onica.
Figura 3.3:Se describen las EAS. En (a) se muestra el desarrollo de una cascada generada por
un rayo γ que coliciona con un n´ucleo de aire, se generan part´ıculas secundarias (electrones,
positrones), ´estas generan m´as rayosγy se reinicia el proceso. En (b) se observa el desarrollo de
una cascada generada por un CR que interacciona con los n´ucleos de aire y se generan piones,
que decaen en muones, neutrinos y rayosγ. Im´agenes obtenidas de [21].
3.3a se muestra el desarrollo de una cascada electromagn´etica [27].
Producci´on de pares
La producci´on de pares es el proceso por el cual un fot´on interact´ua con el campo el´ectrico de un n´ucleo. En esta interacci´on, el fot´on desaparece y crea un par electr´ on-positr´on. La energ´ıa m´ınima, Emin, que debe de tener el fot´on para producir un par
electr´on-positr´on es:
Emin= 2mec2(1 +
me
M) ≈ 1.02M eV (3.5)
dondeme y M son las masas del electr´on y del n´ucleo.
En caso que la energ´ıa del fot´on sea mayor a 1.02 MeV, el excedene se reparte entre el electr´on y positr´on como energ´ıa cin´etica.
Bremsstrahlung
Radiacci´on de frenado o Bremsstrahlung es el proceso por el cual un electr´on de alta energ´ıa emite un fot´on cuando interacciona con el campo magn´etico de un n´ucleo en el medio.
3.2.2 Cascadas Hadr´onicas
Cuando un CR penetra la atm´osfera de la Tierra e interacciona con un n´ucleo de aire, parte de la energ´ıa de la part´ıcula primaria se pierde en la producci´on de part´ıculas
3.2. CASCADAS ATMOSF ´ERICA EXTENDIDAS 17
secundarias, a esta fracci´on de p´erdida es llamada inelasticidad.
El n´umero de part´ıculas secundarias generadas es llamado multiplicidad total, lenta-mente se incrementa conforme se dan m´as interacciones cuando viajan a trav´es de la atm´osfera. Las part´ıculas secundarias se constituyen de piones, kaones, muones, neutri-nos, entre otras [27].
La mayor´ıa de las part´ıculas secundarias en la primera interacci´on son piones. En peque˜nas cantidades se producen los kaones, bariones y antibariones si la energ´ıa es lo suficientemente grande, estas part´ıculas interaccionan en el aire conforme viajan. En el caso de los piones neutros,π0, su tiempo de vida es≈ 10−6 sy por lo tanto decaen en dos gammas (ver ecuaci´on 3.6). Estos gammas inician las cascadas electromagn´eticas, ver secci´on 3.2.1.
π0 → γ + γ (3.6)
Los mesones cargados dan lugar a los muones (µ) y neutrinos (νµ); los decaimientos
dominantes son:
π± → µ± + νµ (3.7)
K± → µ± + νµ (3.8)
K± → π± + π0 (3.9)
La probabilidad del decaimiento de los kaones,K±, es del 63.5 % para la ecuaci´on 3.8 y un 21.2 % en la ecuaci´on 3.9. El resultado de estos decaimientos son, principalmente,
µyνµ. Losµsolo pierden su energ´ıa por ionizaci´on y una peque˜na fracci´on de ellos por
decaimiento. El resultado de est´a decaimiento es descrito por:
µ± → e± + ¯νµ + ¯µe (3.10)
En la Figura 3.3b se muestra el desarrollo de una cascada cuando un CR colisiona con los n´ucleos de la atm´osfera, generando piones neutros y cargados, y ´estos generan gammas, neutrinos, muones, electrones y positrones [27].
3.2.3 Caracter´ısticas en ambas cascadas
Hay algunas caracter´ısticas que se definen en las EAS como son el desarrollo longitu-dinal y lateral. El primero es el aumento de las part´ıculas secundarias a trav´es del paso por la atm´osfera, la segunda es la distribuci´on de part´ıculas a un nivel de observaci´on. Otras caracter´ısticas importantes se mencionan a continuaci´on:
• Tama˜no de la cascada (N) es el n´umero total de part´ıculas secundarias que son producidas en el desarrollo de la cascada a un nivel de observaci´on. ´Esta como funci´on de la energ´ıa de la part´ıcula primaria, el ´angulo de incidencia de la part´ıcula primaria (θ o ´angulo zenital) y la altitud de la primera interacci´on (Figura 3.4).
• Profundidad de m´aximo desarrollo (Xmax) es la localizaci´on de m´axima
generaci´on de part´ıculas en la atm´osfera, ´esta depende de la energ´ıa de la part´ıcula primaria ya que a mayor energ´ıa mayor profundidad, generalmente las unidades se indican eng cm−2
Figura 3.4: Cuando una part´ıcula primaria colisiona con la atm´osfera, ´este viaja en un eje,
llamado eje de la cascada y con respecto al zenit se forma un ´anguloθ, conforme va viajando en
la atm´osfera se van creando part´ıculas y produce un plano con una peque˜na curvatura. Imagen
obtenida de [13].
• Eje de la cascadase define como la extensi´on del vector del momento inicial de la part´ıcula incidente en la direcci´on de propagaci´on (Figura 3.4).
• Nucleo de la cascada es el centro de la distribuci´on de carga, otra manera de definirla es la intersecci´on del eje de la cascada a un nivel de observaci´on. En la Figura 3.5, se muestra la distribuci´on de cargas en 3D a un nivel de observaci´on, en la Figura 3.5a, se muestra que existe un m´aximo, generalmente el n´ucleo, y decrece conforme se aleja de ´el, ´este es un caso t´ıpico de una part´ıcula primaria de rayo γ, en la Figura 3.5b se presentan varios picos, es decir, mutin´ucleos, ´este es el caso de un CR como part´ıcula primaria [13].
• Plano de la cascadatiene la forma de un disco que presenta una ligera curvatura, como se muestra en la Figura 3.4. El espesor del disco se ensancha ligeramente si se aleja del n´ucleo de la cascada
3.3
Luz Cherenkov
Una peque˜na fracci´on de p´erdida de energ´ıa es emitida como radiaci´on Cherenkov. La luz Cherenkov se emite cuando una part´ıcula se mueve en un medio con una velocidad,
v = βc, m´as grande que la velocidad de fase de la luz (ecuaci´on 3.3). Esta emisi´on depende del ´ındice de refracci´on y el umbral de energ´ıa, Etr. Para el caso del aire este
umbral de energ´ıa es 21 M eV y para el agua es 1 M eV, ´este cambio se debe al valor del ´ındice de refracci´on en el medio (ηaire = 1.0003 y ηagua = 1.33) [33].
Etr =
moc2
p
1−η2 (3.11)
3.3. LUZ CHERENKOV 19
(a) Gamma. (b) Prot´on.
Figura 3.5:Se muestran las distribuciones de densidad de part´ıculas. En (a) es un ejemplo t´ıpico
de un rayoγ como part´ıcula primaria, donde se genera un cono. En (b) se muestra un prot´on,
donde existen diversos conos de diferentes tama˜nos, lo cual indica la existencia de multin´ucleos.
Im´agenes obtenidas de [13].
La luz Cherenkov se emite en un cono alrededor de la trayectoria de la part´ıcula (Figura 3.6). El ´angulo de apertura del cono (θ), se expresa como:
cosθ = 1
βη +q (3.12)
donde q es el factor de correcci´on cu´antico con poca importancia para nuestro caso. La m´axima apertura se alcanza a altas energ´ıas cuandoβ = 1, para el caso del agua se tiene un ´angulo de 41◦ y para el aire es 1◦, ´esto da una ventaja a los detectores Cherenkov en agua, en ingl´es Water Cherenkov Detector(WCD) [33].
(a) Localizaci´on de HAWC, vista satelital. (b) WCD instalados actualmente.
Figura 3.7:En (a) se muestra la localizaci´on del observatorio de HAWC. En (b) se muestran
los WCD instalados. Im´agenes obtenidas de [15].
3.4
HAWC
El observatorio HAWC es un experimento que capta las EAS, entre un rango de energ´ıa de 100 GeV hasta 100 TeV. Se localiza dentro del parque nacional Pico de Orizaba a 4,097 msnm (equivalente a 625.6 mbar, 638 g/cm2) en una meseta entre el pico de Orizaba y el volc´an Sierra Negra como se muestra en la Figura 3.7a. Su latitud es 18.99◦ y su longitud es 97.31◦ similar a muchos observatorios en M´exico, Estados Unidos y el Sur de Am´erica, teniendo exposiciones diarias de fuentes como nebulosa del Cangrejo (NGC1952), Mkr 421 y 501. Actualmente, se encuentra bajo construcci´on (Figura 3.7b) [37].
HAWC aprovecha toda la experiencia en detecci´on con la t´ecnica de Cherenkov en agua del Observatorio MILAGRO, pero usando tecnolog´ıa actual. Las mejoras en el dise˜no permiten tener mayor ´area de detecci´on y mayor altitud (de 2,650 msnm a 4,100 msnm), por lo que la sensibilidad se incrementa por un orden de magnitud, HAWC tiene un ´area de 22,000 m2 con 12,000m2 de superficie activa. Adem´as puede realizar observaciones simult´aneas con IceCube y VERITAS [11].
HAWC consiste en un arreglo de 300 WCD, cada uno con un tubo fotomultiplicador, en ingl´esPhotoMultiplier tube(PMT) de 1000 y 3 PMT’s de 800(ver las secciones 3.4.1 y 3.4.2), su desempe˜no se basa en el tiempo de arribo y amplitud de la se˜nal de los 1,200 PMT’s, El tiempo de cada PMT en un evento se reconstruye la direcci´on de la part´ıcula primaria y con su se˜nal se estima su energ´ıa [30].
En las dos siguientes secciones se describen las caracter´ısticas de los WCD y PMT, como sus dimensiones, materiales y las posiciones de los PMT’s en el WCD.
3.4. HAWC 21
3.4.1 Detectores Cherenkov en Agua (WCD)
El WCD es un tanque cil´ındrico galvanizado de l´aminas de acero corrugado de di´ ame-tro 7.3 m y altura de 5 m. En su interior se almacena la membrana pl´astica a la cual le llaman bladder1 (la Figura 3.8a), esta membrana contiene agua ultrapura e impide el paso de la luz, su altura es de 4.5 m para contener aproximadamente 188,000 litros de agua. En la Figura 3.8c se muestra el plano de las dimensiones del tanque e indica el nivel del agua, es decir, la altura del bladder y adem´as la altura en la que se encuentran los PMT’s [14].
En el fondo del bladder se anclan los 4 PMT’s mirando hacia arriba para detectar los fotones cherenkov de cascadas de part´ıculas relativistas dentro del volumen del agua. Uno de los cuatro PMT’s es de alta eficiencia (Hamamatsu R7081 de 10” de di´ametro) y es colocando en el centro del bladder. Los otros tres PMT’s son de baja eficiencia (Hamamatsu R5912 de 8” de di´ametro), son reutilizados del Observatorio MILAGRO, y se localizan a 1.85 m del centro formando un tri´angulo entre ellos. En la Figura 3.8b se presenta una simulaci´on de un muon (µ) que incidi´o en el WCD produciendo radiaci´on Cherenkov en el agua, adem´as se aprecia el cono de luz producido, debido al ´ındice de refracci´on en el agua es de 1.33 por lo que el ´angulo de apertura es de 41◦. ´Esto implica que por lo menos un PMT debe observar esta radiaci´on [22, secci´on de tanques de agua Cherenkov].
3.4.2 Tubo Fotomultiplicador (PMT)
Un PMT es un dispositivo de detecci´on de luz en el rango del ultravioleta, visible e infrarrojo que convierten los fotones en una se˜nal el´ectrica, Figura 3.9a. El principio b´asico de un PMT depende del efecto fotoel´ectrico y de las emisiones secundarias, es decir, la luz (fotones) expulsa electrones del fotoc´atodo que se conecta a un alto voltaje negativo (del orden de 1500 V con respecto al ´anodo), los electrones son acelerados y enfocados hasta el primer d´ınodo, con la ayuda de un campo el´ectrico con electrodos adicionales, la superficie esta hecha de un material que emit´e un n´umero de electro-nes cuando es golpeado por un electr´on de alta energ´ıa, estos electrones secundarios son acelerados dentro de la superficie del segundo d´ınodo, Figura 3.9b. y produce m´as electrones, este proceso de aceleraci´on y emisi´on de electrones se repite hasta el ´ultimo d´ınodo, y el pulso amplificado o corriente es colectado en el ´anodo. El ancho del pulso de salida es del orden de nanosegundos, permitiendo que un fot´on pueda ser contado con una resoluci´on en tiempo extremadamente alta [28].
Algunos inconvenientes al usar este tipo de dispositivos son:
• Las propiedades del fotoc´atodo determinan la sensbilidad del PMT, es decir, cuan-do los electrones liberacuan-dos por el c´atodo cuando golpea un fot´on, ´este debe ser enfocado hacia el primer d´ınodo, el cual no siempre es cap´az de caer en el c´atodo por eso se reduce la eficiencia cu´antica.
• La raz´on de se˜nal a ruido es reducida, si los d´ınodos tienen una inadecuada ga-nancia.
1
Se usar´a este nombre para refererirnos a la membrana pl´astica que contiene el agua ultra pura dentro de cada WCD
(a) Bladder. (b) Localizaci´on de los PMT’s en el blad-der.
(c) Diagrama del WCD.
Figura 3.8: Se muestran los elementos de un WCD (bladder (a) y los PMT’s (b)), as´ı como
su localizaci´on, adem´as en (b) se muestra una simulaci´on de un muon cuando interact´uan con
elWCD. En (c) se observa las dimensiones f´ısicas del tanque, blader y posici´on de cada
PMT. Im´agenes obtenidas de [14]
Para almacenar estos pulsos, en HAWC, se utiliza el convertidor de tiempo a palabra digital, en ingl´esTime to Digital Converter(TDC). Primero, se tienen que convertir los pulsos de corriente a voltaje, despu´es con el TDC se convierte a una se˜nal cuadrada, el ancho de cada pulso depende de los umbrales que cruz´o (Figura 3.10, donde se muestra dos se˜nales t´ıpicas de la salida de un PMT). Hay dos umbrales: el primero a 0.25 foto-electron, en ingl´esPhotoElectron(PE)’s (es un ajuste para que el ruido no se considere en la detecci´on del PMT) y el segundo a 4 PE’s (para considerar valores altos en energ´ıa manifestada en el PMT). Con la onda cuadrada digitalizada se reconstruye la carga de-positada en el PMT, el m´etodo es conocido como tiempo por encima del umbral, en ingl´es Time Over Threshold (TOT), donde se utiliza la diferencia de trancisi´on y los filos de subida y bajada del pulso. Un pulso corto consiste en “2-filos” porque cruza un solo umbral, 0.25 PE’s, dos veces, mientras un pulso largo tiene “4-filos” por que cruza dos umbrales, 0.25 PE’s y 4 PE’s, dos veces, como se muestra en la Figura 3.10 [9].
3.5. CORSIKA 23
(a) Vista real. (b) Descripci´on de los elementos del PMT.
Figura 3.9:Se muestra un PMT. En (a) se observan varios PMT en su estado f´ısico. En (b) se
muestran los elementos que contiene el PMT para la detecci´on de la luz.
3.5
Corsika
COsmic Ray SImulation KAscade (CORSIKA) es un programa para la simulaci´on detallada de las EAS inicializada por part´ıculas muy energ´eticas como protones, n´ucleos ligeros hasta pesados, fotones y part´ıculas que pueden ser tratadas como primarias. Se simula el paso de las part´ıculas a trav´es de la atm´osfera y sus colisiones con los n´ucleos de aire que producen otras part´ıculas mendiante decaimientos o procesos radiactivos. La inteacci´on a altas energ´ıas, del orden de TeV, puede ser descrita por diversos modelos alternativos como VENUS, QGSJET y DPMJET basados en la teor´ıa de Gribov-Regge y las interacciones a bajas energ´ıas, del orden de GeV, son descritos por rutinas de interacci´on como GHEISHA, FLUKA o UrQMD [16].
Se definen algunas especificaciones en el momento de la instalaci´on, como es el caso de selecionar el modelo de interacci´on, pero muchas otras se especifican en un archivo de texto de entrada donde los par´ametros m´as sobresalientes son el n´umero de corrida, n´umero de cascadas a simular, el tipo de part´ıcula primaria, el rango de energ´ıas, el ´ındice espectral, el rango de los ´angulos θ y φ, nivel de observaci´on, entre otras cosas. Su salida es una base de datos de todas las cascadas simuladas. En la Figura 3.11 se muestra el resultado de simular tres part´ıculas primaria (fot´on, prot´on y n´ucleo de hierro), estas simulaciones comienzan desde su primera interacci´on con la atm´osfera generando part´ıculas secundarias y estas cuando van viajando a trav´es de la atm´osfera siguen produciendo m´as part´ıculas hasta llegar al nivel de energ´ıa m´ınimo para continuar produciendo part´ıculas.[16]
3.6
AERIE
Analysis and Event Reconstructor Integrated Environment (AERIE), es una plata-forma que cuenta con un conjunto de clases para procesar, trabajar y manejar los datos en HAWC, por ejemplo las simulaciones y la generaci´on de mapas utilizando los datos
Figura 3.10: Conversi´on del pulso de salida de un PMT a una se˜nal cuadada, mediante dos umbrales, del lado izquierdo se muestra un pulso corto (2-filos) y del lado derecho un pulso largo (4-filos).
(a) Fot´on. (b) Prot´on. (c) N´ucleo de Hierro.
Figura 3.11:Simulaciones de las EAS con diferentes part´ıculas primarias a trav´es de la atm´ osfe-ra.
reales, las herramientas b´asicas para la simulaci´on de eventos y el manejo de sus archivos de salida de HAWCSim, HAWCSim-reco y Offline-reconstructor.
3.6. AERIE 25
3.6.1 XCDF
El formato de datos expl´ıcitamente compactado, en ingl´eseXplicitly-Compacted Data Format (XCDF), es un formato de datos binarios dise˜nado para guardar los campos con una exactitud espec´ıfica definida por el usuario. Utiliza un empaquetamiento de bit para almacenar los campos con una precisi´on dada, para el conjunto de valores dados y proporciona una compresi´on sustancial.
El empaquetamiento de bit es el proceso de compresi´on de datos para reducir el n´umero de bits necesarios para representar los valores de los datos, es decir, empaqueta estos bits en serie por cada dato, ignorando el l´ımite de la palabra digital.
Los archivos XCDF almacenan un conjunto de campos que tienen un ´ındice en com´un, cada ´ındice se refiere a un evento, cada campo tiene: un nombre, una resoluci´on y el tipo de la variable (enteros positivos, enteros o puntos flotantes). Los datos son escritos dentro de cada campo y los eventos son escritos en el archivo [15, secci´on de Explicitly Compacted Data Format].
El manejo de estos archivos se realiza mediante algunos comandos. A continuaci´on se describen los m´as utilizados:
• xcdf-utility info $Nom Arch Despliega la informaci´on de los campos del ar-chivo de entrada ($Nom Arch).
• xcdf-utility count $Nom Arch(s) Retorna el valor del n´umero de eventos en el o los archivos ($Nom Arch(s)).
• xcdf-utility select “Expresion Boleana” $Nom Arch(s)Selecciona los even-tos que cumplan las condiciones de la expresion boleana. El nombre del archivo de salida, es opcional, colocando “-o $Nom Salida.xcd”.
• xcdf-utility dump “Campos” $Nom Arch(s)Muestra los valores de los cam-pos indicados del archivo “$Nom Salida.xcd”.
• xcdf-root -- input $Nom Arch(s).xcd - o $Arch salida.rootConvierte un archivo XCDF a un archivo ROOT.
3.6.2 HAWCSim
HAWCSim es una aplicaci´on de GEANT-4 para la simulaci´on en Monte Carlo del arreglo de HAWC. ´Este toma la informaci´on de las part´ıculas generadas en Corsika y simula los eventos hasta el punto de producir PE’s en el PMT (la colecci´on de PE’s por el fotoc´atodo no es simulado en este punto de la cadena). Es cap´az de producir dos tipos de salida: un archivo ASCII con el formato especifico de MILAGRO o una lista de PE’s y las part´ıculas que interact´uan con el WCD almacenando en un archivo XCDF.
Actualmente, el formato ASCII es obsoleto por lo tanto se utiliza el formato XCDF. Para ejecutar HAWCSim es necesario indicar 8 archivos de configuraci´on:
centro de HAWC, adem´as se coloca un identificador a cada PMT y WCD.
• ChannelStatus.xml. Se define el estado de los PMT’s colocados en el archivo
Survey.xml, es decir, si estan activados o desactivados. Este archivo es ´util si se requiere simular solo una parte del observatorio.
• Materials. Se define las propiedades f´ısicas de los materiales que son utilizados. Los archivos XML, Survey.xml y ChannelStatus.xml, necesitan de tres archivos de esquema XML, en ingl´esXML schema files (XCD) que son DetectorLayout.xsd,
HAWCStatusMap.xsdy HAWCSchemaTypes.xsd.
Antes de ejecutar este programa, se declara la variable “HAWCSIM CONFIG” asig-nandole la ruta del directorio donde se localizan los archivos de configuraci´on. Con el comando “./hawcsim-exe -h” se despliega la ayuda del programa, Figura 3.12, donde se muestran los argumentos de entrada del programa, los m´as importantes son:
• -i $ARGdonde $ARG es la direcci´on y nombre del archivo de entrada (salida de Corsika, DAT####).
• -- itype $ARGdonde $ARG es el formato del archivo de entrada: ascii o corsika. • -o $ARGdonde $ARG es la direcci´on y nombre del archivo de salida.
• -- otype $ARGdonde $ARG es el formato del archivo de salida: xcdf o ascii. La siguiente instrucci´on es un ejemplo de como se ejecuta el comando:
./hawcsim-exe --input ./DAT000001 --itype corsika --output ./hawcsim dat000001.xcd --otype xcdf --seed 128129479
3.6.3 HAWCSim-reco
HAWCSim-reco es un programa que simula la colecci´on de PE’s, el Sistema de adqui-sici´on de datos, en ingl´esData Acquisition System (DAQ), la reconstrucci´on del n´ucleo y el ´angulo de arribo de los eventos. Toda esta informaci´on se almacenada en un archivo ROOT (ver ap´endice C), para generar esta salida es necesario colocar 6 archivos de configuraci´on, que son:
• Survey.xml. Es el mismo archivo de configuraci´on que utiliza el programa HAWC-Sim (ver secci´on 3.6.2).
3.6. AERIE 27
argumentos necesarios para su ejecuci´on son:
• -- input $ARGdonde $ARG es la direcci´on y el nombre del archivo de entrada (salida de HAWCSim).
• - o $ARG$ARG es la direcci´on y nombre del archivo de salida, algunas variables se describen en el ap´endice C.
• - C $ARGdonde $ARG es la direcci´on y el nombre del archivopeCurves.dat. • - s $ARGdonde $ARG es la direcci´on y el nombre del archivoSurvey.xml
• - t $ARG donde $ARG es la direcci´on y el nombre del archivo ChannelSta-tus.xml
La siguiente intrucci´on es un ejemplo de como utilizar el programa:
./aerieappshawcsimreco input ./hawcsim dat000001.xcd o ./hawcsimreco dat000001.root -C ./config/pe-Curves.dat -s ./config/Survey.xml -r ./config/-ChannelStatus.xml
3.6.4 Offline-reconstructor
Offline-reconstructor es un programa que realiza la reconstrucci´on de los eventos que son detectados por HAWC. La entrada es el archivo “TRIG File”, que es un archivo en formato XCDF producido por el sistema de DAQ/Online que contiene los eventos detectados por el observatorio. La informaci´on que almacena este archivo son: los identi-ficadores de cada evento, el n´umero de part´ıculas que detect´o, los pulsos cortos (2-filos) y largos (4-filos) y el identificador del PMT que las detect´o (en el ap´endice C se reporta las variables del archivo).
Existe dos tipos de salida:
1. El archivo “REC FILE” que es un archivo en formato XCDF y contiene un resu-men del proceso de reconstrucci´on. Este archivo es usado para un an´alisis f´ısico, como ejemplo la obtenci´on de mapas.
2. El archivo “Full Hits File” es un archivo en formato ROOT y contiene la informa-ci´on de varios pasos en la reconstrucci´on, como del n´ucleo y el plano de la cascada, adem´as la carga de cada PMT y el tiempo en que se detect´o.
3.6. AERIE 29
la instrucci´on “./offline-reconstructor -h” se despliega la ayuda del programa, Figura 3.14, en esta Figura se muestra los par´ametros del programa, los m´as importantes se enumeran a continuaci´on:
• -- input $ARG donde $ARG es la direcci´on y salida del archivo de entrada (TRIG FILE).
• - o $ARGdonde $ARG es la direcci´on y salida del archivo de salida. El formato depende de la informaci´on que se desea, como predefinido se generan archivos
REC FILE.
• -- r. Se coloca esta opci´on si se requiere el archivo Full Hits File.
• -- g. Se coloca esta opci´on si se requiere que utilice en la reconstrucci´on del n´ucleo el m´etodo Gauss. La opci´on predefinida es el m´etodo NKG.
Las siguientes instrucciones son ejemplos de la manera de ejecutar el programa.
• Para obtener un archivo ROOT, es decir, el archivo FULL HIT FILE y utilizando el m´etodo Gauss en la reconstrucci´on del n´ucleo:
./offline-reconstructor -- g -- r -o ./rectrig 000001.root --input ./trig 0001.xcd
• Usando los valores predefinidos, es decir, el archivo de salida en formato XCDF (REC FILE) y el uso del m´etodo NKG para la reconstrucci´on del n´ucleo
./offline-reconstructor -o ./rectrig 000001.xcd --input ./trig 0001.xcd
3.7
Redes Neuronales (NN’s)
Las redes neuronales son modelos matem´aticos basados en sistemas neuronales biol´ ogi-cos, desde una perspectiva matem´atica, una red neuronal es simplemente un mapeo de
Rn → Rm donde Rn son las variables de entrada de la red y Rm es la dimensi´on de
salida de la red [6]. Una NN no se programa, ella aprende por ejemplos, dicho de otra forma, se le especifica la salida de cada entrada que fue introducida, para que la red identifique las diferencias de los grupos de entrada para su clasificaci´on. Antes de seguir definiendo a una NN se explica los sistemas neuronales biol´ogicos con el fin de enten-der su paralelismo, as´ı sera m´as facil entender el modelo de una neurona para llegar a describir a una red.
3.7. REDES NEURONALES (NN’S) 31
Figura 3.15:Estrucura de una neurona biol´ogica t´ıpica: dendritas (obtenci´on de las entradas),
soma (procesamiento de las entradas y la generaci´on de una salida) y axi´on (env´ıa la informaci´on
de salida). Imagen obtenida de [31].
3.7.1 Modelos neuronales biol´ogicos
El cient´ıfico aragon´es Santiago Ram´on y Cajal establece que el sistema nervioso esta compuesto por cien mil millones de neuronas interconectadas entre s´ı. La comunicaci´on entre neuronas se realiza a trav´es de la sinapsis. En la sinapsis m´as com´un no existe contacto f´ısico pero la distancia entre neuronas es del orden de 0.2 micras. La comu-nicaci´on es direccional, dicho de otra manera, las sinapsis solo envi´an informaci´on en una sola direcci´on. Las neuronas que envian las se˜nales son llamadas presin´apticas y las neuronas que reciben la informaci´on postsin´apticas. Hay tres tipos de neuronas: inter-neuronas (comunicaci´on neurona-neurona), motoras (comunicaci´on neurona-musculo) y receptoras o sensoras (comunicaci´on exterior-neurona) [31].
El flujo de informaci´on se divide en tres bloques: entrada de informaci´on, procesa-miento y salida, las dendritas se encargan de la recepci´on de informaci´on, la soma de procesar la informaci´on y el ax´on de enviar una salida (Figura 3.15) [31].
Un sistema neuronal biol´ogico est´a constituido por diversos conjuntos, estos conjuntos est´an compuestos por miles de neuronas y una neurona es el elemento b´asico. La misma jer´arquia se cumple para las redes neuronales artificiales, se tiene como elemento b´asico la neurona artificial, un conjunto de ellas le llamamos capas, al conjunto de capas le llamamos red neuronal artificial, un grupo de redes neuronales con sus interfases de entradas y salidas construyen un sistema global (Figura 3.16) [31].
3.7.2 Modelo est´andar de la neurona
Una neurona artificial es una unidad elemental encargada de procesar un n´umero de entradas y producir una salida, ´esta consiste en tres elementos, Figura 3.17.
• Entradas. Es un conjunto de entradasxj(t) (enviadas de las neuronas presin´
apti-cas o una se˜nal externa), y sus pesos sin´apticos,wij2.
3.7. REDES NEURONALES (NN’S) 33
Figura 3.16: Estrutura jer´arquica de un sistema basado en redes neuronales. Un conjunto de
neuronas forman una capa, muchas capas conforman una red y una red m´as las interfases de
entrada-salida forman un sistema neuronal. Imagen obtenida de [31].
• Regla de propagaci´on. A partir de las entradas se obtiene un valor hi
jun-tando los valores de las neuronas postsin´apticas, hi = σi(wij, xj(t)). El
proce-so m´as com´un es en una suma ponderada de la entrada y sus pesos, es decir,
hi = Pj wij xj(t).
• Funci´on de transferencia. Se aplica una funci´on de transferencia al valorhi, que
es la salida de la neurona artificial (yi(t) =fi(hi(t))). Existen diferentes funciones
de transferencia, las m´as habituales son las mostradas en la Figura 3.18.
3.7.3 Arquitectura de la red neuronal
Una NN tiene tres capas: entrada, oculta y salida. En la capa de entrada o sensorial, se definen la misma cantidad de neuronas como caracter´ısticas. En la capa de salida, la cantidad de neuronas declaradas depende de la configuraci´on de salida (por ejemplo activar o desactivar uno o varios equipos). En la capa oculta, las capas no tienen comu-nicaci´on con el medio exterior, solo procesan la informaci´on de la capa de entrada a la de salida, Figura 3.19.
3.7.4 M´etodos de aprendizaje
La manera de educar a una NN depende del tipo de aprendizaje que se utiliza, por la forma del aprendizaje se puede dividir en 4 grupos que son:
• Supervisado. Se pretende estimar una funci´on desconocida f : Rn → Rm pro-porcionando ejemplos (x, y), para todo x ∈ Rn (entradas), y y ∈ Rm (salidas).
En cada ejemplo se calcula el error en la operaci´on E[W], es decir, que tanto se aproxim´o o se alej´o del valor de salida real. Dependiendo E[W] sera el aumento o disminuci´on del valor de los pesos sipn´aticos, dicho de otra forma, se presentan ejemplos a la entrada de la red y se espec´ıfica el valor de su salida si este valor es igual a la respuesta de la red, no se modifican los pesos, pero si es diferente, son modificados.
Figura 3.17: Modelo de una neurona est´andar, donde las entradas xj se multiplican con sus
pesos wij, despues son sumadas y pasan por una funci´on de transferencia para generar una
salida (yi). Imagen obtenida de [31].
3.8. ROOT 35
Figura 3.19:Arquitectura de la red, formada por tres capas: entrada(sensorial), oculta
(proce-samiento) y salida. Imagen obtenida de [31].
• No supervisado o autoorganizado. Es una estimaci´on de la funci´on de densi-dad de probabilidap(x) que describe la distribuci´on de patronesxpertenecientes al espacio de entrada,Rn, es decir, va generando grupos dependiendo de la
infor-maci´on de entrada
• H´ıbrido. Es la utilizaci´on del aprendizaje supervisado y el no supervisado. • Reforzado. Se ubica entre el aprendizaje supervizado y el no supervisado. Ya
que en el supervisado se indica la clase de cada ejemplo que se introduce, en comparaci´on con el m´etodo reforzado que existe un par´ametro donde indica lo bien o mal que funciona.
En la Figura 3.20 se muestra una clasificaci´on de redes neuronales dependiendo del m´etodo de aprendizaje, y hablando de los supervisados y no supervisados, existe otra subdivision dependiendo si son realimentados o unidireccionales. La elecci´on de una red neuronal depende del tipo de aplicaci´on que se usar´a, por lo general las redes unidirec-cionales se utilizan para ser clasificadores, para la reconstrucci´on de una imagen da˜nada, un archivo, entre otras cosas se usan las redes unidireccionales.
3.8
ROOT
ROOT es un infraestructura orientada a objetos para el procesamiento de datos, hecho en CERN. Un archivo ROOT es cap´az de guardar etiquetas (pueden ser utilizadas para colocar los detalles la informaci´on almacenada), histogramas, clases ´arbol o TTree3, entre otras cosas. La clase TTree contienen ramas o TBranch4, donde se especifican el nombre y tipo de variable (caracter, entero, entero positivo, flotante o doble flotante)
3
As´ı son llamados en ROOT y de aqui en adelante se utilizar´a este nombre 4As´ı son llamados en ROOT y de aqui en adelante se utilizar´a este nombre
Figura 3.20: Clasificaci´on de las redes neuronales dependiendo del m´etodo de aprendizaje. En
el caso de los m´etodos supervisados y no supervisados existen una subclasificaci´on que depende
de la direcci´on del flujo de informaci´on: realimentado o unidireccional. Imagen obtenida de [31].
de cada evento. Por analog´ıa se puede comparar a losTBranchcon objetos, a losTTree
como cajas y a los archivos ROOT con un almacen, los objetos se guardan en cajas y estas cajas se guardan en un almac´en. Es por eso que se crea un archivo ROOT que puede contener de una a variasTTree, en cada TTree se coloca unaTBranch por cada variable o par´ametro a almacenar. A continuaci´on se describen algunos procesos que se pueden realizar [35].
• Almacenamiento. Es posible colocar diferentes datos de informaci´on en un ar-chivo ROOT, adem´as la creaci´on de imagenes o archivos PDF de la informaci´on procesada.
• Accesar.La facilidad de consultar la informaci´on en los archivos ROOT.
• Procesamiento.Las herramientas matem´aticas y estad´ısticas para el apoyo en el manejo de los datos.
• Desplegar resultados.Los datos de las variables del archivo ROOT pueden ser desplegadas en histogramas, gr´aficas, ajustar funciones, etc´etera.
• Aplicaci´on interactiva. La utilizaci´on del interprete de CINT C++ o Python para la generaci´on de c´odigos para la obtenci´on de datos, procesamiento y salida de informaci´on. Estos c´odigos pueden ser compilados para crear un ejecutable y disminuir el tiempo de c´omputo.
Una de las tantas herramientas que dispone ROOT es una clase para la red neuronal MLP descrita a continuaci´on.
3.8. ROOT 37
3.8.1 Biblioteca Perceptr´on multicapa (MLP)
En ROOT, existe una biblioteca que contiene una clase con la implementaci´on de una red MLP (TMultiLayerPerceptron) (Figura 3.21a). La funci´on de transferencia en las neuronas de entrada y salida son lineales, en cambio las funciones de las neuronas de la capa oculta son sigmoidea.
σ(x) = 1
1 +e−x (3.13)
Para llegar a que una NN indique el tipo de salida dependiendo de los valores de entra-da, ´esta necesita pasar por una etapa de entrenamiento y de verificaci´on. A continuaci´on se enumeran los pasos b´asicos para aplicar una red MLP en ROOT.
1. Se crea unTTreeque contenga en susTBranchel valor de las variables de entrada y salida.
2. Se declara un objeto, definiendo su estructua, mediante el siguiente comando:
T M ultilayerP erceptron(”$Entradas: $CapOcu: $Salidas”,$N om T T ree)
Donde las neuronas de entradas ($Entradas) son los nombres de las TBranch
que contiene los valores de las variables de entrada, cada una separada por una coma. En la capa oculta ($CapOcu) se describe el n´umero de neuronas por cada capa, cada capa se separa por dos puntos (:). Por ´ultimo, en la capa de salida (Salidas) se escriben los nombres de las TBranchque contienen los valores de las variables de salida, cada una separada por comas. Si en las neuronas de entrada se coloca un @ indica que se normaliza. La siguiente instrucci´on es un ejemplo de la declaraci´on de la red y especificaci´on de su estructura (3,2,3) con tres neuronas en la capa de entrada cada una normalizada, 2 neuronas en la capa oculta y tres neuronas en la etapa de salida (Figura 3.21a).
TMultiLayerPerceptron *mlp =
new TMultiLayerPerceptron(“@P1,@P2,@P3:2:S1,S2,S3”,simu)
3. Para seleccionar el m´etodo de aprendizaje de la red se usa la funci´on miem-bro “TMultiLayerPerceptron::SetLearningMethod()”, se env´ıa como argumento el nombre del m´etodo de aprendizaje (TMultiLayerPerceptron::kStochastic, TMul-tiLayerPerceptron::kBatch, TMultiLayerPerceptron::kBFGS, entre otras). La ma-yor´ıa de estos m´etodos se basan en introducir un ejemplo o un grupo de ejemplos, obtener el valor de error y dependiendo de este valor se modifican los pesos, como se observa en la Figura 3.21b.
4. Para indicar que comienze el proceso de aprendizaje, se usa la funci´on miembro TMultiLayerPerceptron::Train(), donde se env´ıan en los argumentos: el n´umero de ciclos, indicando si se desea la curva de evoluci´on (opcional), cada cuantos ciclos imprime el valor de evoluci´on (s´olo si se define que tenga la curva de evoluci´on). La siguiente instrucci´on es un ejemplo del uso de esta funci´on indicando el n´umero m´aximo de ciclos igual a 200 y cada 10 ciclos imprimir´a el valor de aprendizaje en la curva de evoluci´on y se obtiene un archivo de texto con estos valores.