B B ú ú squeda de fuentes squeda de fuentes puntuales con el
puntuales con el algoritmo EM en el algoritmo EM en el
telescopio de Neutrinos telescopio de Neutrinos
ANTARES ANTARES
Juan Antonio Aguilar S
Juan Antonio Aguilar Sáánchez, IFICnchez, IFIC
XXX Reuni
XXX Reuni ó ó n Bienal Real Sociedad n Bienal Real Sociedad Espa Espa ñ ñ ola de F ola de F í í sica sica
F F ísica de Altas Energ í sica de Altas Energí ías as
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Motivaci
Motivaci ó ó n n
AGNs: Galaxias con un agujero negro supermasivo en su centro.
GRBs: Explosiones de rayos gamma.
Objetos más energéticos del Universo.
Microcuásares: Binarias de rayos X con radio jets relativistas.
SNRs: Restos de supernovas con una estrella de neutrones capaz de acelerar partículas
La detección de fuentes emisoras de neutrinos sería un evidencia de los modelos de aceleración hadrónica en los procesos de aceleración de rayos cósmicos (mecanismo Fermi).
ANTARESANTARES tiene una gran resolución angular por lo que tiene un gran potencial para la búsqueda de fuentes de neutrinos.
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Principio de detección
-1 0 1cos θ 10-8
10-11
10-14
10-17
φ (cm-2s-1sr-1)
p
ν
atmp
µ
ν
µe e
K p
ν ν ν µ
π
µ µ
+ + +
→ +
→
+ + +
+
α ...)
(
e e
K n
ν ν ν µ
π
µ µ
+ + +
→ +
→
−
−
−
−
α ...)
(
ν
µµ
N X
W
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
B B ú ú squeda de fuentes puntuales squeda de fuentes puntuales
Neutrinos atmosfé Neutrinos atmosf éricos ricos
constituyen el mayor fondo en un constituyen el mayor fondo en un telescopio de neutrinos.
telescopio de neutrinos.
El flujo de neutrinos có El flujo de neutrinos c ósmicos smicos es muy peque
es muy pequeñ ño, pero se o, pero se concentran en ciertas
concentran en ciertas direcciones.
direcciones.
Bú B úsqueda de fuentes puntuales: squeda de fuentes puntuales:
identificaci
identificació ón de agrupamientos n de agrupamientos de sucesos sobre un fondo de de sucesos sobre un fondo de neutrinos atmosf
neutrinos atmosfé éricos. ricos.
Fuente puntual:
- Agrupamiento en una cierta dirección
- Depende del índice espectral
~1832 atmospheric ν / year + 138 single µ / year
+ 98 multi-µ / year
= ~ 2068 bg. events
Algoritmo EM
– Búsqueda de clusters.
– Fuentes con distribuciones Gausianas sobre una distribución de fondo.
– Significancia basada en probabilidad del fondo para producir acumulación de
sucesos.
Fondo:
- Uniforme en AR
- Depende de la declinación
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Algoritmo EM: Modelo de Mezcla Algoritmo EM: Modelo de Mezcla
∑
==
gj
j j
p
π p
1
)
; ( )
( x x θ
g es el nú g es el n úmero de componentes en el modelo mero de componentes en el modelo
π π
jj≥ ≥ 0, proporciones de mezcla ( 0, proporciones de mezcla (Σ Σ π π
jj= 1) = 1)
p(x p( x; ; θ θ
jj), j=1,… ), j=1, …,g ,g funciones densidad funciones densidad de las componentes de las componentes
) 2
det(
)}
( )
2 ( exp{ 1 )
,
; (
1
j
j j
T j j
j Gauss
p Σ
µ x Σ µ
x Σ
µ
x π
−
−
−
=
−
Asumimos que las distribuciones de densidad de las fuentes son
Asumimos que las distribuciones de densidad de las fuentes son GausianasGausianas::
) ,
, (
) ,
(
)
,
(
j j x y x y xyj
= µ Σ µ = µ µ Σ = σ σ σ
θ
donde∑
∑
= =+
=
g
j
j j Gauss
j g
j
j
jp p
π
2
RA 7
1 1
) ,
| , ( )
( 2 P ) 1
;
(x θ δ π α δ µ Σ
π π
Fondo Fuentes
Nuestro caso:
Nuestro caso: 1) 1) Pdf Pdf = fondo + señ = fondo + se ñal al 2) 2) x = (α x = ( α
RARA, δ , δ) )
Posici
Posicióón de la fuenten de la fuente
Construimos la
Construimos la pdf pdf basá bas ándonos en ndonos en modelo de mezclas:
modelo de mezclas:
No se usa la energía de los sucesos!
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Algoritmo EM: M
Algoritmo EM: M é é todo todo General
General
∏∑
= ==
=
ni
g
j
j i j
p π p
1 1
)
; ( )
}, ({
) (
L Ψ x Ψ x θ
– Donde Ψ es un vector que denota el conjunto de parámetros {π1,…,πg,θ1,…,θg} – Esta verosimilitud en principio no es maximizable analíticamente!
zik
1 si xi pertenece al grupo k 0 otros
∫ ∏
==
=
ni
i
d
g p
1
)
; , ( )
}, ({
) (
L Ψ x Ψ x z Ψ z
Conjunto INCOMPLETO Conjunto INCOMPLETO
{x { x} = ( } = (α α
RARA, , δ) δ )
Conjunto COMPLETO Conjunto COMPLETO
{ { y} y }
yyii=(x=(xii,z,zii))) }, ({
) ( '
L Ψ = g y Ψ
)
; ( ) ,
| ( )
; , ( )
;
( y Ψ g x z Ψ f x z Ψ p x θ
g = =
Dado un conjunto de n observaciones la verosimilutud es:
Las nuevas funciones de densidad:
Verosimilitud del conjunto completo:
La verosimilitud “incompleta” se obtiene integrando sobre los valores posibles de {y}
donde {x} está embebido:
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
E E - - Step Step and and M M - - Step Step
E-Step:
Empezamos con un conjunto inicial de parámetros Ψ
(m)Calculamos el valor esperado de la log-likelihood del
conjunto completo, condicionado en los datos observados {x}
)]
};
({
| )) };
({
[log(
E )
, (
Q Ψ Ψ
(m)= g y Ψ p x Ψ
(m)M-Step:
Encontrar que maximiza
Ψ = { Ψ
( +m 1)} Q ( Ψ , Ψ
(m))
Dos pasos:
Dos pasos: ExpectationExpectation--stepstep y Maximizationy Maximization--stepstep::
)
Ψ( m
)) ( L log( Ψ
) 1 (m+
Ψ Ψ(m+2)
1 ) 1
( )
, (
Q Ψ Ψ m+ +hm+
m m )+h ,
( Q Ψ Ψ( )
Ψ
Maximizaciones sucesivas de la función Q(Ψ,Ψ(m)) llevan a un incremento en la log-likelihood
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Selecci
Selecci ó ó n de modelo (BIC) n de modelo (BIC)
1. Conjunto de datos D
2. Varios modelos M1, …, Mk
1. M0 = fondo
2. M1 = fondo + señal
Necesitamos un parámetro λ(D) que nos diga si nuestros datos se ajustan mejor al modelo M
0o el modelo M
1k k
k k
k
k
p D M p M d
M D
p ( | ) = ∫ ( | θ , ) ( θ | ) θ
Integraci
Integracióón sobre el espacio de n sobre el espacio de paráparámetros desconocidos θmetros desconocidos θkk
Bayesian
Bayesian InformationInformation CriterionCriterion o BIC*:o BIC*:
k k
k k
k
p D M v n
M D
p ( | )] 2 log ( | ˆ , ) log( ) BIC log[
2 ≈ θ − =
g.d.l (parámetros a ajustar)
* G. Schwarz. Estimating the dimension of a model. Ann. of Statist. 6, 461-464 (1978)
[ ( , ) ( ) ] 2 log [ ( ) ] 6 log( )
log 2
BIC p p p
BG in
n
n i n
n i
i BG i i
RA Gauss
k
= ∑ + − ∑ −
=
=
δ δ
δ
α ) ) ) )
Probabilidad de darse
Probabilidad de darse M M
kkdado D dado D
Fondo + se
Fondo + señ ñal al Fondo Fondo 6 par 6 par ámetros á metros
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Procedimiento
¿Converge?
Algoritmo sencillo Algoritmo sencillo que identifica cada que identifica cada cluster
cluster de la muestra de la muestra
Algoritmo EM:
Algoritmo EM:
Maximization Expectation
SI SI NO NO
Cada cluster se ajusta por el Cada cluster se ajusta por el algoritmo EM
algoritmo EM
Obtenemos un valor del BIC por cada Obtenemos un valor del BIC por cada cluster candidato de la muestra
cluster candidato de la muestra Realizamos 3000 experimentos
Realizamos 3000 experimentos cada uno equivalente a 1 a
cada uno equivalente a 1 añño de o de toma de datos
toma de datos
Fuente Fondo
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Probabilidad de Probabilidad de
descubrimiento descubrimiento
Se calcula la funcióSe calcula la función n
acumulativa de la distribuci acumulativa de la distribucióón n de BIC en el caso de s
de BIC en el caso de sóólo fondolo fondo
Valores del BIC para distintos Valores del BIC para distintos niveles de confianza.
niveles de confianza.
exp
BIC
( BIC )
)
( N
f P Ν σ = ∫
∞ Νσ srcDefinición de la probabilidad de descubrimiento es:
BIC at 3σ
BIC at 2σ
Donde
Donde NNσσ= 2= 2
σ σ
, 3, 3σ σ
, 5, 5σ σ
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Probabilidad de Probabilidad de
descubrimiento: Resultados descubrimiento: Resultados
Probabilidad en funci
Probabilidad en funci ó ó n del n del
n n ú ú mero de sucesos para distintas mero de sucesos para distintas declinaciones (5
declinaciones (5 σ σ ) )
Nú N úmero de sucesos emitidos por mero de sucesos emitidos por la fuente que dan lugar a una la fuente que dan lugar a una probabilidad del 50% (3
probabilidad del 50% (3 σ σ y 5σ y 5 σ) )
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Flujo de descubrimiento al 50%
Flujo de descubrimiento al 50%
live eff
i
events
i
A V T
N
) ( ) , (
) ) (
,
( γ δ δ
δ δ
γ =
Φ
– Nevents(δ) Número de sucesos al 50%
– Aeff(γ,δ) Area efectiva (i = µ, ν) para γ = 2 – V(δ) Visibilidad
– Tlive Tiempo de adquisición del detector
Effective area
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Sensibilidad (flux
Sensibilidad (flux limit limit ) )
µ ν,
Φ
Discovery flux
Flux limit Fuente descubierta
Fuente descubierta Fuente candidata Fuente candidata
Fuente no visible Fuente no visible
Si no hemos visto ninguna fuente, podemos ser capaces de dar un flujo por debajo del cual no
podemos decir si existe o no una fuente
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Conclusiones
Se ha estudiado el potencial de ANTARES para la búsqueda de fuentes puntuales usando para ello un algoritmo basado en la búsqueda de
clusters.
El método basado en el algoritmo EM presenta un mayor potencial de descubrimiento que los métodos basado en bines sin la necesidad de usar información estimada del Monte Carlo como otros métodos de búsqueda.
El flujo de descubrimiento al 50% (5σ):
La sensibilidad también se ha calculado en términos del flujo (90% CL):
1 2 15
10 2
) 0
( = ≈ ⋅
− − −Φ
µδ cm s
1 2 15
10 5
. 1 )
0
( = ≈ ⋅
− − −Φ
µδ cm s
(1 año)
(1 año)
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Plots
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez
Selecci
Selecci ó ó n del modelo (BIC) n del modelo (BIC)
) (
)
| ( )
|
( M
kD p D M
kp M
kp ∝
1. Conjunto de datos D
2. Varios modelos M1, …, Mk
Bayesian
Bayesian InformationInformation CriterionCriterion o BIC*:o BIC*:
k k
k k
k
p D M v n
M D
p ( | )] 2 log ( | ˆ , ) log( ) BIC log[
2 ≈ θ − =
Si p(MSi p(M11) = …) = … = = p(Mp(Mkk) basta con p(D|M) basta con p(D|Mkk) (factor de Bayes) (factor de Bayes))
k k
k k
k
k
p D M p M d
M D
p ( | ) = ∫ ( | θ , ) ( θ | ) θ
g.d.l (parámetros a ajustar)
* G. Schwarz. Estimating the dimension of a model. Ann. of Statist. 6, 461-464 (1978)
Definici
Definició ó n general: n general:
Probabilidad de
Probabilidad de MMkk de reproducir D de reproducir D XX
Probabilidad darse
Probabilidad darse MMkkdado D =dado D =
Probabilidad a priori de Probabilidad a priori de MMkk Teorema de
Teorema de BayesBayes::
Integraci
Integracióón sobre el espacio de n sobre el espacio de paráparámetros desconocidos θmetros desconocidos θkk
[ ( , ) ( ) ] 2 log [ ( ) ] 6 log( )
log 2
BIC p p p
BG in
n
n i n
n i
i BG i i
RA Gauss
k
= ∑ + − ∑ −
=
=
δ δ
δ
α ) ) ) )
XXX Reunión Bienal de Física Juan Antonio Aguilar Sánchez