Estimación de conjuntos y funcionales
asociados.
Una aproximación no paramétrica.
Alejandro Cholaquidis
II Jornadas de Ingeniería Matemática
Estimación de conjuntos.
Estimación de funcionales asociados Datos insuficientes
Sin restricciones de forma: Devroye-Wise.
Restricciones Estimación de la frontera.
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Distancias entre Conjuntos
Distancia de Hausdorff
Sean
A
y
C
subconjuntos compactos, no vacíos, de
R
d
,
d
H
(
A
,
C
) =
max
sup
a
∈
A
d
(
a
,
C
)
,
sup
c
∈
C
d
(
c
,
A
)
.
Distancia en Medida
Sean
A
y
C
en
B
(
R
),
Estimación de conjuntos.
Estimación de funcionales asociados Datos insuficientes
Sin restricciones de forma: Devroye-Wise.
Restricciones Estimación de la frontera.
Estimador de Devroye-Wise
Sean
X
1
, . . . ,
X
n
,
v.a. a valores en
R
d
, i.i.d,
X
1
∼
P
X
con
soporte
S
, sea
{
ε
n
}
una sucesión de números reales,
definimos
ˆ
S
n
=
n
[
i
=1
B
(
X
i
, ε
n)
si
n
→ ∞
y
n
ε
d
n
→ ∞
,
entonces
d
µ
(
S
,
S
ˆ
n
)
P
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Estimación de conjuntos.
Estimación de funcionales asociados Datos insuficientes
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
Restricciones de forma
Conjunto Estándar
S
⊂
R
d
de Borel, es
estándar
respecto a
µ
si existe
λ >
0 y
δ >
0 tal que
µ
B
(
x
, ε
)
∩
S
≥
δµ
L
B
(
x
, ε
)
,
∀
x
∈
S
,
0
< ε
≤
λ.
Rodamiento de una bola
Una bola de radio
r
>
0
rueda libremente
por el complemento
de
S
si
∀
x
∈
∂
S
existe
c
∈
R
d
tal que
Restricciones de forma
Conjunto Estándar
S
⊂
R
d
de Borel, es
estándar
respecto a
µ
si existe
λ >
0 y
δ >
0 tal que
µ
B
(
x
, ε
)
∩
S
≥
δµ
L
B
(
x
, ε
)
,
∀
x
∈
S
,
0
< ε
≤
λ.
Rodamiento de una bola
Una bola de radio
r
>
0
rueda libremente
por el complemento
de
S
si
∀
x
∈
∂
S
existe
c
∈
R
d
tal que
Estimación de conjuntos.
Estimación de funcionales asociados Datos insuficientes
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
Restricciones de forma
Conjunto parcialmente expandible
S
⊂
R
d
es
parcialmente expandible
si existen
r
>
0 y
C
(
S
)
≥
1 tal que
d
H
∂
S
, ∂
(
S
⊕
ε
B
)
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Estimación de conjuntos.
Estimación de funcionales asociados Datos insuficientes
Sin restricciones de forma: Devroye-Wise. Restricciones
Estimación de la frontera.
Estimación de la frontera
Para
S
ˆ
n
el estimador de Devroye queremos sabe:
bajo que condiciones:
d
H
(
∂
S
ˆ
n
, ∂
S
)
n
−→
0
c
.
s
.,
Estimación de la frontera
Teorema
Sea X
1
,
X
2
, . . .
i.i.d en
R
d
X
1
∼
P
X
. Sea S el soporte de P
X
.
Supongamos que S es compacto parcialmente expandible con
constante C
(
S
)
, para algún r
>
0
, y estándar con respecto a
P
X
. Si
ε
n
=
C
log
n
n
1d,
C
>
2
δω
d
1d.
Entonces, con probabilidad uno, existe n
0
tal que
Estimación de conjuntos.
Estimación de funcionales asociados
Datos insuficientes
Contenido de Minkowski,L0, condiciones de existencia.
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Estimación de conjuntos.
Estimación de funcionales asociados
Datos insuficientes
Contenido de Minkowski,L0, condiciones de existencia.
Contenido de Minkowski
Si
S
⊂
R
d
es compacto no vacío,
∂
S
su borde, si existe y es
finito
lim
ε
→
0
µ
L
x
:
d
(
x
, ∂
S
)
≤
ε
2
ε
=:
L
0
(
∂
S
)
se denomina contenido de Minkowski
d
−
1 dimensional.
Si
∂
S
⊂
R
d
es compacto y
d
−
1-rectificable entonces:
L
0
(
∂
S
) =
H
d
−
1
(
∂
S
)
.
Si
S
⊂
R
d
es compacto y tiene alcance positivo entonces
Estimación de conjuntos.
Estimación de funcionales asociados
Datos insuficientes
Contenido de Minkowski,L0, condiciones de existencia.
Contenido de Minkowski
Si
S
⊂
R
d
es compacto no vacío,
∂
S
su borde, si existe y es
finito
lim
ε
→
0
µ
L
x
:
d
(
x
, ∂
S
)
≤
ε
2
ε
=:
L
0
(
∂
S
)
se denomina contenido de Minkowski
d
−
1 dimensional.
Se puede demostrar:
Si
∂
S
⊂
R
d
es compacto y
d
−
1-rectificable entonces:
L
0
(
∂
S
) =
H
d
−
1
(
∂
S
)
.
El estimador
Sean
(
Z
1
, δ
1
)
, . . . ,
(
Z
n
, δ
n)
i.i.d de
(
Z
, δ
)
con distribución
uniforme en
[0
,
1]
d
, donde
δ
=
1 si
Z
∈
S
,
δ
=
0 si
Z
∈
[0
,
1]
d
\
S
.
Llamamos
S
z
(
ε
)
≡
S
n,z
(
ε
) =
n
X
i
=1
I
{
δ
i=1,
k
Z
i−
z
k≤
ε
}
,
y analogamente
S
c
z
(
ε
)
S
z
c
(
ε
)
≡
S
n,z
c
(
ε
) =
n
X
i
=1
I
{
δ
i=0
,
k
Z
i−
z
k≤
ε
}
.
Estimación de conjuntos.
Estimación de funcionales asociados
Datos insuficientes
Contenido de Minkowski,L0, condiciones de existencia.
Consistencia del estimador
Teorema
Supongamos que:
a)
S y S
c
son estándar en
∂
S.
b)
La sucesión
{
ε
n
}
cumple que:
ε
n
−→
0
y
n
ε
d
n
log
(
n
)
−→ ∞
,
entonces
L
n
=
µ
L
(
S
n
)
2
ε
n
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
Algunos ejemplos
Problema de punto de cambio
Supongamos que tenemos
(
U
1
,
Y
1
)
, . . . ,
(
U
n
,
Y
n
)
en
[0
,
1]
×
R
donde
U
i
∼
U
([0
,
1]),
Y
i
∼
F
si
U
i
∈
S
= [0
, θ
)
y
Y
i
∼
G
6
=
F
si
U
i
∈
S
c
, supongamos que desconocemos
F
y
G
. Queremos
estimar
θ
, el
punto de cambio
de la distribución.
En general...
Algunos ejemplos
Problema de punto de cambio
Supongamos que tenemos
(
U
1
,
Y
1
)
, . . . ,
(
U
n
,
Y
n
)
en
[0
,
1]
×
R
donde
U
i
∼
U
([0
,
1]),
Y
i
∼
F
si
U
i
∈
S
= [0
, θ
)
y
Y
i
∼
G
6
=
F
si
U
i
∈
S
c
, supongamos que desconocemos
F
y
G
. Queremos
estimar
θ
, el
punto de cambio
de la distribución.
En general...
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
El estimador
Construiremos una familia
Γn
que no depende del azar y de ahí
tomaremos según un criterio que se especificará, un
subconjunto
T
n
que esté próximo a
S
en medida.
1)
Si
A
⊂
(0
,
1)
d
es medible, fijado
n
,
|
A
|
=#
{
i
:
Z
i
∈
A
}
.
2)
Para
ε
n
>
0 y
T
∈
Γ
n
anotamos:
T
⊕
ε
n
B
:=
[
l
∈
T
∩
U
dB
(
l
, ε
n)
.
Tomaremos
ε
n
de modo que
T
⊂
T
⊕
ε
n
B
.
3)
Por simplicidad si
A
es un conjunto medible, usaremos la
∈
Una idea intuitiva
Consideremos
h
T
(
x
) :=
1
|
T
⊕
ε
n
B
|
X
i
∈
T
⊕
ε
nB
I
{
X
i≤
x
}
,
y
h
T
c(
x
) :=
1
|
(
T
⊕
ε
n
B
)
c
|
X
i
∈
(
T
⊕
ε
nB
)
cI
{
X
i≤
x
}
.
Entonces
|
h
T
(
x
)
−
h
T
c(
x
)
| ≈
|
T
⊕
ε
n
B
∩
S
|
|
T
⊕
ε
n
B
|
−
|
(
T
⊕
ε
n
B
)
c
∩
S
|
|
(
T
⊕
ε
n
B
)
c
|
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
El estimador
Sean
d
T
i
:=
|
h
T
(
X
i)
−
h
T
c(
X
i
)
|
,
i
=
1
, . . . ,
n
,
N
(
d
1
T
,
d
2
T
, . . . ,
d
n
T
)
una función a valores reales,
definimos
D
(
T
) :=
|
T
⊕
ε
n
B
|
n
|
(
T
⊕
ε
n
B
)
c
|
n
N
(
d
T
1
, . . . ,
d
n
T
)
,
y
ˆ
Sobre la distancia entre conjuntos
Definimos para
A
y
B
en
B
(
R
)
∂
(
A
,
B
) :=
min
µ
(
A
4
B
)
, µ
(
A
c
4
B
)
.
Observación
∂
( . , . ) tiene las siguientes propiedades:
(1.a)
∂
(
A
,
B
)
≥
0
.
(1.b)
∂
(
A
,
A
) =
0
.
(1.c)
∂
(
A
,
B
) =
∂
(
B
,
A
)
.
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
Sobre la función N
Definición
Una función
N
(.):
R
n
+
→
R
1
+
es una norma de
promedios-dominante
si se cumple:
D.a)
N
(.) es simétrica en sus
n
variables.
D.b)
N
(
α
d
1
, . . . , α
d
n) =
α
N
(
d
1
, . . . ,
d
n)
para todo
α
≥
0.
D.c)
N
(
d
1
+
c
1
, . . . ,
d
n
+
c
n)
≤
N
(
d
1
, . . . ,
d
n) +
N
(
c
1
, . . . ,
c
n).
D.d)
N
(1
, . . . ,
1) =
1.
Hipótesis sobre
Γ
n
T1)
∀
T
∈
Γn
|
T
|
/
n
>
0 y 0
< µ
(
S
)
<
1.
T2)
∀
n
∃
T
n
∈
Γn
y
ε
n
tal que
{
T
n
}
cumple
n
δ
∂
(
S
,
T
n
⊕
ε
n
B
)
−→
0
,
cuando
n
→ ∞
, para
δ <
1
/
2.
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
1
Estimación de conjuntos.
Sin restricciones de forma: Devroye-Wise.
Restricciones
Estimación de la frontera.
2
Estimación de funcionales asociados
Contenido de Minkowski,
L
0
, condiciones de existencia.
3
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.
Resultados asintóticos
Teorema
Consistencia:
bajo las hipótesis
T1)
a
T3)
n
δ
∂
(
S
,
S
ˆ
n)
→
0
,
c
.
s
.
Error en Probabilidad:
bajo las hipótesis
T1)
a
T3)
se cumple
que
P
∂
(
S
,
S
ˆ
n
)
> ε
≤
c
1
|
Γ
n
|
exp
−
c
2
ε
2
n
,
Estimación de conjuntos. Estimación de funcionales asociados
Datos insuficientes
Planteo del problema y algunas aplicaciones.
Resultados asintóticos para variables reales.