Test de bondad de ajuste a una distribución completamente especificada en el caso de muestras censuradas.
3. Observaciones con censura doble o por intervalo: consisten en N observaciones de las cuales sólo n son completamente observadas y
3.2 Test de bondad de ajuste a una distribución completamente especificada en el caso de muestras censuradas
Se tiene una muestra con censura simple a la derecha de tamaño N de una distribución F y sean X(1) X(2) X( )n las n observaciones completas. Las hipótesis nula y alternativa son:
Ho:
F x( )
F x
o( )
H1:F x( )
≠F x
o( )
Donde
F x
o( )
tiene parámetros conocidos de locación y escala,
y
, respectivamente.Como la distribución nula está completamente especificada, aplicando la denomina transformación integral de probabilidad, es decir:
( ) ( ) 0
(
)
i iX
U
F
,i1, 2, ,
n
(3.1)Resulta que bajo Ho la muestra
U
(1),U
(2), ,
U
( )n es una muestra censurada de una distribuciónU(0,1)
.En el caso de censura de tipo I, se sabe que los valores
X
i son menores que un valor fijoT
X y los valores transformados resultarán entonces menores queT
F T
o(
X)
.Esto muestra que el problema se reduce, como en los casos de muestras completas, a considerar como
F
o la distribución U(0,1), trabajando sobre los datos transformados según la fórmula dada en (3.1).3.2.1 Tests basados en el estadístico K-S para muestras censuradas
Se consideran las hipótesis Ho:
F x( )
F x
o( )
H1:
F x( )
≠F x
o( )
(3.2) siendo F0 la distribución U(0,1).Se utiliza en primer lugar el estadístico de Kolmogorov-Smirnov y siguiendo las definiciones brindadas en 3.1.2.
Se considera en primer lugar el caso de censura de tipo I, simple y a la derecha. Sean U(1)U(2) U( )n T las observaciones completas de una muestra aleatoria censurada ordenada U(0,1) de tamaño N , el estadístico K-S en este caso está definido por:
1 max ( ), ( ) , . 1 , 1 i i n u u T D i i T N i n N N N (3.3)
Los sub-índices indican el tipo de censura y que el estadístico depende del punto de censura fijo y del tamaño de la muestra.
En el caso de censura de tipo II, simple y a la derecha, se tiene que hay n valores completos U(1)U(2) U( )n donde
U
( )n es el máximo y n es fijo. El estadístico K-S está definido de la siguiente forma en este caso:0.5 0.5 max 2 , 1 ( ) i D u n N i n N i N (3.4)
El estadístico K-S depende del tamaño de la muestra y del número total de observaciones completas.
Los estadísticos presentados en (3.3) y (3.4) de K-S (D´Agostino, 1986, página 111) se conocen también como estadísticos modificados de K-S.
Con los estadísticos dados en (3.3) y (3.4) se testean las hipótesis planteadas en (3.2). El valor de estos estadísticos se compara con los valores de percentiles que se obtienen desde las Tablas A3 o A4, según corresponda en cada caso. Se rechaza Ho para un nivel de significación si el valor observado del estadístico supera el 1- cuantil consignado en la tabla correspondiente.
En el caso de censura de tipo II, la tabla se consulta con
p
n
N
y en el caso de censura de tipo I, la respectiva tabla se consulta conpT
.La distribución aproximada de los estadísticos definidos en (3.3) y (3.4) bajo Ho, fue estudiada por Dufour and Maag (1978). Los autores proveen fórmulas que permiten utilizar dicha distribución en el caso de muestras finitas y presentan dos tablas que contienen algunos percentiles para tamaños de muestra N 10, 15, 20 y 25.
También Barr and Davidson (1973) han estudiado este test y presentan tablas de la FDA de dichos estadísticos, pero no los cuantiles por lo que resultan trabajosas para utilizar en la práctica.
Los autores D´Agostino y Stephens ( 1986, página 112) presentan una tabla que contiene los percentiles para la distribución asintótica de ambos estadísticos, que pueden ser utilizados para tamaños de muestra mayores o iguales a 25 y valores p de razón de censura desde 0.2 hasta 1. También consignan tablas de percentiles de otros estadísticos propuestos para el caso de muestras con censura. Se trata de los estadísticos W2 de Cramer-von Mises y de A2 de Anderson- Darling con las definiciones correspondientes para muestras con censura simple de tipo I o de tipo II.
Mediante simulaciones de Monte-Carlo, empleando 10000 replicaciones para cada tamaño de muestra considerado, se han obtenido los
cuantiles de la distribución de los estadísticos definidos en (3.3) y (3.4) bajo Ho. Estos resultados están consignados en Tablas A3 y A4 de Apéndice 1. Los valores que se han obtenido dan muy buena precisión comparados con los valores de los percentiles dados por Dufour and Maag (1978).
3.2.2 Tests basados en el estadístico DSP para muestras censuradas
Como ya se ha mencionado en Sección 2.9, los tests basados en estadísticos de tipo cuadrático resultan en general más potentes que el test basado en D, para detectar algunas hipótesis alternativas. Se proponen otros estadísticos basados en el DSP definido en la Sección 2.5, para realizar los tests de bondad de ajuste en el caso de muestras con censura simple. Se compara luego la potencia de los tests basados en los estadísticos que se proponen a continuación, con la potencia de los tests basados en D.
En el caso de censura de tipo I, el estadístico propuesto es:
0.5 0.5 0.5 0.5 ( ) 2 0.5 2 0.5 max max ( ) ( ) , ( ) ( ) 1 , 1 i i n
DSPT N arcsen arcsen u arcsen arcsen T
N N i n , (3.5) y para censura de tipo II, es:
0.5 0.5 ( ) 2 0.5 max ( ) ( ) 2 , 1 i i DSPn N arcsen arcsen u N i n . (3.6)
Mediante simulaciones de Monte Carlo en base a 10000 replicaciones, se estudió la distribución de estos estadísticos bajo Ho, para tamaños de muestra de 10 a 100, con paso 5, y distintos valores p desde 0.1 a 1 con paso 0.1.
Los resultados han sido consignados en Tablas A5 y A6 del Apéndice 1 según se trate de censura de tipo I o de tipo II. En la próxima sección se comparará la potencia de estos tests propuestos con los de K-S para muestras censuradas.
Una vez definidos estos estadísticos se pueden realizar los tests propuestos siguiendo los siguientes pasos, suponiendo
( , )
vector que contiene los parámetros de locación y escala: 1. Calcular ( ) ( )
(
)
i i oX
U
F
, parai1, 2, ,
n
.2. Utilizando
U
( )i obtener los estadísticos correspondientes, según se trate de censura simple de tipo I o de tipo II, de acuerdo a las definiciones (3.5) y (3.6)3. El valor de estos estadísticos se compara con los valores de percentiles que se obtienen desde Tablas A5 o A6, según corresponda en cada caso. Se rechaza Ho para un nivel de significación si el valor observado del estadístico supera el 1- cuantil consignado en la tabla correspondiente.
Tal como en el caso de los estadísticos basados en D, en el caso de censura de tipo II, la tabla se consulta con
p
n
N
y en el caso de censura de tipo I, la respectiva tabla se consulta con pT.Se ha desarrollado un programa que calcula, para una muestra censurada dada y tamaño de muestra total N, los estadísticos
1DT N, , 1DSPT N, ,2Dn N, y 2DSPn N, , para los casos de censura de tipo I o de
tipo II. Este programa se encuentra en Apéndice 2.
Observación:
Se puede convertir una muestra con censura a la izquierda en una a derecha invirtiendo el orden de la muestra (ver por ejemplo D`Agostino y Stephens, 1986, pág. 115), es decir, se toma
*
( )i
1
(n 1 )iU
U
, parai1, 2, ,
n
. Luego se utilizan los tests dados para censura a la derecha.Cuando la censura es de tipo I, el valor de censura a la izquierda T, se convierte en *
1
T
T
a la derecha para ser usado con los valores transformados *U
. De modo que basta calcular los percentiles de las distribuciones de los estadísticos sólo en el caso de censura a derecha.3.3 Bandas de aceptación derivadas de los tests presentados en