Estadistica No Parametrica
CLASE 2
Pruebas de Rachas y Aleatoriedad
JAIME MOSQUERA RESTREPO
El Test de Rachas (Run Test)
Para Llegar a una conclusión fundamentadose
en
lo
observado
en
una
muestra,
es
absolutamente
necesario
que
esta
sea
totalmente aleatoria
Este test es una prueba de aleatoriedad que se
Racha: Definición
Sucesión de símbolos idénticos que pueden
estar o no separados por otros símbolos
intermedios
Ejemplo: Se lanza una moneda que se supone legal 14 veces al aire
y se obtienen los siguientes resultados.
+++ - - + - - - - + + - +
r = 7 rachas en los resultados Cree usted que la moneda es legal?
Algunas Preguntas
Que se puede pensar si hay pocas rachas?
H H H H H H H H H H T T T T T T T T T T
Que se puede pensar si hay muchas
rachas?
H T H T H T H T H T H T H T H T H T H T
En una muestra “aleatoria”. El numero de rachas
no puede ser tan grande, pero tan poco muy corto.
“Debe existir un intervalo tolerable”
Pregunta: Como determinar el intervalo?
R/ Teoría Combinatoria Ejemplo:
a) Suponga la existencia de una variable dicotoma, la cual usted ha observado durante 4 días, obteniendo 1 resultado negativo y 3 positivos. Cual es la distribución del numero de rachas a obtener?
b) Que sucede si el numero positivos y negativos se iguala. Manteniendo el numero de observaciones? Cual serie el numero maximo de rachas? c) Que sucede si se incrementa el numero de observaciones en una unidad
obteniendo 1 negativo mas?
De esta manera, si se conoce la distribución del
numero de rachas R, para un situación especifica,
seria posible obtener un intervalo de tolerancia
para la prueba de aleatoriedad.
(
)
/ 2
(
)
/ 2
i sP R
r
P R
r
α
α
≤
=
≥
=
Intervalo de tolerancia (ri; rs)“Garantizar un nivel de significancia exacto es sumamente complicado, ya que la distribución es discreta”.
Distribución del Numero de Rachas
(Frieda, Swed, Eisenhart, 1943)
m: numero de observaciones de una de las categorías (la de menor frecuencia) n: numero de observaciones de la otra categoría (n ≥ m)
s: Numero máximo de rachas que se pudieran formar dado (m)
f (r=i): numero posible de formas como en una muestra con (m, n) elementos se
puede dar un numero de rachas igual a i
2
(
)
(
)
s i
f R
i
P R
r
m
n
m
==
≤
=
+
∑
S= 2m si m=n S= 2m +1 si m < nThe Annals of Mathematical Statistics, Vol 14 No. 1
Distribución del Numero de Rachas
(Frieda, Swed, Eisenhart, 1943)
1
1
2 *
1
1
2
2
(
)
1
1
1
1
1
1
1
1
1
2
2
1
2
2
2
2
m
n
i
i
f R
i
m
n
m
n
i
i
i
i
−
−
−
−
=
=
−
−
−
−
−
−
+
−
−
−
−
−
−
Cuando i es par Cuando i es imparDistribución del Numero de Rachas
(Frieda, Swed, Eisenhart, 1943)
Ejercicio:
• Suponga la existencia de una variable dicotoma, la cual usted ha observado durante 5 días, obteniendo 2 resultado negativos y 3 positivos. Cual es la distribución del numero de rachas a obtener, utilizando la expresión de Frieda, Swed y Eisenhart?
• Si por alguna razón usted obtuvo dos rachas, creería que la muestra es aleatoria?, que sucede si obtuvo 5?
Manejo de la Tabla
a) Se lanza una moneda “legal” al aire durante 30 ocasiones obteniendo los siguientes resultados
C S CCCC S CCC SS CC S CC SSS C SS CCC SSS C Verifique si el procedimiento es aleatorio.
b) Ahora la moneda se lanza 10 veces mas.
C S CCCC S CCC SS CC S CC SSS C SS CCC SSS CCCC SSS CC SS
Distribución Asintótica Para Muestra Grandes
(Gibbons & Chakriborti, 1992)
Estos autores, estudiaron el comportamiento de la variable R, encontrando que para muestra grandes (m+n > 20) es posible modelarse mediante la distribución normal con los
siguientes parámetros: 2 2
2
2
(2
)
1
;
(
1)
R Rmn
mn mn
N
N
N
N
µ
= +
σ
=
−
−
Recuerde: esta aproximación debe ajustarse por continuidadAdicionar 0.5 si R < E(R) o restar 0.5 si R > E(R)
Ejercicio 1
Se lleva una estadística de control de calidad de las características suceptibles de medición de artículos tomados de un punto fijo de una banda transportadora en una línea de producción: Las mediciones obtenidas en un turno de producción, en orden cronológico, son las siguientes
68.2 71.6 69.3 71.6 70.4 65.0 63.3 64.7 65.3 64.2 67.6 68.6 66.8 68.9 66.8 70.1
a) Clasifique las mediciones de esta serie de tiempo como superiores o inferiores al promedio muestral y determine (con la prueba de rachas) si observaciones consecutivas sugieren una falta de estabilidad en el proceso de producción.
b) Divida el periodo en dos partes iguales y aplique una prueba T-student, sugieren los datos un desplazamiento del nivel medio de las características de calidad?
Test sobre dos Poblaciones Independientes
Se tienen muestras aleatorias de dos poblaciones independientes
El objetivo es probar la hipótesis:
n m
y
y
y
y
x
x
x
x
.,
,...
,
,
,....,
,
,
3 2 1 3 2 1]
[
]
[
:
0E
X
E
Y
H
=
Prueba de Rachas de Wald – Wolfowitz
(1940)
Es posible probar la hipótesis de que las dos muestras provienen de la misma población, conformando una sola muestra combinada ordenada.
Dicotomizando la muestra según el siguiente criterio
, , 1 3 2 1
,
z
,
z
,....,
z
m nz
m nz
+ − + ] 0 1 ∈ ∈ Y z si X z si i i i ηPrueba de Rachas de Wald – Wolfowitz (1940)
Esto generaría sucesiones de 0 y 1, cuyos casos mas extremos serian:
Según esto, es posible probar la hipótesis planteada a través del análisis de las rachas generadas en el procedimiento
0000000000….111111111111 E[X] > E[Y]
111111111111 …. 0000000000 E[Y] > E[X]
Observación: la prueba es unidireccional, y tan solo
evidencia diferencias, mas no su dirección.
Recordando la Prueba de Rachas
Max (r) = 2n+1 si m > n 2n si m = n 1 1 2 * 1 1 2 2 ( ) 1 1 1 1 1 1 1 1 1 2 2 1 2 2 2 2 m n i i f R i m n m n i i i i − − − − = = − − − − − − + − − − − − − Cuando i es par Cuando i es impar 2 2 2 2 (2 ) 1 ; ( 1) R R mn mn mn N N N N
µ
= +σ
= − −Ejercicio
Grupo
Observaciones
A
10 12 13 14
B
8 11 11
Pruebe la hipótesis de que ambos grupos tienen el mismo centramiento
Ejercicio 2
Se cuenta con dos maquinas para la elaboración de cierto tipo de papel, cuya característica típica de calidad es su brillantes (radiactividad luminosa). Durante los últimos días se han recibido quejas acerca de la inestabilidad de esta característica por parte de los clientes y se sospecha que puede deberse al tipo de maquina empleada. Se han tomado mediciones de ambas maquinas, obteniendo los siguientes resultados:
A B 6.1 9.1 9.2 8.2 8.7 8.6 8.9 6.9 7.6 7.5 7.1 7.9 9.5 8.3 8.3 7.8 9.0 8.9 Sugieren los datos evidencia suficiente para
corroborar la hipótesis de la empresa?, utilice la prueba de wald wolfowitz
El Test de Aleatoriedad Para Pares Igualados
Suponga que se esta interesado en medir el efecto que presenta sobre un probeta de concreto la incorporación de cierto aditivo de caolín, para ello es medida la resistencia a la compresión de cada una de las probetas con y sin aditivo.
El diseño experimental debe ser cuidadoso, puesto que para que sean comparables la probeta con caolín y sin caolín que se piensa comparar deben ser creadas bajo el mismo lote de producción, de manera que el único efecto no aleatorio posible sea el aditivo.
El Test de Aleatoriedad Para Pares Igualados
Procedimiento de aleatorización: Se disponen de 4 lotes de
producción, en cada uno se producen dos probetas, una de las cuales mediante asignación aleatoria es sometida al aditivo. Y se obtienen los siguientes resultados
a) Estas diferencias se deben al azar, o son consecuencia del aditivo? b) Que opciones parametricas existen?
1 2 3 4
Con aditivo 82 65 74 82
Sin aditivo 63 68 66 65
El Test de Aleatoriedad Para Pares Igualados
Test de Hipótesis:
H0: Ambos tratamientos son equivalentes (la muestra es
totalmente aleatoria)
Ha: Existe un Patrón que favorece a una de las dos
categorías
El Test de Aleatoriedad Para Pares Igualados
Situaciones a considerar:
1)
Las observaciones por lote se encuentran
correlacionadas.
2)
Si el aditivo no tienen ningún efecto, las 10
observaciones pueden considerarse como una
sola muestra aleatoria.
3)
Si el aditivo no tiene ningún efecto, las
diferencias observadas seguirían existiendo sin
importar la presencia ausencia de aditivo.
El Test de Aleatoriedad Para Pares Igualados
Estrategias de Solución:
Bajo 1) para eliminar la asociación entre categorías es necesario trabajar con
las diferencias observadas
Bajo 3) Si las diferencias se deben al azar, es igualmente probable obtener
una diferencia de (3) o una diferencia de (-3). En resumen el espacio muestral estaría conformado por 24= 32 posibles resultados.
1 2 3 4 suma (di)
Diferencias (di) 19 -3 8 17 41
LOTE
El Test de Aleatoriedad Para Pares Igualados
Espacio muestral de la suma de diferencias bajo
Ho:
1 2 3 4 suma (di) E1 19 -3 8 17 41 E2 19 -3 8 -17 7 E3 19 -3 -8 17 25 E4 19 -3 -8 -17 -9 E5 19 3 8 17 47 E6 19 3 8 -17 13 E7 19 3 -8 17 31 E8 19 3 -8 -17 -3 E9 -19 -3 8 17 3 E10 -19 -3 8 -17 -31 E11 -19 -3 -8 17 -13 E12 -19 -3 -8 -17 -47 E13 -19 3 8 17 9 E14 -19 3 8 -17 -25 E15 -19 3 -8 17 -7 E16 -19 3 -8 -17 -41 LOTE Genera distribución de referencia / 2 1 / 2(
P
α;
P
−α)
Zona Aceptación HoEl Test de Aleatoriedad Para Pares Igualados
Decisión:
1 2 3 4 suma (di) E12 -19 -3 -8 -17 -47 E16 -19 3 -8 -17 -41 E10 -19 -3 8 -17 -31 E14 -19 3 8 -17 -25 E11 -19 -3 -8 17 -13 E4 19 -3 -8 -17 -9 E15 -19 3 -8 17 -7 E8 19 3 -8 -17 -3 E9 -19 -3 8 17 3 E2 19 -3 8 -17 7 E13 -19 3 8 17 9 E6 19 3 8 -17 13 E3 19 -3 -8 17 25 E7 19 3 -8 17 31 E1 19 -3 8 17 41 E5 19 3 8 17 47 Zona de Aceptacion (87.5%) LOTE“La muestra es aleatoria, no existe un efecto del aditivo sobre la resistencia mecánica de la probeta”
El Test de Aleatoriedad Para Pares Igualados
Recordando los supuestos
1. Los datos corresponden a muestras apareadas.
2. La asignación de un individuo a una de los dos tratamientos se realiza de manera aleatoria.
3. La escala de medición es al menos de intervalo. 4. El tamaño de muestra es pequeño*
* Para muestras grandes es computacionalmente costoso, es preferible utilizar
Si N > 25 , es posible utilizar el teorema del limite central, 2 2 max 2 2 5 ~ (0, ) 2 i i i i i d d d N d Z d N d ⇒ =
∑
⇔ ≤∑
∑
∑
∑
El Test de Aleatoriedad de dos Muestras
Independientes
Si se dispone de dos muestra aleatorias independientes
con n
1y n
2(pequeños) como tamaño de muestras,
mediciones en escala al menos de intervalo y se desea
probar la hipótesis:
0
:
1 21
:
0 2H
µ
=
µ
vs
H
µ
≠
µ
Según Ho, la razón por la cual se presentan n1observaciones en el grupo 1 y n2 observaciones en el grupo 2 corresponde a factores de azar, con una probabilidad de: 1 1 2 1 n n n − +
El Test de Aleatoriedad de dos Muestras
Independientes
Ejemplo:
Grupo
Observaciones
A
19 20 22
B
0 11
Según Ho esta es una de las 10 posibles ordenamientos que se hubieran podido obtener al realizar la clasificación desde elementos provenientes de la misma población