Revista Colombiana de Estadística N» 3 - 1981
UNA
E X T E N S I Ó N
DE LA PRUEBA DE FRIEDMAN
Jofige. OKtiz V.
Instructor Asociado Universidad NacionalIntroducción. Diversas generalizaciones de la prue-ba de Friedman a problemas de clasificación cruzada a tres o más vías son posibles tanto en el caso de una observación por celda como en el de varias ob-servaciones por celda.
Damos en este artículo una ilustración para el caso de una clasificación cruzada a tres vías con una observación por celda.
Problema. Consideramos una o varias poblaciones cu-yos elementos son clasificables según tres crite-rios diferentes A, 8, C. La clasificación es posi-ble dentro de I modalidades de A, J modalidades de 8 y ÍC modalidades de C. Notamos ^ ¿ J k el elemento que presenta la modalidad i. de A, la modalidad /' de B y la modalidad fe de C simultáneamente.
Suponemos que cada combinación de modalidades { X . , j , k ) está representada en el tablero de datos
por un ú n i c o e l e m e n t o ^ ; ! f ¿ (es d e c i r , hay una o b s e £ v a c i ó n por c e l d a ) . Tab I ero de d a t o s C r i t e r i o A M o d . 1 Mod.x; M o d . I C r i t e r i o 8 M o d . 1 • • M o d . J M o d . 1 • • M o d . J M o d . 1 • • M o d . J C r i t e r i o C M o d . I • • Mod.fe • • • •
• ' ü k
Mod.KS u p o n e m o s que los e l e m e n t o s X . -i n o s p e r m i t e n una c o m p a r a c i ó n de tipo o r d i n a l e n t r e e l l o s , de tal manje ra q u e p a r a cada X/;fc p o d e m o s d e f i n i r su r a n g o d e n t r o de un c i e r t o s u b c o n j u n t o del t a b l e r o de d a t o s . F i n a l m e n t e s u p o n e m o s q u e las v a r i a b l e s a l e a t o r i a s X . i son m u t u a m e n t e i n d e p e n d i e n t e s . Con el a n á l i s i s que p r e s e n t a m o s e n s e g u i d a , t r a t a -m o s de d e t e c t a r si d e n t r o de uno de los c r i t e r i o s A, 8,C, e x i s t e n m o d a l i d a d e s que t i e n d e n a t e n e r r e s u l t a -d o s m á s g r a n -d e s q u e o t r a -de las m o -d a l i -d a -d e s -del m i s m o c r i t e r i o .
HlPOTESIS
I. Para el criterio de clasificación A.
H . : De acuerdo con el criterio de clasificación A, todas las posibles maneras de ordenar los ele-mentos son igualmente probables.
H,: En el criterio A, hay por lo menos una modali-dad que tiende a tener valores más grandes que al menos una de las demás.
2, Para el criterio de clasificación B O
H
8 De acuerdo con el criterio de clasificación 8,
todas las maneras posibles de ordenar los ele-mentos son igualmente probables.
Hg: Dentro del criterio de clasificación 8 hay por lo menos una modalidad que tiende a tener valo-res más grandes que al menos una de las demás.
3. Para el criterio de clasificación C.
Formulamos las hipótesis en forma análoga a las anteriores.
MÉTODO. (Lo indicamos solamente para el criterio 8)
Sea R - ; L el rango asociado a ^ j j u dentro del conj unto
^^^lfe''^.c2fe"*-''^.¿Jfe^
i g u a l p r o b a b i l i d a d 1/J.
Es fácil ver e n t o n c e s que el valor e s p e r a d o y la v a r i a n z a de ^ : : t, son (bajo H g ) , E(R^yjj) = ( J + l ) / 2 Va^íR ..,) = ( J ^ - l ) / 1 2 -C j fe p a r a t o d o i = 1 , . . . , I y t o d o fe = ! , . . . , / ( . Sea I K R . = y y R - .. i = l fe = l e n t o n c e s se t i e n e . E(R . )= I J ( J + I ) / 2
• i
-l/a^(R .) = I J ( J ^ - 1 ) / 1 2 . Y si d e f i n i m o s las v a r i a b l e s Z m e d i a n t e la e x p r e -s ion R - -IÍ((J+l)/2 -' /líC(J - 1 ) / 1 2e n t o n c e s Z • tiene valor e s p e r a d o cero y v a r i a n z a u n o . A d e m á s s i e n d o las v a r i a b l e s R • i d é n t i c a m e n t e d i s t r i b u i d a s con v a r i a n z a f i n i t a no c e r o , p o d e m o s a p l i c a r el t e o r e m a del l í m i t e c e n t r a l y c o n c l u i r e n t o n c e s q u e la d i s t r i b u c i ó n d i s t r i b u c i ó n n o r m a l e s t á n d a r e n t o n c e s q u e la d i s t r i b u c i ó n a s i n t ó t i c a de Z- es la De esta m a n e r a v e m o s q u e las v a r i a b l e s
, (R . - l K i J + l ) / 2 )
I Í ( ( J - 1 )
i
= 1,
. J
t i e n e n una d i s t r i b u c i ó n a s i n t ó t i c a de C h i - 2 con un g r a d o de l i b e r t a d . No d e b e m o s o l v i d a r s i n e m b a r g o que las v a r i a b l e s R • no son i n d e p e n d i e n t e s , p u e s
-• j -• to que se tiene la s i g u i e n t e r e l a c i ó n J J I K
I R. = I ( I
I
R..^) = IO(J+l)/2
i = i •^- y = i -¿=1 fe=i ^^'^
Se p u e d e ver que la v a r i a b l e T = J-1i^'
i = l J t i e n e una d i s t r i b u c i ó n a s i n t ó t i c a de C h i - 2 con (J-1) g r a d o s de l i b e r t a d . A s í , para p r o b a r la hipó-t e s i s H Q c o n hipó-t r a Hn p o d e m o s u t i l i z a ri m u í ) i^(^y.-i>^(J^i)/2)
12TJTCnT)
J
i = l •
- 3 T K ( J + l )y s a b i e n d o que T 'v- X'_i asin tót icament e, d o n d e esta ú l t i m a e x p r e s i ó n s i g n i f i c a que la d i s t r i b u c i ó n asiri t ó t i c a de T es C h i - 2 con ( J - 1 ) g r a d o s de l i b e r t a d .
P o d e m o s o b s e r v a r q u e b a j o H„ e s p e r a m o s q u e R • sea a p r o x i m a d a m e n t e i g u a l a su v a l o r e s p e r a d o
ne un valor pequeño. Si hay alguno de los R• que difiere considerablemente de su valor esperado, T e s más grande. De esta manera los valores grandes de T conducen a rechazar Hg.
Estadísticas análogas pueden obtenerse para pro^ O ,,1
bar las hipótesis H. contra H. y j (.uiiLici MI y H- contra n - ,
Es interesante observar que si por ejemplo ÍC= 1 , es decir que si solo hay dos criterios de clasifica^ ción (A y 8) entonces la estadística T se reduce a
J
TJ
v ^ / j ] - '''''''
que es la estadística de Friedman.
Ejemplo práctico. Se usan cuatro fertilizantes dife^ rentes, uno en cada uno de seis terrenos diferentes; el experimento se repite usando tres tipos diferen-tes de semilla. Se observa la producción por área obteniéndose los siguientes resultados:
Semilla Fertilizante 1 2 3 4 Terreno 1 2 3 4 5 6 80.5 87.0 86.1 82.1 79.3 84.2 90.1 83.4 82.4 84.9 87.1 89.3 87.0 89.1 91.0 84.4 92.2 85.3 88.0 90.3 86.1 83.1 90.8 84.7 79.1 77.6 84.1 83.3 76.6 81.0 87.0 82.0 80.6 79.5 86.2 84.1
Semilla F e r t i l i z a n t e T e r r e n o 3 4 1 2 3 4 5 6 3 82.6 81.4 89.0 86.3 84.0 88.1 4 81.5 87.9 80.4 83.1 87.4 85.0 1 2 3 4 85.4 89.2 90.0 83.4 87.1 82.3 92.3 90.1 88.1 85.3 86.3 92.9 92.0 90.2 87.2 94.3 88.4 95. 1 89.3 93.6 90.8 87.6 93.7 82.9 ,,0
Hg Ninguno de los fertilizantes tiende a tener va-lores de producción más grande c¡ue ninguno de los demás.
Hg Existe por lo menos uno de los fertilizantes que tiende a tener valores de producción más grandes que al menos uno de los demás.
Nota. Este ejemplo es extraído de Conover (1971) pág 172 donde el problema es resuelto mediante una prue-ba de la mediana.
En este problema particular tenemos:
1 - 3 , J = 4, K ' 6
y las sumas de rangos para los fertilizantes son
R - 26.5 R, - 47
R- - 56 R, - 50.5
. 4 .
go m e d i o ) R e e m p l a z a n d o e s t o s v a l o r e s en la e x p r e s i ó n d a d a para T e n c o n t r a m o s T = 1 6 . 5 8 3 3 . A t í t u l o de c o m p a r a c i ó n d a m o s el v a l o r 14.0 o b -t e n i d o m e d i a n -t e la u -t i l i z a c i ó n de la e s -t a d í s -t i c a de la m e d i a n a ; a m b o s v a l o r e s son r e s u l t a d o de v a r i a b l e s c u y a d i s t r i b u c i ó n a s i n t ó t i c a es la de C h i - 2 con tres g r a d o s de l i b e r t a d . Sin q u e e l l o c o n s t i t u y a una p r u ^ b a , p o d e m o s o b s e r v a r que la e s t a d í s t i c a T b a s a d a en r a n g o s pone en m a y o r e v i d e n c i a el r e c h a z o de Hg que la e s t a d í s t i c a de la m e d i a n a . C o n c l u s i o n e s y o b s e r v a c i o n e s . Al c o n o c i m i e n t o del a u t o r del a r t í c u l o , la e s t a d í s t i c a p r o p u e s t a no a p a rece e s t u d i a d a en la l i t e r a t u r a . La idea de su exiis t e n c i a es s u g e r i d a por C o n o v e r ( 1 9 7 1 ) .
La d i s t r i b u c i ó n e x a c t a de la e s t a d í s t i c a T b a j o la h i p ó t e s i s n u l a Hg p u e d e e n c o n t r a r s e e n u m e r a n d o los (JI )''* a r r e g l o s p o s i b l e s de los r a n g o s ; p e r o e £ to r e s u l t a b a s t a n t e largo y e n g o r r o s o (en el c a s o del e j e m p l o c i t a d o hay 6 . 979 1 4 7 0 3 5 x 1 0 ^ ^ a r r e g l o s e q u i p r o b a b l e s bajo H g l ) . Este i n c o n v e n i e n t e es aún m á s s e r i o en p r o b l e m a s de m á s de t r e s v í a s ; sin em b a r g o la c o n v e r g e n c i a h a c i a la ley a s i n t ó t i c a es en e s t o s c a s o s m u c h o m á s r á p i d a q u e en el c a s o de dos v í a s .
B I B L I O G R A F Í A
[ l ] Conover ,W.J . , P f i a c t i c a t Nonpaxametl. ¿c S t a t i i
t l c i > , John W i l e y , N . Y o r k , ( 1 9 7 1 ) .
10
POST-GRADO EN ESTADÍSTICA
El Departamento de Matemáticas y Estadística de la Universidad Nacional de Colombia ofrece cur-sos de postgrado en Estadística, conducentes a
optar al título de
fÁag¿6ttfL S c i í n t i a z
en
E ^ t a
-dX-itica.
Para mayores informes dirigirse a:
Director Académico
Postgrado en Estadística
Departamento de Matemáticas y Estadística Universidad Nacional de Colombia
Bogotá , D.E.