INSTIT Lft)
TECNOLÓGICOY DE ESTUDIOS SUPERIORES DE MONTERREY
CAMPUS
MONTERREYDIVISIÓN DE CIENCIAS Y HUMANIDADES
TESIS
ESTUDIO COMPARATIVO DE LAS POTENCIAS DE
DOS
PRUEBASESTADÍSTICAS QUE ABORDAN EL PROBLEMA DE BEHRENS-FISHER, APLICANDO LA METODOLOGÍA
DE P-VALORES POR INTERVALO.ERIC ULISES RODRÍGUEZ ESPINO
MONT[RREY, N. L. MAYO DE 1999
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY
CAMPUS MONTERREY
DIVISIÓN DE CIENCIAS Y
HUMANIDADES
TESIS
ESTUDIO COMPARATIVO DE LAS POTENCIAS DE DOS PRUEBAS ESTADÍSTICAS QUE ABORDAN EL PROBLEMA DE BEHRENS-FISHER,
APLICANDO LA METODOLOGÍA DE P-VALORES POR INTERVALO.
ERIC ULISES RODRÍGUEZ ESPINO
MAYO DE 1999
MONTERREY, N. L.
RE SUMEN
FI objetivo de este trabajo se centra en estimar las potencias de dos pruebas estadísticas que abordan el problema de Behrens-Fisher. La metodología involucrada para el cómputo de las potencias incorpora los conceptos desarrollados por Berger y Boos
(1994) relacionados con la
estimación de p-valores por intervalos de confianza para parámetros de ruido.Se utilizaron rutinas computacionales desarrolladas ad/xc como método de estimaci5n, en las que se simularon, por una parte, las distribuciones asociadas con
ios estadísticos de prueba
para obtener los puntos de corte que delimitaban una prueba detamaño
a0.05, así como
muestras que permitiesen estimar conjuntamente las potencias asociadas.Se encontró que bajo ciertas combinaciones de los tamafios de muestra y del parámetro de ruido, una prueba resulta localmente más potente que la otra, en otras circunstancias,
las
potencias muestran un“entrelazado”. Por otra parte, se encontr5 que una de las pruebas
permanece localmente constante.e A g r a d e e i m i e n
to s
AGRAD E CIM lENTOS
En lo aca(lémicO.
‘[res (lrKt(nn~
En lo económico.
Raz~7.,1771lXfl77~V~2O
En el motivo.
Unamujer.-. la m~ier.
Jorge Sierra, Graciela González y Rogelio Ramos:
Verdaderamente les digo que la diferencia entre esta maestría y las demás que se ofrecen en el mercado la hace su excelente calidad humana. Es impecable.
Cumpliste - probablemente sin darte cuenta - una promesa hecha hace mucho, mucho tiempo.
Simplemente, me hubiera asfixiado.
Yana
Yap Guerrero.A todos ustedes,
nmi
sincero agradecimiento.Indice
ÍNDICE
Presnión
1.1 Introducción 1
1.2 Métodos de solución 3
1.3 Planteamiento 5
2 Pruebas
2.1 Repaso de p-valores 6
2.2 Método de Berger y Boos 9
2.3 Método exacto 11
3 Metodología
3.1 Supuestos 14
3.2 Metodología 15
3,2.1 Estadístico S 16
3.2.2 Estadístico t 19
4 Conclusiones
4.1 Resultados 22
4.2 Conclusiones y recomendaciones 23
Anexos
Anexo A.1 A.1
Anexo A.2 A.2
Anexo A.3 A.3
Anexo A.4 A.4
Anexo A.5 A.5
Forma de lectura del anexo A. 5 A.5. 1
Bibliografía
e 1 Presentación
1.1 Introducción
Uno de lOS objetivos de la estadística es hacer inferencias con respecto a los parámetros poblacionales desconocidos, basadas en la información obtenida mediante datos muestrales Estas inferencias se expresan básicamente en una de dos maneras, como estimaciones de los parámetros respectivos o como pruebas de hipótesis referentes a sus valores.
Las pruebas de hipótesis se realizan en todos los ámbitos en los cuales puede contrastarse la teoría frente a la observación. Se someten las hipótesis a una verificación estadística, comparando las hipótesis con los datos muestrales observados.
En muchos casos, las herramientas estadísticas utilizadas para resolver los problemas de hipótesis están sustentados por una teoría asintótica, es decir una teoría para muestras grandes. Sin embargo, es muy común que las características del experimento impidan la obtención de un tamaño de muestra suficientemente grande para validar la utilización de dichas herramientas.
Usualmente se aborda este problema desarrrollando teoría estadística que nos permita conocer las características distribucionales asociadas a estadísticos basados en pequeñas muestras, características que en la mayoría de las ocasiones serán desconocidas o en el menor de los casos, serán aproximaciones.
¿Qué hacer entonces si queremos una solución exacta?
Probablemente, la forma más usual en la que se ataca el problema es haciendo uso de la tecnología computacional a nuestro alcance. Si bien es cierto que la simulación no ofrece una solución exacta, también es cierto que reproduce, en buenaparte,la realidad.
Atendiendo este precepto, utilizaremos la simulación para contrastan dos métodos alternativos de prueba que abordan el problema de Behrens-Fisher, problema que ha permanecido abierto puesto que no se ha encontrado una solución satisfactoria a pesar de encontrarse en la literatura numerosas soluciones exactas yaproximadas.
Nos abocaremos al caso en el que se presenten muestras pequeñas para este problema.
P res en t dci Oil
Sean X,, X2... X~y Y1, Y2... Y~dos muestras aleatorias independientes de
poblaciones
normales con media i’~y Aty , y vanianza o~.y o~,respectivamente y consideremos las siguientes hipótesis estadísticas:110 — = O
H :~i~—»~=~ >0 (1.1)
Sean ~,
Y
y y S~, las medias y las varianzas muestrales, respectivamente.Para un problema como (1.1), cuando se presupone que las varianzas de ambas poblaciones,
~ y a~.,son desconocidas pero iguales,
la prueba del cociente de verosimilitudes
indica que la hipótesis se probará a partir de la utilización de un estadístico T, definido de la siguiente forma:12
~
que incorpora la estimación de una vanianza muestral conjuntaS~2,a partirde la ponderación de ambas varianzas muestrales, S~y S~.Es decir,
s
2 — (in—1)S~.+(n—l)S~— m+n—2
Cuando H
0 es cierta, el estadístico Y tiene una
distribución t-Sti-irient
con m-fn-2 grados de libertad.Sin embargo, cuando o-~.y
son desconocidas y además, o,~- c-~,el estadístico anterior
no continúa teniendo una distribución t-Sturknt cuando H0 es cierta. A este problema, la literatura lo ha denominado como el problema de Behrens-Fisher’.Un estadístico que surge de manera natural pararesolver (1.1) es
Verejercicio 8.52 de Casella y Berger (1990 p396)
2
Presentación
—
/ (1.3)
+
/1? /1
Y resulta iiiuv natural el uso de (1.3) si observamos que el denominador continúa siendouna estimacion de la desviación estándar de
~
—Y,
aun cuando o~.y no sean iguales.Es bien s~hidoque la distribución del estadístico (1.3) es asintóticaniente N~O,1)para poblaciones con cualquier función de densidad, siempre que los segundos momentos poblacionales existan. Sin embargo, para muestras pequeñas, (m yn fijos) si las poblaciones son normales, la distribución dependerá de la razón delasvarianzas poblacionales,
(1.4)
Es fácil comprobar que (1.3) depende de p puesto que es una combinación lineal del estadístico (1.2). De hecho, la relación está dada por:
=T.Ji(pIS~,S~,m,n) donde la función
2 ~(1 +p/N)(1+ Nu/p)~í(m- 1)(n-l)~
Il(p~S~,S~,m,n)=~jJ
~ (n-1)S~+(m-1)S~
J~
m+n-2J
y,donde N=in/n y u=S~/S~.
1.2 Métodos de solución
Para poder resolver (1.1), suponiendo ~ o~,probablemente el método más utilizadoes el que estableció Welch (1937), quien propuso un estadístico ç , similar a (1.3), cuya distribución se aproxima a unat-Stiid~it.
3
Pies en t acm 5 n
En este sentido, la investigación de Welch condujo a que la distribución de t~p~ía ser
aproximada a partir de una distribuciónt-Studentcon
y
grados de libertad, dondey (s~
/m +S~/n)2/(S~/(n~
flm2) +S~/(n3—Esta aproximación, posteriormente la generalizaría Satterthwaite (1946), quien encontraría una distribución aproximada para lasuma ponderada de variables aleatorias independientes Ji-Cuadrada (no necesariamente con igual número de grados de libertad), en donde la ponderación no necesariamente tenía que suman la unidad.
Varios estudios han demostrado que la solución propuesta por Welch es ligeramente liberal, lo que significa que para ciertas combinaciones de m, n yp, el error Tipo 1 es mayor que el valor nominal preestablecido.
No obstante, Best y Rayner (1987) reafirman el valor práctico de la solución propuesta por Welch y recomiendan su uso rutinario cuando los grados de libertad estimados, y, sean mayores que 5. Varios libros de texto ofrecen como herramienta para abordan (1.1) esta solución aproximada.
Antes de que se encontrara la distribución exacta de (1.3), varios autores trabajaron en proponer distribuciones aproximadas para resolver (1.1). La primera distribución “exacta”
fue dada por Behrens (1929) y fue extendida por Fisher (1939). De acuerdo con Best y Rayner (1987), la solución de Behrens-Fisher no es aceptada por muchos estadísticos, sin embargo Robinson (1976), Barnard (1984), yTsui y Weerahandi (1989), entre otros, aseguran que los p-valores de los estadísticos obtenidos con la solución de Behrens-Fisher es aceptable. Por ejemplo, Robinson (1976) comenta que la solución de Behrens-Fisher, para el problema de medias, es óptima de entre todas las pruebas que son ccnseru~doras2Así mismo, sugiere que esta técnica debe utilizarse como la prueba correcta, siempre que no se encuentre una prueba Bayesiana más apropiada. En este sentido, Johnson y Weerahandi (1988) proporcionaron una solución Bayesiana al caso multivariado del problema de Behrens-
2 Se utiliza la palabra cri~n.adorasparareferimosal hecho de queelerror Tipo 1, por lo general, es menor que el valor nominaldel valor preestablecido.
4
P r e s e n t a e i 5 n
Fisher, y para el caso univariado, la solución Bayesiana de Jeffreys (1961) coincide con la solución de Behrens-Fishcr.
Así como Welch, algunos otros autores abordaron el problema desde la misma perspectiva y
ofrecieron distribuciones aproximadas para el estadístico t~.Una buena referencia donde se comentan las ventajas y desventajas de las distribuciones aproximadas más sobresalientes se
puede encontrarenScheffé (1944) yScheffé (1970).
Por otra parte, para resolver (1.1), algunos autores como Nel D.G., Van der Merwe C.A. y Moser B.K. (1990) han trabajado en obtener una solución exacta a (1.2). Por su parte, Dudewicz y Mishra (1988 p503) y Weerahandi (1996 p.l74) exponen algunos otros métodos para evitan las aproximaciones y ofrecen algunas soluciones exactas al problema original (1.1).
1.3 Planteamiento
Una pregunta inmediata puede establecerse al tratar de conocer cuál es la prueba uniformemente más potente para el problema (1.1), si es que una existe. Sin embargo, Best y Rayner (1987) comentan que para el Problema de Behrens-Fisher no existen pruebas uniformemente más potentes (insesgadas) para todos los tamaños de muestra, porlo que el objetivo de este trabajo gira en torno a comparar la potencia de dos pruebas y así, determinar si alguna de ellas es localmente más potente que la otra.
La primera ele ellas es un método exacto extraído de Weerahandi (1996 p.l74) y la otra se basa en el estadísticot~,cuyo método de dlculo fue propuesto por Bergery Boos (1994) y está relacionado con la estimación de p-valores a través de regiones de confianza
A continuación, se tendrá especial atención en ofrecer los detalles de ambas pruebas y posteriormente, en presentar la metodología computacional que se instrumentó para el cálculode las potencias.
En la última parte de este trabajo se exponen las conclusiones y recomendaciones derivadas de los resultados obtenidos.
5
2 Métodos
2.lRepaso de p-valores
Cuando queremos probar una hipótesis en presencia de parámetros de ruido1 surgen algunas complicaciones. Por ejemplo, consideremos un modelo en el que la muestra, X, tiene una distribución de probabilidad
Ph,,
definida en términos de los parámetros8
y p. Ahora,supongamos que queremos probar (1.1) desconociendo el valor del parámetro p.
Supongamos que tenemos un estadístico de prueba Y, entonces, para un valor observado t, el p-valor,p, se define como p = sup P~(Y t) 2
Desafortunadamente, el cálculo de este supremo a veces puede resultar muy complicado.
Paraatacar esta dificultad, se puede proceder de tres maneras que reemplazan el cómputo de
supt~por el cálculo de una sola probabilidad.
• En algunas situaciones es posible que el SU~pse alcance en un valor específico de p, digamos p0, para todot. En tal caso, el p-valor es simplemente p= ~ (T t).
• Otra forma de manejar el problema es escogiendo un estadístico T (que incorpora usualmente una estimación del parámetro p), cuya distribución, cuando H0 es cierta, no dependa de p. De esta forma, el cálculo del supremo se evita y el p-valor se define como
p=P6~(T t), queeselmismoparatodop.
Se traducirícomoparebnetrode ividolo que en inglés se conoce como nniavacrpantrn~er.
2 Para una exposick~nclara sobre la definici6n del p-valor se puede consultarCasella y Berger (1990p. 364).
Métodos
• Un tercer método es condicionar el cálculo del p-valor a un estadístico
S
que sea suficiente para p cuando H0 es cierta. Así, el p-valor se define comop = P1. (Y 1 S = s), que no dependerá de p cuando H0 es cierta.
Cada uno de estos métodos produce un p-valor válido en el sentido de que, cuando la hipótesis nula es cierta,
P(p a) a ,paracada a ~ {0,1l (2.1)
Es decir, se construye un estadístico p tal que, cuando H0 es cierta, la probabilidad de rechazar la hipótesis nula, dadapor (p a), sea tan pequeña como se desee.
Sin embargo, a veces existen ciertos inconvenientes para aplicar alguna de las alternativas descritas anteriormente. Por ejemplo:
• El valor de p en el que ocurre el supremo puede depender del valor de ten una forma
muy“rebuscada”.
• Las propiedades distribucionales asociadas a estadísticos que incorporan estimaciones de los parámetros de ruido, usualmente, no son conocidas.
• Es posible que no podamos encontrar un estadístico suficiente S, para p, sobre elcual condicionan.
Para simplifican la flotación, denotaremos a un p-valor válido, es decir, un p-valor que cumple (2.1), como una función p(p) que depende del parámetro de ruido p . Dentro de
7
M é t o d o s
este contexto, si conocemos el valor verdadero de p , digamos p~,entonces el p-valor se denotará corno p(p0) y se definirá corno:
p(p0) = J~ (T t) (2.2)
Por otra parte, si no conocemos el valor real del parámetro p, entonces, un p-valor válido puede calcularse a partir de la maximización de p(p) sobre todo el espacio paramétrico de p.
Esta maximización se definecomo:
=
sup p(p)
= sup ~ (T t) (2.3)El cálculo de p~presenta dos dificultades potenciales:
• Es común que la maximización sobre el espacio panamétrico de ,ø se efectúe numéricamente, entonces, si este espacio no está acotado, siempre queda la duda si la rutina efectivamente alcanzó el máximo absoluto.
• Estadísticamente hablando, es un desperdicio de información tomar el supremo sobre todo el espacio paramétrico de p habiendo observado ios datos. En este sentido, debemos de ser capaces de estimar p y no consideran en la maximización valores para p que no estén avalados por la muestra.
Storer y Kim (1990) extrapolaron esta idea y propusieron como p-valor a p(~,), donde es el estimador de máxima verosimilitud para p. Sin embargo, Berger y Boos (1994) comentan que este p-valor usualmente no es válido en el sentido de (2.1).
8
M é t o d o s
2.2 Método de Berger y Boos
Berger yBoos (1994) proponen una forma alternativa para calculan p-valores que cumplan con (2.1). Su método facilita los cálculos de maximización e incorpora la información estadística de la muestra observada; se maximiza la probabilidad buscada sobre un intervalo de confianza para p, que se calcula a partir de los datos.
Sea un intervalo de confianza de tamaño (1-fi) para el parámetro de ruido p cuando la hipótesis nula de (1.1) es cierta. El p-valor propuesto se calcula de la siguiente forma:
= sup p(p) +/3 (2.4)
Computacionalmente hablando, el cálculo de este p-valor debepreferirse a (2.3) en virtud de que la maxirnización se efectúa sobre un intervalo cerrado. Desde un punto de vista estadístico, las bondades de (2.4) residen en la incorporación de información a partirde la
muestra obtenida, al hacer la maximización sobre un conjunto verosímil parap.
La demostración desarrollada para comprobar que Pfl constituye un p-valorválido, es decir, que cumple (2.1), se puede encontrar en Bergery Boos (1994) y es casi inmediata.
Como siempre, el valor de /3 y por consiguiente el intervalo de confianza Cfi deberán especificarse antes de observan los datos. Los autores dan argumentos por los cuales recomiendan que /3 deba escogerse con valores pequeños, tales como 0.001 ¿ 0.0001.
Gupta y Yang (1996) demuestran analíticamente que no hay necesidad de hacer una maximización numérica para encontrar (2.4) en virtud de que se comprueba que el máximo
9
Métodos
ocurre siempre en cualquiera de los puntos extremos del intervalo C~fi.En este sentido, el problema se reduce aún más, puesto que lamaximnización que se debería llevar a cabo para encontrarel p-vaior, p13, ahora se reduce al cálculo de dos probabilidades:
p~=p(p)+/3
(2.5)
± (+)~/3
donde f) y p~ son los límites inferior y superior del intervalo de confianza Cfi
respectivamente. Después de calcular (2.5) se selecciona como p-valor válido aquel Pfl que resulte mayor.
Es conveniente aclarar que el desarrollo del método, presentado en este documento, es una particularización de lo propuesto en el artículo de Berger y Boos. Los autores hacen el desarrollo considerando no sólo un parámetro de ruido, sino un vector de parámetros de ruido, lo que claramente se traduce en hablar de regionesde confianzaen lugar de intervalos de confianza.
Berger (1996) reporta excelentes resultados en el cálculo de p-valores aplicando este método en casos en ios que se quiere comparar proporciones binomiales, es decir, tablas de
contingencia 2 x 2.
El objetivo de este trabajo, entonces, es extrapolar estos resultados y aplican esta metodología del cálculo de p-valores para determinar cuál de los dos estadísticos de prueba que se presentan en este trabajo, (1.3) ~ (2.6), es más potente cuando se quiere atacar el problema de Behrens-Fisher.
10
M 5 t o
d
o s2.3 Método exacto
Para poder estar en condiciones de evaluar las bondades del método descrito en la sección 2.2, será necesario proponer algún método que aborde directamente el problema de Behrens- Fisher
y
así, con base en el cálculo de las potencias para ambas pruebas, estar en posibilidad de contrastar ambos métodos. Dentro de este contexto, se dejarán de lado soluciones aproximadas para (1.1) y se considerará una solución exacta.Uno de estos métodos exactos para abordar el problema de Behrens-Fisher se presenta a continuación y está ampliamente desarrollado en Weerahandi (1996 p.l74).
Sean:
(X—Y)-8 ~ (m-1)S~. ~, (n.-1)S~
z—
‘ 2 ‘ Y 2¡~.2 ~2 ay
/
---~- +\:/fl fl
donde
Z
—~N(O,1),Y~
—~,~, Y~ ~ son variables aleatorias independientes entre sí.Definamos ahora:
Yx~,as~x +Y~ Zrn+n-2
Y (rn—1 n—1
B~ X —~Beta~~ 2 ,—2
donde
Z, B
y ~ ~.son también variables aleatorias independientes entre sí.La cantidad pivote propuesta es:
~ /~‘+~~—+8~ (26)
~ B 1— B
11
Métodos
y el p-valor que se utiliza para probar (1.1), una vez que se tiene la muestra, está dado por:
p=
P(S
s 8— =EB
‘~n+n-2 -(s _6~)/1~2 (2.7)~13 1-B
donde s = —
Y, E1~
es el valor esperado que se toma sobre la variable aleatoria ByF~÷~2esla función de distribución acumulada de una variable aleatoria t-S~daatconm+n-2 gados de libertad.
Los cálculos exactos para obtener este p-valor se pueden efectuar mediante la utilización de una rutina disponible en el paquete estadístico Xpro. Sin embargo, una buena aproximación de esta probabilidad puede realizarse mediante la generación de un número si?icientariente gr~vide de variables aleatorias Beta((rn—l)/2,(n —1)/2) y promediando los resultados
obtenidos de la evaluación de Fm+~.2(•)para cada uno de ellos. Sin embargo, para efectos de este trabajo no se utilizará esta aproximación en virtud de que se procedió a calcular la potencia vía la simulación de la distribución del estadístico (2.6).
Notemos que la metodología dada por Bergery Boos (1994) se refiere a encontrar p-valores, sin embargo, observemos que:
p—valor=_supP5 ~(Ttobse,.vada) Y
potencia(3) supP5~(Te ~1puu(o decorte)
Es decir, ambas cantidades se refieren a un proceso de maximización sobre todos los valores posibles del parámetro de ruido p. Por lo tanto, la metodología propuesta por Berger y Boos
Para este caso, puede considerarse un námero sufia n~grardecualquieraque sea superiora 10,000.
12
M 5 t o
d
o sse puedeulilizar para e1 cálculo de la potencia de la prueba para el problema de Behrens- 1 is her.
Por cuestiones computacionales, sólo estimaremos la potencia para cinco valores de ó equidistantes a lo largo de una desviación estándar de (Y(—
Y),
que denotaremos, para efectos exclusivos de esta explicación, como ~. Es decir,potencia(~) sup P
8. (T p,~odecorte)
Si recapitulamos, hasta ahoraya contamos con los elementos necesarios para poder iniciar
el
cálculo de la potencia de cada prueba, pu.es contamos con los estadísticos definidos por (1.3) y por (2.6), que serán contrastados a partir de la estimación de sus potencias, la cuales se obtendrán a partir de la metodología expuesta en la sección 2.2.Ahora, como sólo tiene sentido comparan pruebas que tienen el mismo tamaño (nivel), procedemos a establecer en a= 0.05 el nivel de error Tipo1 para ambas pruebas.
En la siguiente sección de la investigación estableceremos los supuestos necesarios y
describiremos la metodología
analíticay computacional involucrada en el cálculo de las
potencias para ambas pruebas.
fl
3 Instrumentación
3.1 Supuestos
Corno se discutió en la sección 1.1, cuando se tienen muestras pequeñas, el estadístico (1.3) no sigue una distribución conocida si las vanianzas poblacionales a~y son distintas. Por esta razón, para evaluar el desempeño de las pruebas, sólo consideraremos en las simulaciones tamaños de muestra m y n pequeños. De acuerdo con Robinson (1976) i podemos restringir el estudio a los valores que se encuentren en el conjunto {2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 1S}; entotal, 11 valores.
El total de parejas (m, n) que se pueden formar son 55 parejas. No se considerarán parejas en donde m y n sean iguales en virtudde que la investigación de Welch (1938) reporta que mientras que in = n, no hay mucho daño en ignorar que p
1 cuando se quiere probar
(1.1) utilizando el siguiente estadístico:(3.1)
~gv donde:
71 1
=sp
~+~
2s;
= (m—1)S~+(n—l)S~U. m+n-2
/ —~-+~
/ 11! fl
b(p2(m_l)+(n_1))/ .
e, /p(in—1)+(n—l) ‘ /(m+n—2)(na~+rna~)
y
(P(’~— ~ + @1 — /p (ni-l)+(n-l) ,donde pestá definido como en (1.4).1 La propuesta original de Robinson (1976) incluye los tamañosdemuestra (24, 32, 50, 100,cc).
Instrumentación
El estadístico (3.1) tiene siempre una distribución t-StudQit con m -fn- 2grados de libertad. Si p = 1 , (3.1) se reduce a (1.2) , tal como es de esperanse. Pero, en general, g yv dqenden del parámetro p.
Los estadísticos sobre los cuales se calcularán las potencias, utilizando el m&odo de Berger y Boos, están definidos en (1.3) y en (2.6). Como ya se mencionó, el primero depende explícitamente de p y en el segundo, la relación es intrínseca; se simularán distribuciones de estos estadísticos para distintos valores del parámetro p.
Para tal efecto, nuevamente utilizaremos la recomendación de Robinson (1976), quien propone simular distribuciones para cada k= dentro del conjunto
{
1/10, 1/5 , 1/3,1/2 , 2/3 ,
1, 3/2
, 2 , 3, 5, 10 }; en total, 11 valores2Entonces, para cada estadístico de
prueba, se tendrá que generar un total de ii.(’~) 605 distribuciones.Por último, proponemos que las
pruebas tengan un tamañode error Tipo1 de a
= 0.05.3.2 Metodología
La potencia de la prueba de hipótesis (1.1) con región de rechazoR se defme como una funciónde 6 de la siguiente forma:
2r(’6)=P~XERI8EíJ1)
(3.2)
Por lo que nuestro primer objetivo será determinar la región de rechazo, R
,para ambas
pruebas, que se logra partiendo del supuesto de que se desean pruebas de tamaño a= 0.05.Siguiendo esta línea, se describirá primero la metodología utilizada para encontrar la región
de rechazo para el estadístico S, defmido en (2.6), y posteriormente, la metodología para
calcular
su potencia. En
seguida,se procederá de
igualforma para elestadístico t definido en (1.3).2 La propuesta original incluye los valores {1/1000, 1/100, 1/30) ysusrecíprocos.
~.-.1o •~‘r~
;, iÇ~Jij( 15
3.2,1
EstadísticoSInstrumentación
I)elimitación de la región de rechazo.
Analíticamente tendríamos que encontrar un punto crítico s tal que:
P[»~+~ sJ=0.O5
donde las variablesZ, ~ Bse definieron en la
sección 2.3.
Sin embargo, el algoritmo siguiente fue utilizado para
encontrar una aproximación del punto
crítico s.1.
Fijan los tamaños de muestra
m, n y el valor del parámetro p ,de acuerdo con las
premisas establecidas en la sección 3.1.2. Generar dos muestras replicadas k veces, XIk~X2k~••~XmkY ~k’~,k’”~’~’n,k que
provengan
de distribuciones N(O,l) y N(IO,)/~,), respectivamente, donde
kE{1,2,...,l0000}.
3. Para cada réplica, k ,deXlk,X2k,...,Xmk ‘ k~’2,k~”J’~,kaplicarlatransformación
Z
IS~.
S~sk(lfl,n,p) =
4. Ordenar los diez mil valores
s,/m,n,p),de menor a mayor, y denotar esos valores
ordenados como s~(m,n,p).5. Seleccionar el s~5~(m,n,p)
como el
punto crítico que determina la región de rechazo para una prueba de tamaño a = 0.05.Es importante recordar que la distribución
normal pertenece a una familiade localidad y
escala, por lo que no hay pérdida de generalidad en las inferencias a partir de la distribución16
Instrumentación
normal que se está generando paralas muestras. En este sentido, se pudieron haber generado muestras provenientes de cualquier distribución normal con parámetros de localidad y escala escogidos libremente, siempre y cuando se satisfaga que:
a) —~=6~=O, y
b) p=
U)
El programa elaborado en S-Plusque calcula el punto crítico para el estadístico
S
se presenta en el anexo Al.Estimación de la potencia de la prueba.
Atendiendo la metodología de Berger y Boos (1994), analíticamente, el cálculo de la potencia de la prueba encontrada anteriormente se traduce en evaluar la siguiente probabilidad:
(
Z i 1 1/~(8~)=
sup P~~=~+ +8~s(95~)(m,n,p)6~=_~j_+~ +fl
ie {l,2,...,5}
Para efectos de este trabajo y debido a las limitaciones computacionales, la función potencia
sSMo estará evaluada en cinco puntos para el
parámetro 5= —¡1)~los puntos serán
equidistantesa lo largo de una desviación estándar de la estimación (~
—Y).
El hecho de restringir el recorrido del parámetro Sa
una desviación estándar se hace con el objeto de determinan si alguna de las pruebas es localmente más potente, en virtudde que se había hecho referencia, en la sección 1.3, que no existen pruebas uniformemente más potentes para el problema de Behrens-Fisher.Por otra
parte, la razón por la que sólo se calculancinco puntos de la potencia constituye
una de las limitaciones de esta investigación, que se deriva de la relativa ineficiencia computacional en cuestiónde tiempos de procesamiento.17
Instrumentación
Coinputacionalrnente, para poder evaluar la probabilidad anterior se procede de la siguiente forma:
1. Fijar los tamaños de muestra m, iry el valor del parámetro p , de acuerdo con las premisas establecidas en la sección 3.1.
2. Seleccionar el punto crítico,S~5~) (in,n,p),que corresponda a dicha elección de nr , n y p.
3. Generar dos muestras, X~,X,...,X y ~ que provengan de distribuciones
N(O,l) y respectivamente.
4. Obtener
p~=~-F~°’’~ ~
(n—I)1——
y 2
=
(n—1),—
y
25. Generar dos muestras replicadas k veces, XIk,X2k Xmk )~~‘I,k‘~“2,k~ ~“n,k
que
provengan de distribuciones N(O,l) y N~—8~,/ J, respectivamente, donde
ke{l,2,... ,10000} y ~=~[~~J
parai E (1,2,..., 5}.6. Para cada réplica,k,de XIk,Xak,...,Xflk ~“~,k,1T2,k»’~~n.k aplicarlatransformación
ke{1,2,...,10000}
7. Determinar q, que es
la cantidad de valores
s~in,n,p)que sobrepasan
S(95~)(in,n,p).8. Estimar la potencia, ir~(8k), que estarádada por el cociente entre q y 10000.
Instrumentación
9. Repetir el proceso a partir del punto 5, pero ahora, con el va1orp~ycalculan ~r, (5k).
10. Lapotencia estará dada por ~r(6~)= max{~r (Se), ~r. (S~)}+
3.2.2 Estadístico t
Delimitación de la región de rechazo.
Analíticamente tendríamos que encontrar un punto crítico t tal que:
Sin embargo, el algoritmo siguiente fue utilizado para encontrar una aproximación del punto crítico t. Este algoritmo es muy similar al usado en el estadístico anterior.
1. Fijan los tamaños de muestra m, n y el valor del parámetro p ,
de acuerdo con las
premisas establecidas en la sección 3.1.2. Generar dos muestras replicadas k veces, XIk,X2k X’mk y ~ ~k ,..., Y~ que
provengan de distribuciones N(O,1) y N(O~)/~)~respectivamente, donde
ke{l,2,...
,10000}.3. Para cada réplica, k ,de Xlk X2k,..., Xmk Y~,k ~2,k ~ ~‘n,kaplican la transformación
tk(fll,2’P)~=_-__ , ke{1,2,...,10000}
lm + n
19
Instrumentación
4. Ordenar los diez mil valores tk(~n,n,p), de menor a mayor, y denotan esos valores ordenados como t~ (‘m,n,p,).
5. Seleccionarelt(9500)(m,n,p)
como
el punto crítico que determina la región de rechazo para una prueba de tamaño a = 0.05.El programa elaborado en S-Plusque calcula el punto crítico para el estadísticot se presenta en el anexo A.2.
Estimación de la potencia de la prueba.
Atendiendo la metodología de Bergery Boos (1994),
analíticamente, el cálculo de la potencia de la prueba encontrada anteriormente se traduce en evaluar la siguiente probabilidad:donde p y p~son los límites inferior y superiorde un intervalo
de confianzade tamaño (1-j3)
parap.La forma en como se procedió computacionalmente fue
la
siguiente:1. Fijan los tamaños de muestra m, n y el valor
del parámetro p
,de acuerdo con
laspremisas establecidas en la sección 3.1.
2. Seleccionar el punto
crítico,t~y~)(m,n,p),que corresponda a dicha elección de nr
, iry p.3. Generar dos muestras,
~
y,Y,...,1Ç
que provengan de distribuciones N(O,1) y N~O,/~,
respectivamente.4. Obtener
20
Instrumentación
/2 -—
2~~__j;-(~~)
/3~2
= ç.2 (n 1)—
2
5. Generar dos muestras replicadas k veces, XIk,X2k,...,X,nk y k,Y2k,.»Y,k que provengan de distribuciones N(O,1) y N(_~1~/~,respectivamente, donde ke{1,2,...,l0000} y 8~
=~1+~~
paraiE {1,2,...,5}.6. Para cada réplica, k, de Xlk, X2k,...,
Xmk
~‘,k ~2,k ~ ~Ç,k aplicar la transformación tk(ífl,fl,p)~~ , k~{1,2,...,10000}7. Determinar q , que es la cantidad de valores tk(m,n,p)
que sobrepasan
t(95~)(m,n,p).8. Estimar la potencia, ir (Se), que estará dada por el cociente entre q y 10000.
9. Repetir el proceso a partir del punto 5, pero ahora con el valor p~y calcular ~ (Se).
10. La potencia de la prueba estará dada por7r(6,) max{2r~(Se)‘71~~
(8~ )}
+ 13El programa elaborado enS-Plusque calcula las potencias de ambas pruebas se presenta en el anexo A.3.
En el siguiente capítulo se presentan las conclusiones y recomendaciones derivadas de los resultados numéricos obtenidos a partir de la instrumentación de los programas.
21
4 Conclusiones
4.1 Resultados
En los anexos A.4 y A.5 se presentan los resultados numéricos que se derivan de lapuesta en marcha de los programas elaborados en S-Plus. El A.4 contiene los puntos críticos obtenidos para cada distribución generada correspondiente a cada método de prueba. Por su parte, el A.3 presenta conjuntamente las potencias asociadas a cada distribución.
De la tabla correspondiente a los puntos críticos podemos comentar que el estadístico t es el que presenta menor variabilidad en las estimaciones para diferentes valores de los parámetros. Por otra parte, es importante destacan que los puntos críticos estimados para el estadistico
S
son mucho mayores para valores pequeños de k=(n/m)*p que para sus recíprocos, mientras que para el estadísticotse presenta una relativa simetría.Por atender las recomendaciones de Robinson (1976), los puntos críticos no pueden analizarse en sentido vertical. Sin embargo, cabe señalar que la convergencia de los puntos críticos del estadístico t, conforme los tamaños de muestra aumentan,
están
encaminados hacia el percentil Z005 =1.645. Por otra parte, es posible apreciar que los puntos críticos estimados para el caso en el quek
=1 y m~n ~n relativamente iguales al percentil‘/fl4,2.005 , tal como es de esperarse.
Más que comparan las estimaciones puntuales de las potencias entre estadísticos, lo que
necesitamos es encontrar los patrones de conducta generales que nos permitan decidir por algiín método de prueba cuando nos enfrentemos condatos en la práctica. No obstante, si se deseara satisfacer la primera necesidad, podemos apuntar que la potencia es una variable aleatoria Binomial con parámetrosir= 10000 y p =4.2
Conclusiones y Recomendaciones
Para finalizan, podemos señalan que en general, el comportamiento de las potencias puede ser
descrito de la siguiente forma:Co nc/u sio nc s
• Mientras las potencias asociadas con el estadístico t presentan un comportamiento creciente dentro de cada combinación de m, n y
k,
las potencias estimadas para el estadístico 5 se mantienen relativamente constantes a lo largo de ios cinco valores.• Para valores pequeños de 8, la potencia de la prueba basada en el estadístico S tiende a
ser mayor. Para valores grandes de 6, la prueba basada en el estadístico
t tiende a detectar mejor las diferencias verdaderas entre las medias de las dos poblaciones.• En los casos en los que el valor del parámetro
k
es mayor que 5, es decir, en aquellos2 /~
casos en los que o~, ~—, la prueba basada en el estadistico
tdetectamejor los cambios
5,nentre las medias, tanto pequeños, como notorios. Esta
últimacaracterística se acentúa conforme los tamaños de muestra se incrementan.
La recomendación general que se puede desprender de los resultados obtenidos de
lassimulaciones se sintetiza de la siguiente forma. Si somos capaces de determinar a
prioila
relación que guarda el cociente delas varianzas poblacionales, entonces consulte directamente la tabla del anexo A.5 para seleccionar la mejor prueba.
Sin embargo, si no conocemos la relación, y si no somos capaces de encontrar estudios previos que nos la clarifiquen, entonces, una primera aproximación será calcularuna estimación de p en
términos de las varianzas muestrales y de ahí referirse a la tabla A.4. Sin embargo, ésto nos conduce a una prueba secuencial que pudiese tener alguna otra connotacion estadística.23
Anexos
ooo
~:~‘~v~
y
c~in ouy
o.,y
‘-4o‘oo.,o,)—.
-~~
~
-~c~’Tv~,E-~~2-~~-~.~‘-4..±4i~,~r~’O.~-’—~1~u
o,.
-«o., uo-4uouo-o‘o-oou-oyuo.,qoo-9+
-4uoouo
ou-J-oa
yoao-,ao.,Qo
o
ay
a-o
y
o.,aoa
y
-auouo,,
uo1 e‘-4‘-4
o
Li’)
1-4) -o+o.,o,,
y
-o-ÜÑ
oooooouOo
y
e~’:!~ooc.~y
‘-4o.:VV _-4—-4 U’)a.’.eouo.,o~y
‘~«oCo
yo,.,
-d~—.oo~ -o’oy
-ooo,)-.4Oo4.,o-,-)o04‘-4.,’-~ ooo-,uo
‘-4
‘-Le
-4.Oa
‘—~-‘-~--~2o,~-c-~.’~4;~~9
-e~
~Vy.8~~-.~~-o~o-..~d’a—.
codo,,.-Or:.~00_Oouuo-,’+4—a -~iu2)cf:—Jo,,yu-4oaa-4uo,,a-oa
1
~-..o —‘~
~z:~~2)~ +-o“..,o,,,
o.,—a—o~y-ao,,10:2~‘,.-.~~~o.,(.2
-~~O1,)e~o,-,~.~‘ouu
~-~ua~ci,a~~u~~~.4 oq~oN~,,Vy(/o,~00~aaÇ”)uo-,~‘-~.u.u00.-4~~V\~f~f~~~oo~a e+—.-E~z~~o.,‘Ob~~Ñ~o.,o.,o,,o,’‘-..-...~--~~4~~~u~~~~.‘“~,.‘O-:E°~—H‘.0V-~Vyo,~
y
eCOV~2,_0~~.ouu~.‘o,-,~-= -4Li’)o-.y
oo-4+-4o-.Ir)-4
-)if’.~ 1
d-oao-2)O2)au-4(.22)u-4ua
-~
-2).—o,,,—42—+--a--o,-,.(.0Ua2’-00
o,,,-aO
~~
y
2~y
g000o,,,.-~~~~uu+qa~‘-~‘~—txd—~‘~OO.-.,uuu04-’o-o.,
y
a-0O~040o.,E~8~E~-,,22~0.,0.,~_~o_:AAo,.o,O/VV‘4,..~,.,.,o‘~-rVV--~~0~
o~~~f-~