Y DE ESTUDIOS SUPERIORES DE MONTERREY

(1)

INSTIT Lft)

TECNOLÓGICO

Y DE ESTUDIOS SUPERIORES DE MONTERREY

CAMPUS

MONTERREY

DIVISIÓN DE CIENCIAS Y HUMANIDADES

TESIS

ESTUDIO COMPARATIVO DE LAS POTENCIAS DE

DOS

PRUEBAS

ESTADÍSTICAS QUE ABORDAN EL PROBLEMA DE BEHRENS-FISHER, APLICANDO LA METODOLOGÍA

DE P-VALORES POR INTERVALO.

ERIC ULISES RODRÍGUEZ ESPINO

MONT[RREY, N. L. MAYO DE 1999

(2)

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY

CAMPUS MONTERREY

DIVISIÓN DE CIENCIAS Y

HUMANIDADES

TESIS

ESTUDIO COMPARATIVO DE LAS POTENCIAS DE DOS PRUEBAS ESTADÍSTICAS QUE ABORDAN EL PROBLEMA DE BEHRENS-FISHER,

APLICANDO LA METODOLOGÍA DE P-VALORES POR INTERVALO.

ERIC ULISES RODRÍGUEZ ESPINO

MAYO DE 1999

MONTERREY, N. L.

(3)

RE SUMEN

FI objetivo de este trabajo se centra en estimar las potencias de dos pruebas estadísticas que abordan el problema de Behrens-Fisher. La metodología involucrada para el cómputo de las potencias incorpora los conceptos desarrollados por Berger y Boos

(1994) relacionados con la

estimación de p-valores por intervalos de confianza para parámetros de ruido.

Se utilizaron rutinas computacionales desarrolladas ad/xc como método de estimaci5n, en las que se simularon, por una parte, las distribuciones asociadas con

ios estadísticos de prueba

para obtener los puntos de corte que delimitaban una prueba de

tamaño

a

0.05, así como

muestras que permitiesen estimar conjuntamente las potencias asociadas.

Se encontró que bajo ciertas combinaciones de los tamafios de muestra y del parámetro de ruido, una prueba resulta localmente más potente que la otra, en otras circunstancias,

las

potencias muestran un

“entrelazado”. Por otra parte, se encontr5 que una de las pruebas

permanece localmente constante.

(4)

e A g r a d e e i m i e n

^t

o s

(5)

AGRAD E CIM lENTOS

En lo aca(lémicO.

‘[res (lrKt(nn~

En lo económico.

Raz~7.,¹⁷⁷¹lXfl77~V~2O

En el motivo.

Unamujer.^-. la m~ier.

Jorge Sierra, Graciela González y Rogelio Ramos:

Verdaderamente les digo que la diferencia entre esta maestría y las demás que se ofrecen en el mercado la hace su excelente calidad humana. Es impecable.

Cumpliste ^- probablemente sin darte cuenta ^- una promesa hecha hace mucho, mucho tiempo.

Simplemente, me hubiera asfixiado.

Yana

Yap Guerrero.

A todos ustedes,

nmi

sincero agradecimiento.

(6)

Indice

(7)

ÍNDICE

Presnión

1.1 Introducción 1

1.2 Métodos de solución 3

1.3 Planteamiento 5

2 Pruebas

2.1 Repaso de p-valores 6

2.2 Método de Berger y Boos 9

2.3 Método exacto 11

3 Metodología

3.1 Supuestos 14

3.2 Metodología 15

3,2.1 Estadístico S 16

3.2.2 Estadístico t 19

4 Conclusiones

4.1 Resultados 22

4.2 Conclusiones y recomendaciones 23

Anexos

Anexo A.1 A.1

Anexo A.2 A.2

Anexo A.3 A.3

Anexo A.4 A.4

Anexo A.5 A.5

Forma de lectura del anexo A. 5 A.5. 1

Bibliografía

(8)

e ¹ Presentación

(9)

1.1 Introducción

Uno de lOS objetivos de la estadística es hacer inferencias con respecto a los parámetros poblacionales desconocidos, basadas en la información obtenida mediante datos muestrales Estas inferencias se expresan básicamente en una de dos maneras, como estimaciones de los parámetros respectivos o como pruebas de hipótesis referentes a sus valores.

Las pruebas de hipótesis se realizan en todos los ámbitos en los cuales puede contrastarse la teoría frente a la observación. Se someten las hipótesis a una verificación estadística, comparando las hipótesis con los datos muestrales observados.

En muchos casos, las herramientas estadísticas utilizadas para resolver los problemas de hipótesis están sustentados por una teoría asintótica, es decir una teoría para muestras grandes. Sin embargo, es muy común que las características del experimento impidan la obtención de un tamaño de muestra suficientemente grande para validar la utilización de dichas herramientas.

Usualmente se aborda este problema desarrrollando teoría estadística que nos permita conocer las características distribucionales asociadas a estadísticos basados en pequeñas muestras, características que en la mayoría de las ocasiones serán desconocidas o en el menor de los casos, serán aproximaciones.

¿Qué hacer entonces si queremos una solución exacta?

Probablemente, la forma más usual en la que se ataca el problema es haciendo uso de la tecnología computacional a nuestro alcance. Si bien es cierto que la simulación no ofrece una solución exacta, también es cierto que reproduce, en buenaparte,la realidad.

Atendiendo este precepto, utilizaremos la simulación para contrastan dos métodos alternativos de prueba que abordan el problema de Behrens-Fisher, problema que ha permanecido abierto puesto que no se ha encontrado una solución satisfactoria a pesar de encontrarse en la literatura numerosas soluciones exactas yaproximadas.

Nos abocaremos al caso en el que se presenten muestras pequeñas para este problema.

(10)

P ^res en t dci Oil

Sean X,, X2... X~y Y1, Y2... Y~dos muestras aleatorias independientes de

poblaciones

normales con media i’~y ^Aty ^, y vanianza o~.y o~,respectivamente y consideremos las siguientes hipótesis estadísticas:

110 ^— ⁼ O

H ^:~i~—»~^=~ >0 (1.1)

Sean ^~,

Y

^y ^{y S~}^, las medias y las varianzas muestrales, respectivamente.

Para un problema como (1.1), cuando se presupone que las varianzas de ambas poblaciones,

~ y a~.,son desconocidas pero iguales,

la prueba del cociente de verosimilitudes

indica que la hipótesis se probará a partir de la utilización de un estadístico T, definido de la siguiente forma:

12

~

que incorpora la estimación de una vanianza muestral conjuntaS~2,a partirde la ponderación de ambas varianzas muestrales, S~y S~.Es decir,

s

² ^— (in—1)S~.+(n—l)S~

— m+n—2

Cuando H

0 es cierta, el estadístico Y tiene una

distribución t-Sti-irient

con m-fn-2 grados de libertad.

Sin embargo, cuando o-~.y

son desconocidas y además, o,~- c-~,el estadístico anterior

no continúa teniendo una distribución t-Sturknt cuando H0 es cierta. A este problema, la literatura lo ha denominado como el problema de Behrens-Fisher’.

Un estadístico que surge de manera natural pararesolver (1.1) es

Verejercicio 8.52 de Casella y Berger (1990 p396)

2

(11)

Presentación

—

/ (1.3)

+

/1? /1

Y resulta ^iiiuv natural el uso de (1.3) si observamos que el denominador continúa siendouna estimacion de la desviación estándar de

~

^—

Y,

aun cuando o~.y no sean iguales.

Es bien s~hidoque la distribución del estadístico (1.3) es asintóticaniente N~O,1)para poblaciones con cualquier función de densidad, siempre que los segundos momentos poblacionales existan. Sin embargo, para muestras pequeñas, (m yn fijos) si las poblaciones son normales, la distribución dependerá de la razón delasvarianzas poblacionales,

(1.4)

Es fácil comprobar que (1.3) depende de p puesto que es una combinación lineal del estadístico (1.2). De hecho, la relación está dada por:

=T.Ji(pIS~,S~,m,n) donde la función

2 ~(1 +p/N)(1+ Nu/p)~í(m^- 1)(n-l)~

Il(p~S~,S~,m,n)=~jJ

~ (n-1)S~+(m-1)S~

J~

^m+n-2

J

y,donde N=in/n y u=S~/S~.

1.2 Métodos de solución

Para poder resolver (1.1), suponiendo ~ o~,probablemente el método más utilizadoes el que estableció Welch (1937), quien propuso un estadístico ç ^, similar a (1.3), cuya distribución se aproxima a unat-Stiid~it.

3

(12)

Pies en t acm 5 n

En este sentido, la investigación de Welch condujo a que la distribución de t~p~ía ser

aproximada a partir de una distribuciónt-Studentcon

y

grados de libertad, donde

y (s~

^/m ⁺

S~/n)2/(S~/(n~

^flm2) ⁺^S~/(n3^—

Esta aproximación, posteriormente la generalizaría Satterthwaite (1946), quien encontraría una distribución aproximada para lasuma ponderada de variables aleatorias independientes Ji-Cuadrada (no necesariamente con igual número de grados de libertad), en donde la ponderación no necesariamente tenía que suman la unidad.

Varios estudios han demostrado que la solución propuesta por Welch es ligeramente liberal, lo que significa que para ciertas combinaciones de m, n yp, el error Tipo 1 es mayor que el valor nominal preestablecido.

No obstante, Best y Rayner (1987) reafirman el valor práctico de la solución propuesta por Welch y recomiendan su uso rutinario cuando los grados de libertad estimados, y, sean mayores que 5. Varios libros de ^texto ofrecen como herramienta para abordan (1.1) esta solución aproximada.

Antes de que se encontrara la distribución exacta de (1.3), ^varios autores trabajaron en proponer distribuciones aproximadas para resolver (1.1). La primera distribución “exacta”

fue dada por Behrens (1929) y fue extendida por Fisher (1939). De acuerdo con Best y Rayner (1987), la solución de Behrens-Fisher no es aceptada por muchos estadísticos, sin embargo Robinson (1976), Barnard (1984), yTsui y Weerahandi (1989), entre otros, aseguran que los p-valores de los estadísticos obtenidos con la solución de Behrens-Fisher es aceptable. Por ejemplo, Robinson (1976) comenta que la solución de Behrens-Fisher, para el problema de medias, es óptima de entre todas las pruebas que son ccnseru~doras2Así mismo, sugiere que esta técnica debe utilizarse como la prueba correcta, siempre que no se encuentre una prueba Bayesiana más apropiada. En este sentido, Johnson y Weerahandi (1988) proporcionaron una solución Bayesiana al caso multivariado del problema de Behrens-

2 Se utiliza la palabra cri~n.adorasparareferimosal hecho de queelerror Tipo 1, por lo general, es menor que el valor nominaldel valor preestablecido.

4

(13)

P r e s e n t a e i 5 n

Fisher, y para el caso univariado, la solución Bayesiana de Jeffreys (1961) coincide con la solución de Behrens-Fishcr.

Así como Welch, algunos otros autores abordaron el problema desde la misma perspectiva y

ofrecieron distribuciones aproximadas para el estadístico t~.Una buena referencia donde se comentan las ventajas y desventajas de las distribuciones aproximadas más sobresalientes se

puede encontrarenScheffé (1944) yScheffé (1970).

Por otra parte, para resolver (1.1), algunos autores como Nel D.G., Van der Merwe C.A. y Moser B.K. (1990) han trabajado en obtener una solución exacta a (1.2). Por su parte, Dudewicz y Mishra (1988 p503) y Weerahandi (1996 p.l74) exponen algunos otros métodos para evitan las aproximaciones y ofrecen algunas soluciones exactas al problema original (1.1).

1.3 Planteamiento

Una pregunta inmediata puede establecerse al tratar de conocer cuál es la prueba uniformemente más potente para el problema (1.1), si es que una existe. Sin embargo, Best y Rayner (1987) comentan que para el Problema de Behrens-Fisher no existen pruebas uniformemente más potentes (insesgadas) para todos los tamaños de muestra, porlo que el objetivo de este trabajo gira en torno a comparar la potencia de dos pruebas y así, determinar si alguna de ellas es localmente más potente que la otra.

La primera ele ellas es un método exacto extraído de Weerahandi (1996 p.l74) y la otra se basa en el estadísticot~,cuyo método de dlculo fue propuesto por Bergery Boos (1994) y está relacionado con la estimación de p-valores a través de regiones de confianza

A continuación, se tendrá especial atención en ofrecer los detalles de ambas pruebas y posteriormente, en presentar la metodología computacional que se instrumentó para el cálculode las potencias.

En la última parte de este trabajo se exponen las conclusiones y recomendaciones derivadas de los resultados obtenidos.

5

(14)

2 Métodos

(15)

2.lRepaso de p-valores

Cuando queremos probar una hipótesis en presencia de parámetros de ruido¹ surgen algunas complicaciones. Por ejemplo, consideremos un modelo en el que la muestra, X, tiene una distribución de probabilidad

Ph,,

definida en términos de los parámetros

8

y p. Ahora,

supongamos que queremos probar (1.1) desconociendo el valor del parámetro p.

Supongamos que tenemos un estadístico de prueba Y, entonces, para un valor observado t, el p-valor,p, se define como p ⁼ sup P~(Y t) ²

Desafortunadamente, el cálculo de este supremo a veces puede resultar muy complicado.

Paraatacar esta dificultad, se puede proceder de tres maneras que reemplazan el cómputo de

supt~por el cálculo de una sola probabilidad.

• En algunas situaciones es posible que el SU~pse alcance en un valor específico de p, digamos p0, para todot. En tal caso, el p-valor es simplemente p⁼ ~ (T t).

• Otra forma de manejar el problema es escogiendo un estadístico T (que incorpora usualmente una estimación del parámetro p), cuya distribución, cuando H0 es cierta, no dependa de p. De esta forma, el cálculo del supremo se evita y el p-valor se define como

p=P6~(T t), queeselmismoparatodop.

Se traducirícomoparebnetrode ividolo que en inglés se conoce como nniavacrpantrn~er.

2 Para una exposick~nclara sobre la definici6n del p-valor se puede consultarCasella y Berger (1990p. 364).

(16)

Métodos

• Un tercer método es condicionar el cálculo del p-valor a un estadístico

S

^que sea suficiente para p cuando H0 es cierta. Así, el p-valor se define como

p ⁼ P1. (Y 1 S ⁼ s), que no dependerá de p cuando H0 es cierta.

Cada uno de estos métodos produce un p-valor válido en el sentido de que, cuando la hipótesis nula es cierta,

P(p a) a ,paracada a ~ {0,1l (2.1)

Es decir, se construye un estadístico p tal que, cuando H0 es cierta, la probabilidad de rechazar la hipótesis nula, dadapor (p a), sea tan pequeña como se desee.

Sin embargo, a veces existen ciertos inconvenientes para aplicar alguna de las alternativas descritas anteriormente. Por ejemplo:

• El valor de p en el que ocurre el supremo puede depender del valor de ten una forma

muy“rebuscada”.

• Las propiedades distribucionales asociadas a estadísticos que incorporan estimaciones de los parámetros de ruido, usualmente, no son conocidas.

• Es posible que no podamos encontrar un estadístico suficiente S, para p, sobre elcual condicionan.

Para simplifican la flotación, denotaremos a un p-valor válido, es decir, un p-valor que cumple (2.1), como una función p(p) que depende del parámetro de ruido p ^. Dentro de

7

(17)

M é t o d o s

este contexto, si conocemos el valor verdadero de p ^, digamos p~,entonces el p-valor se denotará corno p(p0) y se definirá corno:

p(p0) ⁼ J~ (T t) (2.2)

Por otra parte, si no conocemos el valor real del parámetro p, entonces, un p-valor válido puede calcularse a partir de la maximización de p(p) sobre todo el espacio paramétrico de p.

Esta maximización se definecomo:

=

sup p(p)

⁼ sup ~ (T ^t) ^(2.3)

El cálculo de p~presenta dos dificultades potenciales:

• Es común que la maximización sobre el espacio panamétrico de ,ø se efectúe numéricamente, entonces, si este espacio no está acotado, siempre queda la duda si la rutina efectivamente alcanzó el máximo absoluto.

• Estadísticamente hablando, es un desperdicio de información tomar el supremo sobre todo el espacio paramétrico de p habiendo observado ios datos. En este sentido, debemos de ser capaces de estimar p y no consideran en la maximización valores para p que no estén avalados por la muestra.

Storer y Kim (1990) extrapolaron esta idea y propusieron como p-valor a p(~,), donde es el estimador de máxima verosimilitud para p. Sin embargo, Berger y Boos (1994) comentan que este p-valor usualmente no es válido en el sentido de (2.1).

8

(18)

M é ^t o d o s

2.2 Método de Berger y Boos

Berger yBoos (1994) proponen una forma alternativa para calculan p-valores que cumplan con (2.1). Su método facilita los cálculos de maximización e incorpora la información estadística de la muestra observada; se maximiza la probabilidad buscada sobre un intervalo de confianza para p, que se calcula a partir de los datos.

Sea un intervalo de confianza de tamaño (1-fi) para el parámetro de ruido p cuando la hipótesis nula de (1.1) es cierta. El p-valor propuesto se calcula de la siguiente forma:

= sup p(p) +/3 (2.4)

Computacionalmente hablando, el cálculo de este p-valor debepreferirse a (2.3) en virtud de que la maxirnización se efectúa sobre un intervalo cerrado. Desde un punto de vista estadístico, las bondades de (2.4) residen en la incorporación de información a partirde la

muestra obtenida, al hacer la maximización sobre un conjunto verosímil parap.

La demostración desarrollada para comprobar que Pfl constituye un p-valorválido, es decir, que cumple (2.1), se puede encontrar en Bergery Boos (1994) y es casi inmediata.

Como siempre, el valor de /3 y por consiguiente el intervalo de confianza Cfi deberán especificarse antes de observan los datos. Los autores dan argumentos por los cuales recomiendan que /3 deba escogerse con valores pequeños, tales como 0.001 ¿ 0.0001.

Gupta y Yang (1996) demuestran analíticamente que no hay necesidad de hacer una maximización numérica para encontrar (2.4) en virtud de que se comprueba que el máximo

9

(19)

Métodos

ocurre siempre en cualquiera de los puntos extremos del intervalo C~fi.En este sentido, el problema se reduce aún más, puesto que lamaximnización que se debería llevar a cabo para encontrarel p-vaior, p13, ahora se reduce al cálculo de dos probabilidades:

p~=p(p)+/3

(2.5)

± (+)~/3

donde f) y p~ son los límites inferior y superior del intervalo de confianza Cfi

respectivamente. Después de calcular (2.5) se selecciona como p-valor válido aquel Pfl que resulte mayor.

Es conveniente aclarar que el desarrollo del método, presentado en este documento, es una particularización de lo propuesto en el artículo de Berger y Boos. Los autores hacen el desarrollo considerando no sólo un parámetro de ruido, sino un vector de parámetros de ruido, lo que claramente se traduce en hablar de regionesde confianzaen lugar de intervalos de confianza.

Berger (1996) reporta excelentes resultados en el cálculo de p-valores aplicando este método en casos en ios que se quiere comparar proporciones binomiales, es decir, tablas de

contingencia 2 x 2.

El objetivo de este trabajo, entonces, es extrapolar estos resultados y aplican esta metodología del cálculo de p-valores para determinar cuál de los dos estadísticos de prueba que se presentan en este trabajo, (1.3) ~ (2.6), es más potente cuando se quiere atacar el problema de Behrens-Fisher.

10

(20)

M 5 t o

d

o s

2.3 Método exacto

Para poder estar en condiciones de evaluar las bondades del método descrito en la sección 2.2, será necesario proponer algún método que aborde directamente el problema de Behrens- Fisher

y

así, con base en el cálculo de las potencias para ambas pruebas, estar en posibilidad de contrastar ambos métodos. Dentro de este contexto, se dejarán de lado soluciones aproximadas para (1.1) y se considerará una solución exacta.

Uno de estos métodos exactos para abordar el problema de Behrens-Fisher se presenta a continuación y está ampliamente desarrollado en Weerahandi (1996 p.l74).

Sean:

(X—Y)-8 ~ (m-1)S~. ^~, (n.-1)S~

z—

^‘ ² ^‘ ^Y ²

¡~.2 ~2 ay

/

^---~- ⁺

\:/fl fl

donde

Z

^—~^N(O,1),

Y~

^—~^,~, ^Y~ ^~ son variables aleatorias independientes entre sí.

Definamos ahora:

Yx~,as~x +Y~ Zrn+n-2

Y (rn—1 n—1

B~ ^X —~Beta~~ 2 ^,—2

donde

Z, B

y ~ ^~.son también variables aleatorias independientes entre sí.

La cantidad pivote propuesta es:

~ /~‘+~~—+8~ (26)

~ B 1— B

11

(21)

Métodos

y el p-valor que se utiliza para probar (1.1), una vez que se tiene la muestra, está dado por:

p⁼

P(S

s 8— ⁼

EB

^‘~n+n-2 -(s _6~)/1~2 (2.7)

~13 1-B

donde s ⁼ ^—

Y, _E1~

es el valor esperado que se toma sobre la variable aleatoria ByF~÷~2es

la función de distribución acumulada de una variable aleatoria t-S~daatconm+n-2 gados de libertad.

Los cálculos exactos para obtener este p-valor se pueden efectuar mediante la utilización de una rutina disponible en el paquete estadístico Xpro. Sin embargo, una buena aproximación de esta probabilidad puede realizarse mediante la generación de un número si?icientariente gr~vide de variables aleatorias Beta((rn^—l)/2,(n ^—1)/2) y promediando los resultados

obtenidos de la evaluación de Fm+~.2(•)para cada uno de ellos. Sin embargo, para efectos de este trabajo no se utilizará esta aproximación en virtud de que se procedió a calcular la potencia vía la simulación de la distribución del estadístico (2.6).

Notemos que la metodología dada por Bergery Boos (1994) se refiere a encontrar p-valores, sin embargo, observemos que:

p^—valor^=_supP5 ~(Ttobse,.vada) Y

potencia(3) supP5~(Te ^~^1puu(o ^de^corte)

Es decir, ambas cantidades se refieren a un proceso de maximización sobre todos los valores posibles del parámetro de ruido p. Por lo tanto, la metodología propuesta por Berger y Boos

Para este caso, puede considerarse un námero sufia n~grardecualquieraque sea superiora 10,000.

12

(22)

M 5 ^t o

d

^{o s}

se puedeulilizar para e1 cálculo de la potencia de la prueba para el problema de Behrens- 1 is her.

Por cuestiones computacionales, sólo estimaremos la potencia para cinco valores de ó equidistantes a lo largo de una desviación estándar de (Y(^—

Y),

que denotaremos, para efectos exclusivos de esta explicación, como ^~. Es decir,

potencia(~) sup P

8. (T p,~odecorte)

Si recapitulamos, hasta ahoraya contamos con los elementos necesarios para poder iniciar

el

cálculo de la potencia de cada prueba, pu.es contamos con los estadísticos definidos por (1.3) y por (2.6), que serán contrastados a partir de la estimación de sus potencias, la cuales se obtendrán a partir de la metodología expuesta en la sección 2.2.

Ahora, como sólo tiene sentido comparan pruebas que tienen el mismo tamaño (nivel), procedemos a establecer en a⁼ 0.05 el nivel de error Tipo1 para ambas pruebas.

En la siguiente sección de la investigación estableceremos los supuestos necesarios y

describiremos la metodología

analítica

y computacional involucrada en el cálculo de las

potencias para ambas pruebas.

fl

(23)

3 Instrumentación

(24)

3.1 Supuestos

Corno se discutió en la sección 1.1, cuando se tienen muestras pequeñas, el estadístico (1.3) no sigue una distribución conocida si las vanianzas poblacionales a~y son distintas. Por esta razón, para evaluar el desempeño de las pruebas, sólo consideraremos en las simulaciones tamaños de muestra m y n pequeños. De acuerdo con Robinson (1976) ⁱ podemos restringir el estudio a los valores que se encuentren en el conjunto {2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 1S}; entotal, 11 valores.

El total de parejas (m^, n) que se pueden formar son 55 parejas. No se considerarán parejas en donde m y n sean iguales en virtudde que la investigación de Welch (1938) reporta que mientras que in ⁼ n, no hay mucho daño en ignorar que p

1 cuando se quiere probar

(1.1) utilizando el siguiente estadístico:

(3.1)

~gv donde:

71 1

=sp

^~+

~

²

s;

⁼ (m—1)S~+(n—l)S~

U. m+n-2

/ ^—~-+~

/ ^11! ^fl

b(p2(m_l)+(n_1))/ ^.

e, /p(in—1)+(n—l) ^‘ /(m+n—2)(na~+rna~)

y

(P(’~^{— ~} ⁺ ^{@1 —} /p (ni-l)+(n-l) ,donde pestá definido como en (1.4).

1 La propuesta original de Robinson (1976) incluye los tamañosdemuestra (24, 32, 50, 100,cc).

(25)

Instrumentación

El estadístico (3.1) tiene siempre una distribución t-StudQit con m -fn^- 2grados de libertad. Si p ⁼ 1 ^, (3.1) se reduce a (1.2) ^, tal como es de esperanse. Pero, en general, g yv dqenden del parámetro p.

Los estadísticos sobre los cuales se calcularán las potencias, utilizando el m&odo de Berger y Boos, están definidos en (1.3) y en (2.6). Como ya se mencionó, el primero depende explícitamente de p y en el segundo, la relación es intrínseca; se simularán distribuciones de estos estadísticos para distintos valores del parámetro p.

Para tal efecto, nuevamente utilizaremos la recomendación de Robinson (1976), quien propone simular distribuciones para cada k= dentro del conjunto

{

^{1/10, 1/5} ^, ^1/3,

1/2 ^, 2/3 ^,

1, 3/2

^, 2 ^, 3^, 5^, 10 }; en total, 11 valores²

Entonces, para cada estadístico de

prueba, se tendrá que generar un total de ii.(’~) 605 distribuciones.

Por último, proponemos que las

pruebas tengan un tamañode error Tipo

1 de a

⁼ 0.05.

3.2 Metodología

La potencia de la prueba de hipótesis (1.1) con región de rechazoR se defme como una funciónde 6 de la siguiente forma:

2r(’6)=P~XERI8EíJ1)

(3.2)

Por lo que nuestro primer objetivo será determinar la región de rechazo, R

^,

para ambas

pruebas, que se logra partiendo del supuesto de que se desean pruebas de tamaño a⁼ 0.05.

Siguiendo esta línea, se describirá primero la metodología utilizada para encontrar la región

de rechazo para el estadístico S, defmido en (2.6), y posteriormente, la metodología para

calcular

su potencia. En

seguida,

se procederá de

igualforma para elestadístico ^t definido en (1.3).

2 La propuesta original incluye los valores {1/1000, 1/100, 1/30) ysusrecíprocos.

~.-.1o •~‘r~

;, iÇ~Jij( 15

(26)

3.2,1

EstadísticoS

Instrumentación

I)elimitación de la región de rechazo.

Analíticamente tendríamos que encontrar un punto crítico s tal que:

P[»~+~ sJ=0.O5

donde las variablesZ, ~ Bse definieron en la

sección 2.3.

Sin embargo, el algoritmo siguiente fue utilizado para

encontrar una aproximación del punto

crítico s.

1.

Fijan los tamaños de muestra

m, n y el valor del parámetro p ^,

de acuerdo con las

premisas establecidas en la sección 3.1.

2. Generar dos muestras replicadas k veces, XIk~X2k~••~XmkY ~k’~,k’”~’~’n,k que

provengan

de distribuciones N(O,l) y N(IO,)/~,), respectivamente, donde

kE{1,2,...

,l0000}.

3. Para cada réplica, k ^,deXlk,X2k,...,Xmk ^‘ k~’2,k~”J’~,kaplicarlatransformación

Z

IS~.

S~

sk(lfl,n,p) ⁼

4. Ordenar los diez mil valores

s,/m,n,p),

de menor a mayor, y denotar esos valores

ordenados como s~(m,n,p).

5. Seleccionar el s~5~(m,n,p)

como el

punto crítico que determina la región de rechazo para una prueba de tamaño a ⁼ 0.05.

Es importante recordar que la distribución

normal pertenece a una familia

de localidad y

escala, por lo que no hay pérdida de generalidad en las inferencias a partir de la distribución

16

(27)

Instrumentación

normal que se está generando paralas muestras. En este sentido, se pudieron haber generado muestras provenientes de cualquier distribución normal con parámetros de localidad y escala escogidos libremente, siempre y cuando se satisfaga que:

a) —~=6~=O^, y

b) p⁼

U)

El programa elaborado en S-Plusque calcula el punto crítico para el estadístico

S

se presenta en el anexo Al.

Estimación de la potencia de la prueba.

Atendiendo la metodología de Berger y Boos (1994), analíticamente, el cálculo de la potencia de la prueba encontrada anteriormente se traduce en evaluar la siguiente probabilidad:

(

^Z ⁱ ¹ ^1/

~(8~)=

sup P~~=^~+ +8~s(95~)(m,n,p)6~⁼

_~j_+~ ^+fl

ie {l,2,...,5}

Para efectos de este trabajo y debido a las limitaciones computacionales, la función potencia

sSMo estará evaluada en cinco puntos para el

parámetro 5⁼ ^—¡1)~

los puntos serán

equidistantes

a lo largo de una desviación estándar de la estimación (~

^—

Y).

El hecho de restringir el recorrido del parámetro Sa

una desviación estándar se hace con el objeto de determinan si alguna de las pruebas es localmente más potente, en virtudde que se había hecho referencia, en la sección 1.3, que no existen pruebas uniformemente más potentes para el problema de Behrens-Fisher.

Por otra

parte, la razón por la que sólo se calculan

cinco puntos de la potencia constituye

una de las limitaciones de esta investigación, que se deriva de la relativa ineficiencia computacional en cuestiónde tiempos de procesamiento.

17

(28)

Instrumentación

Coinputacionalrnente, para poder evaluar la probabilidad anterior se procede de la siguiente forma:

1. Fijar los tamaños de muestra m, iry el valor del parámetro p ^, de acuerdo con las premisas establecidas en la sección 3.1.

2. Seleccionar el punto crítico,^S~5~) (in,n,p)^,que corresponda a dicha elección de nr ^, n y p.

3. Generar dos muestras, X~,X,...,X y ~ que provengan de distribuciones

N(O,l) y respectivamente.

4. Obtener

p~=~-F~°’’~ ~

(n—I)1——

y 2

=

(n—1),—

y

²

5. Generar dos muestras replicadas k veces, XIk^,_X2k _{Xmk )~}_~‘I,k_‘~“2,k_~ _~“n,k

que

provengan de distribuciones N(O,l) y N~—8~,

/ J, respectivamente, donde

ke{l,2,... ,10000} y ~

=~[~~J

^{parai E} (1,2,..., 5}.

6. Para cada réplica,k,de XIk,Xak,...,Xflk ^~“~,k,1T2,k»’~~n.k aplicarlatransformación

ke{1,2,...,10000}

7. Determinar q, que es

la cantidad de valores

s~in,n,p)

que sobrepasan

^S(95~)(in,n,p).

8. Estimar la potencia, ir~(8k), que estarádada por el cociente entre q y 10000.

(29)

Instrumentación

9. Repetir el proceso a partir del punto 5, pero ahora, con el va1orp~ycalculan ~r, ^(5k).

10. Lapotencia estará dada por ~r(6~)⁼ max{~r (Se), ~r. (S~)}+

3.2.2 Estadístico ^t

Delimitación de la región de rechazo.

Analíticamente tendríamos que encontrar un punto crítico ^t tal que:

Sin embargo, el algoritmo siguiente fue utilizado para encontrar una aproximación del punto crítico ^t. Este algoritmo es muy similar al usado en el estadístico anterior.

1. Fijan los tamaños de muestra m, n y el valor del parámetro p ^,

de acuerdo con las

premisas establecidas en la sección 3.1.

2. Generar dos muestras replicadas k veces, XIk^,_X2k _X’mk y ^~ ^~k ^,..., Y~ que

provengan de distribuciones N(O,1) y N(O~)/~)~respectivamente, donde

ke{l,2,...

,10000}.

3. Para cada réplica, k ^,de Xlk X2k^,..., Xmk ^Y~,k ^~2,k ^~ ^~‘n,kaplican la transformación

tk(fll,2’P)~=_-__ , ke{1,2,...,10000}

lm + n

19

(30)

Instrumentación

4. Ordenar los diez mil valores tk(~n,n,p), de menor a mayor, y denotan esos valores ordenados como ^t~ (‘m,n,p,).

5. Seleccionarel^t(₉₅₀₀₎(m,n,p)

como

el punto crítico que determina la región de rechazo para una prueba de tamaño a ⁼ 0.05.

El programa elaborado en S-Plusque calcula el punto crítico para el estadístico^t se presenta en el anexo A.2.

Estimación de la potencia de la prueba.

Atendiendo la metodología de Bergery Boos (1994),

analíticamente, el cálculo de la potencia de la prueba encontrada anteriormente se traduce en evaluar la siguiente probabilidad:

donde p y p~son los límites inferior y superiorde un intervalo

de confianzade tamaño (1-j3)

parap.

La forma en como se procedió computacionalmente fue

la

del parámetro p

^,

de acuerdo con

las

premisas establecidas en la sección 3.1.

2. Seleccionar el punto

crítico,t~y~)(m,n,p)^,

que corresponda a dicha elección de nr

^, iry p.

3. Generar dos muestras,

~

^y

,Y,...,1Ç

que provengan de distribuciones N(O,1) y N~O,

/~,

respectivamente.

4. Obtener

20

(31)

Instrumentación

/2 -—

2__j;-()

^/3

~2

= ç.2 (n ^1)—

2

5. Generar dos muestras replicadas k veces, XIk,X2k,...,X,nk y k,Y2k,.»Y,k que provengan de distribuciones N(O,1) y N(_~1~/~,respectivamente, donde ke{1,2,...,l0000} y 8~

=~1+~~

paraiE {1,2,...,5}.

6. Para cada réplica, k^, de Xlk, X2k^,...,

Xmk

^~‘,k ^~2,k ^~ ^~Ç,k aplicar la transformación tk(ífl,fl,p)~~ ^, k~{1,2,...,10000}

7. Determinar q ^, que es la cantidad de valores tk(m,n,p)

que sobrepasan

t(95~)(m,n,p).

8. Estimar la potencia, ir (Se), que estará dada por el cociente entre q y 10000.

9. Repetir el proceso a partir del punto 5, pero ahora con el valor p~y calcular ~ (Se).

10. La potencia de la prueba estará dada por7r(6,) max{2r~(Se)^‘71~~

(8~ )}

⁺ ¹³

El programa elaborado enS-Plusque calcula las potencias de ambas pruebas se presenta en el anexo A.3.

En el siguiente capítulo se presentan las conclusiones y recomendaciones derivadas de los resultados numéricos obtenidos a partir de la instrumentación de los programas.

21

(32)

4 Conclusiones

(33)

4.1 Resultados

En los anexos A.4 y A.5 se presentan los resultados numéricos que se derivan de lapuesta en marcha de los programas elaborados en S-Plus. El A.4 contiene los puntos críticos obtenidos para cada distribución generada correspondiente a cada método de prueba. Por su parte, el A.3 presenta conjuntamente las potencias asociadas a cada distribución.

De la tabla correspondiente a los puntos críticos podemos comentar que el estadístico ^t es el que presenta menor variabilidad en las estimaciones para diferentes valores de los parámetros. Por otra parte, es importante destacan que los puntos críticos estimados para el estadistico

S

son mucho mayores para valores pequeños de k=(n/m)*p que para sus recíprocos, mientras que para el estadístico^tse presenta una relativa simetría.

Por atender las recomendaciones de Robinson (1976), los puntos críticos no pueden analizarse en sentido vertical. Sin embargo, cabe señalar que la convergencia de los puntos críticos del estadístico ^t, conforme los tamaños de muestra aumentan,

están

encaminados hacia el percentil Z005 ⁼1.645. Por otra parte, es posible apreciar que los puntos críticos estimados para el caso en el que

k

=1 y m~n ~n relativamente iguales al percentil

‘/fl4,2.005 , tal como es de esperarse.

Más que comparan las estimaciones puntuales de las potencias entre estadísticos, lo que

necesitamos es encontrar los patrones de conducta generales que nos permitan decidir por algiín método de prueba cuando nos enfrentemos condatos en la práctica. No obstante, si se deseara satisfacer la primera necesidad, podemos apuntar que la potencia es una variable aleatoria Binomial con parámetros^ir⁼ 10000 y p ⁼

4.2

Conclusiones y Recomendaciones

Para finalizan, podemos señalan que en general, el comportamiento de las potencias puede ser

descrito de la siguiente forma:

(34)

Co nc/u sio nc s

• Mientras las potencias asociadas con el estadístico t presentan un comportamiento creciente dentro de cada combinación de m, n y

k,

las potencias estimadas para el estadístico 5 se mantienen relativamente constantes a lo largo de ios cinco valores.

• Para valores pequeños de 8, la potencia de la prueba basada en el estadístico S tiende a

ser mayor. Para valores grandes de 6, la prueba basada en el estadístico

t tiende a detectar mejor las diferencias verdaderas entre las medias de las dos poblaciones.

• En los casos en los que el valor del parámetro

k

es mayor que 5, es decir, en aquellos

2 /~

casos en los que o~, ~—, la prueba basada en el estadistico

tdetecta

mejor los cambios

5,n

entre las medias, tanto pequeños, como notorios. Esta

última

característica se acentúa conforme los tamaños de muestra se incrementan.

La recomendación general que se puede desprender de los resultados obtenidos de

las

simulaciones se sintetiza de la siguiente forma. Si somos capaces de determinar a

prioi

la

relación que guarda el cociente de

las varianzas poblacionales, entonces consulte directamente la tabla del anexo A.5 para seleccionar la mejor prueba.

Sin embargo, si no conocemos la relación, y si no somos capaces de encontrar estudios previos que nos la clarifiquen, entonces, una primera aproximación será calcular

una estimación de p en

términos de las varianzas muestrales y de ahí referirse a la tabla A.4. Sin embargo, ésto nos conduce a una prueba secuencial que pudiese tener alguna otra connotacion estadística.

23

(35)

Anexos

(36)

ooo

~:~‘~v~

y

c~in ou

y

o.,

y

‘-4o‘oo.,o,)

—.

-~~

~

-~c~’Tv~,E-~~2

-~~-~.~‘-4..±4i~,~r~’O.~-’—~1~u

o,.

-«o., uo-4uo^uo-o‘o-oou-o_y_uo.,qoo

-9+

(37)

-4uoouo

ou-J-oa

yoao-,ao.,Qo

o

ay

a-o

y

o.,ao

a

y

-auou

o,,

uo

1 e^‘-4^‘-4

o

Li’)

1-4) -o+o.,o,,

y

-o

-ÜÑ

oooooouOo

y

e~’:!~oo

c.~y

‘-4o.:VV _-4—-4 U’)a.’._eou^o.,^o

~y

‘~«oCo

yo,.,

-d~—.oo~ -o’o

y

-o_o_o,)

-.4Oo4.,o-,-)o04‘-4.,’-~ ooo-,uo

(38)

‘-4

‘-Le

-4.Oa

‘—~-‘-~--~2o,~-c-~.’~4;~~9

-e~

~Vy.8~~-.~~-o~o-..~d’

a—.

codo,,.-Or:.~00_Oouuo-,’+4—

a -~i_u₂₎_cf:—Jo,,yu-4oaa-4uo,,a-oa

1

^~-^..o —‘

~

~z:~~2)~ +-o“..,

o,,,

o.,—a—o~y-ao,,10:2~‘,

.-.~~~o.,(.2

-~~O1,)e~o,-,~.~‘ouu

~-~ua~ci,a~~u~~~.4 oq~oN~,,Vy(/o,~00~aaÇ”)uo-,~‘-~.u.u00.-4~~V\~f~f~~~oo~a e+—.-E~z~~o.,‘Ob~~Ñ~o.,o.,o,,o,’‘-..-...~--~~4~~~u~~~~.‘“~,.‘O-:E°~—H‘.0V-~Vyo,~

y

eCOV~2,_0~~.ouu~.‘o,-,~-= -4Li’)o-.

y

oo^-4+^-4o-.

Ir)-4

-)if’.~ 1

(39)

d-oao-2)O2)au-4(.22)u-4ua

-~

-2).—o,,,—42—+--a--o,-,.(.0Ua2’-00

o,,,-aO

~~

y

2~

y

g000o,,,.-~~~~uu+qa~‘-~‘~—txd—~‘~O

O.-.,uuu04-’o-o.,

y

a-0O~040o.,E~8~E~-,,22~

0.,0.,~_~o_:AAo,.o,O/VV‘4,..~,.,.,o‘~-rVV--~~0~

o~~~f-~

Y DE ESTUDIOS SUPERIORES DE MONTERREY

INSTIT Lft)