• No se han encontrado resultados

Contrastes de hip´ otesis

N/A
N/A
Protected

Academic year: 2023

Share "Contrastes de hip´ otesis"

Copied!
27
0
0

Texto completo

(1)

Cap´ıtulo 7

Contrastes de hip´ otesis

7.1. Introducci´on . . . . 1

7.1.1. Contraste de media de normal, con varianza conocida . . 2

7.1.2. Contraste de proporci´on . . . . 6

7.2. Contrastes bilaterales . . . . 7

7.2.1. Tests bilaterales m´as usuales . . . . 7

7.3. Contrastes unilaterales . . . . 9

7.3.1. Dise˜no de tests unilaterales. Elecci´on de hip´otesis nula . . 10

7.3.2. Tests unilaterales m´as usuales . . . . 11

7.4. Test generales, funci´on de potencia . . . . 12

7.5. Tests de raz´on de verosimilitudes . . . . 18

7.6. Tests uniformemente m´as potentes . . . . 26

7.6.1. Lema de Neyman–Pearson . . . . 26

7.1. Introducci´ on

Continuamos en este cap´ıtulo dentro del marco general de los dos anteriores: una cierta variableX tiene funci´on de masa/densidad f(x;θ), donde θ es un par´ametro desconocido. El objetivo de la tecnolog´ıa de inferencia (param´etrica) consiste en obtener informaci´on sobre θa partir de una muestra emp´ırica (x1, . . . , xn).

En el cap´ıtulo 5 analizamos estimadores del par´ametro θ (m´etodos de construc- ci´on y propiedades). Con un estimador T, la muestra emp´ırica da lugar a una esti- maci´on θˆ=T(x1, . . . , xn) del par´ametro θ.

En el cap´ıtulo 6 nos ocupamos de establecer intervalos de confianza I para el par´ametroθ, de manera que, con alta confianza, el verdadero (y desconocido) valor de θest´e en el intervalo I (que depende de la muestra).

En este cap´ıtulo cambiaremos el punto de vista, y desarrollaremos una tecno- log´ıa paracontrastar hip´otesis sobre el par´ametro, como que valga 3, que sea mayor

(2)

que 5, etc. Avisamos al lector de que, aunque la cuesti´on de inter´es sea distinta, la metodolog´ıa que dise˜naremos se va a apoyar en gran medida en los desarrollos que dieron lugar a los intervalos de confianza.

Digamos, por ejemplo, que tenemos una muestra (x1, . . . , xn), donde los xi son ceros o unos, que sabemos que ha sido obtenida lanzando repetidamente una mone- da. La hip´otesis que queremos contrastar (qu´e otra pod´ıa ser) es que la moneda en cuesti´on esregular. En t´erminos m´as t´ecnicos, siXsigue unaber(1/2) o no. Obser- vamos la muestra, contamos ceros y unos, calculamos promedios y obtenemos que en la muestra aparece un 30 % de unos. Esto, desde luego, parece ir en contra de la hip´otesis; no es que sea imposible que una moneda regular produzca tal proporci´on de caras, pero se nos antoja bastante improbable. ¿Cu´anto?, ¿lo suficiente como para descartar que la moneda sea regular?

Veamos. Si la muestra fuera de tama˜no 10 y se tuvieran tres caras y siete cruces, quiz´as la alarma fuera injustificada: no parece que haya suficiente evidencia como para descartar, sin miramientos, la posibilidad de que la moneda sea 50 %-50 %. Sin embargo, si en 1000 lanzamientos obtenemos 300 caras, entonces s´ı, la intuici´on (y si no, nuestro sabio consejo) nos dice que es pr´acticamente imposible que tal resul- tado provenga de una moneda regular, lo que nos inducir´ıa a rechazar la hip´otesis:

definitivamente, la moneda estaba cargada.

As´ı que de lo que se trata es de dise˜nar un cierto procedimiento, o test, cuya expresi´on expl´ıcita depender´a de la variable X, del estimador del par´ametro que se considere, y del tama˜no de la muestra, que racionalice el “mosqueo” que la muestra parece producir al respecto de la hip´otesis; que cuantifique el peso que la evidencia estad´ıstica (la muestra emp´ırica) aporta en contra de la hip´otesis de partida.

Note, lector, c´omo en esta ilustraci´on estamos insistiendo siempre en la posibili- dad de rechazar la hip´otesis.

7.1.1. Contraste de media de normal, con varianza conocida Comenzamos, como para los intervalos de confianza, con el ejemplo b´asico de

contrastar la hip´otesis de que la media (esperanza)μ

de una determinada cantidad X en una poblaci´on que sigueX ∼ N(μ, σ2) toma un determinado valorμ0

suponiendo que se conoce la varianzaσ2.

Aprovecharemos este ejemplo concreto para ir introduciendo la terminolog´ıa y notaci´on generales.

A. Hip´otesis nula. La hip´otesis que queremos contrastar, que se conoce como hip´otesis nula y se denota porH0, es en este caso que μ=μ0. Escribiremos

H0:μ=μ0.

Aqu´ı, μ0 es un dato. La hip´otesisH0 puede venir de estudios previos, de modelo te´orico, de. . .

(3)

7.1. Introducci´on 3 B. Test de hip´otesis. Para contrastar esta hip´otesis realizaremos un test, que se dice de hip´otesis.

1) Tomamos un estad´ıstico para el test, que en este caso va a serX.

2)Estudio previo.Si la hip´otesisH0fuera cierta, entonces la media muestralX de una muestra de tama˜no nseguir´ıa una normal N(μ0, σ2/n).

Si fijamos α peque˜no (digamos α= 1 %), entonces X∈I(μ0, α) :=

μ0−zα/2√σ

n, μ0+zα/2√σ n

ocurrir´a con probabilidad de 1−α (digamos, probabilidad de 99 %).

3) Aplicaci´on del test. Ahora obtenemos una muestra concreta de tama˜no n, pongamos (x1, . . . , xn).

Si ocurriera que x no se encuentra en el intervalo I(μ0, α), habr´ıa sucedido un evento extremo, algo que s´olo ocurre con probabili- dad α (digamos 1 de cada 100). Si as´ı fuera, desconfiar´ıamos de la hip´otesis H0. No es que no pueda ocurrir, pero es tan inusual que ocu- rra (si la hip´otesis es cierta) que desconfiamos, adem´as cuantificablemente.

As´ı que, six /∈I(μ0, α),rechazamosla hip´otesisH0y decimos que lo hacemos con nivel de significaci´onα.

Por el contrario, si hubiera ocurrido x I(μ0, α) no tendr´ıamos argumentos (evidencia estad´ıstica) para rechazar H0 yaceptamosH0.

Observaciones:

Si x est´a significativamente alejado de μ0, consideramos que hay evidencia estad´ıstica (suficiente) como para rechazar la hip´otesis de queμ=μ0.

En general, un test de hip´otesis rechaza la hip´otesis H0 cuando sucede algo inusualmente extremo, que va muy en contra (probabilistamente hablando) de la hip´otesis.

Los niveles de significaci´on usuales sonα= 5 %,1 %,0.1 %, etc. La significaci´on de 5 % es un est´andar de referencia en contrastes de hip´otesis de estudios cient´ıficos.

C. Hip´otesis alternativa. Cuando rechazamos H0, en la pr´actica nos estamos quedando con la llamada hip´otesis alternativa H1, que en este caso es

H1 :μ=μ0.

Cuando el test rechaza la hip´otesis H0 (y acepta H1), lo hace con fundamento, pero cuando aceptaH0 lo hace porque no queda m´as remedio. M´as sobre esto, en el apartado F de esta misma secci´on.

(4)

D. Regi´on de rechazo. La regi´on Rα = {X /∈ I(μ0, α)} es conocida como la regi´on de rechazo del test. Al complementario de Rα nos referiremos como la regi´on de aceptaci´onAα del test.

Ejemplo 7.1.1. Contraste para la media de una normal de varianza σ2 = 4 para una muestra de tama˜no 100.

Tenemos una normalN(μ, σ2), conσ2 = 4 (y por tantoσ= 2). La hip´otesis nula esH0:μ=μ0, dondeμ0 = 1. Siguiendo el an´alisis anterior, rechazamos la hip´otesis

six cumple que |x−μ0|> zα/2 √σ n, es decir, six cae en la regi´on de rechazo.

Supongamos que tenemos 100 muestras deX, y que la media muestral esx= 1.3.

Por un lado,

|x−1|= 0.3. Por otro lado, si tomamos α= 1 %, entonces

zα/2 √σ

n = 2.58 2

10 = 0.52.

La conclusi´on es que no podemos rechazar la hip´otesis nula y, por tanto, no queda m´as remedio, aceptamosH0.

Si tomamos α= 5 %, entonces zα/2 √σ

n = 1.96 2

10 = 0.39, y de nuevo tendr´ıamos que aceptar H0.

Sin embargo, si hubi´eramos fijadoα = 15 %, entonces tendr´ıamos que zα/2 √σ

n = 1.44 2

10 = 0.29,

y en este caso s´ı que rechazar´ıamos H0 (con nivel de significaci´on del 15 %). E. Nivel de significaci´on α y p-valor. Si, en el ejemplo num´erico anterior, fijamos, digamos, α = 5 %, solo rechazar´ıamos H0 cuando |x−1| > 0.39, es decir, cuando la media muestral estuviera por encima de 1.39 o por debajo de 0.61. Sin embargo, si pusi´eramos α = 1 %, entonces rechazar´ıamos solo en el caso en que

|x−1| > 0.52 (media muestral por encima de 1.52 o por debajo de 0.48). Ahora, para rechazarH0, se necesita quexse aparte de 1 mucho m´as que en el caso anterior.

Es decir, cuanto m´as peque˜no es el valor de la significaci´on α, m´as dif´ıcil es que el test rechace la hip´otesis H0, y cuanto mayor seaα, m´as f´acil es que se rechace la hip´otesisH0.

(5)

7.1. Introducci´on 5 O, d´andole la vuelta, dada la muestra (y el consiguiente valor dex): siα es muy grande, entonces seguramente rechazaremos la hip´otesis, y si α es muy peque˜no, la aceptaremos. Nos gustar´ıa determinar el menor valor de la significaci´on α para el que rechazar´ıamos la hip´otesisH0.

Dada la muestra (x1, x2, . . . , xn) deX, al valor deα, digamos α0, tal que H0 se rechaza para α≥α0 y se acepta paraα < α0, se le denomina p-valor. Es decir, el p-valor es el m´as peque˜no valor de α para el que la hip´otesis se rechaza.

no rechaza rechaza p-valor

Un rechazo est´a m´as justificado cuanto mas peque˜no sea el nivel de significaci´on con que se hace. As´ı que, si el p-valor es muy peque˜no, entonces la muestra aporta una evidencia estad´ıstica muy contundente en contra de la hip´otesis que se est´a contrastando.

Ejemplo 7.1.2. C´alculo expl´ıcito del p-valor para el contraste de la media en una muestra normal.

Seguimos con una normal de varianza σ2 conocida. La hip´otesis nula se escribe H0:μ=μ0. Tenemosnmuestras, y la media muestral esx. RechazaremosH0cuando

|x−μ0|> zα/2 √σ

n = zα/2<

√n

σ |x−μ0|.

Comozα/2 = Φ1(1−α/2), podemos “despejar” α y obtener una f´ormula expl´ıcita para el p-valor α0:

α0= 2

1Φ

n

σ |x−μ0| .

Para la muestra del ejemplo 7.1.1, de tama˜no 100 y con media muestralx= 1.3, tendr´ıamos unp-valor

2

1Φ 10

2 0.3

= 2(1Φ(3/2)) = 13.36 %,

que es (medianamente) alto. Esto significar´ıa que la evidencia estad´ıstica que la muestra aporta en contra de la hip´otesis no es muy alta.

Sin embargo, con muestras de tama˜no 100, si ocurriera que x= 1.5, entonces el p-valor ser´ıa 1.24 %, y el rechazo estar´ıa m´as que justificado.

(6)

F. Errores y sus tipos. En un test de hip´otesis, se pueden producir cuatro si- tuaciones, recogidas en la siguiente tabla:

Aceptamos H0 Rechazamos H0

H0 cierta OK error tipo 1

H0 falsa error tipo 2 OK

Las dos situaciones en las que el test comete error se conocen tradicionalmente (y poco nemot´ecnicamente) como:

Error de tipo 1.Este es el error que se comete si´ se rechaza la hip´otesisH0

cuando es cierta.

Error de tipo 2. Este es el error que se comete cuando´ se acepta (o no se rechaza) H0 cuando es falsa.

En el test que estamos considerando, la probabilidad de cometer un error del tipo 1 es exactamente α. Como habitualmente tomamos α peque˜no, el test est´a dise˜nado para que este tipo de error sea peque˜no: la probabilidad de equivocarse al rechazar es muy peque˜na.

Tambi´en interesar´ıa controlar la probabilidad de que el error de tipo 2 fuera peque˜no, pero el dise˜no del test anterior no contempla esta posibilidad.

Ejemplo 7.1.3. Inocentes a la c´arcel o culpables en libertad.

En un juicio se intenta dilucidar si un sospechoso es culpable o inocente de un cierto crimen. Nos preguntamos si la hip´otesis que se debe plantear esH0 : “el sospe- choso es culpable”, oH0: “el sospechoso es inocente”. Parece asunto intrascendente, pero no.

En el sistema judicial espa˜nol (y en cualquiera razonable, con la presunci´on de inocencia como gu´ıa) se plantea como hip´otesisH0 : “el sospechoso es inocente”, de manera que la evidencia aportada (las pruebas) han de ser muy contundentes para rechazar H0, y condenar al sospechoso. Con una tabla an´aloga a la anterior,

Se aceptaH0 Se rechazaH0

H0 cierta Se absuelve a un inocente Se condena a un inocente H0 falsa Se absuelve a un culpable Se condena a un culpable

Y se pretende que la probabilidad de cometer un error de tipo 1 (condenar a un inocente) sea muy peque˜na. Esto exige que el sistema sea muy garantista, que las pruebas de culpabilidad hayan de ser muy s´olidas. . . lo que conduce, claro, a que en ocasiones algunos culpables queden libres (error de tipo 2). Como es bien sabido. 7.1.2. Contraste de proporci´on

Tratamos ahora otro caso de inter´es, en el que se desea contrastar la hip´otesis de que, en una determinada poblaci´on, la proporci´on de individuos con una determinada caracter´ıstica (votantes por un partido, seguidores de un equipo, etc.) esp0.

(7)

7.2. Contrastes bilaterales 7 Es decir, tenemos una variable X∼Ber(p) y queremos contrastar la hip´otesis

H0: p=p0, contra la hip´otesis alternativa

H1: p=p0.

Si H0 fuera cierta, es decir, si p0 fuera el verdadero valor dep, en una muestra aleatoria (X1, X2, . . . , Xn) de tama˜no n(grande) se habr´ıa de cumplir, con probabi- lidad 1−α, que

X∈

p0−zα/2

√n

p0(1−p0), p0+zα/2

√n

p0(1−p0)

El test de hip´otesis consiste entonces en rechazar H0 cuando en la muestra rea- lizada (x1, . . . , xn) se tiene que

x /∈

p0 zα/2

√n

p0(1−p0), p0+zα/2

√n

p0(1−p0)

La regi´on de rechazo es la uni´on de dos intervalos semiinfinitos:

Rα =

− ∞, p0−zα/2

√n

p0(1−p0)

p0+zα/2

√n

p0(1−p0),+

El estad´ıstico del test es X. Obs´ervese que, en este caso,xes la proporci´on de la caracter´ıstica en estudio en la muestra.

El test compara la proporci´on observada x con la proporci´on p0 esperada/su- puesta, y si son muy diferentes, rechaza la suposici´on.

7.2. Contrastes bilaterales

En los llamados contrastes bilaterales, la hip´otesis que se desea contrastar es que el par´ametro de inter´es tome un determinado valor. Es decir, la hip´otesis nulaH0 es H0: θ=θ0 y la hip´otesis alternativa esH1 : θ=θ0.

M´as adelante se contrastan hip´otesis nulas como H0: θ θ0, conocidas como hip´otesis unilaterales, que tienen alg´un ingrediente adicional.

7.2.1. Tests bilaterales m´as usuales

Con el mismo argumento que en los dos ejemplos que hemos visto (que, de hecho, son contrastes bilaterales), se obtienen los siguiente test de hip´otesis, todos con nivel de significaci´on α. Compare el lector con los intervalos de confianza an´alogos de la secci´on 6.5.1.

(8)

Contrastes para una poblaci´on

Variable Hip´otesis nula Estad. Regi´on de rechazo N(μ, σ2) H0:μ=μ0 (σconocida) X |xμ0|> zα/2σ/ n N(μ, σ2) H0:μ=μ0 (σdesc.) X |xμ0|> t{n−1;α/2}s/

n N(μ, σ2) H0:σ2=σ02 S2 (n−1)sσ2 2

0 /

χ2{n−1;1−α/2}, χ2{n−1;α/2}

ber(p) H0:p=p0 X |xp0|> zα/2

p0(1p0)/ n poiss(λ) H0:λ=λ0 X |xλ0|> zα/2

λ0/ n

(Nota: el tama˜nonde la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.) Contrastes para dos poblaciones

Variables Hip´otesis nula Regi´on de rechazo

N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2

(σ1, σ2conocidas) |x1x2|> zα/2

σ21

n1 +σn22

2

N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2

(σ1=σ2 desconocidas) |x1x2|> t{n1+n22;α/2} sp

1

n1 +n1

2

N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2

(σ1=σ2 desconocidas) |x1x2|> t{f;α/2}

s21 n1 +ns22

2

N(μ1, σ12),N(μ2, σ22) H0:σ21=σ22 s21 s22 /

F{n11;n21;1−α/2}, F{n11;n21;α/2}

ber(p1),ber(p2) H0: p1=p2 |x1x2|> zα/2

p(1p)

1

n1 +n1

2

donde

n1 y n2 son los tama˜nos muestrales (que han de ser grandes para el contraste de medias de Bernoullis);

x1 yx2 son las medias muestrales;

s21 ys22 son las cuasivarianzas muestrales;

s2p= (n11)s21+ (n21)s22 (n11) + (n21) ;

f es el entero m´as pr´oximo a (s21/n1+s22/n2)2

(s21/n1)2

n11 +(sn22/n2)2

21

; p¯= n1x1+n2x2

n1+n2 .

(9)

7.3. Contrastes unilaterales 9

7.3. Contrastes unilaterales

Volvemos al ejemplo b´asico de una variable X ∼ N(μ, σ2), con σ2 conocida y donde estamos contrastando una hip´otesis sobre la esperanzaμ.

En particular, planteamos ahora, co- mo hip´otesis nula,

H0:μ≤μ0, para un cierto μ0. La hip´otesis alternativa es H1:μ > μ0. El estad´ıstico es de nuevo X.

Si la hip´otesis H0 es cierta, X sigue una normal N(μ, σ2), con una media μ cuyo valor es menor o igual que el μ0 de

referencia. Es decir, X es unaN(μ, σ2/n), con μ≤μ0, y por tanto X sigue uno de los modelos representados en la figura.

Esto sugiere rechazar H0 cuandox seamucho mayor queμ0. En concreto, y por analog´ıa con el caso bilateral, la regi´on Rα de rechazo ser´a

x > μ0+zα √σ n. Ahora la significaci´on α se define como

α= sup

μ≤μ0

Pμ(Rα) =Pμ0(Rα),

y mide la m´axima probabilidad de cometer error de tipo 1, que se alcanza justamente en μ=μ0. V´ease la nota 7.3.1 siguiente, y tambi´en la secci´on 7.4.

El p-valor es, de nuevo, el valor α0 de la significaci´on α para el que, dada la muestra concreta, se rechaza H0 si α≥α0 y no se rechaza paraα≤α0.

Ê Nota7.3.1. Detalle del significado deαen este test unilateral. Queremos medir la probabilidad de cometer un error de tipo 1, es decir, de rechazarH0cuando la hip´otesis es cierta. Ahora, n´otese,H0

incluye un rango completo de valores deμ.

SiX tuviera una mediaμ0, entonces la probabilidad de cometer un error de tipo 1 ser´ıa Pμ0(Rα) =Pμ0(X > μ0+zασ/

n) =Pμ0

Xμ0

σ/n > zα

=α.

Mientras que siX tuviera una media ˜μ, con ˜μ < μ0, entonces Pμ˜(Rα) =Pμ˜(X > μ0+zασ/

n) =Pμ˜

Xμ˜ σ/

n > zα+μ0μ˜ σ/

n < α.

otese el menor estricto.

(10)

7.3.1. Dise˜no de tests unilaterales. Elecci´on de hip´otesis nula Seguimos analizando el caso en el queX ∼ N(μ, σ2), con σ2 conocida. Tenemos como valor de referencia un ciertoμ0.

Mantenemos, adem´as, la firme convicci´on de que el verdadero μ es mayor que ese μ0 de referencia. Como los test de contraste de hip´otesis funcionan “bien” en caso de rechazo, lo natural es plantear en este caso la hip´otesis H0 :μ≤μ0, con la esperanza de que, cuando tengamos la muestra, y por tanto el valor de x, podamos rechazar H0 con un nivel de significaci´on peque˜no, y por tanto concluir, confiada y finalmente, queμ es mayor queμ0.

Como situaci´on alternativa, digamos queya disponemos de una muestra, y que el valor dexes bastante mayor que μ0. Esto nos inclina a pensar que, plausiblemente, elμverdadero sea mayor queμ0. De nuevo, el test natural que deber´ıamos plantear tiene como hip´otesis nula a H0: μ μ0. Si x es significativamente mayor que μ0, es decir, si x cae en la regi´on de rechazo para un α peque˜no (o mejor, si el p- valor es peque˜no), entonces rechazaremos H0 con garant´ıa, con confianza, es decir, confirmaremos confiadamente queμ > μ0.

Ê Nota7.3.2.Bilateral vs unilateral.Supongamos queX ∼ N(μ, σ2). La hip´otesis de referencia es μ= 0 (yσes conocido). Pero no nos hemos decantado por aplicar un contraste bilateral o unilateral.

Tenemos en mente el est´andar de significaci´on de 5 %. Y disponemos de una muestra con mediax, positiva y relativamente grande.

Si planteamos un test bilateral, rechazaremos la hip´otesisH0:μ= 0 si x > zα/2σ

n = 1.96σ n.

Mientras que si planteamos un test unilateral, rechazaremos la hip´otesisH0:μ0 si x > zασ

n = 1.64σ n.

Como se aprecia, es m´as f´acil rechazar en el unilateral y concluir que μ >0, que rechazar en el bilateral y concluir queμ= 0.

Digamos, por ejemplo, que σ = 2 y n = 100. As´ı que 1.96σ/n 0.392, mientras que 1.64σ/

n 0.328. Si la muestra nos dierax = 0.35, entonces no podr´ıamos rechazar la hip´ote- sisμ= 0, pero s´ı la hip´otesisμ0.

(11)

7.3. Contrastes unilaterales 11 7.3.2. Tests unilaterales m´as usuales

Contrastes para una poblaci´on

Variable Hip´otesis nula Estad. Regi´on de rechazo N(μ, σ2) H0:μμ0 (σconocida) X x < μ0zασ/

n N(μ, σ2) H0:μμ0 (σconocida) X x > μ0+zασ/

n N(μ, σ2) H0:μμ0 (σdesc.) X x < μ0t{n−1;α}s/

n N(μ, σ2) H0:μμ0 (σdesc.) X x > μ0+t{n−1;α}s/

n N(μ, σ2) H0:σ2σ02 S2 (n−1)sσ2 2

0 < χ2{n−1;1−α}

N(μ, σ2) H0:σ2σ02 S2 (n−1)sσ2 2

0 > χ2{n−1;α}

ber(p) H0:pp0 X x < p0zα

p0(1p0)/ n ber(p) H0:pp0 X x > p0+zα

p0(1p0)/ n poiss(λ) H0:λλ0 X x < λ0zα

λ0/ n poiss(λ) H0:λλ0 X x > λ0+zα

λ0/ n

(Nota: el tama˜nonde la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.) Contrastes para dos poblaciones

Variables Hip´otesis nula Regi´on de rechazo

N(μ1, σ12),N(μ2, σ22) H0:μ1μ2

(σ1, σ2 conocidas) x1x2> zα

σ21 n1 +σn22

2

N(μ1, σ12),N(μ2, σ22) H0:μ1μ2

(σ1=σ2 desconocidas) x1x2> t{n1+n22;α} sp

1

n1 +n1

2

N(μ1, σ12),N(μ2, σ22) H0:μ1μ2

(σ1=σ2 desconocidas) x1x2> t{f;α}

s21 n1 +ns22

2

N(μ1, σ12),N(μ2, σ22) H0:σ21σ22 s21

s22 > F{n11;n21;α}

ber(p1),ber(p2) H0:p1p2 x1x2> zα

p(1p)

1

n1 +n1

2

donde

n1 y n2 son los tama˜nos muestrales (que han de ser grandes para el contraste de medias de Bernoullis);

x1 yx2 son las medias muestrales; s21 ys22 son las cuasivarianzas muestrales;

s2p= (n11)s21+ (n21)s22

(n11) + (n21) ; p¯= n1x1+n2x2

n1+n2 . f es el entero m´as pr´oximo a (s21/n1+s22/n2)2

(s21/n1)2

n11 +(sn22/n2)2

21

;

(12)

7.4. Test generales, funci´ on de potencia

Planteamos a continuaci´on un marco general para analizar test de contrastes de hip´otesis. Partimos, como es habitual, de una variable X con funci´on de den- sidad/masa f(x;θ), con θ Θ. El espacio de par´ametros Θ se divide en Θ0 y su complementario Θ1. La hip´otesis nula, que deseamos contrastar, es

H0:θ∈Θ0, y la hip´otesis alternativa es

H1:θ∈Θ1. Para construir un test de hip´otesis,

seleccionamos un estad´ısticoT =h(X1, . . . , Xn);

y determinamos una regi´on (de rechazo) R ⊂ R, que habitualmente depende de un cierto nivel o umbral.

La operativa del test va como sigue: dada una muestra emp´ırica (x1, . . . , xn) de X, obtenemos un valor t=h(x1, . . . , xn) del estad´ıstico. Entonces,

sit∈ R, entonces se rechaza H0 (y se acepta H1);

sit /∈ R, entonces se acepta H0.

Ya hemos visto, en p´aginas anteriores, los estad´ısticos y regiones de rechazo correspondientes a los tests m´as habituales.

Vamos ahora a dar un paso m´as all´a en el an´alisis y obtener, para cada posible valor de par´ametro θ, la probabilidad de que el test rechace la hip´otesis nulasupo- niendo que ese θ fuera el verdadero valor del par´ametro. Esto es lo que se conoce como lafunci´on de potencia del test,β(θ), que a cadaθ∈Θ le asocia el n´umero (entre 0 y 1)

(7.1) β(θ) =Pθ(rechazarH0) =Pθ(T ∈ R).

Por supuesto, con la funci´on 1−β(θ) codificamos la probabilidad de que el testacepte la hip´otesis suponiendo que ese θfuera el verdadero valor del par´ametro.

Lo ideal, claro, ser´ıa que

•β(θ) fuera muy pr´oxima a 0 para todoθ∈Θ0(es decir, que si la hip´otesis fuera cierta, el test la rechazara con baja probabilidad);

y queβ(θ) fuera cercana a 1 para todoθ∈Θ1 (es decir, que si la hip´otesis nula fuera falsa, el test la rechazara con probabilidad cercana a 1).

La primera situaci´on se corresponde con errores de tipo 1. De hecho, lasignifi- caci´onα del test se define como

(7.2) α= sup

θ∈Θ0

β(θ),

es decir, la “m´axima” probabilidad de rechazo suponiendo que la hip´otesis fuera cierta (m´axima probabilidad de cometer error de tipo 1).

(13)

7.4. Test generales, funci´on de potencia 13 En la segunda situaci´on, cuando θ Θ1 (y la hip´otesis H0 es falsa), entonces 1−β(θ) nos da la probabilidad, para cadaθ∈Θ1, de cometer error de tipo 2. Como veremos en los ejemplos que siguen, en los tests con un nivel de significaci´on peque˜no, la probabilidad de cometer errores de tipo 2 puede (y suele) llegar a ser grande.

Los test de las p´aginas anteriores, que se escriben en t´erminos de unα de refe- rencia, tienen nivel de significaci´on justamenteα, en el sentido t´ecnico dado en (7.2), como ilustramos en los dos siguientes ejemplos.

Ê Nota7.4.1. En un test de contraste de hip´otesis general, se plantea una regi´on de rechazoR, que habitualmente depende de uno o varios umbrales. A posteriori, se calcula su nivel de significaci´onα siguiendo (7.2). V´eanse, en los ejemplos 7.4.3 y 7.4.4, un par de ilustraciones.

En los test est´andar que hemos descrito en las primeras secciones de este cap´ıtulo, se pone por adelantado el valor deα, y se dise˜na la regi´on de rechazoRα para que tenga justamente nivel de significaci´onα.

Ejemplo 7.4.1. Funci´on de potencia para el test habitual de la hip´otesisH0:μ=μ0

para X ∼ N(μ, σ2), con σ conocida.

Para muestras (X1, . . . , Xn) de X de tama˜no n, consideramos el estad´ıstico X. Dado unα∈(0,1), y como ya hemos visto, la regi´on de rechazo es

Rα= |X−μ0|> zα/2 √σ n

Para calcular la funci´on de potencia, recordamos que, siX ∼ N(μ, σ2), entonces (X−μ)/(σ/√

n)∼ N(0,1). Usando esto, tenemos que β(μ) =Pμ(X ∈ Rα) =Pμ

|X−μ0|> zα/2σ/√ n

= 1Pμ

|X−μ0| ≤zα/2σ/√ n

= 1Pμ

−zα/2σ/√

n≤X−μ0≤zα/2σ/√ n

= 1Pμ

(μ0−μ)−zα/2σ/√

n≤X−μ≤(μ0−μ) +zα/2σ/√ n

= 1Pμ

μ0−μ σ/√

n −zα/2 X−μ σ/√

n μ0−μ σ/√

n +zα/2

= 1 Φ

μ0−μ σ/√

n +zα/2 Φ

μ0−μ σ/√

n −zα/2

.

La funci´on β(μ) tiende a 1 cuando μ→ ±∞. Y adem´as,β(μ0) = 1Φ(zα/2) + Φ(−zα/2) =α, de manera que el nivel de significaci´on del test es α, como debe ser.

La figura de la izquierda muestra el as- pecto de β(μ) para para los valores μ0 = 1, σ= 1,α= 5 % yn= 100. Obs´ervese c´omoβ es peque˜no en el entorno deμ0. N´otese tam- bi´en que si el verdaderoμestuviera cerca de μ0, pero no fueraexactamente μ0, la hip´ote- sis nula ser´ıa falsa, pero el test la aceptar´ıa con una (relativa) alta probabilidad. Si por

(14)

el contrarioμestuviera lejos deμ0, entonces el test cometer´ıa un error de tipo 2 con baja probabilidad. Ejemplo 7.4.2. Funci´on de potencia para el test habitual de la hip´otesisH0:μ≤μ0

para X ∼ N(μ, σ2), con σ conocida.

El estad´ıstico es de nuevoX. Dado unα∈(0,1), la regi´on de rechazo es Rα= X > μ0+zα √σ

n

Procediendo como en el ejemplo anterior, β(μ) =Pμ(X ∈ Rα) =Pμ

X > μ0+zασ/√ n

=Pμ

X−μ >(μ0−μ) +zασ/√ n

=Pμ

X−μ σ/√

n > μ0−μ σ/√

n +zα

= 1Φ

μ0−μ σ/√

n +zα

.

Representamos a la izquierda muestra el as- pecto deβ(μ) (de nuevo para los valoresμ0 = 1, σ = 1, α = 5 % y n = 100). La funci´on β es peque˜na, casi 0, a la izquierda de μ0, como es- per´abamos. El nivel de significaci´on viene dado por supμ≤μ0β(μ) =β(μ0) = 1Φ(zα) = α, co- mo (de nuevo) debe ser.

Como en el ejemplo anterior, si μfuera lige- ramente mayor que μ0, la hip´otesis ser´ıa falsa,

pero el test la aceptar´ıa con alta probabilidad.

Ejemplo 7.4.3. Un test para proporciones.

Queremos contrastar la hip´otesis de que la proporci´on p de personas infectadas por una cierta enfermedad en una poblaci´on es inferior al 5 %. Es decir, la hip´otesis nula es

H0: p≤5 %.

Para contrastarla, dise˜namos el siguiente test: analizaremos a cinco personas, y si en esa muestra encontramosal menos una infectada, entonces rechazaremos la hip´otesis de partida. El test parece razonable, pues un infectado (o m´as) de cada cinco apunta a una proporci´on mucho mayor del 5 % (o menor) supuesto.

Digamos que X1, . . . , X5 son las variables que registran si cada persona analiza- da est´a infectada o no. Son variables independientes, que siguen1 una distribuci´on ber(p). Su suma Z = X1+· · ·+X5, que registra el n´umero de infectados, es una variablebin(5, p).

1Para que esto sea cierto, deber´ıamos suponer, en el lenguaje habitual de las urnas, que cada extracci´on se hace con reemplazamiento; o bien que la poblaci´on es tan grande que unas cuantas extracciones no cambian lapde partida.

(15)

7.4. Test generales, funci´on de potencia 15 La regi´on de rechazo se escribe ahora

R={Z 1}.

La funci´on de potencia del test es

β(p) =Pp(Z 1) = 1Pp(Z = 0) = 1(1−p)5. A la izquierda hemos dibujado esta funci´on de po- tencia. Comoβ(p) es una funci´on creciente, la sig- nificaci´on del test es supp≤5 %β(p) = β(5 %) = 22.62 %, un poco (bastante) alta.

Buscando un mejor nivel de significaci´on, redise˜namos el test y rechazamos la hip´otesis si encontramos en la muestra de cinco personas al menos dos infectadas.

La regi´on de rechazo ser´ıa ahoraR={Z 2}, y la funci´on de potencia del test ser´ıa β(p) =Pp(Z 2) = 1Pp(Z = 0)Pp(Z = 1) = 1(1−p)55p(1−p)4, cuyo aspecto es similar a la de la gr´afica anterior, pero que nos dar´ıa un nivel de significaci´on de supp≤5 %β(p) =β(5 %) = 2.26 %, mucho menor que el anterior.

Obs´ervese que, para los dos tests, pero m´as pronunciadamente en el segundo, la probabilidad de error de tipo 2 puede llegar a ser muy grande. Por ejemplo, si p fuera del 6 %, la hip´otesis ser´ıa falsa, pero el test la aceptar´ıa con una (alt´ısima)

probabilidad del 1−β(6 %) = 96.81 %.

Ejemplo 7.4.4. Tests para la uniforme.

Digamos queX unif[0, a], dondeaes un par´ametro positivo. Tratamos primero la hip´otesis

H0:a≤A,

donde A es un cierto valor dado. Digamos que tenemos una muestra (x1, . . . , xn).

Obs´ervese que en cuanto haya alg´un valorxi mayor que A, la hip´otesis no puede ser cierta. Esto sugiere definir la siguiente region de rechazo:

R={m´ax(X1, . . . , Xn)> A}, que describimos usando el m´aximo de las Xi.

La funci´on de potencia asociada es

β(a) =Pa(m´ax(X1, . . . , Xn)> A) = 1Pa(m´ax(X1, . . . , Xn)≤A) = 1Pa(X≤A)n. Obs´ervese que Pa(X A) = 1 si a < A, y que Pa(X ≤A) = A/a si a≥A. Lo que nos da, finalmente, que

β(a) =

0, sia≤A, 1(A/a)n, sia > A.

(16)

A la izquierda dibujamos la funci´on de potencia del test. El nivel de significaci´on es α = 0, pues β(a) = 0 sia≤A; es decir, no es posible cometer errores de tipo 1 con este test.

Planteamos ahora la hip´otesis

H0:a≥A.

Ahora no est´a tan claro c´omo definir una regi´on de rechazo. Planteamos dos posibles alternativas: una primera un tanto imaginativa, la segunda algo m´as organizada.

Veamos. La hip´otesis H0 sugiere que el par´ametroa es “grande”, mayor que A. As´ı que parece razonable rechazarla si en la muestra observ´aramos “muchos” valores relativamente “peque˜nos”. Cuantificamos ese “peque˜nos” con un nivel, digamosA/5, y los “muchos valores”, con, por ejemplo, m´as de la mitad de ellos. Definimos, pues, la siguiente regi´on de rechazo para una muestra (X1, . . . , Xn):

() R=

#{Xi≤A/5} ≥n/2 . La funci´on de potencia del test es

β(a) =Pa(R) =P(Z ≥n/2),

donde Z es una variable binomial con n repeticiones y probabilidad de ´exito dada porPa(X ≤A/5). Obs´ervese que

Pa(X ≤A/5) =

1 si a≤A/5, A/(5a) si a > A/5.

Esto nos da, finalmente, que β(a) =

1 sia < A/5,

P

bin(n,5aA

≥n/2) sia > A/5.

A la izquierda dibujamos el aspecto de esta fun- ci´on de potencia. En azul, la regi´on de par´ame- tros en la que la hip´otesis es cierta. El nivel de significaci´on del test es α = supa≥Aβ(a) = β(A) = P(bin(n,1/5) n/2). Por ejemplo, si n= 10 yA= 5, rechazamos la hip´otesis cuando al menos cinco muestras sean menores o iguales que 1.

(17)

7.4. Test generales, funci´on de potencia 17 El nivel de significaci´on es, en este caso,

α=P(bin(10,1/5)5) = 10 j=5

P(bin(10,1/5) =j)3.28 %,

que es razonable peque˜no. Si el corte en la regi´on de rechazo () se hubiera puesto en A/4, en lugar de en A/5 (manteniendo el n/2), entonces el nivel de significaci´on ser´ıa mayor, de 7.81 %

Como alternativa, podr´ıamos argumentar como sigue: si X sigue unaunif[0, a], esperamos que el m´aximo de una muestra (grande) de X est´e (muy) cerca del valor extremo a. As´ı que si la hip´otesis es cierta, es decir, si a A, el m´aximo de la muestra deber´ıa estar (quiz´as bastante) a la derecha de A.

Esto sugiere un test que rechace la hip´otesis si el m´aximo est´a un poco a la izquierda deA. Cuantificaremos esta idea en el ejemplo 7.5.4.

Referencias

Documento similar

Es decir para mantenerse en operación una máquina térmica debe intercambiar calor tanto con un sumidero de baja temperatura como con una fuente de alta temperatura