Cap´ıtulo 7
Contrastes de hip´ otesis
7.1. Introducci´on . . . . 1
7.1.1. Contraste de media de normal, con varianza conocida . . 2
7.1.2. Contraste de proporci´on . . . . 6
7.2. Contrastes bilaterales . . . . 7
7.2.1. Tests bilaterales m´as usuales . . . . 7
7.3. Contrastes unilaterales . . . . 9
7.3.1. Dise˜no de tests unilaterales. Elecci´on de hip´otesis nula . . 10
7.3.2. Tests unilaterales m´as usuales . . . . 11
7.4. Test generales, funci´on de potencia . . . . 12
7.5. Tests de raz´on de verosimilitudes . . . . 18
7.6. Tests uniformemente m´as potentes . . . . 26
7.6.1. Lema de Neyman–Pearson . . . . 26
7.1. Introducci´ on
Continuamos en este cap´ıtulo dentro del marco general de los dos anteriores: una cierta variableX tiene funci´on de masa/densidad f(x;θ), donde θ es un par´ametro desconocido. El objetivo de la tecnolog´ıa de inferencia (param´etrica) consiste en obtener informaci´on sobre θa partir de una muestra emp´ırica (x1, . . . , xn).
En el cap´ıtulo 5 analizamos estimadores del par´ametro θ (m´etodos de construc- ci´on y propiedades). Con un estimador T, la muestra emp´ırica da lugar a una esti- maci´on θˆ=T(x1, . . . , xn) del par´ametro θ.
En el cap´ıtulo 6 nos ocupamos de establecer intervalos de confianza I para el par´ametroθ, de manera que, con alta confianza, el verdadero (y desconocido) valor de θest´e en el intervalo I (que depende de la muestra).
En este cap´ıtulo cambiaremos el punto de vista, y desarrollaremos una tecno- log´ıa paracontrastar hip´otesis sobre el par´ametro, como que valga 3, que sea mayor
que 5, etc. Avisamos al lector de que, aunque la cuesti´on de inter´es sea distinta, la metodolog´ıa que dise˜naremos se va a apoyar en gran medida en los desarrollos que dieron lugar a los intervalos de confianza.
Digamos, por ejemplo, que tenemos una muestra (x1, . . . , xn), donde los xi son ceros o unos, que sabemos que ha sido obtenida lanzando repetidamente una mone- da. La hip´otesis que queremos contrastar (qu´e otra pod´ıa ser) es que la moneda en cuesti´on esregular. En t´erminos m´as t´ecnicos, siXsigue unaber(1/2) o no. Obser- vamos la muestra, contamos ceros y unos, calculamos promedios y obtenemos que en la muestra aparece un 30 % de unos. Esto, desde luego, parece ir en contra de la hip´otesis; no es que sea imposible que una moneda regular produzca tal proporci´on de caras, pero se nos antoja bastante improbable. ¿Cu´anto?, ¿lo suficiente como para descartar que la moneda sea regular?
Veamos. Si la muestra fuera de tama˜no 10 y se tuvieran tres caras y siete cruces, quiz´as la alarma fuera injustificada: no parece que haya suficiente evidencia como para descartar, sin miramientos, la posibilidad de que la moneda sea 50 %-50 %. Sin embargo, si en 1000 lanzamientos obtenemos 300 caras, entonces s´ı, la intuici´on (y si no, nuestro sabio consejo) nos dice que es pr´acticamente imposible que tal resul- tado provenga de una moneda regular, lo que nos inducir´ıa a rechazar la hip´otesis:
definitivamente, la moneda estaba cargada.
As´ı que de lo que se trata es de dise˜nar un cierto procedimiento, o test, cuya expresi´on expl´ıcita depender´a de la variable X, del estimador del par´ametro que se considere, y del tama˜no de la muestra, que racionalice el “mosqueo” que la muestra parece producir al respecto de la hip´otesis; que cuantifique el peso que la evidencia estad´ıstica (la muestra emp´ırica) aporta en contra de la hip´otesis de partida.
Note, lector, c´omo en esta ilustraci´on estamos insistiendo siempre en la posibili- dad de rechazar la hip´otesis.
7.1.1. Contraste de media de normal, con varianza conocida Comenzamos, como para los intervalos de confianza, con el ejemplo b´asico de
contrastar la hip´otesis de que la media (esperanza)μ
de una determinada cantidad X en una poblaci´on que sigueX ∼ N(μ, σ2) toma un determinado valorμ0
suponiendo que se conoce la varianzaσ2.
Aprovecharemos este ejemplo concreto para ir introduciendo la terminolog´ıa y notaci´on generales.
A. Hip´otesis nula. La hip´otesis que queremos contrastar, que se conoce como hip´otesis nula y se denota porH0, es en este caso que μ=μ0. Escribiremos
H0:μ=μ0.
Aqu´ı, μ0 es un dato. La hip´otesisH0 puede venir de estudios previos, de modelo te´orico, de. . .
7.1. Introducci´on 3 B. Test de hip´otesis. Para contrastar esta hip´otesis realizaremos un test, que se dice de hip´otesis.
1) Tomamos un estad´ıstico para el test, que en este caso va a serX.
2)Estudio previo.Si la hip´otesisH0fuera cierta, entonces la media muestralX de una muestra de tama˜no nseguir´ıa una normal N(μ0, σ2/n).
Si fijamos α peque˜no (digamos α= 1 %), entonces X∈I(μ0, α) :=
μ0−zα/2√σ
n, μ0+zα/2√σ n
ocurrir´a con probabilidad de 1−α (digamos, probabilidad de 99 %).
3) Aplicaci´on del test. Ahora obtenemos una muestra concreta de tama˜no n, pongamos (x1, . . . , xn).
Si ocurriera que x no se encuentra en el intervalo I(μ0, α), habr´ıa sucedido un evento extremo, algo que s´olo ocurre con probabili- dad α (digamos 1 de cada 100). Si as´ı fuera, desconfiar´ıamos de la hip´otesis H0. No es que no pueda ocurrir, pero es tan inusual que ocu- rra (si la hip´otesis es cierta) que desconfiamos, adem´as cuantificablemente.
•As´ı que, six /∈I(μ0, α),rechazamosla hip´otesisH0y decimos que lo hacemos con nivel de significaci´onα.
• Por el contrario, si hubiera ocurrido x ∈ I(μ0, α) no tendr´ıamos argumentos (evidencia estad´ıstica) para rechazar H0 yaceptamosH0.
Observaciones:
Si x est´a significativamente alejado de μ0, consideramos que hay evidencia estad´ıstica (suficiente) como para rechazar la hip´otesis de queμ=μ0.
En general, un test de hip´otesis rechaza la hip´otesis H0 cuando sucede algo inusualmente extremo, que va muy en contra (probabilistamente hablando) de la hip´otesis.
Los niveles de significaci´on usuales sonα= 5 %,1 %,0.1 %, etc. La significaci´on de 5 % es un est´andar de referencia en contrastes de hip´otesis de estudios cient´ıficos.
C. Hip´otesis alternativa. Cuando rechazamos H0, en la pr´actica nos estamos quedando con la llamada hip´otesis alternativa H1, que en este caso es
H1 :μ=μ0.
Cuando el test rechaza la hip´otesis H0 (y acepta H1), lo hace con fundamento, pero cuando aceptaH0 lo hace porque no queda m´as remedio. M´as sobre esto, en el apartado F de esta misma secci´on.
D. Regi´on de rechazo. La regi´on Rα = {X /∈ I(μ0, α)} es conocida como la regi´on de rechazo del test. Al complementario de Rα nos referiremos como la regi´on de aceptaci´onAα del test.
Ejemplo 7.1.1. Contraste para la media de una normal de varianza σ2 = 4 para una muestra de tama˜no 100.
Tenemos una normalN(μ, σ2), conσ2 = 4 (y por tantoσ= 2). La hip´otesis nula esH0:μ=μ0, dondeμ0 = 1. Siguiendo el an´alisis anterior, rechazamos la hip´otesis
six cumple que |x−μ0|> zα/2 √σ n, es decir, six cae en la regi´on de rechazo.
Supongamos que tenemos 100 muestras deX, y que la media muestral esx= 1.3.
Por un lado,
|x−1|= 0.3. Por otro lado, si tomamos α= 1 %, entonces
zα/2 √σ
n = 2.58 2
10 = 0.52.
La conclusi´on es que no podemos rechazar la hip´otesis nula y, por tanto, no queda m´as remedio, aceptamosH0.
Si tomamos α= 5 %, entonces zα/2 √σ
n = 1.96 2
10 = 0.39, y de nuevo tendr´ıamos que aceptar H0.
Sin embargo, si hubi´eramos fijadoα = 15 %, entonces tendr´ıamos que zα/2 √σ
n = 1.44 2
10 = 0.29,
y en este caso s´ı que rechazar´ıamos H0 (con nivel de significaci´on del 15 %). ♣ E. Nivel de significaci´on α y p-valor. Si, en el ejemplo num´erico anterior, fijamos, digamos, α = 5 %, solo rechazar´ıamos H0 cuando |x−1| > 0.39, es decir, cuando la media muestral estuviera por encima de 1.39 o por debajo de 0.61. Sin embargo, si pusi´eramos α = 1 %, entonces rechazar´ıamos solo en el caso en que
|x−1| > 0.52 (media muestral por encima de 1.52 o por debajo de 0.48). Ahora, para rechazarH0, se necesita quexse aparte de 1 mucho m´as que en el caso anterior.
Es decir, cuanto m´as peque˜no es el valor de la significaci´on α, m´as dif´ıcil es que el test rechace la hip´otesis H0, y cuanto mayor seaα, m´as f´acil es que se rechace la hip´otesisH0.
7.1. Introducci´on 5 O, d´andole la vuelta, dada la muestra (y el consiguiente valor dex): siα es muy grande, entonces seguramente rechazaremos la hip´otesis, y si α es muy peque˜no, la aceptaremos. Nos gustar´ıa determinar el menor valor de la significaci´on α para el que rechazar´ıamos la hip´otesisH0.
Dada la muestra (x1, x2, . . . , xn) deX, al valor deα, digamos α0, tal que H0 se rechaza para α≥α0 y se acepta paraα < α0, se le denomina p-valor. Es decir, el p-valor es el m´as peque˜no valor de α para el que la hip´otesis se rechaza.
no rechaza rechaza p-valor
Un rechazo est´a m´as justificado cuanto mas peque˜no sea el nivel de significaci´on con que se hace. As´ı que, si el p-valor es muy peque˜no, entonces la muestra aporta una evidencia estad´ıstica muy contundente en contra de la hip´otesis que se est´a contrastando.
Ejemplo 7.1.2. C´alculo expl´ıcito del p-valor para el contraste de la media en una muestra normal.
Seguimos con una normal de varianza σ2 conocida. La hip´otesis nula se escribe H0:μ=μ0. Tenemosnmuestras, y la media muestral esx. RechazaremosH0cuando
|x−μ0|> zα/2 √σ
n =⇒ zα/2<
√n
σ |x−μ0|.
Comozα/2 = Φ−1(1−α/2), podemos “despejar” α y obtener una f´ormula expl´ıcita para el p-valor α0:
α0= 2
1−Φ √
n
σ |x−μ0| .
Para la muestra del ejemplo 7.1.1, de tama˜no 100 y con media muestralx= 1.3, tendr´ıamos unp-valor
2
1−Φ 10
2 0.3
= 2(1−Φ(3/2)) = 13.36 %,
que es (medianamente) alto. Esto significar´ıa que la evidencia estad´ıstica que la muestra aporta en contra de la hip´otesis no es muy alta.
Sin embargo, con muestras de tama˜no 100, si ocurriera que x= 1.5, entonces el p-valor ser´ıa 1.24 %, y el rechazo estar´ıa m´as que justificado. ♣
F. Errores y sus tipos. En un test de hip´otesis, se pueden producir cuatro si- tuaciones, recogidas en la siguiente tabla:
Aceptamos H0 Rechazamos H0
H0 cierta OK error tipo 1
H0 falsa error tipo 2 OK
Las dos situaciones en las que el test comete error se conocen tradicionalmente (y poco nemot´ecnicamente) como:
Error de tipo 1.Este es el error que se comete si´ se rechaza la hip´otesisH0
cuando es cierta.
Error de tipo 2. Este es el error que se comete cuando´ se acepta (o no se rechaza) H0 cuando es falsa.
En el test que estamos considerando, la probabilidad de cometer un error del tipo 1 es exactamente α. Como habitualmente tomamos α peque˜no, el test est´a dise˜nado para que este tipo de error sea peque˜no: la probabilidad de equivocarse al rechazar es muy peque˜na.
Tambi´en interesar´ıa controlar la probabilidad de que el error de tipo 2 fuera peque˜no, pero el dise˜no del test anterior no contempla esta posibilidad.
Ejemplo 7.1.3. Inocentes a la c´arcel o culpables en libertad.
En un juicio se intenta dilucidar si un sospechoso es culpable o inocente de un cierto crimen. Nos preguntamos si la hip´otesis que se debe plantear esH0 : “el sospe- choso es culpable”, oH0: “el sospechoso es inocente”. Parece asunto intrascendente, pero no.
En el sistema judicial espa˜nol (y en cualquiera razonable, con la presunci´on de inocencia como gu´ıa) se plantea como hip´otesisH0 : “el sospechoso es inocente”, de manera que la evidencia aportada (las pruebas) han de ser muy contundentes para rechazar H0, y condenar al sospechoso. Con una tabla an´aloga a la anterior,
Se aceptaH0 Se rechazaH0
H0 cierta Se absuelve a un inocente Se condena a un inocente H0 falsa Se absuelve a un culpable Se condena a un culpable
Y se pretende que la probabilidad de cometer un error de tipo 1 (condenar a un inocente) sea muy peque˜na. Esto exige que el sistema sea muy garantista, que las pruebas de culpabilidad hayan de ser muy s´olidas. . . lo que conduce, claro, a que en ocasiones algunos culpables queden libres (error de tipo 2). Como es bien sabido.♣ 7.1.2. Contraste de proporci´on
Tratamos ahora otro caso de inter´es, en el que se desea contrastar la hip´otesis de que, en una determinada poblaci´on, la proporci´on de individuos con una determinada caracter´ıstica (votantes por un partido, seguidores de un equipo, etc.) esp0.
7.2. Contrastes bilaterales 7 Es decir, tenemos una variable X∼Ber(p) y queremos contrastar la hip´otesis
H0: p=p0, contra la hip´otesis alternativa
H1: p=p0.
Si H0 fuera cierta, es decir, si p0 fuera el verdadero valor dep, en una muestra aleatoria (X1, X2, . . . , Xn) de tama˜no n(grande) se habr´ıa de cumplir, con probabi- lidad 1−α, que
X∈
p0−zα/2
√n
p0(1−p0), p0+zα/2
√n
p0(1−p0)
El test de hip´otesis consiste entonces en rechazar H0 cuando en la muestra rea- lizada (x1, . . . , xn) se tiene que
x /∈
p0− zα/2
√n
p0(1−p0), p0+zα/2
√n
p0(1−p0)
La regi´on de rechazo es la uni´on de dos intervalos semiinfinitos:
Rα =
− ∞, p0−zα/2
√n
p0(1−p0)
p0+zα/2
√n
p0(1−p0),+∞
El estad´ıstico del test es X. Obs´ervese que, en este caso,xes la proporci´on de la caracter´ıstica en estudio en la muestra.
El test compara la proporci´on observada x con la proporci´on p0 esperada/su- puesta, y si son muy diferentes, rechaza la suposici´on.
7.2. Contrastes bilaterales
En los llamados contrastes bilaterales, la hip´otesis que se desea contrastar es que el par´ametro de inter´es tome un determinado valor. Es decir, la hip´otesis nulaH0 es H0: θ=θ0 y la hip´otesis alternativa esH1 : θ=θ0.
M´as adelante se contrastan hip´otesis nulas como H0: θ ≤ θ0, conocidas como hip´otesis unilaterales, que tienen alg´un ingrediente adicional.
7.2.1. Tests bilaterales m´as usuales
Con el mismo argumento que en los dos ejemplos que hemos visto (que, de hecho, son contrastes bilaterales), se obtienen los siguiente test de hip´otesis, todos con nivel de significaci´on α. Compare el lector con los intervalos de confianza an´alogos de la secci´on 6.5.1.
Contrastes para una poblaci´on
Variable Hip´otesis nula Estad. Regi´on de rechazo N(μ, σ2) H0:μ=μ0 (σconocida) X |x−μ0|> zα/2σ/√ n N(μ, σ2) H0:μ=μ0 (σdesc.) X |x−μ0|> t{n−1;α/2}s/√
n N(μ, σ2) H0:σ2=σ02 S2 (n−1)sσ2 2
0 ∈/
χ2{n−1;1−α/2}, χ2{n−1;α/2}
ber(p) H0:p=p0 X |x−p0|> zα/2
p0(1−p0)/√ n poiss(λ) H0:λ=λ0 X |x−λ0|> zα/2√
λ0/√ n
(Nota: el tama˜nonde la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.) Contrastes para dos poblaciones
Variables Hip´otesis nula Regi´on de rechazo
N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2
(σ1, σ2conocidas) |x1−x2|> zα/2
σ21
n1 +σn22
2
N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2
(σ1=σ2 desconocidas) |x1−x2|> t{n1+n2−2;α/2} sp
1
n1 +n1
2
N(μ1, σ12),N(μ2, σ22) H0:μ1=μ2
(σ1=σ2 desconocidas) |x1−x2|> t{f;α/2}
s21 n1 +ns22
2
N(μ1, σ12),N(μ2, σ22) H0:σ21=σ22 s21 s22 ∈/
F{n1−1;n2−1;1−α/2}, F{n1−1;n2−1;α/2}
ber(p1),ber(p2) H0: p1=p2 |x1−x2|> zα/2
p(1−p)
1
n1 +n1
2
donde
n1 y n2 son los tama˜nos muestrales (que han de ser grandes para el contraste de medias de Bernoullis);
x1 yx2 son las medias muestrales;
s21 ys22 son las cuasivarianzas muestrales;
s2p= (n1−1)s21+ (n2−1)s22 (n1−1) + (n2−1) ;
f es el entero m´as pr´oximo a (s21/n1+s22/n2)2
(s21/n1)2
n1−1 +(sn22/n2)2
2−1
; p¯= n1x1+n2x2
n1+n2 .
7.3. Contrastes unilaterales 9
7.3. Contrastes unilaterales
Volvemos al ejemplo b´asico de una variable X ∼ N(μ, σ2), con σ2 conocida y donde estamos contrastando una hip´otesis sobre la esperanzaμ.
En particular, planteamos ahora, co- mo hip´otesis nula,
H0:μ≤μ0, para un cierto μ0. La hip´otesis alternativa es H1:μ > μ0. El estad´ıstico es de nuevo X.
Si la hip´otesis H0 es cierta, X sigue una normal N(μ, σ2), con una media μ cuyo valor es menor o igual que el μ0 de
referencia. Es decir, X es unaN(μ, σ2/n), con μ≤μ0, y por tanto X sigue uno de los modelos representados en la figura.
Esto sugiere rechazar H0 cuandox seamucho mayor queμ0. En concreto, y por analog´ıa con el caso bilateral, la regi´on Rα de rechazo ser´a
x > μ0+zα √σ n. Ahora la significaci´on α se define como
α= sup
μ≤μ0
Pμ(Rα) =Pμ0(Rα),
y mide la m´axima probabilidad de cometer error de tipo 1, que se alcanza justamente en μ=μ0. V´ease la nota 7.3.1 siguiente, y tambi´en la secci´on 7.4.
El p-valor es, de nuevo, el valor α0 de la significaci´on α para el que, dada la muestra concreta, se rechaza H0 si α≥α0 y no se rechaza paraα≤α0.
Ê Nota7.3.1. Detalle del significado deαen este test unilateral. Queremos medir la probabilidad de cometer un error de tipo 1, es decir, de rechazarH0cuando la hip´otesis es cierta. Ahora, n´otese,H0
incluye un rango completo de valores deμ.
SiX tuviera una mediaμ0, entonces la probabilidad de cometer un error de tipo 1 ser´ıa Pμ0(Rα) =Pμ0(X > μ0+zασ/√
n) =Pμ0
X−μ0
σ/√n > zα
=α.
Mientras que siX tuviera una media ˜μ, con ˜μ < μ0, entonces Pμ˜(Rα) =Pμ˜(X > μ0+zασ/√
n) =Pμ˜
X−μ˜ σ/√
n > zα+μ0−μ˜ σ/√
n < α.
N´otese el menor estricto.
7.3.1. Dise˜no de tests unilaterales. Elecci´on de hip´otesis nula Seguimos analizando el caso en el queX ∼ N(μ, σ2), con σ2 conocida. Tenemos como valor de referencia un ciertoμ0.
Mantenemos, adem´as, la firme convicci´on de que el verdadero μ es mayor que ese μ0 de referencia. Como los test de contraste de hip´otesis funcionan “bien” en caso de rechazo, lo natural es plantear en este caso la hip´otesis H0 :μ≤μ0, con la esperanza de que, cuando tengamos la muestra, y por tanto el valor de x, podamos rechazar H0 con un nivel de significaci´on peque˜no, y por tanto concluir, confiada y finalmente, queμ es mayor queμ0.
Como situaci´on alternativa, digamos queya disponemos de una muestra, y que el valor dexes bastante mayor que μ0. Esto nos inclina a pensar que, plausiblemente, elμverdadero sea mayor queμ0. De nuevo, el test natural que deber´ıamos plantear tiene como hip´otesis nula a H0: μ ≤ μ0. Si x es significativamente mayor que μ0, es decir, si x cae en la regi´on de rechazo para un α peque˜no (o mejor, si el p- valor es peque˜no), entonces rechazaremos H0 con garant´ıa, con confianza, es decir, confirmaremos confiadamente queμ > μ0.
Ê Nota7.3.2.Bilateral vs unilateral.Supongamos queX ∼ N(μ, σ2). La hip´otesis de referencia es μ= 0 (yσes conocido). Pero no nos hemos decantado por aplicar un contraste bilateral o unilateral.
Tenemos en mente el est´andar de significaci´on de 5 %. Y disponemos de una muestra con mediax, positiva y relativamente grande.
Si planteamos un test bilateral, rechazaremos la hip´otesisH0:μ= 0 si x > zα/2√σ
n = 1.96√σ n.
Mientras que si planteamos un test unilateral, rechazaremos la hip´otesisH0:μ≤0 si x > zα√σ
n = 1.64√σ n.
Como se aprecia, es m´as f´acil rechazar en el unilateral y concluir que μ >0, que rechazar en el bilateral y concluir queμ= 0.
Digamos, por ejemplo, que σ = 2 y n = 100. As´ı que 1.96σ/√n ≈ 0.392, mientras que 1.64σ/√
n ≈ 0.328. Si la muestra nos dierax = 0.35, entonces no podr´ıamos rechazar la hip´ote- sisμ= 0, pero s´ı la hip´otesisμ≤0.
7.3. Contrastes unilaterales 11 7.3.2. Tests unilaterales m´as usuales
Contrastes para una poblaci´on
Variable Hip´otesis nula Estad. Regi´on de rechazo N(μ, σ2) H0:μ≥μ0 (σconocida) X x < μ0−zασ/√
n N(μ, σ2) H0:μ≤μ0 (σconocida) X x > μ0+zασ/√
n N(μ, σ2) H0:μ≥μ0 (σdesc.) X x < μ0−t{n−1;α}s/√
n N(μ, σ2) H0:μ≤μ0 (σdesc.) X x > μ0+t{n−1;α}s/√
n N(μ, σ2) H0:σ2≥σ02 S2 (n−1)sσ2 2
0 < χ2{n−1;1−α}
N(μ, σ2) H0:σ2≤σ02 S2 (n−1)sσ2 2
0 > χ2{n−1;α}
ber(p) H0:p≥p0 X x < p0−zα
p0(1−p0)/√ n ber(p) H0:p≤p0 X x > p0+zα
p0(1−p0)/√ n poiss(λ) H0:λ≥λ0 X x < λ0−zα√
λ0/√ n poiss(λ) H0:λ≤λ0 X x > λ0+zα√
λ0/√ n
(Nota: el tama˜nonde la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.) Contrastes para dos poblaciones
Variables Hip´otesis nula Regi´on de rechazo
N(μ1, σ12),N(μ2, σ22) H0:μ1≤μ2
(σ1, σ2 conocidas) x1−x2> zα
σ21 n1 +σn22
2
N(μ1, σ12),N(μ2, σ22) H0:μ1≤μ2
(σ1=σ2 desconocidas) x1−x2> t{n1+n2−2;α} sp
1
n1 +n1
2
N(μ1, σ12),N(μ2, σ22) H0:μ1≤μ2
(σ1=σ2 desconocidas) x1−x2> t{f;α}
s21 n1 +ns22
2
N(μ1, σ12),N(μ2, σ22) H0:σ21≤σ22 s21
s22 > F{n1−1;n2−1;α}
ber(p1),ber(p2) H0:p1≤p2 x1−x2> zα
p(1−p)
1
n1 +n1
2
donde
n1 y n2 son los tama˜nos muestrales (que han de ser grandes para el contraste de medias de Bernoullis);
x1 yx2 son las medias muestrales; s21 ys22 son las cuasivarianzas muestrales;
s2p= (n1−1)s21+ (n2−1)s22
(n1−1) + (n2−1) ; p¯= n1x1+n2x2
n1+n2 . f es el entero m´as pr´oximo a (s21/n1+s22/n2)2
(s21/n1)2
n1−1 +(sn22/n2)2
2−1
;
7.4. Test generales, funci´ on de potencia
Planteamos a continuaci´on un marco general para analizar test de contrastes de hip´otesis. Partimos, como es habitual, de una variable X con funci´on de den- sidad/masa f(x;θ), con θ ∈ Θ. El espacio de par´ametros Θ se divide en Θ0 y su complementario Θ1. La hip´otesis nula, que deseamos contrastar, es
H0:θ∈Θ0, y la hip´otesis alternativa es
H1:θ∈Θ1. Para construir un test de hip´otesis,
seleccionamos un estad´ısticoT =h(X1, . . . , Xn);
y determinamos una regi´on (de rechazo) R ⊂ R, que habitualmente depende de un cierto nivel o umbral.
La operativa del test va como sigue: dada una muestra emp´ırica (x1, . . . , xn) de X, obtenemos un valor t=h(x1, . . . , xn) del estad´ıstico. Entonces,
sit∈ R, entonces se rechaza H0 (y se acepta H1);
sit /∈ R, entonces se acepta H0.
Ya hemos visto, en p´aginas anteriores, los estad´ısticos y regiones de rechazo correspondientes a los tests m´as habituales.
Vamos ahora a dar un paso m´as all´a en el an´alisis y obtener, para cada posible valor de par´ametro θ, la probabilidad de que el test rechace la hip´otesis nulasupo- niendo que ese θ fuera el verdadero valor del par´ametro. Esto es lo que se conoce como lafunci´on de potencia del test,β(θ), que a cadaθ∈Θ le asocia el n´umero (entre 0 y 1)
(7.1) β(θ) =Pθ(rechazarH0) =Pθ(T ∈ R).
Por supuesto, con la funci´on 1−β(θ) codificamos la probabilidad de que el testacepte la hip´otesis suponiendo que ese θfuera el verdadero valor del par´ametro.
Lo ideal, claro, ser´ıa que
•β(θ) fuera muy pr´oxima a 0 para todoθ∈Θ0(es decir, que si la hip´otesis fuera cierta, el test la rechazara con baja probabilidad);
•y queβ(θ) fuera cercana a 1 para todoθ∈Θ1 (es decir, que si la hip´otesis nula fuera falsa, el test la rechazara con probabilidad cercana a 1).
La primera situaci´on se corresponde con errores de tipo 1. De hecho, lasignifi- caci´onα del test se define como
(7.2) α= sup
θ∈Θ0
β(θ),
es decir, la “m´axima” probabilidad de rechazo suponiendo que la hip´otesis fuera cierta (m´axima probabilidad de cometer error de tipo 1).
7.4. Test generales, funci´on de potencia 13 En la segunda situaci´on, cuando θ ∈ Θ1 (y la hip´otesis H0 es falsa), entonces 1−β(θ) nos da la probabilidad, para cadaθ∈Θ1, de cometer error de tipo 2. Como veremos en los ejemplos que siguen, en los tests con un nivel de significaci´on peque˜no, la probabilidad de cometer errores de tipo 2 puede (y suele) llegar a ser grande.
Los test de las p´aginas anteriores, que se escriben en t´erminos de unα de refe- rencia, tienen nivel de significaci´on justamenteα, en el sentido t´ecnico dado en (7.2), como ilustramos en los dos siguientes ejemplos.
Ê Nota7.4.1. En un test de contraste de hip´otesis general, se plantea una regi´on de rechazoR, que habitualmente depende de uno o varios umbrales. A posteriori, se calcula su nivel de significaci´onα siguiendo (7.2). V´eanse, en los ejemplos 7.4.3 y 7.4.4, un par de ilustraciones.
En los test est´andar que hemos descrito en las primeras secciones de este cap´ıtulo, se pone por adelantado el valor deα, y se dise˜na la regi´on de rechazoRα para que tenga justamente nivel de significaci´onα.
Ejemplo 7.4.1. Funci´on de potencia para el test habitual de la hip´otesisH0:μ=μ0
para X ∼ N(μ, σ2), con σ conocida.
Para muestras (X1, . . . , Xn) de X de tama˜no n, consideramos el estad´ıstico X. Dado unα∈(0,1), y como ya hemos visto, la regi´on de rechazo es
Rα= |X−μ0|> zα/2 √σ n
Para calcular la funci´on de potencia, recordamos que, siX ∼ N(μ, σ2), entonces (X−μ)/(σ/√
n)∼ N(0,1). Usando esto, tenemos que β(μ) =Pμ(X ∈ Rα) =Pμ
|X−μ0|> zα/2σ/√ n
= 1−Pμ
|X−μ0| ≤zα/2σ/√ n
= 1−Pμ
−zα/2σ/√
n≤X−μ0≤zα/2σ/√ n
= 1−Pμ
(μ0−μ)−zα/2σ/√
n≤X−μ≤(μ0−μ) +zα/2σ/√ n
= 1−Pμ
μ0−μ σ/√
n −zα/2 ≤ X−μ σ/√
n ≤ μ0−μ σ/√
n +zα/2
= 1− Φ
μ0−μ σ/√
n +zα/2 −Φ
μ0−μ σ/√
n −zα/2
.
La funci´on β(μ) tiende a 1 cuando μ→ ±∞. Y adem´as,β(μ0) = 1−Φ(zα/2) + Φ(−zα/2) =α, de manera que el nivel de significaci´on del test es α, como debe ser.
La figura de la izquierda muestra el as- pecto de β(μ) para para los valores μ0 = 1, σ= 1,α= 5 % yn= 100. Obs´ervese c´omoβ es peque˜no en el entorno deμ0. N´otese tam- bi´en que si el verdaderoμestuviera cerca de μ0, pero no fueraexactamente μ0, la hip´ote- sis nula ser´ıa falsa, pero el test la aceptar´ıa con una (relativa) alta probabilidad. Si por
el contrarioμestuviera lejos deμ0, entonces el test cometer´ıa un error de tipo 2 con baja probabilidad. ♣ Ejemplo 7.4.2. Funci´on de potencia para el test habitual de la hip´otesisH0:μ≤μ0
para X ∼ N(μ, σ2), con σ conocida.
El estad´ıstico es de nuevoX. Dado unα∈(0,1), la regi´on de rechazo es Rα= X > μ0+zα √σ
n
Procediendo como en el ejemplo anterior, β(μ) =Pμ(X ∈ Rα) =Pμ
X > μ0+zασ/√ n
=Pμ
X−μ >(μ0−μ) +zασ/√ n
=Pμ
X−μ σ/√
n > μ0−μ σ/√
n +zα
= 1−Φ
μ0−μ σ/√
n +zα
.
Representamos a la izquierda muestra el as- pecto deβ(μ) (de nuevo para los valoresμ0 = 1, σ = 1, α = 5 % y n = 100). La funci´on β es peque˜na, casi 0, a la izquierda de μ0, como es- per´abamos. El nivel de significaci´on viene dado por supμ≤μ0β(μ) =β(μ0) = 1−Φ(zα) = α, co- mo (de nuevo) debe ser.
Como en el ejemplo anterior, si μfuera lige- ramente mayor que μ0, la hip´otesis ser´ıa falsa,
pero el test la aceptar´ıa con alta probabilidad. ♣
Ejemplo 7.4.3. Un test para proporciones.
Queremos contrastar la hip´otesis de que la proporci´on p de personas infectadas por una cierta enfermedad en una poblaci´on es inferior al 5 %. Es decir, la hip´otesis nula es
H0: p≤5 %.
Para contrastarla, dise˜namos el siguiente test: analizaremos a cinco personas, y si en esa muestra encontramosal menos una infectada, entonces rechazaremos la hip´otesis de partida. El test parece razonable, pues un infectado (o m´as) de cada cinco apunta a una proporci´on mucho mayor del 5 % (o menor) supuesto.
Digamos que X1, . . . , X5 son las variables que registran si cada persona analiza- da est´a infectada o no. Son variables independientes, que siguen1 una distribuci´on ber(p). Su suma Z = X1+· · ·+X5, que registra el n´umero de infectados, es una variablebin(5, p).
1Para que esto sea cierto, deber´ıamos suponer, en el lenguaje habitual de las urnas, que cada extracci´on se hace con reemplazamiento; o bien que la poblaci´on es tan grande que unas cuantas extracciones no cambian lapde partida.
7.4. Test generales, funci´on de potencia 15 La regi´on de rechazo se escribe ahora
R={Z ≥1}.
La funci´on de potencia del test es
β(p) =Pp(Z ≥1) = 1−Pp(Z = 0) = 1−(1−p)5. A la izquierda hemos dibujado esta funci´on de po- tencia. Comoβ(p) es una funci´on creciente, la sig- nificaci´on del test es supp≤5 %β(p) = β(5 %) = 22.62 %, un poco (bastante) alta.
Buscando un mejor nivel de significaci´on, redise˜namos el test y rechazamos la hip´otesis si encontramos en la muestra de cinco personas al menos dos infectadas.
La regi´on de rechazo ser´ıa ahoraR={Z ≥2}, y la funci´on de potencia del test ser´ıa β(p) =Pp(Z ≥2) = 1−Pp(Z = 0)−Pp(Z = 1) = 1−(1−p)5−5p(1−p)4, cuyo aspecto es similar a la de la gr´afica anterior, pero que nos dar´ıa un nivel de significaci´on de supp≤5 %β(p) =β(5 %) = 2.26 %, mucho menor que el anterior.
Obs´ervese que, para los dos tests, pero m´as pronunciadamente en el segundo, la probabilidad de error de tipo 2 puede llegar a ser muy grande. Por ejemplo, si p fuera del 6 %, la hip´otesis ser´ıa falsa, pero el test la aceptar´ıa con una (alt´ısima)
probabilidad del 1−β(6 %) = 96.81 %. ♣
Ejemplo 7.4.4. Tests para la uniforme.
Digamos queX ∼unif[0, a], dondeaes un par´ametro positivo. Tratamos primero la hip´otesis
H0:a≤A,
donde A es un cierto valor dado. Digamos que tenemos una muestra (x1, . . . , xn).
Obs´ervese que en cuanto haya alg´un valorxi mayor que A, la hip´otesis no puede ser cierta. Esto sugiere definir la siguiente region de rechazo:
R={m´ax(X1, . . . , Xn)> A}, que describimos usando el m´aximo de las Xi.
La funci´on de potencia asociada es
β(a) =Pa(m´ax(X1, . . . , Xn)> A) = 1−Pa(m´ax(X1, . . . , Xn)≤A) = 1−Pa(X≤A)n. Obs´ervese que Pa(X ≤ A) = 1 si a < A, y que Pa(X ≤A) = A/a si a≥A. Lo que nos da, finalmente, que
β(a) =
0, sia≤A, 1−(A/a)n, sia > A.
A la izquierda dibujamos la funci´on de potencia del test. El nivel de significaci´on es α = 0, pues β(a) = 0 sia≤A; es decir, no es posible cometer errores de tipo 1 con este test.
Planteamos ahora la hip´otesis
H0:a≥A.
Ahora no est´a tan claro c´omo definir una regi´on de rechazo. Planteamos dos posibles alternativas: una primera un tanto imaginativa, la segunda algo m´as organizada.
Veamos. La hip´otesis H0 sugiere que el par´ametroa es “grande”, mayor que A. As´ı que parece razonable rechazarla si en la muestra observ´aramos “muchos” valores relativamente “peque˜nos”. Cuantificamos ese “peque˜nos” con un nivel, digamosA/5, y los “muchos valores”, con, por ejemplo, m´as de la mitad de ellos. Definimos, pues, la siguiente regi´on de rechazo para una muestra (X1, . . . , Xn):
() R=
#{Xi≤A/5} ≥n/2 . La funci´on de potencia del test es
β(a) =Pa(R) =P(Z ≥n/2),
donde Z es una variable binomial con n repeticiones y probabilidad de ´exito dada porPa(X ≤A/5). Obs´ervese que
Pa(X ≤A/5) =
1 si a≤A/5, A/(5a) si a > A/5.
Esto nos da, finalmente, que β(a) =
1 sia < A/5,
P
bin(n,5aA
≥n/2) sia > A/5.
A la izquierda dibujamos el aspecto de esta fun- ci´on de potencia. En azul, la regi´on de par´ame- tros en la que la hip´otesis es cierta. El nivel de significaci´on del test es α = supa≥Aβ(a) = β(A) = P(bin(n,1/5) ≥ n/2). Por ejemplo, si n= 10 yA= 5, rechazamos la hip´otesis cuando al menos cinco muestras sean menores o iguales que 1.
7.4. Test generales, funci´on de potencia 17 El nivel de significaci´on es, en este caso,
α=P(bin(10,1/5)≥5) = 10 j=5
P(bin(10,1/5) =j)≈3.28 %,
que es razonable peque˜no. Si el corte en la regi´on de rechazo () se hubiera puesto en A/4, en lugar de en A/5 (manteniendo el n/2), entonces el nivel de significaci´on ser´ıa mayor, de 7.81 %
Como alternativa, podr´ıamos argumentar como sigue: si X sigue unaunif[0, a], esperamos que el m´aximo de una muestra (grande) de X est´e (muy) cerca del valor extremo a. As´ı que si la hip´otesis es cierta, es decir, si a ≥ A, el m´aximo de la muestra deber´ıa estar (quiz´as bastante) a la derecha de A.
Esto sugiere un test que rechace la hip´otesis si el m´aximo est´a un poco a la izquierda deA. Cuantificaremos esta idea en el ejemplo 7.5.4. ♣