An´
alisis Inferencial
Maestr´ıa en Gerencia para el Desarrollo
John F. Moreno T.
Universidad Externado de Colombia
Prueba de hip´
otesis
Elementos de una prueba de hip´otesis:
I Hip´otesis nula (H0): es la hip´otesis que inicialmente se
asume como cierta.
I Hip´otesis alternativa (Ha): es la hip´otesis contraria a la
hip´otesis nula, en el contexto del problema en consideraci´on. Como ejemplo, si H0:p=0.1, entonces una posible forma de
la hip´otesis alternativa es Ha:p6=0.1.
Se rechazaH0 en favor deHa solo si la evidencia muestral hace
pensar queH0 es falsa, de forma que las conclusiones posibles de
un procedimiento de prueba de hip´otesis son: rechazarH0 o no
rechazarH0 en favor de Ha.
I Procedimiento de prueba: procedimiento mediante el cual se utilizan los datos muestrales para determinar si se rechaza o no H0. Para llevar a cabo este procedimiento se deben establecer:
I Estad´ıstico de prueba: es una funci´on que depende solamente de los valores observados en la muestra.
I Regi´on de rechazo: conjunto de valores del estad´ıstico de prueba para los cuales se rechazaH0.
Como parte del procedimiento de prueba se calcula el estad´ıstico en los valores observados de la muestra, yH0 es rechazada si el
Errores en la prueba de hip´
otesis
Los errores que se pueden cometer al realizar un procedimiento de prueba de hip´otesis son:
I Error tipo I:rechazarH0 cuando esta es verdadera. A la
probabilidad de cometer este error se le denota como α.
I Error tipo II:no rechazarH0 cuando esta es falsa. A la probabilidad de cometer este error se le denota como β.
Prueba de hip´
otesis sobre la media poblacional
Poblaci´on normal con σ conocida:
Consideramos una muestra aleatoria simpleX1,X2, ...,Xn de una
poblaci´on normal con media µ y desviaci´onσ conocida. Sabemos queX¯ ∼N(µ;σ/
√
n) y estandarizando se tiene que
Z=X¯−µ0
σ/
√
Si consideramos queH0:µ=µ0, entonces:
I SiHa=µ>µ0, un valor deX¯ mucho mayor queµ0 respalda la hip´otesis
alternativa, pero queX¯>µ0implica queZ>0, de forma que:
SiHa:µ>µ0entonces la regi´on de rechazo es de la formaZ≥c, lo que se
conoce comoprueba de cola derecha.
I SiHa=µ<µ0, un valor deX¯ mucho menor queµ0 respalda la hip´otesis
alternativa, pero queX¯<µ0implica queZ<0, de forma que:
SiHa:µ<µ0 entonces la regi´on de rechazo es de la formaZ≤ −c, lo que se
conoce comoprueba de cola izquierda.
I SiHa=µ6=µ0, un valor deX¯ muy diferente deµ0 respalda la hip´otesis
alternativa, pero queX¯6=µ0implica queZ<0oZ>0, de forma que:
SiHa:µ6=µ0entonces la regi´on de rechazo es de la formaZ≥c, o,Z≤ −c, lo
que se conoce comoprueba de dos colas.
De forma general se pueden considerar los siguientes pasos en todo procedimiento de prueba de hip´otesis.
1. Identifique el par´ametro de inter´es.
2. Determine el valor nulo y exprese la hip´otesis nula.
3. Exprese la hip´otesis alternativa apropiada.
4. Establezca la forma y distribuci´on del estad´ıstico de prueba.
5. Exprese la regi´on de rechazo de acuerdo con el nivel de significancia.
6. Calcule el estad´ıstico en la muestra.
Pruebas con muestras grandes
Si el tama˜no de muestra es grande (n>30), las pruebasz se modifican f´acilmente para este caso sin requerir que la poblaci´on sea normal o que el valor deσ sea conocido. Sin es grande, la desviaci´on est´andar muestralstiene un valor cercano a σ, y la variable estandarizada:
Z=X¯−µ
s/√n
tiene aproximadamente distribuci´on normal est´andar. De esta forma, el estad´ıstico de prueba es:
Z=X¯−µ0
s/√n
el cual sigue una distribuci´on normal est´andar cuandoH0 es
verdadera. As´ı, el procedimiento de prueba descrito para el caso de poblaciones normales se aplica en este caso de la misma manera.
Pruebas con distribuci´on poblacional normal
Se considera una muestraX1,X2, ..,Xn de una poblaci´on normal y la
variable aleatoria estandarizada:
T =X¯−µ
S/√n
Ejemplo
Se est´a estudiando el efecto de reducir la jornada laborar a 4 horas diarias sobre el desempe˜no en el trabajo (medida como n´umero de unidades creadas de un cierto producto). Para esto, se considera una muestra de 5 individuos a los cuales se les ha reducido la jornada laborar durante un mes, y se ha llevado un registro del
n´umero de unidades terminadas por cada uno. Los resultados son:
25,8; 36,6; 26,3; 21,8; 27,2.
Suponiendo que el n´umero promedio de unidades creadas durante
el mes sigue una distribuci´on normal ¿sugieren los datos que el
n´umero de unidades terminadas es mayor que 25, considerando un
nivel de significanciaα=0.05?
Ejemplo
Se tiene que:
1. µ=promedio poblacional de unidades terminadas.
2. H0:µ=25. 3. Ha:µ>25. 4. T=X¯−25
s/√n.
5. RechazarH0siT≥tα;n−1=t0,05 ; 4=2.132.
6. Se tiene queX¯=27.54ys=5.47, luego:
T=27.54−25
5.47/√5 =1.04
7. Como el valor deT calculado en la muestra no cae en la regi´on de rechazo
(1,04<2,132), entonces no se puede rechazarH0al nivel de significancia
Prueba de hip´
otesis sobre la proporci´
on poblacional
Sea p la proporci´on de individuos en una poblaci´on que poseen una caracter´ıstica espec´ıfica (lo que se tomar´a como ´exito), luego p es la proporci´on poblacional de ´exitos. Las pruebas sobre p est´an basadas en una muestra aleatoria de tama˜no nde esta poblaci´on y en la proporci´on muestral de ´exitos X. Sin es peque˜no respecto al tama˜no de la poblaci´onX tiene distribuci´on aproximadamente
binomial, y sines grande entonces tanto X como el estimador
ˆ
p=X/ntienen distribuci´on aproximadamente normal.
Pruebas con muestras grandes:
Dado que el estimador pˆ=X/n es insesgado, tiene distribuci´on
aproximadamente normal yσpˆ=
p
ˆ
p(1−pˆ))/n, entonces se define el estad´ıstico de prueba (para un valor cr´ıtico p0 asociado aH0)
como:
Z= p pˆ−p0
p0(1−p0)/n
Hip´otesis nula H0:p=p0.
Estad´ıstico de prueba: Z=√ pˆ−p0 p0(1−p0)/n
Hip´otesis alternativa Regi´on de rechazo
Ha:p>p0 Z≥Zα (extremo derecho)
Ha:p<p0 Z≥ −Zα (extremo izquierdo)
Ha:p6=p0 Z≥Zα/2 oZ≤ −Zα/2 (dos extremos)
Estos procedimientos son v´alidos si np0≥10 yn(1−p0)≥10.
Ejemplo
Se realiza un estudio acerca del abuso en el consumo de alcohol por parte de j´ovenes entre los 15 y 18 a˜nos. De acuerdo con resultados presentados por el gobierno nacional, se afirma que m´aximo el 44% de los j´ovenes de una ciudad consumen alcohol 4 veces o m´as por semana.
En un estudio independiente sobre el mismo tema se considera una muestra de 2500 jovenes de los cuales 1200 reportaron consumir alcohol 4 o m´as veces por semana.
Ejemplo
Se tiene que:
1. H0:p≤0.44
2. Ha:p>0.44
3. Estad´ıstico: Z= pˆ−σp0 ˆ
p , y como:
ˆ
p=1200
2500=0,48 σpˆ=
r
(0,48)(0,52)
2500 =0,009992
entonces Z=00,48−0,009992,44 =4
4. Regi´on de rechazo: para α=0,05 se rechaza H0 si Z>1.645.
5. Como Z=4>1.645se rechaza H0.
Valor p
Ejemplo
Suponga que como parte de un procedimiento de hip´otesis se desea probar
H0:µ=1,5contraHa:µ>1,5. En este caso, la regi´on de rechazo es de extremo derecho, es decir, se rechazaH0 siZ≥Zα. Sup´ongase queZ=2,10. La siguiente tabla
muestra la regi´on de rechazo para diferentes valores deαy la conclusi´on posible.
Nivel de significanciaα Regi´on de rechazo Conclusi´on 0,05 Z≥1,645 RechazarH0
0,025 Z≥1,96 RechazarH0
0,01 Z≥2,33 No rechazarH0
0,005 Z≥2,58 No rechazarH0
Se puede ver entonces que un valor deαrelativamente grande hace que se rechace la hip´otesis nula mientras que un valor relativamente peque˜no hace que esta no se rechace.
Ejemplo
De la tabla de la distribuci´on normal se puede observar que el ´area bajo la curva y a la derecha, de valor 2,10, es 0,0179, lo que
implica que utilizar un valor deα mayor a 0,0179 corresponde a
Zα<2,10 (por ejemplo si α=0,025se tiene que Zα=1,96),
mientras que unα menor a 0,0179 requiere usar un valor
Zα>2,10. Se puede ver entonces que0,0179 es el menor nivel de
Elvalor p(nivel de significancia observado) es el nivel de significancia m´as peque˜no al cual se rechaza la hip´otesis nula cuando se emplea un procedimiento de prueba espec´ıfico para la serie de datos.
Una vez determinado el valor p, la conclusi´on a alg´un nivel α resulta de comparar estos dos valores:
I Si valor p ≤α, entonces se rechazaH0 al nivel α.
I Si valor p >α, entonces no se rechazaH0 al nivel α.
Ejemplo
Se tiene una prueba de hip´otesis en la cual H0:µ=10, contra
Ha:µ<10con α=0,05, considerando que la distribuci´on del
estad´ısticoZ es normal cuando H0 es verdadera, se calcula un valor
p de 0,0384. Comoα> valor p se rechaza H0 a nivel 0,05.
Nota
Como el valor p es la probabilidad calculada, suponiendo queH0 es
cierta, de obtener un valor del estad´ıstico de prueba por lo menos tan contradictorio paraH0 como el valor que result´o, se tiene que,
Valores p para pruebas Z
Valor p=
1−Φ(z) Extremo superior
Φ(z) Extremo inferior
2[1−Φ(|z|)] Dos extremos
Ejemplo
Consideremos una prueba de hip´otesis sobre un par´ametro µ de forma que: H0:µ=245,Ha:µ 6=245, el estad´ıstico esZ=
¯ X−245
s/√n .
Se considera una muestra de tama˜non=50 en la cuals=3.6 y
¯
X=246,18.
De acuerdo con lo anterior se tiene quez=246,18−245
3,6/√50 =2,32, y el
valor p de dos colas es:
p=2[1−Φ(2,32)] =0,0204
Si se considera un nivel de significanciaα =0,01, entoncesH0 no