1
"Es una verdad muy cierta que, cuando no esté a
nuestro alcance determinar lo que es verdad,
deberemos seguir lo que es más probable".
Descartes, en su
Discurso del Método
2
Contraste de hipótesis:
¿Qué es una hipótesis estadística?
• Es una conjetura o creencia acerca de una o
varias poblaciones. Normalmente en referencia
a sus parámetros: la media, la varianza o una
proporción, por ejemplo.
• Si queremos contrastarla, debe establecerse
antes del análisis. Después se utilizan los
datos de las muestras para obtener evidencias
que confirmen o no la hipótesis propuesta.
3
Hipótesis científica: Escuchar la música de Mozart tiene
un efecto sobre el CI diferente al de la música de El Fari.
Experimento: De la población española seleccionamos
20 niños al azar en dos grupos de 10. Un grupo
escuchará Mozart antes de hacer el test de CI. El otro escuchará a El Fari. Después de realizar los test, se
calculan las medias y cuasivarianzas en cada uno de los dos grupos.
Veamos un ejemplo:
El efecto "Mozart vs. El Fari":
Se sospecha que los individuos rinden más en un test de
inteligencia tras escuchar música de Mozart que cuando han
4
Supongamos que la media del CI del grupo de
Mozart fue 110 con cuasivarianza = 100, mientras
que la media del grupo de El Fari fue de 102
y cuasivarianza = 64.
Entonces: ¿Podemos decir que hay diferencias
a nivel poblacional entre ambos grupos?
Para tomar tal decisión necesitaremos plantear
DOS hipótesis estadísticas:
5
Hipótesis estadísticas:
-Hipótesis nula. Es la que proporciona la solución "más
sencilla". En nuestro ejemplo sería que la media
poblacional de ambos grupos es la misma. Es decir, que no hay un efecto de la música sobre el CI.
H
0:
µ
1=
µ
2-Hipótesis alternativa. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media poblacional de ambos grupos es diferente. Es decir, que hay un efecto de la música sobre el CI.
H
1:
µ
1≠ µ
2¿Cómo decidimos
entre ambas hipótesis?
Veamos otros ejemplos.
6
Otro ejemplo:
Sometamos a la reina de
Inglaterra al siguiente
experimento:
Se le presentan 8 tazas de té
con leche, idénticas en su
aspecto. En 4 de ellas la
leche se añadió a la taza
con anterioridad al té. Y en
las 4 restantes, se añadió la
leche después.
La reina las prueba y
dictamina, acertadamente, las tazas en las que se
sirvió primero la leche.
¿Chiripa?
7
¿Cuántas posibilidades había?
La reina debía escoger 4 tazas de las 8. Sin tener
en cuenta el orden tenía 70 posibilidades distintas
(Combinaciones de 8 elementos tomados de 4 en 4).
Si supusiéramos que respondió al azar, su probabilidad
de acertar hubiera sido de 1/70.
¿Cuáles son aquí las hipótesis estadísticas? -Hipótesis nula: La reina acertó por chiripa.
H
0: p
= 1/70
-Hipótesis alternativa: La reina tiene un paladar sobrenatural.
8
Parece razonable en este caso rechazar la
hipótesis nula.
¿Por qué nos parece razonable rechazarla?
Hemos supuesto que la reina juzgaba al azar
(hipótesis nula). Por tanto hemos supuesto una
distribución de probabilidad : cualquier
combinación de las cuatro tazas tenía la misma
probabilidad de ser elegida: p = 1/70
(una distribución uniforme).
Con esa distribución la reina tenía 69/70 de
probabilidad de no acertar. Y sin embargo la reina
acertó…
“The title comes from the "lady tasting tea", an example from the famous book, The Design of Experiments, by Ronald A. Fisher”.
10
Otro ejemplo más (lo tenéis en detalle en el libro
de Marta y Jose):
Pasados 2 años cierta vacuna solo es eficaz en un
25% de los casos.
Se experimenta con una nueva vacuna que tal vez
prolongue la eficacia.
Se inyecta a 20 sujetos experimentales.
Si más de 8 sujetos superan el periodo de dos años
sin contraer el virus, la nueva vacuna se considera
mejor que la anterior.
El número 8 es un tanto arbitrario, pero parece
razonable teniendo en cuenta que esperaríamos
5 casos para la vacuna anterior.
11
¿Quién es H
0?
• Hipótesis nula H
0: ambas vacunas son iguales.
• Hipótesis alternativa H
1: la nueva vacuna es mejor.
Con la vacuna antigua cada paciente tiene una
probabilidad p = 1/4 de no contraer la enfermedad
pasados 2 años.
H
0
: p = 1/4 y H
1: p > 1/4
¿Podemos rechazar la hipótesis nula, que las dos
vacunas son igualmente eficaces?
El estadístico de prueba es
X = número de individuos
de la prueba que reciben protección contra el
virus más allá de dos años
. Y se distribuye como
12
Dividiremos los posibles valores de
X
(de 0 a 20) en
dos grupos:
(1) Menores o iguales a 8 (Región de aceptación).
(2) Mayores a 8 (Región crítica o de rechazo).
8 es el valor crítico en este caso.
Si x es el número de pacientes experimentales que
no se han infectado después de 2 años, entonces:
Si x > 8 rechazamos H
0a favor de la hipótesis
13
El procedimiento descrito nos puede conducir
a las siguientes conclusiones erróneas:
(1) La nueva vacuna realmente no es mejor
que la antigua (hemos rechazado la hipótesis
nula y cometido
un error de tipo I
).
(2) Concluimos que la nueva vacuna no es mejor
que la anterior, cuando realmente sí lo es (hemos
aceptado la hipótesis nula y cometido
un error
14
La probabilidad de cometer un error de tipo I
se llama nivel de significación o tamaño de la
región crítica y se representa por α.
En nuestro ejemplo:
Se dice que la hipótesis nula, p = 1/4, se está
probando con un nivel de significación de
α = 0.0409. Nivel de significación bastante
pequeño, por tanto poco probable que hayamos
cometido un error de tipo I.
∑
= −=
=
=
>
=
=
=
20 9 20 0 00409
.
0
4
3
4
1
20
)
4
/
1
|
8
(
)
cierta
es
H
|
H
Rechazar
(
)
I
tipo
de
error
(
x x xx
p
X
P
P
P
α
15
La probabilidad de cometer un error de tipo II
se representa por β. Sólo podemos calcularla
si tenemos una hipótesis alternativa “concreta”.
Por ejemplo en nuestro caso podíamos haber
tomado como hipótesis alternativa: p = 0.5.
En nuestro ejemplo:
2517
.
0
2
1
2
1
20
)
2
/
1
|
8
(
)
falsa
es
H
|
H
Aceptar
(
)
II
tipo
de
error
(
8 0 20 0 0∑
= −=
=
=
≤
=
=
=
x x xx
p
X
P
P
P
β
18
Contraste de hipótesis:
Los tres pasos básicos para contrastar una
hipótesis serán:
1- Formular dos hipótesis H
0y H
1.
2- Derivar un estadístico de contraste a partir
de la muestra de observaciones e identificar su
distribución muestral bajo la hipótesis nula.
3- Derivar una regla de decisión y elegir una de
las dos hipótesis en base a la evidencia de una
muestra. Una regla de decisión que selecciona
una de las dos sentencias siguientes:
19
Contrastes para la media de una población
Población normal (o n > 30) y
σ
conocida. Hipótesis bilateral Ho: µ = µ0 H1: µ ≠ µ0 Estadístico:n
x
z
σ
µ
−
=
-z
α/2 +z
α/2 1 -α
α
σ
µ
α α
=
−
−
<
−
<
1
/
/2 0 2 /z
n
x
z
P
Si la media muestral está fuera de este intervalo
rechazamos H0. No rechazamos H0 en caso contrario.
−
+
2 / 0 2 / 0 α,
ασ
µ
σ
µ
z
n
z
n
Región de aceptación. Región de aceptación20
• Hipótesis:
• Estadístico y distribución:
0
3
μ
:
H
y
30
μ
:
H
o=
1≠
Ejemplo: Sea una población normal con
σ
2= 20
µ
0= 30, n = 10 , y α = 0.05.
)
1
,
0
(
N
n
x
z
=
−
≡
σ
µ
27
=
x
95 . 0 / /2 2 / = − < − < α α σ µ z n x z P -z
α/2 +z
α/2 1 -α
= 0.95 α/2 = 0.025 α/2 = 0.02595
.
0
2 / 2 /
=
−
<
<
+
α ασ
µ
σ
z
n
x
z
n
x
P
Para calcular intervalo de confianza:
Conociendo el tamaño de la muestra, la desviación poblacional y la media muestral, podemos determinar un intervalo de confianza al 95%.
21
Valor crítico del estadístico de prueba: Se
busca en la tabla z, y nos preguntamos qué
valor de z tiene una probabilidad igual a α/2 =
0.025 y resulta ser z = -1.96.
- 1.96 + 1.96
1 -
α
= 0.95 α/2 = 0.02522
Pero ahora estamos haciendo una hipótesis: que la media poblacional es µ0 = 30, e intentando
contrastarla a partir de la media muestral que es 27. 12 . 2 4142 . 1 3 10 / 20 30 27 − = − = − = z - 2.12 - 1.96 + 1.96 1 -
α
= 0.95 Región de aceptación Regla de decisión: Ho se rechaza si z cae en la zona de rechazo (fuera de la zona de aceptación), utilizando α = 0.05 (error de tipo I) que está dividida en dos partes iguales (α/2 = 0.025).Decisión estadística: Se puede rechazar Ho porque -2.12 está en la región de rechazo con un nivel de significación de α = 0.05.
HIPOTESIS A CONTRASTAR
datos de la muestra
Se definen:
medida de discrepancia con una distribución de probabilidad conocida
Regla de decisión(nivel de significación α)
Valor crítico o tabulado
Se calcula una medida de discrepancia Valor calculado
Se comparan los valores calculado con tabulado
¿se rechaza Ho? NO SI H1 Se extraen conclusiones
24
Contrastes para la media de una población
Población normal (o n > 30) y
σ
conocida. Hipótesis unilateral por la izquierda. Ho: µ = µ0 H1: µ < µ0 Estadísticon
x
z
cσ
µ
−
=
α
σ
µ
α
=
−
−
>
−
1
/
0z
n
x
P
Si la media muestral está fuera de este intervalo, rechazamos H0.
Aceptamos H0 en caso contrario.
−
+
∞
,
0 ασ
µ
z
n
Región de aceptación: -z
α 1 -α
25
• Los datos y suposiciones se mantienen. • Hipótesis:
(hipótesis nula e hipótesis alternativa)
• Cálculo del estadístico de prueba:
• Regla de decisión: Si el zcalc cae en la zona de rechazo se rechaza Ho. Como es una prueba de una cola o unilateral, se busca en la tabla qué valor de z tiene una probabilidad de 0.05 y es igual a -1.645.
• Decisión estadística y conclusión: Como -2.12 es menor que -1.645 se rechaza Ho y se concluye que la media de la población es menor de 30.
0
3
μ
:
H
y
30
μ
:
H
o≥
a<
12
.
2
10
/
20
30
27
/
0=
−
=
−
−
=
n
x
z
σ
µ
26
Región crítica y nivel de significación
Región crítica
• Valores ‘improbables’ si...
• Es conocida antes de realizar el experimento: resultados
experimentales que refutarían H0
Nivel de significación: α
• Número pequeño: 1% , 5%, ... • Fijado de antemano por el
investigador • Es la probabilidad de rechazar H0 cuando es cierta No rechazo H0 Reg. Crit. Reg. Crit. α=5% Η0: µ = 40
27
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: µ < 40 H1: µ > 40
La variable aleatoria poblacional X de nuestro interés es la duración de un componente. Esta variable se distribuye en la población como una exponencial: X = Exp(λ).
(a) Nos piden como contraste de hipótesis:
H0: µ=300 H1: µ<300
Disponemos de una muestra de n = 100 elementos. Para cada componente se ha medido su duración: {x1, x2, ... , x100}. Y sabemos que la media
muestral, que la vida media de los 100 componentes es:
∑
= = = 100 1 260 100 1 i i x x29
Usaremos como estimador a la media muestral:
∑
= = n i i x n x 1 1
Recuerda que es una variable aleatoria, de la que nosotros disponemos de un valor particular: el que nos da nuestra muestra.
¿Qué distribución tiene nuestro estimador?
El de la suma de 100 variables aleatorias distribuidas exponencialmente. En principio sería una Erlang, pero puesto que el número de variables es mayor que 30, podemos utilizar una aproximación normal:
(
n
)
N
x
≡
µ
,
σ
/
Observa que para el caso particular de la exponencial, la media coincide con la desviación típica y podemos escribir:
(
n
)
N
x
≡
µ
,
µ
/
Tipifiquemos el estimador para que se distribuya como una N(0,1):
)
1
,
0
(
N
n
x
z
=
−
≡
µ
µ
30 a = 250.65 1 -
α
) 1 , 0 ( N n x z = − ≡µ
µ
Región de aceptación Región críticaα
05
.
0
100
/
300
300
)
300
|
(
cierta)
H
|
H
Rechazar
(
05
.
0
0 0=
≤
−
=
=
≤
=
=
=
=
a
z
P
a
x
P
P
µ
α
65
.
250
645
.
1
100
/
300
300
=
−
⇒
=
−
=
a
a
z
crit 0H
rechazamos
No
aceptación
de
Región
65
.
250
260
⇒
∈
⇒
>
=
x
x
31
Si en realidad µ = 250 y la hipótesis nula es que µ = 300, "detectarlo" supondría rechazar la hipótesis:
(
0
.
03
)
0
.
512
100
/
250
250
65
.
250
)
250
|
(
)
250
|
H
Rechazar
(
0=
≤
=
−
≤
=
=
=
≤
=
=
z
P
z
P
a
x
P
P
µ
µ
Si queremos elevar esta última probabilidad hasta el 70%:
− ≤ = = ≤ = = = − ≤ = = ≤ = = = n b z P b x P P n b z P b x P P / 300 300 ) 300 | ( ) 300 | H Rechazar ( 05 . 0 / 250 250 ) 250 | ( ) 250 | H Rechazar ( 70 . 0 0 0 µ µ µ µ 157 125 . 156 645 . 1 / 300 300 525 . 0 / 250 250 ≈ = ⇒ − = − = − n n b n b
32
La variable aleatoria poblacional X de nuestro interés es el número de accidentes de tráfico en una semana. Esta variable se distribuye en la población como una poisson: X = P(λ=2.5).
(a) Nos piden como contraste de hipótesis:
H0: λ=10 (reducir el límite de velocidad no influye)
H1: λ<10 (reducir el límite de velocidad disminuye el número de accidentes) Pero observa que contrastaremos las hipótesis con la variable aleatoria
33
∑
= = − = = ≤ = = ≥ a x x I tipo Error x e a Y P P 0 10 0 0 ! ) 10 | ( ) cierta H | H Rechazar ( 1 . 0 λ λ λ λ Mirando en las tablas encontramos que a = 5. Si el número de accidentes observado en las cuatro semanas es menor o igual que 5, entonces
rechazamos H0.
∑
= = − = − = − = = = ≤ − = = > = = = 5 0 8 1 81 . 0 19 . 0 1 ! 1 ) 8 | 5 ( 1 ) 8 | 5 ( ) 8 | H Rechazar ( x x II tipo Error x e Y P Y P P λ λλ
λ
λ
λ
Si el número de accidentes disminuyó a 2 por semana, entonces disminuyó a 8 accidentes por cada cuatro semanas
Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. Esta rapidez es una variable aleatoria con alguna distribución de probabilidad. Especialmente interesa decidir si la rapidez de
combustión promedio, que es un parámetro µ de dicha distribución es o no 50 cm/seg.
Hipótesis Nula: H
0: µ = 50 cm/seg
Hipótesis Alternativa: H
1: µ ≠ 50 cm/seg
48.5 50 51.5
Región Crítica Región de aceptación Región Crítica Se acepta H1 Se acepta H0 Se acepta H1
µ ≠ 50 µ = 50 µ ≠ 50
Condición real
Decisión H0 verdadera H0 falsa
Rechazar H0 Error Tipo I ok
Aceptar H0 ok Error Tipo II
α = P(error Tipo I)= P(rechazar H
0| H
0es verdadera)
Si calculamos α para el ejemplo de la rapidez de combustión para una muestra de n = 10 datos, suponiendo que σ = 2.5 cm/seg, obtenemos:α = P( x caiga en la región crítica | µ = 50 )=
= P( x < 48.5) + P( x > 51.5) = 0,0576
Esto significa que el 5,76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: µ = 50 cm/seg, cuando ésta es verdadera.
β = P(error Tipo II) = P(aceptar H0 | H0 es falsa)
Recordemos que no es posible calcular β si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores.
Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de
combustión µ es mayor que 52 cm/seg o
menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: µ = 50 cuando el valor verdadero es µ = 52.
45 46 47 48 49 50 51 52 53 54 55 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: µ = 50 H152 : µ = De acuerdo a la figura: β = P(48.5 ≤ x ≤ 51.5 | µ = 52) = 0.2643 La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero µ tiende al valor Hipotético. Por ejemplo, si suponemos que µ=50.5, y recalculamos β,
obtenemos 0,8923.
β también depende del tamaño de la muestra, por ejemplo, si n = 16
obtenemos, cuando µ = 52:
σ = 0.625, por lo tanto β = 0,2119. Es decir, β disminuye cuando n aumenta, excepto si el valor real de µ está muy cerca del hipotético.
Es por eso que el rechazo de H0 siempre se considera como una
Conclusión Fuerte (los datos aportan fuerte evidencia de que H0
es falsa).
Como uno puede elegir los valores críticos del intervalo de aceptación, controlamos el valor de α, controlamos la
probabilidad de rechazar de manera errónea H0.
La decisión de aceptar H0 se considera una Conclusión Débil, a
menos que se sepa que β es considerablemente pequeño.
Por esto en lugar de decir: “se acepta H0”, se prefiere decir “no rechazamos H0”, es decir, no se ha encontrado evidencia
suficiente para rechazar H0.
No quiere decir que exista gran evidencia de que H0 sea cierta, sino que no hay gran evidencia de que sea falsa.
Hipótesis Unilaterales
H
0: µ = 50 cm/seg
H
1: µ < 50 cm/seg
En el ejemplo, supongamos que si la rapidez media de
combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿Cómo deben plantearse las
hipótesis?
Nótese que, aunque H0 está planteada como una igualdad, se
sobrentiende que incluye cualquier valor de µ no especificado por H1. Es decir, la incapacidad de rechazar H0, no significa que µ = 50, sino que no se tiene evidencia fuerte que apoye a H1. Es decir,
Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:
H
0: µ = 200 psi H
0: µ = 200 psi
H
(1)
1
: µ > 200 psi H
(2)
1: µ < 200 psi
Con el planteamiento (1) Como el rechazo de H0 es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psi. Con el
planteamiento (2) si se rechaza H0 se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son
satisfactorias a menos que haya evidencia fuerte en sentido contrario. ¿Cuál planteamiento es el correcto?
En la Hipótesis alternativa se debe poner la proposición sobre la cuál es importante llegar a una conclusión fuerte.
Conclusiones Fuerte y Débil
Es por eso que el rechazo de H0 siempre se considera como una
Conclusión Fuerte: los datos aportan fuerte evidencia de que H0
es falsa.
Como uno puede elegir los valores críticos del intervalo de
aceptación, i.e. controlamos el valor de α. Uno puede entonces controlar la probabilidad de rechazar de manera errónea H0.
La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño.
Por esto en lugar de decir “se acepta H0” se prefiere decir
“incapaz de rechazar H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. O sea, no quiere decir que exista
gran evidencia de que H0 sea cierta sino que no hay gran evidencia de que sea falsa.
41
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
• H0: Hipótesis nula
– Es inocente
• H1: Hipótesis alternativa
– Es culpable
Los datos pueden refutarla. La que se acepta si las
pruebas no indican lo contrario.
Rechazarla por error tiene graves consecuencias.
Riesgos al tomar decisiones
No debería ser aceptada sin una gran evidencia a favor.
Rechazarla por error tiene consecuencias consideradas menos graves que la anterior.
42
Tipos de error al tomar una decisión
(Ejemplo 1) Realidad Inocente Culpable
Veredicto
InocenteOK
Error
Menos grave CulpableError
Muy graveOK
43
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H0: Hipótesis nula
– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar
• H1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal
Riesgos al contrastar hipótesis
No especulativa
44
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 falsa
No rechazo H0
Correcto
El tratamiento no tiene efecto y así se determina.
Error de tipo II
El tratamiento sí tiene efecto pero no lo percibimos. Probabilidad
β
Rechazo H0 Acepto H1 Error de tipo I El tratamiento no tiene efecto pero se decide que sí.Probabilidad α
Correcto
El tratamiento tiene efecto y el experimento lo confirma.
45
Para cualquier tipo de test de contraste hay 3
resultados posibles:
(1) - Se toma una decisión correcta.
Es decir se rechaza una hipótesis falsa o no se rechaza una
hipótesis verdadera.
(2) - Se rechaza una hipótesis verdadera.
El error de rechazar H0 cuando es verdadera se
denomina ERROR DE TIPO I (con probabilidad α).
(3) - No se rechaza una hipótesis falsa.
El error de no rechazar H0 cuando es falsa se denomina
Contrastes para la media de una población
Población normal y
σ
desconocida. Hipótesis bilateral Ho: µ = µ0 H1: µ ≠ µ0 Estadístico 1 −≡
−
=
n ct
n
s
x
t
µ
α
µ
α α
=
−
−
<
<
−
1
/
/2 0 2 /t
n
s
x
t
P
Si la media muestral está fuera de este intervalo rechazamos H0.
Aceptamos en caso contrario.
− > = − − n s x t P n 1 0 p Valor
µ
−
+
2 / 0 2 / 0 α,
µ
αµ
z
n
s
z
n
s
Región de aceptación.50
• Hipótesis:
• Estadístico de prueba: dado que se desconoce la varianza de la población, utilizaremos s2.
• Distribución del estadístico de prueba es una t de Student con n-1 grados de libertad.
• Regla de decisión: A un nivel de significancia de α = 0.05, si el valor de tcalc es mayor que tcrítico (2.1604) entonces se rechaza H0.
• Cálculo del estadístico de prueba:
• Decisión estadística: -1.58 cae en la zona de no rechazo, por lo tanto no se rechaza H0.
35
μ
:
H
y
35
μ
:
H
o=
a≠
58 . 1 14 / 64 . 10 35 5 . 30 − = − = tEjemplo para contraste en poblaciones
normales y de varianza conocida
Se quiere saber si hay diferencias en la concentración de ácido úrico en sujetos normales y con síndrome de Down. Se realizó la medición en 12 pacientes con Down y su media fue de 4.5 mg/ml y en 15 individuos sanos cuya media fue de 3.4 mg/ml.
• Datos:
•Supuestos: los datos provienen de poblaciones con distribuciones normales y se conocen sus varianzas.
• Hipótesis:
15
n
y
12
n
1.5;
,
4
.
3
;
1
,
5
.
4
12 2 22 1 2 1=
σ
=
x
=
σ
=
=
=
x
0
:
H
y
0
:
1 2 A 1 2 0µ
−
µ
=
µ
−
µ
≠
H
• Estadístico de prueba:
• Distribución del estadístico: normal estándar.
• Regla de decisión: H0 se rechaza a menos que el valor de zcalc entre los valores críticos, si zcrítico está entre ±1.96, es decir, que -1,96 < zcalc< 1,96.
• Decisión estadística: Se rechaza H0 porque 2,57 > 1,96.
• Conclusión: Con los datos disponibles es posible detectar diferencias estadísticamente significativas entre las dos concentraciones de ácido úrico de ambas poblaciones (Down y normal). 57 . 2 15 5 . 1 12 1 0 ) 4 . 3 5 . 4 ( ) ( ) ( 2 2 2 1 2 1 0 2 1 2 1 = + − − = + − − − = n n x x z σ σ µ µ
Ejemplo con poblaciones normales y
varianzas desconocida.
Se quiere saber si los fumadores sufren mas daños pulmonares que los no fumadores.
• Datos:
•Supuestos : la destrucción pulmonar sigue una distribución normal y no se conocen las varianzas poblacionales, pero se suponen que son iguales.
16
,
8492
.
4
,
4
.
12
;
9
,
4711
.
4
,
5
.
17
=
=
=
=
=
=
nf nf nf f f fn
s
x
n
s
x
• Hipótesis:
• Estadística de prueba:
Y la varianza combinada se calcula como.
nf f nf f
H
0:
µ
≤
µ
,
H
A:
µ
>
µ
6573
.
2
9
2165
.
21
16
2165
.
21
0
)
4
.
12
5
.
17
(
)
(
)
(
2 2 1 2 0 2 1 2 1=
+
−
−
=
+
−
−
−
=
n
s
n
s
x
x
t
p pµ
µ
2
)
1
(
)
1
(
2 1 2 2 2 2 1 1 2−
+
−
+
−
=
n
n
s
n
s
n
s
p• Distribución de la estadística de prueba: Sigue una distribución t de Student con n1+ n2 - 2 grados de libertad. • Regla de decisión: Se rechaza H0 a menos que el tcalc
esté entre los valores críticos. En este caso, si tcrítico es ±1.7139, luego -1.7139 < tcalc< 1.7139.
• Decisión estadística: Se rechaza H0 porque 2.6573 > 1.7139 y cae en la zona de rechazo.
• Conclusión: Con los datos experimentales se puede concluir que sí hay más daño pulmonar en los fumadores que en los no fumadores.
74
75
Valor-p de un contraste
Observa que el resultado de un test depende fuertemente de α... El valor-p es la probabilidad de
obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa.
Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis.
Si p es menor al nivel de significación
predefinido se debe rechazar H0
Dos posibles valores de un
estadístico (puntos en la gráfica) que conducen a rechazar la
hipótesis nula, aunque la evidencia del rechazo es muy distinta según el caso.
En una prueba bilateral se determina el valor-p duplicando el área en la cola, para poder comparar el valor de p directamente con α y mantener así la misma regla de rechazo.
Significación: p
H0: µ=40
Significación: p
43 = X No se rechaza H0: µ = 40 H0: µ = 40α
Significación: p
43 = X No se rechaza H0: µ=40Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α
P
P
α
Significación : p
α
50 = X Se rechaza H0: µ = 40 Se acepta H1: µ > 40Significación : p
Pα
50 = X Se rechaza H0: µ=40 Se acepta H1: µ>40El contraste es estadísticamente significativo cuando p <
α.
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
Resumen: α, p y criterio de rechazo
• Sobre α
– Es número pequeño, preelegido al diseñar el experimento.
– Conocido α sabemos todo sobre la región crítica.
• Sobre p
– Es conocido tras realizar el experimento.
– Conocido p sabemos todo sobre el resultado del
experimento.