ESTADISTICA
Describir y sintetizar
Analizar e inferir
Resumen estadístico
Tablas de frecuencias y Gráficos
Estimación puntual
Contrastes de hipótesis
Intervalos de confianza
¿Qué es una hipótesis?
• Una creencia sobre la población, principalmente sus parámetros:
– Media – Varianza – Proporción
• Si queremos contrastarla, debe establecerse antes del análisis.
• Dicha creencia puede ser o no ser verdadera
Creo que el porcentaje de enfermos será el
5%
Contrastando una hipótesis
¿Es el peso medio de 80 kg?
Son
demasiados...
kg
=65 x
¡Gran diferencia!
Rechazo la hipótesis Muestra
aleatoria
Contraste (Test) de Hipótesis
Conjunto de reglas que se usan para determinar si una afirmación acerca de una población puede rechazarse o no a partir de los resultados obtenidos en una muestra.
En todo contraste de hipótesis, hay 2 enunciados excluyentes:
Hipótesis nula o H0: Hipótesis que se somete a comprobación para ver si se rechaza o no.
Hipótesis alternativa o H1: Hipótesis que se acepta cuando se rechaza H0, es la negación de H0
Ambas hipótesis NO tienen igual fuerza, salvo que se demuestre lo contrario, hay que asumir que H0 es cierta.
Contraste de hipótesis: Filosofía
Un contraste de hipótesis tienen una presunción a favor de H0, de forma similar a como ocurre en los tribunales de justicia, donde hay una presunción de inocencia. Dado que uno es inocente hasta que se demuestre lo contrario, la evidencia aportada debe ser muy consistente para admitir la culpabilidad
Contraste de hipótesis
Hipótesis nula (H0) versus alternativa (H1)
Reglas de inferencia negativa
Se da por supuesto que la hipótesis nula es
verdadera
La decisión por H1, viene dada a partir del rechazo de H0
Razonamiento básico
=80 µ
=65 x
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
¿qué hace un científico cuando
su teoría no coincide con sus
predicciones?
Razonamiento básico
=80 µ
=65 x
Si supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió. Rechazo que H0
sea cierta.
Razonamiento básico
=80 µ
=77 x
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
•No se rechaza H0
•El experimento no es concluyente
•El contraste no es significativo
¿Si una teoría hace una predicción con
éxito, queda probado que es
cierta?
¡¡Siempre puede haber datos (no tomados), que contradigan H0!!
Elementos a establecer en Contraste Hipótesis
• Hipótesis nula Ho
– Afirmación en términos de igualdad – Hipótesis científicamente más simple – Los datos pueden refutarla
– No debería ser rechazada sin una buena razón.
• Hipótesis Alternativa H1 – Niega a H0
– Hipótesis que se quiere demostrar fuera de toda duda
– Si nos decantamos por ella se quiere estar prácticamente seguro de que es cierta
– Los datos pueden mostrar evidencia a favor
– No debería ser aceptada sin una gran evidencia a favor.
≥
≤
= , ,
>
<
≠ , ,
• Nivel de significación, α
– Probabilidad [Rechazar H0 / H0 es cierta] = α
– Es un valor tanto más pequeño cuántas más garantías se precisen de que una decisión a favor de H1 sea correcta.
Usualmente se toma α = 0.05
• Estadístico de Contraste
– Variable aleatoria que se usa para realizar el test
– Es una función de los valores de la muestra que resume la información relevante de ella.
– Si se cumple H0, su comportamiento es conocido
Elementos a establecer en Contraste Hipótesis
¿Quién es H
0?
• Ejemplo: «En la ejecución de una prueba diagnóstico del SIDA hay 2 posibilidades: que se obtenga resultado positivo, o que se obtenga resultado negativo. No obstante, la prueba no es 100%
exacta, ya que existen los falsos negativos y falsos positivos.
Determine quién sería H0»
• Hipótesis:
– El individuo está enfermo (el virus está en el individuo) – El individuo está sano (no existe el virus)
– Seleccionar la hipótesis nula, H0 : El individuo está sano
¿Quién es H
0?
• Ejemplo: «Se está estudiando un nuevo fármaco para poder utilizarlo contra el cáncer de piel. Se espera que sea eficaz en la mayoría de los pacientes sobre los que se aplica. La empresa que produce el fármaco desea alguna prueba estadística que apoye tal afirmación»
• Hipótesis:
– El nuevo fármaco es efectivo en la mayoría de pacientes
– El nuevo fármaco no es efectivo en la mayoría de los pacientes – Seleccionar la hipótesis nula, H0 : El nuevo fármaco no es efectivo
¿Quién es H
0?
• Ejemplo: «Se está estudiando un nuevo fármaco para poder utilizarlo contra el cáncer de piel. Se espera que sea eficaz en la mayoría de los pacientes sobre los que se aplica. La empresa que produce el fármaco desea alguna prueba estadística que apoye tal afirmación»
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
5 .
> 0 p
5 .
≤ 0 p
5 . 0
0
: p ≤
H
¿Quién es H
0?
• Problema: El porcentaje de personas atacadas por cierta epidemia en una gran ciudad, no supera el 10%.
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
1 .
≤ 0 p
1 .
> 0 p
1 . 0
0
: p ≤
H
¿Quién es H
0?
• Problema: ¿El peso medio de una población es 70kg?
• Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la hipótesis nula
= 70 µ
≠ 70
µ
70
0
: µ =
H
Región crítica y nivel de significación
Región crítica
• Valores ‘improbables’ si Ho cierta.
• Es conocida antes de realizar el experimento: son resultados experimentales que harían
rechazar H0
Nivel de significación: α
• Número pequeño: 1% , 5%
• Fijado de antemano por el investigador
• Es la probabilidad de rechazar H0 cuando es cierta
No rechazo H0
Reg. Crit.
Reg. Crit.
α = 0.05=5%
Η0: µ=40
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: µ<20 H1: µ>20
H1: µ≠20
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
• H0: Hipótesis nula
– Es inocente
• H1: Hipótesis alternativa
– Es culpable
Los datos pueden refutarla
La que se acepta si las pruebas no indican lo contrario
Rechazarla por error tiene graves consecuencias
Riesgos al tomar decisiones
No debería ser aceptada sin una gran evidencia a favor
Rechazarla por error tiene consecuencias menos graves
Tipos de error al tomar una decisión
Realidad
Inocente Culpable
Veredicto
InocenteOK Error
Menos grave
Culpable
Error
Muy grave
OK
Ejemplo 2: Se cree que un nueva dieta ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H
0: Hipótesis nula
– (Ej.1) Es inocente
– (Ej.2) La nueva dieta no tiene efecto
– (Ej.3) La incidencia es normal
• H
1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) La nueva dieta es útil
– (Ej. 3) La incidencia es anormal
Riesgos al contrastar hipótesis
Tipos de error al contrastar hipótesis
Realidad
Decisión H0 Cierta H0 Falsa
No Rechazo H0 (Retener H0)
Correcto
La dieta no tiene efecto y así se decide
Probabilidad 1 -
α
«Especificidad del test»
Error de tipo II
La dieta sí tiene efecto pero no se percibe.
Probabilidad β
«Falso negativo»
Rechazo H0
Acepto H1
Error de tipo I
La dieta no tiene efecto pero se decide que sí.
Probabilidad
α
«Falso positivo»
Correcto
La dieta tiene efecto y el experimento lo confirma.
Probabilidad 1- β
«Sensibilidad del test»
Toda decisión por H1 lleva implícita un posible error, llamado error α, o error Tipo I:
α = P [Rechazar H0 / H0 es cierta] ≡ Error Tipo I Toda decisión por H0 lleva implícita un posible error, llamado error β, o error Tipo II:
β = P [Retener H0 / H1 es cierta] ≡ Error Tipo II
Tipos de error al contrastar hipótesis
Consideraciones:
α está controlado. Por eso una decisión por H1 es siempre fiable (es posible que sea errónea, pero es muy improbable)
β no está controlado. Por eso una decisión por H0 NO es fiable (lo único que indica es que no se ha podido demostrar que H0 es falsa)
Procedimiento para un contraste de hipótesis
1. Fijar H
0y H
1de acuerdo al problema.
2. Seleccionar el estadístico de contraste (v.a.) que sea el adecuado para resolver el contraste, y que si H
0es cierta tendrá un comportamiento conocido.
3. Fijar el nivel de significación, α
4. Determinar la región crítica o de rechazo de H
05. Seleccionar una muestra de tamaño n, para la cual el estadístico de contraste tomará un valor numérico (se denomina valor experimental).
6. Adoptar una decisión sobre el rechazo o no de H
0: Se
rechaza H
0si el valor experimental del estadístico está
en la región de rechazo.
Contraste de Hipótesis sobre µ
• Caso 1: Cuando σ2 es conocida, el estadístico de contraste es:
) 1 , 0 ( N n
Z = σ x − µ →
• Caso 2: Cuando σ2 no es conocida, el estadístico de contraste es:
ˆ − →
−1= t
nn s
T x µ
Ejemplo 1
Se estima que el peso medio de una población de adultos es de al menos 76.7 Kg. Por una investigación anterior se conoce que la desviación típica poblacional es σ = 8.6 kg. Se seleccionan 45 individuos aleatoriamente obteniéndose un promedio de de 73.2 kg. Contraste la hipótesis de que el promedio ha disminuido para α = 0.01.
73 . 45 2
/ 6 . 8
7 . 76 2
.
0 73
exp = − = − = −
n z x
σ µ
zexp < zα/2 - 2.73 < - 2.326 Se rechaza Ho al nivel α=0.01
7 . 76
1
: µ <
H
7 . 76 : µ ≥
Ho α = 0 . 01
Z=-2.326
Ejemplo 2
En un preparado alimenticio infantil se especifica que el contenido medio de proteínas es del 42%. Se está comprobando la validez de esa especificación, y para ello se toman 10 preparados que son analizados para determinar su contenido en proteínas, obteniendo una media del 40% y una cuasidesv.
típica del 3.5% ¿Es correcta la especificación para α = 0.05?
42
1
: µ ≠ H
42 : µ =
Ho α = 0 . 05
807 .
10 1 /
5 . 3
42 40
ˆ
0
exp = − = − = −
n s
t x
µ
texp > - t n-1; α/2 -1.807 > - 2.262No se rechaza Ho al nivel α=0.05
t=-2.262 t=2.262
Contraste de Hipótesis sobre σ
2En este caso el estadístico de contraste es:
2 2 1
2
2
( 1 ) ˆ
→
−= n − s
nσ χ χ
• Se trata de efectuar un contraste de hipótesis acerca
de variabilidad en la población, para ello se trabaja
con la varianza poblacional σ
2Ejemplo 3
Para un tratamiento dietético se conoce que la reducción media de peso en mujeres adultas es µ = 9kg con una variabilidad
dada por una varianza σ2 = 2.5 kg2. Un dietista está intentando mejorar la dieta reduciendo la variabilidad. Para ello, en una experiencia piloto con una muestra de 15 mujeres, modifica la dieta obteniendo una cuasivarianza muestral de 2.1 kg2 . ¿Se puede admitir para nivel significación α = 0.05 que el dietista ha reducido la variabilidad?
Ejemplo 3
76 . 5 11
. 2
1 . 2 ˆ 14
) 1 (
2 0
2 2
exp
= − = ⋅ =
χ n σ s
5 . 2 :
21
σ <
H
5 . 2 : σ
2≥
Ho α = 0 . 05
5706 .
2
6
95 . 0
; 14 2
2 / 1 );
1
( − −
= χ =
χ
n αNo se rechaza Ho al nivel α=0.05
• Se trata de efectuar un contraste de hipótesis acerca de la proporción p de individuos que presentan una cierta característica o atributo en una población.
) 1 , 0 ) (
1 ( ˆ
0 0
0
N
n p
p
p
Z p →
−
= −
Contraste de Hipótesis sobre p
En este caso el estadístico de contraste es (n ≥ 30):
Ejemplo 4
Se realizó una encuesta con el fin de estudiar las prácticas sanitarias dentales, de cierta población urbana de adultos. De 300 adultos entrevistados, 123 dijeron que regularmente se sometían a una revisión dental dos veces al año. Contraste la hipótesis de que el 50 % de los adultos de dicha población se someten regularmente a una revisión dental dos veces al año.
5 . 0
1
: p ≠ H
5 . 0 : p =
Ho α = 0 . 05
Ejemplo 4
1176 .
300 3 /
) 5 . 0 5 . 0 (
5 . 0 41
. 0 )
1 ( ˆ
0 0
0
exp
= −
⋅
= −
−
= −
n p
p
p z p
41 . 300 0
ˆ = 123 = p
Se rechaza Ho a nivel de significación α=0.05
Z=-1.96 Z=1.96
Ejemplo 5
Se conoce que el porcentaje de complejos vitamínicos producidos cumple los requerimientos de calidad en al menos 90% de los casos. Para comprobar dicha afirmación, la inspección selecciona una muestra aleatoria de 625 complejos vitamínicos, encontrando que 550 son de calidad. Contraste la hipótesis de que el porcentaje de complejos que se producen con calidad es al menos el 90% para un nivel de significación α = 0.01.
9 . 0
1
: p <
H
9 . 0 : p ≥
Ho α = 0 . 01
Z=-2.326
88 . 625 0
ˆ = 550 = p
6666 .
625 1 /
) 1 . 0 9 . 0 (
9 . 0 88
. 0 )
1 ( ˆ
0 0
0
exp
= −
⋅
= −
−
= −
n p
p
p z p
Ejemplo 5
No se rechaza Ho a nivel de significación α=0.01