ESTADÍSTICA APLICADA
Julián Andrés Tamayo Cardona
Estadístico
Quinta Parte:
Pruebas de Hipótesis
Julián Tamayo
Page 3
Contenido
Fiabilidad y Validez
Hipótesis Estadística
Prueba de Hipótesis
Región Crítica y Nivel de Significación
Significación: p-valor
Julián Tamayo Page 4
Fiabilidad y Validez
Julián Tamayo Si medimos el mismo objeto en varias ocasiones…
Se esperaría que dichas mediciones sean parecidas
Que los datos de las mediciones tengan como centro la medida real
Baja Variabilidad
No haya sesgo
Fiabilidad y Validez
La Fiabilidad esta relacionada con la variabilidad
La Validez esta relacionada con el sesgo
Fiabilidad y Validez
Page 7
Fiabilidad y Validez
Julián Tamayo Válido pero no Fiable
Page 8
Fiabilidad y Validez
Julián Tamayo No Válido y no Fiable
Page 9
Fiabilidad y Validez
Julián Tamayo Válido y Fiable
Page 10
Fiabilidad y Validez
Julián Tamayo ¿Una medición inválida?
Se propone como índice de “Salud”, el número de veces al año que una persona consulta al médico.
Es decir, una persona es más sana entre menos visita al médico.
¿Usted que opina?
Hipótesis Estadística
Nos referimos a hipótesis estadística a aquellas afirmaciones que se realizan sobre el valor de un parámetro de una población estadística.
¿El número promedio de accidentes por año en una empresa es de 9,3?
Hipótesis Estadística
Creo que el porcentaje de trabajadores con problemas
Page 13
Hipótesis Estadística
Julián Tamayo Clasificación
Hipótesis de investigación:Se refiere a lo que el investigador espera encontrar como resultado de su investigación o estudio.
Hipótesis nula (H0): Sirven para refutar o negar lo que afirma la hipótesis de investigación. Se formula con el propósito de rechazarla o invalidarla, de la no diferencia, del no cambio, de que no es bueno, de la no asociación, etc.
Hipótesis alterna (H1):Es la hipótesis que difiere de la hipótesis nula.
Page 14
Hipótesis Estadística
Julián Tamayo Identificación de Hipótesis
Hipótesis nula (H0)
•La que contrastamos •Los datos pueden refutarla •No debería ser rechazada sin una buena razón
Hipótesis alterna (H1)
•Niega a H0
•Los datos pueden mostrar evidencia a favor
•Debería ser rechazada con una gran evidencia a favor
Page 15
Hipótesis Estadística
Julián Tamayo Identificación de Hipótesis
Problema: ¿El 20% de los trabajadores han sufrido lesiones musculares durante el año 2010?
Quien es la H0?
Solución
Traducir a lenguaje estadístico:
Establecer su opuesto:
Seleccionar la hipótesis nula
%
20
=
p
%
20
≠
p
% 20 : 0 p= HPage 16
Hipótesis Estadística
Julián Tamayo Identificación de Hipótesis
Problema: ¿El IMC promedio de los trabajadores es de 28,3?
Quien es la H0?
Solución
Traducir a lenguaje estadístico:
Establecer su opuesto:
Seleccionar la hipótesis nula
3
,
28
=
µ
3
,
28
≠
µ
3
,
28
:
0
µ
=
H
Prueba de Hipótesis
Se refiere a la confrontación de la hipótesis estadística contra los datos que provienen de una muestra aleatoria
Con el objetivo de decidir si es plausible que unos datos como los observados (muestra), puedan provenir de una población como la determinada por los parámetros que establece la hipótesis.
Prueba de Hipótesis
Veámoslo con un ejemplo:
Page 19
Prueba de Hipótesis
Julián Tamayo Veámoslo con un ejemplo:
Si con el propósito de verificar lo anterior, tomamos una muestra de 28 trabajadores y ésta arroja un promedio de edad de 19,1 años¿Contradice este resultado, la hipótesis de que sus hijos tienen en promedio 18 años?
Este es un problema de prueba de hipótesis
Page 20
Prueba de Hipótesis
Julián Tamayo Reflexión
Para saber si la media de 19,1 años es suficientemente sospechosa para hacer sonar laalarma, la compararé con las medias que arrojaron los años anteriores. Es decir, requiero una distribución de referencia.
Page 21
Prueba de Hipótesis
Julián Tamayo Distribución de Referencia
Histograma de 20 registros anteriores obtenidos al calcular la media de edad para 28 hijos de los trabajadores
Media de la edad de 28 hijos de los trabajadores Esto es lo que ocurre
normalmente en los
años anteriores Media igual a
19,1 años
Que suene la Alarma
Page 22
Prueba de Hipótesis
Julián Tamayo Distribución de Referencia
Por lo tanto hay argumentos de peso para el rechazo de la hipótesis de que los hijos de los trabajadores
tienen una edad promedio de 18 años
Región Crítica y Nivel de Significación
Región critica: Es conocida antes de realizar el experimento. Resultados experimentales que refutarían H0
Nivel de Significación: Número pequeño 1%, 3%, 5% y es fijado de antemano por el investigador. Es la probabilidad de rechazar H0cuando es cierta.
Región Crítica y Nivel de Significación
No rechazo H0
Región Critica Región Critica
α=5%
Page 25
Región Crítica y Nivel de Significación
Julián Tamayo
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral (2 Colas)
H1: µ<18 H1: µ>18
H1: µ≠18
Page 26
Significación: p-valor
Julián Tamayo Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
El p-valor es conocido después de realizar el experimento aleatorio.
El Contraste esno significativocuando elp-valor >α, es decir, que se rechaza la hipótesis alterna.
El Contraste essignificativocuando elp-valor <α, es decir, que se rechaza la hipótesis nula.
Page 27
Significación: p-valor
Julián Tamayo
5 , 18
=
X No se rechaza H0: µ=18
P
α
El Contraste es no significativo porque el p-valor > α
Page 28
Significación: p-valor
Julián Tamayo
1 , 19
=
X Se rechaza
H0: µ=18
P
α
El Contraste es significativo porque el p-valor < αResumen
α
SobreEs número pequeño, preelegido al diseñar el experimento
Conocido sabemos todo sobre la región crítica
α
Sobre p-valor
Es conocido tras realizar el experimento
Conocido p-valor sabemos todo sobre el resultado del experimento
Sobre el criterio de rechazo