C
ONTRASTE
DE
Pedro Valero [email protected] 74 Contraste de Hipótesis
Contenidos
El pan y la salud (def y conc. básicos) 75
Contrastes de Hipótesis 77
Media 78 Intervalos de confianza para pruebas de hipótesis 82
Prueba de significación 86
El proceso de la prueba de hipótesis 88
Proporción 91
El Rechazo de la Hipótesis Nula 96
Significación Estadística y Relevancia Práctica 97
Pedro Valero [email protected] 75 Contraste de Hipótesis El pan y la salud (def y conc. básicos)
E
L
PAN
Y
LA
SALUD
(
DEF
Y
CONC
.
BÁSICOS
)
• Quizás no hay un alimento más
inocente
que el pan
- ¿O quizás no?
• Como se puede ver
en esta noticia,
reducir el contenido
de sal del pan puede
tener un gran
impacto en la salud
pública de los
españoles
- La hipertensión es una enfermedad cara, muyextendida y difícil de combatir
Pedro Valero [email protected] 76 Contraste de Hipótesis El pan y la salud (def y conc. básicos)
• Puesto que aumentar la sal es una tentación continua para los fabricantes, podemos
imaginar que es necesario controlar ese compromiso para asegurarse que todos lo
respetan
- ¿Cómo evaluamos si se está respetando correctamente? Habría que recoger muestras de panes por fabricante Analizar la cantidad de sal en las diferentes barras Sacar la media
Comparar la media de sal con el objetivo (18 gs por kilo) - Vamos a ver cómo se haría este análisis
Pedro Valero [email protected] 77
Contraste de Hipótesis Contrastes de Hipótesis
C
ONTRASTES
DE
H
IPÓTESIS
• En primer lugar veremos cómo hacer el contraste de hipótesis para la media usando el
ejemplo del pan
• Luego veremos cómo hacer el contraste de hipótesis para la proporción, para el que
usaremos un ejemplo diferente
Pedro Valero [email protected] 78
Contraste de Hipótesis Contrastes de Hipótesis/Media
Media
• Supongamos que queremos evaluar el pan de un determinado fabricante y recogemos 21
barras de un cuarto de kilo de pan.
- Los datos están a la derecha y también tenéis el archivo de SPSS en la página web (recordar que el objetivo es de 18 gs. por kilo, puesto que la barra pesa un cuarto, cada una debería tener aproximadamente 4.5 gs por kilo)
¿Este fabricante está cumpliendo con el acuerdo?
4 3,8 2,5 8 6 5 3 6 3,5 4,2 5 6 8 3 2 7 2 8 3 4,5 9
Pedro Valero [email protected] 79
Contraste de Hipótesis Contrastes de Hipótesis/Media
• La forma de ver si en general está cumpliendo el acuerdo es calcular la media de gramos
de sal y ver si la media supera ese valor
- En la tabla vemos el resultado de calcular la media y otros valores para nuestro conjunto de datos Vemos que efectivamente, el valor supera la media de sal aceptable pero no obstante, la diferencia no es mucha
Supongamos que tenemos que poner una multa a ese fabricante si pasara de los límites, ¿lo haríamos?
Supongamos que el fabricante alega diciendo que el valor medio que ha salido es sólo producto de un poco de mala suerte en las barras escogidas porque en sus controles internos ese resultado es muy raro que se produzca
¿Podemos usar los descubrimientos de Gosset para aclarar este tema?
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ.
Sal 21 2,00 9,00 4,9286 2,14153
Contraste de Hipótesis Contrastes de Hipótesis/Media/El proceso de prueba de hipótesis
Contenidos 80
El proceso de prueba de hipótesis
• Una hipótesis es una especulación acerca de algo. En Estadística, una prueba de hipótesis
consiste en elegir entres dos hipótesis más o menos plausibles
Hipótesis nula:
La hipótesis nula es la posición de partida de una comprobación de hipótesis Se expresa como una negación del tipo “no hay diferencia” o “no hay relación”En nuestro ejemplo, la hipótesis nula sería: “No hay diferencia entre el contenido medio de sal en la muestra de barras de pan utilizadas y el contenido que marca la ley (4,5 gs de sal por cuarto de kilo)
Hipótesis alternativa:
Esta es la posición contraria a la hipótesis nulaSe expresa como lo contrario de la hipótesis nula y significa “sí hay diferencia” o “sí hay relación”
En nuestro ejemplo, la hipótesis alternativa sería: “El contenido medio de sal en las muestra de barras de pan es incompatible con el contenido que marca la ley (4.5 gs de sal por cuarto de kilo)”
• El resultado del proceso de prueba de hipótesis consiste en rechazar o no rechazar la
hipótesis nula por lo que la frase que se utiliza es:
- No se rechaza la hipótesis nula (con el significado en nuestro caso que el pan del fabricante está bien)
Contraste de Hipótesis Contrastes de Hipótesis/Media/Inocente si no se demuestra lo contrario
Contenidos 81
Inocente si no se demuestra lo contrario
• El resultado de una prueba de hipótesis es Rechazar o No rechazar
- La hipótesis nula no se acepta
- La hipótesis alternativa no se acepta
La explicación de esta terminología nos llevaría un poco más lejos de lo que queremos pero hay una analogía que seguramente os resultará familiar y que viene del mundo legal
“Inocente si no se demuestra lo contrario”
• Si todo el mundo es inocente, ¿por qué llevan al alguien a un juicio? Obviamente porque
hay dudas sobre su inocencia
- Un juicio es una prueba de hipótesis con las siguientes hipótesis:
Hipótesis nula:
No hay pruebas para rechazar que alguien es inocenteHipótesis alternativa:
Hay pruebas para rechazar que alguien es inocente- Observar que
No hay que probar que alguien es inocente, eso se da por supuesto
No se puede probar que alguien es culpable: siempre podría haber nuevas pruebas que invalidaran esa conclusión
Pedro Valero [email protected] 82 Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis
Intervalos de confianza para pruebas de hipótesis
• Volviendo a nuestro ejemplo del pan:
- Si usamos los resultados en la muestra de panes de ese fabricante para calcular un intervalo de confianza dentro del cual estará el valor de la población de panes de ese fabricante haremos:
Los datos los he calculado con el SPSS utilizando el comando Comparar medias>Prueba t para una muestra
- El intervalo nos dice que con un 95% de confianza la media de la sal en las barras de pan de nuestro fabricante estará entre 4 y 5,8 por lo que (responde la correcta):
a) No podemos rechazar la hipótesis nula de que el pan de ese fabricante no difiere del valor 4,5 deseado
b) Podemos rechazar la hipotesis nula
Estadísticos para una muestra
N Media Desviación típ.
Error típ. de la media Sal 21 4,9286 2,14153 ,46732
Pedro Valero [email protected] 83 Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis
• ¿Porqué multiplicamos por 2.086?
- En el tema anterior aprendimos que cuando la muestra es grande se multiplica por 1.96 para calcular el intervalo de confianza pero que cuando la muestra es pequeña hay que usar los valores de la distribución t
- Estos son los valores para unos tamaños de muestra específicos. Tenemos que mirar 20 porque en este caso gl se calcula n-1 (21-1)
Hemos usado intervalos de confianza al 95%, hacerlo al 99% haría los intervalos más grandes y sería más difícil rechazar la hipótesis nula
En la práctica, se suele utilizar intervalos de confianza al 95%
gl 95% 99% 2 4.303 9.925 3 3.182 5.841 4 2.776 4.604 5 2.571 4.032 8 2.306 3.355 10 2.228 3.169 20 2.086 2.845 50 2.009 2.678 100 1.984 2.626
Pedro Valero [email protected] 84 Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis
• Utilizando el SPSS
- El comando del SPSS para hacer el cálculo de la prueba de hipótesis está en Analizar>Comparar medias>prueba t para una muestra. Al seleccionarlo produce el siguiente cuadro de diálogo
El 4,5 lo introducimos nosotros y corresponde con el valor de la hipótesis nula. Apretamos aceptar y en la ventana resultados aparece el output
Pedro Valero [email protected] 85 Contraste de Hipótesis Contrastes de Hipótesis/Intervalos de confianza para pruebas de hipótesis
- El SPSS muestra los resultados de una manera diferente a lo que he puesto antes. Como lo usaremos para hacer nuestros análisis necesitáis saber como funciona.
En la parte de arriba pone valor de prueba=4.5, este es el valor que queremos comparar con el resultado obtenido en nuestra muestra.
La diferencia de medias es la resta entre lo obtenido en nuestra muestra (4,9286) y el valor de prueba (4,5)=0,42857
El intervalo al 95% de confianza es un intervalo de confianza
para la diferencia
La hipótesis nula es que la diferencia es cero, la alternativa que la diferencia no es cero
Si el intervalo de confianza para la diferencia incluye cero no rechazamos la hipótesis nula, si no incluye cero, sí rechazamos la hipótesis nula
Estadísticas de muestra única
N Media Desviación estándar Media de error estándar Sal 21 4,9286 2,14153 ,46732
Prueba para una muestra
Valor de prueba = 4.5 t gl Sig. (bilateral) Diferencia de medias 95% Intervalo de confianza para la diferencia Inferior Superior Sal ,917 20 ,370 ,42857 -,5462 1,4034
Pedro Valero [email protected] 86 Contraste de Hipótesis Contrastes de Hipótesis/Prueba de significación
Prueba de significación
• Existe un segundo método para la prueba de hipótesis que será el que utilizaremos más a
menudo y que es el que habitualmente aparece en todos lados
- El primer paso consiste en calcular el estadístico t mediante la siguiente fórmula:
- En donde:
Estadístico de contraste: es el resultado que en este caso se llama t
Estimación puntual: El valor que nos ha salido en la muestra (en este caso 4,9286) Valor teórico: El valor de prueba (en este caso 4,5)
El error típico: Este valor se puede calcular como sabemos (en este caso daba 0,46)
Con esos tres valores hacemos: (4,9286-4,5)/0,46=0,917 (el valor que aparece en la tabla)
Ese valor de t puede ser buscado en una tabla para evaluar su significación pero en la práctica los paquetes estadísticos la imprimen directamente (es 0,370)
:
Prueba para una muestra
Valor de prueba = 4.5
t gl Sig. (bilateral)
Diferencia de medias
95% Intervalo de confianza para la diferencia
Inferior Superior
Sal ,917 20 ,370 ,42857 -,5462 1,4034
Estimación Puntual Valor Teórico Estadístico de Contraste
Error Típico
Contraste de Hipótesis Contrastes de Hipótesis/Prueba de significación/¿Qué significa la significación estadística?
Contenidos 87
¿Qué significa la significación estadística?
• La significación estadística nos indica si rechazamos la hipótesis nula o no y se lee como
una probabilidad
- Un valor alto en la significación quiere decir que la hipótesis nula no se debe rechazar - Un valor bajo en la significación quiere decir que la hipótesis se debe rechazar
Como regla general, rechazamos la hipótesis nula cuando la significación (p) es menor que
0,05
Repito...
Rechazamos cuando p<0,
5
• En nuestro caso, puesto que p=0,370>0.05 no rechazamos la hipòtesis nula (es decir no
podemos decir que la cantidad media de sal en nuestra muestra es tan grande como para
rechazar con un 95% de confianza que la cantidad de sal que pone ese fabricante es
superior a la que debe)
Pedro Valero [email protected] 88 Contraste de Hipótesis Contrastes de Hipótesis/El proceso de la prueba de hipótesis
El proceso de la prueba de hipótesis
• Vamos a examinar los pasos del proceso de comprobación de hipótesis de nuevo:
a) Plantear una hipótesis nula y una alternativa:
La hipótesis nula es la que afirma que no hay diferencias o que no hay relación. La alternativa es la que afirma que hay diferencias o relación entre las cosas- La mayoría de las veces, cuando uno está estudiando un tema, uno quiere encontrar diferencias o relaciones, así que empezar desde una hipótesis nula puede parecer un poco hipócrita en el fondo
Sin embargo, recordar que en un juicio se parte de una situación similar, “inocente hasta que no se demuestre lo contrario” pero si se decide juzgar a alguien será por algo ¿no?
b) Calcular un estadístico de contraste:
El estadístico de contraste en los ejemplos que hemos visto tiene dos partes- La diferencia entre el valor teórico y el valor que ha salido en la muestra. Si el valor teórico y el que sale en la muestra son muy parecidos entonces es que no hay diferencias y la hipótesis nula es la más creíble
Si en cambio hay mucha diferencia, la hipótesis nula deja de ser creíble. Eso es lo que ocurría en el caso de la proporción de divorcios pero no en el caso de la sal en el pan
Pedro Valero [email protected] 89 Contraste de Hipótesis Contrastes de Hipótesis/El proceso de la prueba de hipótesis
- La división por el error típico. Aunque haya diferencias, siempre es necesario tener en cuenta que esas diferencias dependen del error. Si estuviéramos midiendo algo con precisión absoluta, cualquier diferencia sería significativa, si en cambio lo estuviéramos midiendo con muy poca precisión, es muy difícil demostrar que una diferencia es significativa
Recordar que el error típico depende de dos cosas, el tamaño de la muestra y la desviación típica.
Cuanto mayor es el tamaño de la muestra, más precisión en nuestras medidas y más fácil es conseguir que las diferencias sean significativas. Usar muestras grandes facilita rechazar la hipótesis nula.
Cuanto menor es la desviación típica, más fácil es rechazar la hipótesis nula. Controlar la desviación típica no es tan fácil como aumentar el tamaño de la muestra y en la práctica a menudo sólo se puede hacer en situaciones experimentales (Es un tema que veréis en la asignatura de diseño experimental)
c) Comprobar el nivel de significación:
El estadístico de contraste tiene asociado una probabilidad. Esa probabilidad nos indica si es probable conseguir ese valor del estadístico de contraste si no hubiera diferencias (es decir, si la hipótesis nula fuera verdadera)- Valores bajos de probabilidad significa que la hipótesis nula no parece verdadera y la rechazamos (normalmente es lo que queremos)
- Valores altos de probabilidad significa que la hipótesis nula no puede ser rechazada y nos tenemos que quedar con ella
Pedro Valero [email protected] 90
Contraste de Hipótesis Contrastes de Hipótesis/Proporción
Proporción
• Sexo y Divorcio, ¿tienen algo que ver?
Nadie que se casa piensa que acabará divorciándose. El fracaso de un matrimonio es una experiencia personal con gran impacto psicológico y económico. Por lo tanto, entender los factores que hacen que un matrimonio tenga éxito o constituye un tema de investigación de gran relevancia tanto teórica como aplicada. Ayudar a parejas en dificultades es una actividad habitual para psicólogos profesionales y entender esta situación en profundidad es un requisito para realizarla correctamente
En un estudio por Thornes y Collard (1979) se analizó la historia de un grupo de 1036 personas en los que se buscó que la mitad estuviera casada y la otra mitad fueran divorciados. En ese estudio se les preguntó sobre una serie de cuestiones relacionadas con relaciones sexuales
Una de las preguntas fue sobre si habían tenido relaciones pre-matrimoniales. El resultado fue que 66% (159 de 241) de los que habían tenido relaciones prematrimoniales estaban divorciados, y un 34% (82 de 241) que no
Pedro Valero [email protected] 91
Contraste de Hipótesis Contrastes de Hipótesis/Proporción
• ¿Podemos decir que es mayoría los que se divorcian si tuvieron relaciones
prematrimoniales? Analicemos esto
- ¿Qué quiere decir mayoría? Normalmente significa más del 50%, como cuando se hace una votación para aprobar algo
En realidad, en este estudio, aunque se buscó que el 50% estuviera casado y el 50% divorciado, los valores fueron algo diferentes y un 52,3% estaba casado y un 47,7% divorciado
En este caso, diríamos que “mayoría” sería si hay más de 47,7% de divorciados entre los que tuvieron relaciones prematrimoniales
- Calcularemos el mismo estadístico de contraste salvo por algunos matices
Los “matices” son que, para calcular el error típico, utilizaremos una formula un poco diferente a la que vimos en su momento:
es la proporción que planteamos para la hipótesis nula (en este caso 0,477 después de pasar los porcentajes a proporciones)
es el complementario de , o sea =0,523
Esta fórmula del error típico es diferente de la que vimos en el primer tema porque utiliza la
proporción planteada en la hipótesis nula y no la que se recoge en la muestra
Estimación Puntual Valor Teórico Estadístico de Contraste Error Típico ET p 0 p0q0 n ---= p0 q0 p0 1 p– 0
Pedro Valero [email protected] 92
Contraste de Hipótesis Contrastes de Hipótesis/Proporción
- Poniéndolo todo junto queda:
¿Qué significa ese 5,68?
Es el estadístico de contraste, el cual nos indica si la diferencia entre los valores de arriba es grande o no tal y como hacíamos con la diferencia de medias en el ejemplo del pan
Para decidir si ese valor es grande o es pequeño podemos utilizar los valores de la distribución normal (1,96 para una confianza del 95%) o podemos utilizar la distribución binomial si usamos un ordenador (el SPSS permite hacer la prueba binomial pero normalmente con la aproximación normal tenemos suficiente)
0 66 0 477 – 0 477 0 523
241
Pedro Valero [email protected] 93
Contraste de Hipótesis Contrastes de Hipótesis/Proporción
• La prueba binomial en el SPSS
- Esta prueba se encuentra en el menú Analizar>Pruebas no paramétricas>Cuadros de diálogo antiguos>Binomial
- En este caso ponemos como valor de prueba 0,47 (el número de divorciados en general en nuestro grupo)
Pedro Valero [email protected] 94
Contraste de Hipótesis Contrastes de Hipótesis/Proporción
- El resultado es el siguiente
Podemos utilizar la significación para decidir si la proporción observada de divorciados (0,659) es mayor que la proporción de prueba o media para todos los individuos (0,47). El resultado es menor de 0,05 por lo que rechazamos la hipótesis nula de que no hay diferencia entre esos valores
Conclusión: el grupo de sujetos que tuvieron relaciones prematrimoniales tuvieron una proporción de divorcios mayor que los que no las tuvieron
Prueba binomial Categoría N Proporción observada Prop. de prueba Sig. exacta (unilateral) Div Grupo 1 Divorced 159 ,659751 ,470000 ,000
Grupo 2 Married 82 ,340249
Pedro Valero [email protected] 95 Contraste de Hipótesis El Rechazo de la Hipótesis Nula/Proporción
E
L
R
ECHAZO
DE
LA
H
IPÓTESIS
N
ULA
• El proceso de prueba de hipótesis puede resultar muy confuso al principio
- Seguramente el problema se encuentra en que en la vida real nos proponemos encontrar lo verdadero y no rechazar lo falso
- El proceso de prueba de hipótesis se basa en rechazar cosas que hipotetizamos que son verdaderas aunque en realidad queremos demostrar que no lo son
NO VOY A INTENTAR CONVENCEROS DE QUE NO ES CONFUSO PORQUE LO ES
• Rechazar la hipótesis nula o fallar en rechazar la hipótesis nula
A pesar de que parecerá muy retorcido, los resultados de una prueba de hipótesis se plantean desde el punto de vista de la hipótesis nula
Pedro Valero [email protected] 96 Contraste de Hipótesis Significación Estadística y Relevancia Práctica
S
IGNIFICACIÓN
E
STADÍSTICA
Y
R
ELEVANCIA
P
RÁCTICA
• A pesar de todas las precauciones que hemos tomado, las pruebas de hipótesis pueden dar
lugar a resultados que aunque son correctos técnicamente no lo son desde un punto de
vista lógico
- Uno de estos casos es cuando una diferencia es significativa pero es tan pequeña que en la práctica no importa, o que si tenemos en cuenta otros factores las conclusiones a las que llegamos no se siguen de nuestra prueba de hipótesis
• Ejemplo: El estudio del Halothano
F. Mosteller explica en su libro “los placeres de la Estadística” su implicación en el estudio sobre un anestésico que se utilizaba en aquel momento
El estudio fue lanzado en parte porque una mujer murió de modo fulminante cuando se le puso el anestésico No obstante, otros anestésicos también podrían causar problemas y hay que tener en cuenta que ese anestésico se había utilizado en unos 10 millones de operaciones
Un estudio detallado encontró que la tasa de muerte en operaciones que usaban Halotano era del 2,1% mientras que el Éter era del 2%
Aunque no puedo decirlo porque faltan datos es posible que esa diferencia fuera significativa, ¿se debería utilizar Èter en lugar de Halotano?
Pedro Valero [email protected] 97 Contraste de Hipótesis Significación Estadística y Relevancia Práctica
Tal y como explica F. Mosteller, había bastante interés en dejar de usar Éter y pasarse al Halotano por una razón muy sencilla: el Éter puede explotar y el Halotano no
- Moraleja: No basta con que haya diferencias, éstas tienen que ser lo suficientemente importantes para tener relevancia en la práctica según el contexto y el resto de las condiciones a tener en cuenta
• Intervalos de confianza: Una recomendación que se puede hacer es que se den los
intervalos de confianza además de la significación ya que ayudan a entender si las
diferencias son realmente importantes
Pedro Valero [email protected] 98 Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis
E
RRORES
A
SOCIADOS
AL
C
ONTRASTE
DE
H
IPÓTESIS
• Los contrastes de hipótesis son un proceso bastante complejo y con muchos aspectos
difíciles de entender. Por ello, no es difícil cometer errores. Aunque una lista completa
sería inmanejable, aquí hay algunas pero la lista podría ser más larga:
Hipótesis nula demasiado fácil:
Si la hipótesis nula es demasiado fácil, entonces el proceso de hacer un contraste de hipótesis seguramente dará lugar a que la rechacemos, aunque en la práctica ese rechazo no tiene ninguna consecuencia.Este problema viene de plantear un “rival” que es demasiado fácil de derrotar.
Afirmar que una terapia de adelgazamiento ha tenido éxito porque la reducción de peso ha sido mayor que cero en un mes es algo completamente vacío. Se necesitaría rechazar una hipótesis nula un poco más ambiciosa para poder decir que esa terapia tiene éxito.
No bases tu hipótesis nula en los resultados:
La hipótesis nula se tiene que plantear por anticipado. No vale ver que el 35% de la muestra está a favor de una medida y plantear como hipótesis nula que un tercio de la población está a favor de la medida a continuación.Las hipótesis nulas se plantean a priori
La hipótesis nula no es lo que quieres que sea verdadero:
Es al contrario, es lo que quieres rechazar así que tienes que pensar en lo que quieres y negarlo para ponerlo como hipótesis nulaPedro Valero [email protected] 99 Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis
Pedro Valero [email protected] 100 Contraste de Hipótesis Errores Asociados al Contraste de Hipótesis