PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA
Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y tiene su analogía con los pasos que se realizan en un JUICIO.
Objetivo:
Aquí no se busca Estimar el parámetro 𝜃 sino determinar cuál de las hipótesis contrapuestas propuestas por el investigador es la correcta para cierto nivel.
Procedimiento de Prueba de Hipótesis
El investigador establecerá las hipótesis en base a la teoría que quiere verificar, para un parámetro 𝜃.
Tomar una muestra aleatoria de la población en estudio.
Comparar lo observado con su teoría, si lo observado se
contrapone a su teoría se rechaza su hipótesis en caso
contrario se dice que no se observó cambio.
Primero definiremos los elementos necesarios para lleva adelante una Prueba de hipótesis.
a) El investigador debe establecer las hipótesis contrapuestas de interés para 𝜃, llamadas Hipótesis Nula (𝑯
𝟎) e Hipótesis Alternativa (𝑯
𝒂).
𝑯
𝟎hipótesis de no cambio, no diferencia, no mejoría, etc.
𝑯
𝒂hipótesis que el investigador pretende validar.
Si 𝜃 es el parámetro de interés y 𝜃
0un valor fijado por el investigador entonces en nuestro tratamiento de Prueba de hipótesis consideraremos estas posibles hipótesis alternativas
𝑯
𝒂∶
𝜽 ≠ 𝜽
𝟎𝑷𝒓𝒖𝒆𝒃𝒂 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍
𝜽 > 𝜽
𝟎𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 𝜽 < 𝜽
𝟎𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓
b) Estadístico de Prueba: estadístico con distribución conocida bajo hipótesis nula, sobre el cual se basará la decisión a tomar.
c) Región de Rechazo (RR): conjunto de valores del estadístico de prueba para los cuales 𝑯
𝟎será rechazada.
d) Luego 𝑯
𝟎será rechazada si el valor observado o alcanzado
del estadístico pertenece a la RR, en cuyo caso diremos que
la 𝑯
𝒂es la correcta. En caso contario diremos que no se
encontró evidencia suficiente para rechazar 𝑯
𝟎.
Al tomar una decisión se pueden cometer dos tipos de errores.
Error tipo I: Rechazar 𝑯
𝟎cuando 𝑯
𝟎es verdadera.
Error tipo II: Aceptar 𝑯
𝟎cuando 𝑯
𝟎es falsa.
Denotaremos con 𝛼 𝑦 𝛽 a las probabilidades de cometer los Errores tipo I y tipo II respectivamente.
Llamaremos nivel de significación de una prueba al valor
𝜶 = 𝐦𝐚𝐱
𝜽𝝐𝜴𝟎𝜶 𝜽 , 𝒅𝒐𝒏𝒅𝒆 𝑯
𝟎: 𝜽𝝐𝜴
𝟎.
La RR determina las probabilidades de cometer cada uno de los
errores.
En resumen los pasos a seguir para realizar una Prueba de Hipótesis son:
a) Identificar el parámetro de interés.
b) Determinar las Hipótesis nula y alternativa para el problema.
c) Determinar el Estadístico de Prueba adecuado, con distribución conocida bajo 𝑯
𝟎.
d) Fijado un nivel de significancia 𝜶 determinar la Región de Rechazo.
e) Calcular el valor observado o alcanzado del estadístico de prueba con la muestra obtenida.
f) Determinar si 𝑯
𝟎debe ser rechazada o no para el
nivel de significación dado, estableciendo una
conclusión en el contexto del problema.
PROBLEMA:
Supongamos que el 10% de las tarjetas de circuito producidas por cierto fabricante son defectuosas.
Con el fin de reducir la proporción de tarjetas defectuosas se ha sugerido un nuevo proceso de producción.
En este caso 𝜃 = 𝑝 es la verdadera proporción de tarjetas defectuosas con este nuevo método de producción.
a) Establecer las hipótesis de interés.
b) Se tomó una muestra aleatoria de n=200 tarjetas producidas con este nuevo método. Determinar el Estadístico de Prueba.
c) Dada la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 15 , calcular el nivel de significancia aproximado y hallar una expresión para la probabilidad aproximada de cometer el Error de tipo II.
d) Si ahora la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 12 , calcular el nivel de significancia aproximado.
e) Si en la muestra aleatoria se obtuvo x=13 ¿cuál sería su conclusión? Usando la región de rechazo dada en el ítem c).
Observaciones:
i) 𝛽 𝑝 crece cuando 𝑝 se aproxima a 0,10.
ii) 𝛼 = max
𝑝≥0,10𝛼 𝑝 = 𝛼 0,10 . Luego esta prueba sigue teniendo el mismo nivel de significancia para la hipótesis simplificada 𝐻
0: 𝑝 = 0,10.
Por lo tanto de ahora en más nuestra hipótesis nula será:
𝑯
𝟎∶ 𝜽 = 𝜽
𝟎Pruebas de Hipótesis para la media poblacional
Así como hicimos en IC consideraremos diferentes situaciones para plantear Prueba de Hipótesis.
Hipótesis Nula:
𝑯
𝟎∶ 𝝁 = 𝝁
𝟎Caso A:
Sea 𝑋
1, 𝑋
2, … , 𝑋
𝑛una m.a. de 𝑁(𝜇, 𝜎
2) con 𝜎
2conocido.
Bajo estos supuestos sabemos que 𝑿 ~ 𝑵 𝝁, 𝝈
𝟐𝒏 ⇔ 𝑿 − 𝝁
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) Estadístico de Prueba
𝑿 −𝝁𝟎
𝝈
𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯
𝟎Si la Hipótesis alternativa fuese:
𝑯
𝒂∶ 𝝁 < 𝜇
𝟎Fijado un nivel de significancia 𝛼 entonces veamos cómo
definir la Región de Rechazo (𝑅𝑅
𝛼) y estudiemos el
comportamiento de la función 𝛽.
𝑹𝑹
𝜶= 𝒙 ≤ 𝒌
𝜶= −𝒛
𝜶𝝈
𝒏 + 𝝁
𝟎= 𝒛 ≤ −𝒛
𝜶La probabilidad de cometer el error tipo II es:
𝜷 𝝁′ = 𝟏 − 𝜱 −𝒛
𝜶+
( 𝝁𝟎−𝝁′)𝝈
𝒏 , ∀ 𝝁′ < 𝝁
𝟎.
Observaciones sobre esta función:
i) lim
𝜇→𝜇0−𝛽 𝜇 = 1 − 𝛼 y lim
𝜇 →−∞𝛽 𝜇 = 0.
ii) 𝛽 es una función creciente con punto de inflexión en 𝑘
𝛼.
Ahora si queremos determinar el tamaño de muestra necesario para que una prueba de nivel 𝛼 sea tal que
𝜷 𝝁
′≤ 𝜷
𝟎Entonces:
𝒏 ≥
𝒛𝜷𝟎 + 𝒛𝜶( 𝝁𝟎−𝝁′ )
𝝈
𝟐
.
Ejercicio (8.18)
Se sabe que el tiempo de secado de cierto tipo de pintura, bajo ciertas condiciones de prueba, está normalmente distribuido con valor medio de 75 minutos y una desviación estándar de 9 minutos.
Unos químicos han diseñado un nuevo aditivo para reducir el tiempo medio de secado de la pintura. Se supone que el tiempo de secado para la pintura con el nuevo aditivo seguirá teniendo distribución normal con desviación estándar de 9 minutos.
Debido al gasto asociado con el aditivo, la evidencia debe sugerir de forma contundente una disminución en el tiempo medio de secado (𝜇) para su aceptación.
a) Plantear las hipótesis pertinentes.
b) Dar el estadístico de prueba y su distribución bajo hipótesis nula.
c) Se tomó una muestra aleatoria de tamaño 25 obteniéndose un promedio muestral de 72,3 minutos. ¿Cuál sería su conclusión usando un nivel de significancia de 0,01? Justifique su respuesta.
d) ¿Cuál es el nivel de significación para la 𝑅𝑅= 𝑧 ≤ −2,88 ? e) Para la RR dada en el ítem d), dar el valor de la probabilidad
de cometer el error tipo II cuando 𝜇 =70.
f) Para la RR dada en el ítem d), ¿cuál es el menor tamaño de
muestra que debería tomar para asegurar que 𝛽 70 ≤ 0,01?
Nivel de significación y P(error tipo II cuando μ=70)
68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 0,00
0,02 0,04 0,07 0,09 0,11 0,13 0,16 0,18 0,20 0,22
Densidad
P(errortipo I)=0,0020
68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 0,00
0,02 0,04 0,07 0,09 0,11 0,13 0,16 0,18 0,20 0,22
Densidad
P(error tipo II en 70)=0,5398
De igual forma se puede trabajar con las otras dos hipótesis alternativas y que se pueden resumir como sigue.
Supuestos:
Sea 𝑿
𝟏, 𝑿
𝟐, … , 𝑿
𝒏una m.a. de 𝑵(𝝁, 𝝈
𝟐) con 𝝈
𝟐conocido.
Hipótesis Nula:
𝑯
𝟎∶ 𝝁 = 𝝁
𝟎Estadístico de Prueba:
𝒁 =
𝑿 −𝝁𝟎𝝈
𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯
𝟎𝑯
𝒂𝑹𝑹
𝜶𝜷 𝝁
𝝁 < 𝜇
𝟎𝒛 ≤ −𝒛
𝜶 𝟏 − 𝜱 −𝒛𝜶 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏
𝝁 > 𝜇
𝟎𝒛 ≥ 𝒛
𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏
𝝁 ≠ 𝝁
𝟎𝒛 ≥ 𝒛
𝜶𝟐 𝜱 𝒛𝜶
𝟐 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏 − 𝜱 −𝒛𝜶
𝟐 +( 𝝁𝟎− 𝝁) 𝝈 𝒏
El mínimo tamaño de muestra necesario para que una prueba de nivel 𝛼 sea tal que
𝜷 𝝁
′≤ 𝜷
𝟎tomar 𝒏 ≥
𝒛𝜷𝟎 + 𝒛𝜶( 𝝁𝟎−𝝁′ )
𝝈
𝟐
si la hipótesis es unilateral y poner 𝑧
𝛼2
en lugar de 𝑧
𝛼si la hipótesis es
bilateral. Problemas 8.10 y 8.11
Caso B:
Sea 𝑋
1, 𝑋
2, … , 𝑋
𝑛una m.a. con media y varianza 𝜇 𝑦 𝜎
2. Si el tamaño de muestra es suficientemente grande entonces por TCL:
𝑿 ~ 𝑵 𝝁, 𝝈
𝟐𝒏 ⇔ 𝑿 − 𝝁
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)
Pedir 𝑛 ≥ 30 si la varianza es conocida y si es desconocida reemplazar 𝜎 por S y pedir 𝑛 ≥ 40, luego todo es igual que en el Caso A.
Hipótesis Nula:
𝑯
𝟎∶ 𝝁 = 𝝁
𝟎Estadístico de Prueba:
𝒁 =
𝑿 −𝝁𝟎𝝈
𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯
𝟎𝑯
𝒂𝑹𝑹
𝜶𝜷 𝝁
𝝁 < 𝜇
𝟎𝒛 ≤ −𝒛
𝜶 𝟏 − 𝜱 −𝒛𝜶 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏
𝝁 > 𝜇
𝟎𝒛 ≥ 𝒛
𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏
𝝁 ≠ 𝝁
𝟎𝒛 ≥ 𝒛
𝜶𝟐 𝜱 𝒛𝜶
𝟐 + ( 𝝁𝟎− 𝝁)
𝝈 𝒏 − 𝜱 −𝒛𝜶
𝟐 +( 𝝁𝟎− 𝝁) 𝝈 𝒏
Si el 𝜎 es desconocido reemplazarlo por S, siempre que
𝑛 ≥ 40.
El mínimo tamaño de muestra necesario para que una prueba de nivel aproximado 𝛼 sea tal que 𝜷 𝝁
′≤ 𝜷
𝟎tomar 𝒏 ≥
𝒛𝜷𝟎 + 𝒛𝜶( 𝝁𝟎−𝝁′ )
𝝈
𝟐
si la hipótesis es unilateral y poner 𝑧
𝛼2
en lugar de 𝑧
𝛼si la hipótesis es bilateral.
Caso C:
Sea 𝑋
1, 𝑋
2, … , 𝑋
𝑛una m.a. de 𝑁(𝜇, 𝜎
2) con 𝜎
2desconocido.
Bajo estos supuestos sabemos que 𝑿 − 𝝁
𝑺 𝒏 ~ 𝒕
𝒏−𝟏Hipótesis Nula:
𝑯
𝟎∶ 𝝁 = 𝝁
𝟎Estadístico de Prueba:
𝑻 = 𝑿 −𝝁𝟎
𝑺 𝒏 ~ 𝒕 𝒏−𝟏 , bajo 𝑯 𝟎
𝑯
𝒂𝑹𝑹
𝜶𝝁 < 𝜇
𝟎𝒕 ≤ −𝒕
𝜶𝝁 > 𝜇
𝟎𝒕 ≥ 𝒕
𝜶𝝁 ≠ 𝝁
𝟎𝒕 ≥ 𝒕
𝜶𝟐,𝒏−𝟏
En este caso es muy complicado dar la expresión de la probabilidad de cometer el Error Tipo II y determinar el valor de n.
Problema 8.29
Pruebas de Hipótesis para la Proporción poblacional
Supuestos:
Sea 𝑋
1, 𝑋
2, … , 𝑋
𝑛una m.a. de Bernoulli de parámetro 𝑝, entonces la variable 𝑋 =
𝑛𝑖=1𝑋
𝑖~ B(n, p) . Aquí tendremos dos casos a considerar:
i) Si n es suficientemente grande.
ii) Si n es pequeño.
Caso i)
Por TCL sabemos que 𝑝 = 𝑋
𝑛 ~ 𝑁 𝑝, 𝑝 𝑞 𝑛
Hipótesis Nula:
𝑯
𝟎∶ 𝒑 = 𝒑
𝟎Estadístico de Prueba:
𝒁 =
𝑝 − 𝒑𝟎𝒑𝟎 𝒒𝟎
𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯
𝟎𝑯
𝒂𝑹𝑹
𝜶𝜷 𝒑′
𝒑 < 𝒑
𝟎𝒛 ≤ −𝒛
𝜶𝟏 − 𝜱 −𝒛𝜶 𝒑𝟎 𝒒𝟎
𝒑′𝒒′ + ( 𝒑𝟎− 𝒑′) 𝒑′𝒒′
𝒏
𝒑 > 𝒑
𝟎𝒛 ≥ 𝒛
𝜶𝜱 𝒛𝜶 𝒑𝟎 𝒒𝟎
𝒑′𝒒′ + ( 𝒑𝟎− 𝒑′) 𝒑′𝒒′
𝒏
𝒑 ≠ 𝒑
𝟎𝒛 ≥ 𝒛
𝜶𝟐 𝜱 𝒛𝜶 𝟐
𝒑𝟎 𝒒𝟎
𝒑′𝒒′ + ( 𝒑𝟎− 𝒑′) 𝒑′𝒒′
𝒏
− 𝜱 −𝒛𝜶 𝟐
𝒑𝟎 𝒒𝟎
𝒑′𝒒′ + ( 𝒑𝟎− 𝒑′) 𝒑′𝒒′
𝒏
Si 𝑛 𝑝
0≥ 10 y 𝑛 𝑞
0≥ 10.
El tamaño de muestra necesario para que una prueba de
nivel aproximado 𝛼 sea tal que 𝜷 𝒑
′≤ 𝜷
𝟎tomar
𝒏 ≥
𝒛𝜷𝟎 𝒑′𝒒′ + 𝒛𝜶 𝒑𝟎 𝒒𝟎 ( 𝒑𝟎−𝒑′ )
𝟐
si la hipótesis es unilateral y poner 𝑧
𝛼2