PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

(1)

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y tiene su analogía con los pasos que se realizan en un JUICIO.

Objetivo:

Aquí no se busca Estimar el parámetro 𝜃 sino determinar cuál de las hipótesis contrapuestas propuestas por el investigador es la correcta para cierto nivel.

Procedimiento de Prueba de Hipótesis

 El investigador establecerá las hipótesis en base a la teoría que quiere verificar, para un parámetro 𝜃.

 Tomar una muestra aleatoria de la población en estudio.

 Comparar lo observado con su teoría, si lo observado se

contrapone a su teoría se rechaza su hipótesis en caso

contrario se dice que no se observó cambio.

(2)

Primero definiremos los elementos necesarios para lleva adelante una Prueba de hipótesis.

a) El investigador debe establecer las hipótesis contrapuestas de interés para 𝜃, llamadas Hipótesis Nula (𝑯

_𝟎

) e Hipótesis Alternativa (𝑯

_𝒂

).

𝑯

_𝟎

hipótesis de no cambio, no diferencia, no mejoría, etc.

𝑯

_𝒂

hipótesis que el investigador pretende validar.

Si 𝜃 es el parámetro de interés y 𝜃

₀

un valor fijado por el investigador entonces en nuestro tratamiento de Prueba de hipótesis consideraremos estas posibles hipótesis alternativas

𝑯

_𝒂

∶

𝜽 ≠ 𝜽

_𝟎

𝑷𝒓𝒖𝒆𝒃𝒂 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍

𝜽 > 𝜽

_𝟎

𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 𝜽 < 𝜽

_𝟎

𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓

b) Estadístico de Prueba: estadístico con distribución conocida bajo hipótesis nula, sobre el cual se basará la decisión a tomar.

c) Región de Rechazo (RR): conjunto de valores del estadístico de prueba para los cuales 𝑯

_𝟎

será rechazada.

d) Luego 𝑯

_𝟎

será rechazada si el valor observado o alcanzado

del estadístico pertenece a la RR, en cuyo caso diremos que

la 𝑯

_𝒂

es la correcta. En caso contario diremos que no se

encontró evidencia suficiente para rechazar 𝑯

_𝟎

.

(3)

Al tomar una decisión se pueden cometer dos tipos de errores.

Error tipo I: Rechazar 𝑯

_𝟎

cuando 𝑯

_𝟎

es verdadera.

Error tipo II: Aceptar 𝑯

_𝟎

cuando 𝑯

_𝟎

es falsa.

Denotaremos con 𝛼 𝑦 𝛽 a las probabilidades de cometer los Errores tipo I y tipo II respectivamente.

Llamaremos nivel de significación de una prueba al valor

𝜶 = 𝐦𝐚𝐱

_𝜽𝝐𝜴_𝟎

𝜶 𝜽 , 𝒅𝒐𝒏𝒅𝒆 𝑯

_𝟎

: 𝜽𝝐𝜴

_𝟎

.

La RR determina las probabilidades de cometer cada uno de los

errores.

(4)

En resumen los pasos a seguir para realizar una Prueba de Hipótesis son:

a) Identificar el parámetro de interés.

b) Determinar las Hipótesis nula y alternativa para el problema.

c) Determinar el Estadístico de Prueba adecuado, con distribución conocida bajo 𝑯

_𝟎

.

d) Fijado un nivel de significancia 𝜶 determinar la Región de Rechazo.

e) Calcular el valor observado o alcanzado del estadístico de prueba con la muestra obtenida.

f) Determinar si 𝑯

_𝟎

debe ser rechazada o no para el

nivel de significación dado, estableciendo una

conclusión en el contexto del problema.

(5)

PROBLEMA:

Supongamos que el 10% de las tarjetas de circuito producidas por cierto fabricante son defectuosas.

Con el fin de reducir la proporción de tarjetas defectuosas se ha sugerido un nuevo proceso de producción.

En este caso 𝜃 = 𝑝 es la verdadera proporción de tarjetas defectuosas con este nuevo método de producción.

a) Establecer las hipótesis de interés.

b) Se tomó una muestra aleatoria de n=200 tarjetas producidas con este nuevo método. Determinar el Estadístico de Prueba.

c) Dada la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 15 , calcular el nivel de significancia aproximado y hallar una expresión para la probabilidad aproximada de cometer el Error de tipo II.

d) Si ahora la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 12 , calcular el nivel de significancia aproximado.

e) Si en la muestra aleatoria se obtuvo x=13 ¿cuál sería su conclusión? Usando la región de rechazo dada en el ítem c).

Observaciones:

i) 𝛽 𝑝 crece cuando 𝑝 se aproxima a 0,10.

ii) 𝛼 = max

_𝑝≥0,10

𝛼 𝑝 = 𝛼 0,10 . Luego esta prueba sigue teniendo el mismo nivel de significancia para la hipótesis simplificada 𝐻

₀

: 𝑝 = 0,10.

Por lo tanto de ahora en más nuestra hipótesis nula será:

𝑯

_𝟎

∶ 𝜽 = 𝜽

_𝟎

(6)

Pruebas de Hipótesis para la media poblacional

Así como hicimos en IC consideraremos diferentes situaciones para plantear Prueba de Hipótesis.

Hipótesis Nula:

𝑯

_𝟎

∶ 𝝁 = 𝝁

_𝟎

Caso A:

Sea 𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

una m.a. de 𝑁(𝜇, 𝜎

²

) con 𝜎

²

conocido.

Bajo estos supuestos sabemos que 𝑿 ~ 𝑵 𝝁, 𝝈

^𝟐

𝒏 ⇔ 𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) Estadístico de Prueba

𝑿 −𝝁_𝟎

𝝈

𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯

𝟎

Si la Hipótesis alternativa fuese:

𝑯

_𝒂

∶ 𝝁 < 𝜇

_𝟎

Fijado un nivel de significancia 𝛼 entonces veamos cómo

definir la Región de Rechazo (𝑅𝑅

_𝛼

) y estudiemos el

comportamiento de la función 𝛽.

(7)

𝑹𝑹

_𝜶

= 𝒙 ≤ 𝒌

_𝜶

= −𝒛

_𝜶

𝝈

𝒏 + 𝝁

_𝟎

= 𝒛 ≤ −𝒛

_𝜶

La probabilidad de cometer el error tipo II es:

𝜷 𝝁′ = 𝟏 − 𝜱 −𝒛

_𝜶

+

^{( 𝝁}^𝟎^−𝝁′)

𝝈

𝒏 , ∀ 𝝁′ < 𝝁

_𝟎

.

Observaciones sobre esta función:

i) lim

_𝜇→𝜇₀⁻

𝛽 𝜇 = 1 − 𝛼 y lim

_{𝜇 →−∞}

𝛽 𝜇 = 0.

ii) 𝛽 es una función creciente con punto de inflexión en 𝑘

_𝛼

.

Ahora si queremos determinar el tamaño de muestra necesario para que una prueba de nivel 𝛼 sea tal que

𝜷 𝝁

^′

≤ 𝜷

_𝟎

Entonces:

𝒏 ≥

^𝒛^𝜷𝟎^{+ 𝒛}^𝜶

( 𝝁_𝟎−𝝁′ )

𝝈

𝟐

.

(8)

Ejercicio (8.18)

Se sabe que el tiempo de secado de cierto tipo de pintura, bajo ciertas condiciones de prueba, está normalmente distribuido con valor medio de 75 minutos y una desviación estándar de 9 minutos.

Unos químicos han diseñado un nuevo aditivo para reducir el tiempo medio de secado de la pintura. Se supone que el tiempo de secado para la pintura con el nuevo aditivo seguirá teniendo distribución normal con desviación estándar de 9 minutos.

Debido al gasto asociado con el aditivo, la evidencia debe sugerir de forma contundente una disminución en el tiempo medio de secado (𝜇) para su aceptación.

a) Plantear las hipótesis pertinentes.

b) Dar el estadístico de prueba y su distribución bajo hipótesis nula.

c) Se tomó una muestra aleatoria de tamaño 25 obteniéndose un promedio muestral de 72,3 minutos. ¿Cuál sería su conclusión usando un nivel de significancia de 0,01? Justifique su respuesta.

d) ¿Cuál es el nivel de significación para la 𝑅𝑅= 𝑧 ≤ −2,88 ? e) Para la RR dada en el ítem d), dar el valor de la probabilidad

de cometer el error tipo II cuando 𝜇 =70.

f) Para la RR dada en el ítem d), ¿cuál es el menor tamaño de

muestra que debería tomar para asegurar que 𝛽 70 ≤ 0,01?

(9)

Nivel de significación y P(error tipo II cuando μ=70)

68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 0,00

0,02 0,04 0,07 0,09 0,11 0,13 0,16 0,18 0,20 0,22

Densidad

P(errortipo I)=0,0020

68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 0,00

0,02 0,04 0,07 0,09 0,11 0,13 0,16 0,18 0,20 0,22

Densidad

P(error tipo II en 70)=0,5398

(10)

De igual forma se puede trabajar con las otras dos hipótesis alternativas y que se pueden resumir como sigue.

Supuestos:

Sea 𝑿

_𝟏

, 𝑿

_𝟐

, … , 𝑿

_𝒏

una m.a. de 𝑵(𝝁, 𝝈

^𝟐

) con 𝝈

^𝟐

conocido.

Hipótesis Nula:

𝑯

_𝟎

∶ 𝝁 = 𝝁

_𝟎

Estadístico de Prueba:

𝒁 =

^𝑿^−𝝁^𝟎

𝝈

𝒏 ~ 𝑵(𝟎, 𝟏) , bajo ^𝑯

𝟎

𝑯

_𝒂

𝑹𝑹

_𝜶

𝜷 𝝁

𝝁 < 𝜇

_𝟎

𝒛 ≤ −𝒛

_𝜶 _{𝟏 − 𝜱 −𝒛}

𝜶 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏

𝝁 > 𝜇

_𝟎

𝒛 ≥ 𝒛

_𝜶 _{𝜱 𝒛}

𝜶 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁

_𝟎

𝒛 ≥ 𝒛

^𝜶

𝟐 𝜱 𝒛^𝜶

𝟐 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏 − 𝜱 −𝒛^𝜶

𝟐 +( 𝝁_𝟎− 𝝁) 𝝈 𝒏

El mínimo tamaño de muestra necesario para que una prueba de nivel 𝛼 sea tal que

𝜷 𝝁

^′

≤ 𝜷

_𝟎

tomar 𝒏 ≥

^𝒛^𝜷𝟎^{+ 𝒛}^𝜶

( 𝝁_𝟎−𝝁′ )

𝝈

𝟐

si la hipótesis es unilateral y poner 𝑧

^𝛼

2

en lugar de 𝑧

_𝛼

si la hipótesis es

bilateral. Problemas 8.10 y 8.11

(11)

Caso B:

Sea 𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

una m.a. con media y varianza 𝜇 𝑦 𝜎

²

. Si el tamaño de muestra es suficientemente grande entonces por TCL:

𝑿 ~ 𝑵 𝝁, 𝝈

^𝟐

𝒏 ⇔ 𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)

Pedir 𝑛 ≥ 30 si la varianza es conocida y si es desconocida reemplazar 𝜎 por S y pedir 𝑛 ≥ 40, luego todo es igual que en el Caso A.

Hipótesis Nula:

𝑯

_𝟎

∶ 𝝁 = 𝝁

_𝟎

Estadístico de Prueba:

𝒁 =

^𝑿^−𝝁^𝟎

𝝈

𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯

_𝟎

𝑯

_𝒂

𝑹𝑹

_𝜶

𝜷 𝝁

𝝁 < 𝜇

_𝟎

𝒛 ≤ −𝒛

_𝜶 _{𝟏 − 𝜱 −𝒛}

𝜶 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏

𝝁 > 𝜇

_𝟎

𝒛 ≥ 𝒛

_𝜶 _{𝜱 𝒛}

𝜶 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁

_𝟎

𝒛 ≥ 𝒛

^𝜶

𝟐 𝜱 𝒛^𝜶

𝟐 + ( 𝝁_𝟎− 𝝁)

𝝈 𝒏 − 𝜱 −𝒛^𝜶

𝟐 +( 𝝁_𝟎− 𝝁) 𝝈 𝒏

Si el 𝜎 es desconocido reemplazarlo por S, siempre que

𝑛 ≥ 40.

(12)

El mínimo tamaño de muestra necesario para que una prueba de nivel aproximado 𝛼 sea tal que 𝜷 𝝁

^′

≤ 𝜷

_𝟎

tomar 𝒏 ≥

^𝒛^𝜷𝟎^{+ 𝒛}^𝜶

( 𝝁_𝟎−𝝁′ )

𝝈

𝟐

si la hipótesis es unilateral y poner 𝑧

^𝛼

2

en lugar de 𝑧

_𝛼

si la hipótesis es bilateral.

Caso C:

Sea 𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

una m.a. de 𝑁(𝜇, 𝜎

²

) con 𝜎

²

desconocido.

Bajo estos supuestos sabemos que 𝑿 − 𝝁

𝑺 𝒏 ~ 𝒕

𝒏−𝟏

Hipótesis Nula:

𝑯

_𝟎

∶ 𝝁 = 𝝁

_𝟎

Estadístico de Prueba:

𝑻 = ^𝑿 ^−𝝁

^𝟎

𝑺 𝒏 ~ 𝒕 _𝒏−𝟏 , bajo 𝑯 _𝟎

(13)

𝑯

_𝒂

𝑹𝑹

_𝜶

𝝁 < 𝜇

_𝟎

𝒕 ≤ −𝒕

_𝜶

𝝁 > 𝜇

_𝟎

𝒕 ≥ 𝒕

_𝜶

𝝁 ≠ 𝝁

_𝟎

𝒕 ≥ 𝒕

^𝜶

𝟐,𝒏−𝟏

En este caso es muy complicado dar la expresión de la probabilidad de cometer el Error Tipo II y determinar el valor de n.

Problema 8.29

Pruebas de Hipótesis para la Proporción poblacional

Supuestos:

Sea 𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

una m.a. de Bernoulli de parámetro 𝑝, entonces la variable 𝑋 =

^𝑛_𝑖=1

𝑋

_𝑖

~ B(n, p) . Aquí tendremos dos casos a considerar:

i) Si n es suficientemente grande.

ii) Si n es pequeño.

(14)

Caso i)

Por TCL sabemos que 𝑝 = 𝑋

𝑛 ~ 𝑁 𝑝, 𝑝 𝑞 𝑛

Hipótesis Nula:

𝑯

_𝟎

∶ 𝒑 = 𝒑

_𝟎

Estadístico de Prueba:

𝒁 =

^{𝑝 − 𝒑}^𝟎

𝒑_𝟎 𝒒_𝟎

𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯

𝟎

𝑯

_𝒂

𝑹𝑹

_𝜶

𝜷 𝒑′

𝒑 < 𝒑

_𝟎

𝒛 ≤ −𝒛

_𝜶

𝟏 − 𝜱 −𝒛_𝜶 𝒑_𝟎 𝒒_𝟎

𝒑^′𝒒′ + ( 𝒑_𝟎− 𝒑′) 𝒑^′𝒒′

𝒏

𝒑 > 𝒑

_𝟎

𝒛 ≥ 𝒛

_𝜶

𝜱 𝒛_𝜶 𝒑_𝟎 𝒒_𝟎

𝒑^′𝒒′ + ( 𝒑_𝟎− 𝒑′) 𝒑^′𝒒′

𝒏

𝒑 ≠ 𝒑

_𝟎

𝒛 ≥ 𝒛

^𝜶

𝟐 𝜱 𝒛𝜶 𝟐

𝒑_𝟎 𝒒_𝟎

𝒑^′𝒒′ + ( 𝒑_𝟎− 𝒑′) 𝒑^′𝒒′

𝒏

− 𝜱 −𝒛𝜶 𝟐

𝒑_𝟎 𝒒_𝟎

𝒑^′𝒒′ + ( 𝒑_𝟎− 𝒑′) 𝒑^′𝒒′

𝒏

Si 𝑛 𝑝

₀

≥ 10 y 𝑛 𝑞

₀

≥ 10.

El tamaño de muestra necesario para que una prueba de

nivel aproximado 𝛼 sea tal que 𝜷 𝒑

^′

≤ 𝜷

_𝟎

tomar

(15)

𝒏 ≥

^𝒛^𝜷𝟎^𝒑

′𝒒′ + 𝒛_𝜶 𝒑_𝟎 𝒒_𝟎 ( 𝒑_𝟎−𝒑′ )

𝟐

si la hipótesis es unilateral y poner 𝑧

^𝛼

2

en lugar de 𝑧

_𝛼

si la hipótesis es bilateral.

Problema 8.35.

ii) Si n es pequeño la prueba estadística estará basada en

Hipótesis Nula:

𝑯

_𝟎

∶ 𝒑 = 𝒑

_𝟎

Estadístico de Prueba:

𝑿 =

^𝒏_𝒊=𝟏

𝑿

_𝒊

~ 𝐁(𝐧, 𝒑

_𝟎

) bajo 𝑯

_𝟎

Problema 8.9

p-valor para una prueba de Hipótesis

(16)

Definición:

Se llama p-valor o nivel de significancia alcanzado al mínimo nivel de significancia a partir del cual rechazaría la hipótesis nula para un conjunto dado.

Una vez calculado el p-valor la conclusión a un nivel de significancia 𝛼 será

Si p − valor ≤ α entonces rechazar 𝐻

₀