TEST DE CONTRASTE DE HIPÓTESIS

(1)

Capítulo II

TEST DE CONTRASTE DE HIPÓTESIS

... …...

Objetivo del Capítulo

Desarrollar la metodología de prueba

de hipótesis como una técnica para

analizar

diferencias

y

tomar

decisiones; determinar los riesgos

implicados al tomar tales decisiones si

nos

basamos

únicamente en

la

(2)

2.1 INTRODUCCIÓN

Existen múltiples problemas en los cuales, en vez de estimar el valor de un parámetro, debemos decidir si una afirmación relativa a un parámetro es verdadera o falsa; esto es, debemos probar una hipótesis relativa a un parámetro. Por ejemplo, en un trabajo de control de calidad una muestra aleatoria puede servir para determinar el hecho de que la “media del proceso” (con base en una clase determinada de medición) ha permanecido inalterada o bien si ha cambiado a tal grado que el proceso esté “fuera de control” y tenga que hacerse ajustes.

La comprobación de hipótesis estadísticas es quizás el área más importante de la inferencia estadística y, por consiguiente, de la teoría de la decisión.

Dado que una hipótesis estadística que involucra a una o más poblaciones, decimos que una suposición o afirmación establecida por el investigador, puede ser verdadera o falsa. La verdad o falsedad de una hipótesis estadística nunca se conoce con certidumbre a menos que se examine a la población total. Esto, por supuesto, no sería posible por lo que se escoge una muestra al azar de la población en estudio y se utiliza la información contenida en dicha muestra para decidir si la hipótesis es falsa o verdadera. Si la información obtenida en esa forma muestra inconsistencia con la información establecida se rechaza la hipótesis; si ocurre lo contrario la hipótesis se acepta. Debe tomarse en cuenta que la aceptación de una hipótesis estadística es el resultado de una insuficiente evidencia o información para rechazarla y no necesariame nte implica que dicha hipótesis es verdadera. Cuando las hipótesis establezcan las diferencias entre dos grupos de observaciones, se deben obtener tales observaciones en dos muestras, y los resultados finales estarán comparando dos poblaciones de donde provienen las muestras; esta situación es diferente a la de hacer inferencias a partir de una sola muestra proveniente de una sola población, en este capítulo las pruebas estadísticas para llevar acabo estas serán tanto la distribución normal “Z” como la distribución “t” de Student.

Por cierta característica de algunos problemas se conoce la proporción de ocurrencia de un evento, por lo cual las hipótesis estarán en términos de dichas proporciones. Cuando la única información que se tiene son las varianzas muestrales, obtenidas como estimadores a partir de dos muestras, de la varianza poblacional, se aplicará la prueba de la razón de varianzas para contrastar hipótesis acerca de varianzas.

2.2 TEST DE CONTRASTE DE HIPÓTESIS

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (Ha).

La situación se puede esquematizar:

H0 cierta H0 falsa Ha cierta

H0 rechazada Error tipo I ( ) Decisióncorrecta (*) H0 no rechazada Decisión correcta Error tipo II ( ) (*) Decisión correcta que se busca

(3)

Siempre que se rechaza una Hipótesis se corre el riego de cometer un error del tipo I

 p(rechazar H0|H0 cierta)

siempre que se acepta una Hipótesis nula existe el riego de cometer al error tipo II

 = p(aceptar H0|H0 falsa)

Potencia =1- 0|H0 falsa)

Cuando se lleva a cabo un test de contraste de hipótesis, se ha de comenzar por establecer las hipótesis nula y alternativa, recordando que la hipótesis nula ha de contener obligatoriamente una igualdad.

Por lo general, se establece como hipótesis alternativa, la que trata de probar a lgo que significa un cambio sobre lo que se encuentra preestablecido (por resultados anteriores al test o por inercia) y que está representado por la hipótesis nula. La hipótesis nula es siempre conservadora, frente a la alternativa que propugna el cambio.

Detalles a tener en cuenta: 1.  

2. Sólo pueden disminuirse las dos, aumentando n.

Los pasos necesarios para realizar un contraste relativo a un parámetro  son:

 Establecer la hipótesis nula en términos de igualdad

O O

H  

 Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador

O O

O a

H   ,   ,  

en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral

(derecho en el 2º caso, o izquierdo en el 3º) o una cola.

 Elegir un nivel de significación: nivel crítico para  que puede ser: (0.10, 0.05 ó 0.01, etc.).

 Determinar la función de distribución (función pivotal) que minimice la probabilidad de error, es decir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con  y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que  si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H0.

Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H0, por eso es necesario que tenga la igualdad.

(4)

Se estudia para el nivel de significación dado, si se puede rechazar o no la hipótesis nula. Esto se hace viendo si la media obtenida se encuentra dentro de la región crítica asociada al nivel de significación, o si por el contrario, está fuera.

 Decisión: Verificar si el valor experimental pertenece a la RA/H0 ó RR/Ho

 Conclusión.

Si "se rechaza la hipótesis nula", la conclusión debe ser redactada:

"Existe evidencia suficiente al nivel de significación  ...(Significado de la hipótesis alternativa)"

Si por el contrario la decisión es "no se puede rechazar la hipótesis nula", la conclusión debería ser redactada:

"No existe suficiente evidencia al nivel de significación  que indique que ...(significado de la hipótesis alternativa)"

2.3 PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL

a) Cuando la varianza poblacional es conocida o n grande

Ho:  O Ho: O Ho: O

Ha:  O Ha:  O Ha:  O

Estadísitico de contraste sería:

n x

    

_

Ejemplo 1

Se saca una muestra de 36 análisis de nitratos (NO3) para el diseño de una planta de tratamiento de aguas industriales. Para esto, se calcula un promedio estadístico de x92mg/L. Estudios previos indican una desviación estándar conocida de  9mg/L. Probar la hipótesis de que el valor esperado de µ es 100 mg/L. Asumir 0.05 y calcular el valor de la probabilidad p.

Solución:

1. La hipótesis nula es: Ho: µ = 100. La hipótesis alternativa es Ho: 100

2. Las suposiciones son que la poblacional muestreada es normal, es conocida y, la muestra es aleatoria.

3. Con el nivel de significancia de 0.05 (nivel de confianza 95%), las regiones críticas y los coeficientes críticos son de ±1.96.

(5)

4. La estadística usada es la de la distribución z ,

n x

Z  _= 5.3

36 9

100 92 __

 Z

5. Ahora comparando la z=-5.3 experimental con la z=1.96 tabulada, se rechaza la hipótesis nula

6. El valor de la probabilidad p se calcula buscando el valor de –5.3 en la tabla de la

distribución normal (exel), Z (-5.3=). Además, como la prueba es bilateral, entonces, multiplicamos 5.79013E-07 por 2, es decir, (2)( 5.79013E-07) = 1.15803E-07

Este valor es muy significante y da evidencia para apoyar el rechazo de la hipótesis.

Ejemplo 2

Un psicologo le da a un chimpancé 46 gr. de cacahuate a través de una máquina automática para que se ponga a bailar; la variable se distribuye normalmente con una media (= 46 gr). Si el contenido medio es inferior a 46 gr. el chimpancé brinca, corre y se olvida de la respuesta; por otra parte, si el contenido es superior el chimpancé se satisface rápidamente y emite respuestas. Se sabe que la desviación estándar es de 5 gr. Si se toma una muestra n=25 y se encontró una media de 45.5 gr de cacahuate, contraste las hipótesis establecidas.

Ho: 46 Ha: 46

Nivel de significancia:  = 0.05

Estadístico de contraste sería(varianza conocida): 0.5

25 5

46 5 . 45

_

   

  

n x



Región crítica (para  = 0.05,  1.64):

Decisión: Zexp = -0.5 < 1.64. Pertenece a la región de aceptación, por lo tanto no podemos rechazar Ho.

Conclusión: No existe evidencia suficiente al nivel de significación  la máquina está arrojando la cantidad media como para que el chimpancé baile.

Ejemplo 3

(6)

Solución: Ho:  50 Ha: 50

Nivel de significancia:  = 0.05

Estadístico de contraste sería(varianza conocida): 2.03

19 5 . 1

50 3 . 49

_

      

n x



Región crítica (para  = 0.05, Z 1.96

2



 ):

Región crítica: Z < - 1.96 o Z > 1.96

Decisión: El valor experimental (Z = -2.03) pertenece a la región de rechazo RR/Ho, rechazamos la hipótesis nula, aceptamos la hipótesis alterna.

Conclusión: Existe evidencia suficiente al nivel de significación 

promedio de calorías por botella no está cumpliendo las especificaciones indicadas en la botella.

b) Cuando la varianza poblacional es desconocida y n peque ña

Ho:  O Ho:  O Ho: O

Ha:  O Ha:  O Ha:  O

El estadístico para el contraste es:

n s x t 

_

 , 1



t

_ _n

Ejemplo 1

Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 26 sujetos y encontramos:

_

(7)

P

o

b

l

a

c

i

ó

n

N

1₁

Muestra n1

P

o

b

l

a

c

i

ó

n

N

2₂

Muestra n2 Comparación

Muestras independientes

Solución

Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es:

18 :

 

 

Ha Ho

Es un contraste lateral derecho.

Fijamos "a priori" el nivel de significación en 0,05

El estadístico para el contraste es :

n s x t  

_

La región crítica T > t_

En este ejemplo t(25, 0,05) =1.708.

Calculamos el valor de “t” en la muestra : 0.7082

26 6 . 3

18 5 .

18  _



T

El valor experimental no está en la región crítica (no es mayor que 1,708), por tanto no podemos rechazar H0, esto quiere decir que la presión sistólica media en varones no es mayor que 18 cm de Hg.

Ejemplo 2

El pan integral sandwich de Productos Unión debe tener un peso de 250 Gr. el departamento de control de calidad, para verificar si el proceso está bajo control, selecciona una m.a. de 15 panes y los pesa, obteniéndose los siguientes datos:

248, 248, 245, 253, 250, 249, 244, 252, 253, 248, 247, 247, 252, 250, 247 Si usted fuera el jefe de control de calidad. ¿Qué recomendaría?

2.4 PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES

a) Cuando se conoce la varianza poblacional o n bastante grande

Ho:  O Ho:  O Ho: O

(8)

El estadístico sería:









2 2 2 1 2 1 2 1 2 1 n n x x          

Regiones críticas para probar

Hipótesis alterna Rechaza la Ho si

Ejemplo 1:

Un psicologo efectúa un estudio acerca del uso de una tarjeta de crédito en una muestra formada por 62 personas (32 hombres y 30 mujeres). Este investigador encontró que después de 5 días de haber entregado la tarjeta, el promedio de gastos efectuados con dicha tarjeta fueron los siguientes: Hombres: $730.00 y Mujeres: $820.00, con varianzas de $144.00 y de $162.00, respectivamente; a simple vista no se puede concluir que las mujeres gasten más que los hombres, se quiere saber si la diferencia es estadísticamente significativa o no.

Hombres Mujeres

32 144 730 2    h h h n s x 30 162 820 2    m m m n s x

1. Ho: m h

Ha: m h

2.  0.05

3.



 



h h m m h m h m n n x x 2 2            

=



 



28.60

1464 . 3 90 32 144 30 162 730 820     

 m h

4.

5. Desición: El valor de la distribución Zexperimental pertenece a la región de rechazo, entonces rechazamos Ho, aceptamos la Ha.

6. Conclusión: Al nivel de significancia del 5% la diferencia es significativa; por lo tanto se concluye que las mujeres gastaron más que los hombres (en los primeros 5 días).

0 0 0 2 1 2 1 2 1             2 2     Z Z Z Z Z Z Z Z         h m 

(9)

Ejemplo 2:

Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0 onzas. Las distribuciones de los volúmenes de llenado pueden suponerse normales, con desviaciones estándar

1 = 0.020 y 2 = 0.025 onzas. Un miembro del grupo de ingeniería de calidad sospecha que el volumen neto de llenado de ambas máquinas es el mismo. De cada máquina se toma una muestra aleatoria de 9 botellas.

¿Se encuentra el ingeniero en lo correcto?

Máquina 1 Máquina 2

16,03 16,01 16,04 16,02 16,03 15,97 16,05 16,05 16,02 15,96 16,01 15,99 15,96 15,98 16,02 16,04 16,02 16,00

b) Cuando no se conoce la varianza poblacional y n pequeño

Ho: ₁ ₂ Ho: ₁ ₂ Ho: ₁ ₂ Ha: 1 2 Ha: 12 Ha: 1 2

Si tenemos poblaciones finitas y n₁ y n₂ pequeñas y las varianzas poblacionales desconocidas entonces el estadístico sería:









, 2 2 1 2 2 1 2 1 n s n s x x t p p    

   donde

2 )

1 (

)

1 (

2 1 2 2 2 2 1 1 2













n

s

n

s

n

s

_p

Regiones críticas para probar

Hipótesis alterna Rechaza la Ho si

Ejemplo 1:

Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para determinar el contenido en nicotina y obtiene los resultados siguientes (en miligramos).

Marca A : 24 26 25 22 23 Marca B : 27 28 25 29 26

¿Los resultados anteriores, señalan que existe una diferencia en el contenido medio de nicotina en ambas marcas?

Solución

Ho: 1 2

Ha: 1 2

(10)

Estadísticos obtenidos a traves de las muestras 58 . 1 , 27 58 . 1 ,

24   

 _A _B _B

A S x S

x

Si tenemos poblaciones finitas y n₁ y n₂ pequeñas y las varianzas poblacionales desconocidas

entonces el estadístico será:









,

2 2 1 2 2 1 2 1 n s n s x x t p p _       donde 2 ) 1 ( ) 1 ( 2 1 2 2 2 2 1 1 2       n n s n s n

s_p = 2.5

8 ) 58 . 1 ( 4 ) 58 . 1 (

4 2 2

2   

p S





3 5 5 . 2 5 5 . 2 0 27 24       t

Regla de decisión

Si tot o tot rechazamosHo

2 2   306 . 2 ) 8 , 025 . 0 ( ) 2 , 2

( ₁ ₂  

   t t n n 

Como la distribución t observada = -3 < t tabulada = -2.306, podemos concluir al nivel de significancia del 5% que existe una diferencia significativa en el contenido medio de nicotina en ambas marcas.

2.5 PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES

(MUESTRAS DEPENDIENTES)

N1 N2

n1 (antes)

(11)

El procedimiento para comparar las medias de dos muestras dependientes es muy diferente del que se sigue cuando las muestras son independientes.

Un procedimiento comúnmente usado que da como resultado dos muestras no independientes es la denominada prueba "antes y después". Las mediciones se hacen sobre la muestra de sujetos tanto antes como después de la introducción de algún fenómeno. La presión sanguínea de un grupo de atletas se puede tomar antes y después de un período de ejercicios, en este caso el interés se concentra en la magnitud del cambio que registran las dos mediciones.

También pueden compararse dos clases de observaciones cuando una muestra se divide de tal forma que la mitad experimente un fenómeno y la otra mitad experimente otro.

Pasos de una prueba de Hipótesis para comparaciones pareadas

Paso 1 Planteamiento de hipótesis

Ho: d 0 Ho: d 0 Ho: d 0

Ha: d d Ha: d d Ha: d d

Paso 2 Nivel de significancia

 = (0.01, 0.05, 0.10)

Paso 3 Función pivotal:

n d

d d





 Si la varianza de la población es conocida

n s d t

d d





 Si no se conoce la varianza de la población

Donde: d = x – y

n d d

n i

i





 1

d

 = diferencia media supuesta

d

 = desviación estándar de la población de los resultados de diferencia n = tamaño de muestra

Paso 4 Determinar las regiones de aceptación y rechazo para Ho

Paso 5 Calcular el valor experimental o crítico, que se obtiene reemplazando los datos del problema en el paso 3.

Paso 6 Decisión: Verificar si el valor experimental pertenece a la RA/H0 ó RR/Ho

Paso 7 Conclusión

También es posible estimar la diferencia media en datos pareados. La formula utilizada para esta estimación por Intervalo de confianza es:

n s t

d d

nd )

, 2 ( 1

 _

Ejemplo 1

(12)

Paciente : 1 2 3 4 5 6 7 8 9 10 Antes :75 62 67 70 55 59 60 64 72 59 Después :77 65 68 72 62 61 60 67 75 68

¿El programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes?

Solución

Ho: d 0

Ha: d d

 = 0.05

n s d t

d d





 = 3.692

d = (y – x)

Decisión: La t experimental = 3.692 > t tabular 2.26. Por lo tanto el valor experimental pertenece a la región de rechazo.

Conclusión: Al nivel de significancia del 5% podemos decir que el programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes.

También es posible estimar la diferencia media en datos pareados. La formula utilizada para esta estimación por Intervalo de confianza es:

n s t

d d

n_d ) , 2 ( _₁

 _ =<1.2395, 5.1605>

Reporte del SPSS

1° base de datos

(13)

3° Salida

Es tadísticos de m ue str as re lacionadas

64.3000 10 6.49872 2.05508 67.5000 10 5.79751 1.83333 A NTES

DESPUES Par 1

Media N

Desv iación típ.

Error típ. de la media

Prue ba de m ues tras re lacionadas

3.2000 2.74064 1.2395 5.1605 3.692 9 .005 DESPUES - A NTES

Media

Desv iación

típ. Inf erior Superior 95% Intervalo de conf ianz a para la

dif erencia Dif erencias relacionadas

t gl

Sig. (bilateral)

Regla de decisión: Sig = 0.005< 0.05, por lo tanto al nivel de significancia del 5% podemos decir que el programa educativo fue eficaz con respecto al incremento del conocimiento de los pacientes.

2.6 PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL

(14)

Por otro lado, en la ingeniería ambiental estamos interesados en saber qué fracción de las industrias están cumpliendo con las legislaciones ambientales. También, es de interés social saber qué fracción de los jóvenes universitarios usan determinadas drogas. Igualmente, es de interés saber qué fracción o proporción de personas que puedan estar conscientes de la magnitud del problema de la contaminación ambiental, etc.

Las pruebas de hipótesis con la estadística p (que estima a ) de proporción están basadas en una muestra aleatoria de tamaño n de la población muestreada. Si el tamaño de la muestra n es pequeño, con relación al tamaño poblacional, el promedio x tiene aproximadamente una distribución binomial. Además, si n es grande, el promedio x y el estimador p = X/n posee una distribución binomial. Pero si n es grande, se usa la distribución normal como una aproximación a la binomial.

Las condiciones para usar la distribució n binomial es tener un número fijo de ensayos independientes, que tengan probabilidades constantes y de que, cada ensayo, tenga dos resultados clasificados como “éxito” o “fracaso”.

El planteamiento de la hipótesis sería:

Ho: PP0 Ho: PP0 Ho: PP0

Ha: P P0 Ha: PP0 Ha: PP0

La función de prueba para valores de n  30 es:

Donde:

P=proporción muestral

Po=proporción poblacional o valor esperado q=1-p

n=tamaño de muestra

La función de prueba para valores de n  30 es:

Ejemplo 1:

Un grupo ambiental afirma que los incidentes de las aves que chocan con los aviones son muy raros, es decir, como para justificar la matanza de a ves en los aeropuertos. Sin embargo, un grupo de pilotos aviadores afirman que, en el despegue de los aviones, en el 10% de los casos, las aves chocan contra el avión. Usar = 0.05

para probar esta afirmación. La muestra es de 150 despegues abortados de aviones, de los cuales 5 se debieron a choque contra las aves.

Solución:

Se usa la distribución normal como aproximación a la binomial, porque np 5 y nq5, es decir, (150)(0.10) = 15 y nq = (150)(0.90) = 135.

Debido a que el reclamo es del 10%, entonces, la fracción = p = 0.10. Lo opuesto del reclamo original es = 0.10.

n

)/n

p

-(1

p

-P

=

z

(0,1)

o o

o



t )/n p -(1 p

p -P =

t (n-1)

o o

o

(15)

3. Debido a que  = 0.10 contiene la condición de igualdad, la hipótesis nula y la alternativa son: Ho: =0.10

Ha:  0.10

El nivel de significancia es de  = 0.05.

La estadística apropiada para probar si p = 5/150 = 0.033 es usando la estadística z que se apro xima a la distribución binomial.

Los valores críticos con = 0.05 son z = ±1.96

Debido a que el valor de –2.79 cae en la región crítica izquierda, se rechaza la hipótesis.

Ejemplo 2:

El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde?

Solución

P = 0.60, n = 120, 0.625, 0.05 120

75

ˆ    

p

Como n > 30, entonces la distribución normal para _0.95_ 1.645

05 . 0

60 . 0 :

0

  



P H

a

56 . 0

120 40 . 0 60 . 0

60 . 0 625 .

0  _

 

x

o

Decisión: Como Zo pertenece a la RA/Ho, entonces no podemos rechazar Ho

Conclusión: Al nivel de significancia del 5% los datos no proporcionan suficiente evidencia como para aceptar la opinión del alcalde.

Ejemplo 3:

Por evidencia experimental se sabe que cierta droga pediátrica es eficaz en un 80% de los casos, cuando esta correctamente administrada. Se aplica dicha droga a 400 niños y se obtiene únicamente 300 resultados positivos. ¿Puede considerarse este resultado como evidencia de que la droga no estuvo bien administrada?

79 .

2

150

90 .

0

10 .

0

10 .

0

033 .

0 _

_

)/

(

-=

(16)

Solución

P = 0.80, n = 400, 0.75, 0.05 400

300

ˆ    

p

Como n > 30, entonces la distribución normal para _0.95_ 1.645

05 . 0 80 . 0 : 80 . 0 : 0     P H P H a 5 . 2 400 20 . 0 80 . 0 80 . 0 75 . 0      x o

Decisión: Como Zo pertenece a la RA/Ho, entonces no podemos rechazar Ho

Conclusión: Al nivel de significancia del 5% los datos confirman que existe evidencia de que la droga no estuvo bien administrada.

2.7 PRUEBA PARA LA DIFERENCIA DE PROPORCIONES (P1 - P2)

Ho: P₁ P₂ Ho: P₁  P₂ Ho: P₁ P₂ Ha: P₁ P₂ Ha: P₁ P₂ Ha: P₁  P₂

Prueba bilateral Pruebas unilaterales

La función de prueba es:



 



) 1 , 0 ( . . ˆ ˆ 2 2 2 1 1 1 2 1 2 1 n n q P n q P P P p p o        Ejemplo 1:

En un estudio referente a las preferencias sobre la envoltura de papas fritas en hojuelas. Se entrevistó a un grupo de 100 mujeres de altos ingresos y un grupo de 200 mujeres de bajos ingresos. Los resultados de sus selecciones se dan a continuación:

Grupo de mayores ingresos Grupo de menores ingresos Preferencia de paquete metálico 36 84 Preferencia de paquete en papel encerado 39 51

Preferencia en papel celofán 16 44

No tiene preferencia 9 21

Determine si existe diferencia significativa entre la opinión de las mujeres de alto ingreso con las mujeres de bajo ingreso en cuanto a la envoltura metálica.

Solución

Ho: P1 P2

(17)

05 . 0  



 



) 1 , 0 ( . . ˆ ˆ 2 2 2 1 1 1 2 1 2 1 _n n q P n q P P P p p o      







1.02

200 58 . 0 42 . 0 100 64 . 0 36 . 0 0 42 . 0 36 .

0 __

     x x o 42 . 0 200 84 ˆ 36 . 0 100 36

ˆ₁   p₂  

p

Decisión: El valor experimental pertenece a la región de aceptación, por lo tanto no podemos rechazar la hipótesis nula.

Conclusión: Al nivel de significancia del 5% la prueba no es significativa, esto quiere decir que no existe diferencia significativa entre la opinión que tienen las mujeres de alto ingreso con las de bajo ingreso con respecto a la envoltura metálica.

2.8 PRUEBA DE HIPÓTESIS SOBRE LA VARIANZA POBLACIONAL

El interés es probar la hipótesis nula de que la varianza de una población es igual a una constante determinada contra una alternativa unilateral o bilateral adecuada

Estadístico de prueba: ₂

2 2 ( 1)

(18)

donde S2 es la varianza muestral. Ahora si Ho: 02

2 

  es verdadera, entonces el estadístico de prueba X2o sigue una distribución ji-cuadrada con n-1 grados de libertad. Por consiguiente, se calcula el valor de la estadística de prueba 02, y la hipótesis Ho:

2 0

2 

  debe rechazarse si:

2 1 , 2 / 1 2 2 1 , 2 / 2      n o n o si o      

donde _2_/₂_,_n_₁ y ₁2___/₂_,_n_₁ son los puntos que corresponden a los porcentajes 100/2 inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad, respectivamente.

Ejemplo 1:

Un investigador está convensido de que su equipo de medición tiene una variabilidad que arroja una desviación estándar de 2. Dieciséis mediciones dieron como resultado un valor de 26.1

S :

¿Contradicen los datos su afirmación?. Use  0.05

4 : 4 : 2 2     Ha Ho 05 . 0   2  2 2 2 ( 1)

o o

S n



   = 22.875

4 ) 1 . 6 ( 15 

Conclusión: al nivel de significancia del 5% no podemos rechazar la afirmación del experimentador.

PROBLEMAS DE REPASO DEL CAPÍTULO

1. Una muestra aleatoria de 36 concentraciones atmosféricas de óxido de nitrógeno (NOx), en mg/L, mostró un promedio estadístico de x74.0mg/L. Suponiendo que 2 81.0mg/L, ¿indicaría esto que un límite de concentraciones de NOx arriba de 70 mg/L? Usar  0.05. Rpta: se rechaza la Ho, Z= 2.66

2. En un estudio de la ingeniería ambiental atmosférica, para evitar la contaminación ambiental producida por el consumo excesivo e innecesario de gasolina, en el diseño de un motor de combustión interna, el departamento de ingeniería de un constructor de autos, de cierto modelo, afirma que el rendimiento del millaje de este modelo de auto es de cuando menos 35 millas por galón. El departamento de control de calidad sugiere que el valor de la desviación estándar es de

4



 millas. La Environmental Protection Agency de Estados Unidos de América quiere probar esta afirmación para ver si la figura afirmada debería ser más alta o más baja que 35 millas por galón. Para esto, se saca una muestra aleatoria de 50 modelos de este tipo y se prueban bajo circunstancias iguales. Los resultados dan un promedio muestral de 33.6 millas por galón. Probar el reclamo del departamento de ingeniería usando un nivel de significancia de 0.05.

Rpta: se rechaza la Ho, Z= -2.47

3. Para medir la calidad del aire de cierta zona industrial, con relación a los óxidos de azufre, se sacaron dos muestras de tamaños 50 y 75, respectivamente.

(19)

Rpta: En conclusión, debido a que el valor calculado de z = 2.05 es mayor que la región crítica derecha de 1.96, se rechaza la hipótesis y se concluye que los promedios no son iguales.

4. Se quieren probar dos analizadores de CO de diferentes marcas, para ver si los dos dan los mismos resultados en las mediciones de CO. Llamemos al primer analizador A y al segundo B. Probar que los resultados de las dos mediciones de CO provenientes de los dos analizadores son iguales. Asumir = 0.05. Los datos se dan abajo.

Tabla mostrando los datos de este problema.

Rpta: Debido a que 4.06 cae dentro de la región crítica derecha, se rechaza la hipótesis nula y se concluye que los promedios poblacionales correspondientes a ambos muestreadores de CO no son iguales. Tal parece que el muestreador A da resultados de mediciones de CO, con una probabilidad mucho más significante que el muestreador B.

5. Un activista del medio ambiente afirma que, menos de la mitad de las industrias, cumplen con los límites ambientales. Probar esta aseveración, si un sondeo dice que 48% de 1998 industrias si cumplen, satisfactoriamente, con los reglamentos ambientales. Usar un nivel de = 0.05.

Rpta: Debido a que el valor de –1.79 < 1.645, se introduce en el extremo izquierdo de la distribución, se rechaza Ho

6. Una empresa se dedica a la fabricación y venta de jabones. Ud está a cargo de la planificación de la demanda de los mismos. Su jefe le aconseja para reducir su trabajo analizar la incidencia que pudo tener en las ventas de jabón para ropa blanco la elaboración del mismo con un nuevo aditivo. Para ello usted decide analizar las ventas del último mes para el jabón anterior y el que tiene nuevo aditivo en las 24 sucursales

Sucursal jabón r opa

bl anc a sin aditi vo Sucursal Con aditi vo

A 145 M 160

B 130 N 155

C 125 O 158

D 138 P 150

E 128 Q 162

F 132 R 170

G 140 S 145

H 165 T 168

I 175 U 180

J 182 V 200

K 174 W 195

L 160 X 180

a. Se incrementaron las ventas de jabón con el nuevo aditivo?  =0,05

(20)

c.Que otra prueba podía realizar para comparar las ventas de ambos tipos de jabón para un mismo grupo de sucursales y que ventajas tendría respecto de la prueba utilizada en el punto a).

7. Tomando en cuenta la opinión de los consumidores se considera un éxito el lanzamiento del nuevo jabón, si la proporción de aceptación en el mercado alcanza el 60%. En una muestra de 200 potenciales consumidores 125 expresaron su conformidad con el nuevo jabón. Realizar la prueba al 10% de significación.

8. El archivo de datos “Aerolíneas.sav” contiene datos relativos al número de pasajeros registrados en 48 vuelos de cierta compañía aérea.

a. Hallar un I.C. para la media del número del número de pasajeros basado en la muestra de los 48 vuelos al 90% de confianza. Rpta: IC al 90%= <394.23 , 432.23>

b. Probar la hipótesis de que el número medio de pasajeros es de 450 al nivel de significación de 0.10 basándose en la muestra dada.

9. Durante los tres primeros meses de vida el aumento de peso registrado por cierto anima l fue de 65 gr.desde el nacimiento hasta los tres meses de edad; una docena de estos animales fueron alimentados con determinada dieta y los aumentos de pesos observados fueron los siguientes. (en gr.)

61, 67, 62, 59, 62, 60, 63, 65, 58, 54, 62, 55

¿Hay razón para creer, al nivel de significación del 5% que la dieta originó cambio en el peso?

10.Una empresa comercializa una bebida refrescante, en un envase en cuya etiqueta se puede leer: "Contenido 250 cc". El "Departamento de Consumo", toma aleatoriamente 36 envases, y estudia el contenido medio, obteniendo una media de 234 cc y una desviación típica muestral de 18 cc. ¿Puede afirmarse con un 1% de significación que se está estafando al público? (Consideraremos estafa que el contenido sea menor que el expresado en la etiqueta) (P.A.U. 2006)

11.Una máquina para enlatar conservas de pescado ha sido regulada para que el contenido de cada lata sea de 16 onzas, usando  = 0.05, Diría Ud. que la máquina ha sido adecuadamente regulada, si una muestra de 20 latas dio un peso medio de 16.05 onzas y una desviación típica de 1.5 onzas?

12.Productos Unión distribuye dos tipos de pan integral. En una encuesta se encuentra que 56 de 200 amas de casa prefieren el pan integral mediano y que 29 de 150 amas de casa encuestadas prefieren el pan integral fibra. ¿Se puede concluir al nivel de significación 0.06 que el pan integral mediano se vende más rápidamente que el pan fibra?

13.Una empresa estaba considerando establecer un servicio de reparto de pasteles los domingos en la mañana en La Molina. Con base en el costo de esté servicio y las utilidades que se pueden lograr, ha llegado a la siguiente conclusión: Si hay prueba de que el pedido promedio será de mas de 14 pasteles por casa durante un trimestre, ento nces se instituirá el servicio de reparto. Si no se puede demostrar con pruebas, no se instituirá el servicio. Con base en experiencias previas en otras urbanizaciones se estimó que la desviación estándar era de tres pasteles. Se toma una m.a. de 36 residencias en la cual se encuentra un consumo promedio de pasteles de 12.5, la empresa está dispuesta a correr un riesgo del 1% de que se instituirá el servicio. ¿Que opina Ud.?

(21)

= 175 mm. contra Ha:  > 175 mm, utilizando los resultados obtenidos con n = 10 muestras en las cuales se encuentra que X 180 ¿A qué conclusión puede llegarse?

15.Dos grupos A y B de 100 personas, cada una tiene una tiene una enfermedad, el suero es dado al grupo A pero no al grupo B, por otra parte los grupos son tratados idénticamente, si encontramos que en el grupo A 75 personas se sanaron de la enfermedad y en el grupo B 65. Pruebe la hipótesis de que el suero cura la enfermedad.

16.Durante un periodo de 12 meses, el número de nacimientos de mellizos por mes registrados en un hospital son: 2, 0, 1, 1, 0, 0, 3, 2, 1, 1, 0, 1.¿Contradicen estos resultados la hipótesis de que el promedio de nacimientos de mellizos es de 0.5 por mes? (Nivel del 5%)

17.El jefe de admisión de una universidad afirmó en una reunión con la directiva que el 15% de los estudiantes que ingresan, se retiran antes de haber completado cuatro semestres académicos. En una revisión a los registros de los últimos años, mediante una muestra aleatoria de 300 alumnos, se encontró que 54 se retiraron. ¿Al nivel del 1 % es válida la información?

18.Un estudio de consumo de café en el trabajo, por sexo, mostró en una encuesta aleatoria de 200 mujeres que 128 lo toman durante su trabajo, mientras que una muestra de 150 hombres reveló que 106 lo toman. ¿Hay alguna diferencia entre la proporción de los dos grupos, en cuanto al hábito de tomar café en el trabajo?

19.Se estudia el nivel de nicotina en los cigarrillos de dos marcas A y B, absteniéndose los siguientes resultados.

A: 17, 20, 20, 23

B: 18, 20, 21, 22, 24

Con  = 0.05. Determinar si es posible llegar a la conclusión que el contenido de nicotina en ambas marcas es diferente.

20.11 ratas tratadas crónicamente con alcohol se les midió la presión sanguínea sistólica antes y después de 30 minutos de administrarles a todas ellas una cantidad fija de etanol, obteniéndose los datos siguientes:

Presión sanguínea sistólica

Antes 126 120 124 122 130 129 114 116 119 112 118

Después 119 116 117 122 127 122 110 120 112 110 111

¿Hay un descenso significativo de la presión sanguínea sistólica tras la ingestión de etanol?

21.En un experimento diseñado para estimar los efectos de la inhalación prolongada de óxido de cadmio, 15 animales de laboratorio sirvieron de sujetos para el experimento, mientras que 10 animales similares sirvieron de grupo control. La variable de interés fue el nivel de hemoglobina después del experimento. Se desea saber si puede concluirse que la inhalación prolongada de óxido de cadmio disminuye el nivel de hemoglobina según los siguientes datos que presentamos:

Nivel de hemoglobina

Expuestos 14.4 14.2 13.8 16.5 14.1 16.6 15.9 15.6 14.1 15.3

15.7 16.7 13.7 15.3 14

(22)

22.Se realiza un estudio para determinar los efectos de poner fin a un bloqueo renal en pacientes cuya función renal está deteriorada a causa de una metástasis maligna avanzada de causa no urológica. Se mide la tensión arterial de cada paciente antes y después de la operación. Se obtienen los siguientes resultados:

Tensión arterial

Antes 150 132 130 116

Después 90 102 80 82

¿Se puede concluir que la intervención quirúrgica tiende a disminuir la tensión arterial?

23.Dos tipos de soluciones químicas A y B fueron ensayadas para ver su PH. Análisis de 20 muestras de A dieron un PH de 6.5 con una S1 = 0.24. Análisis de 20 muestras de B arrojó que su PH 7.4 con S2 = 0.30. Docimar si existe una diferencia significativa.

24.En una escuela pública se escogieron 10 pares de niños de primer año para comparar la similitud de inteligencia y preparación. Un niño de cada par fue enseñado a leer con un método y el otro con otro método. Después del periodo de aprendizaje, los niños fueron sometidos a una prueba de lectura con los siguientes resultados, (el puntaje utilizado fue de 0 a 100):

¿A un nivel de significación del 5%, existe alguna diferencia significativa en la mayor efectividad de alguno de los métodos aplicados?

25.Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa picante, que puede preparar en una forma mas espesa (x) o en otra forma menos espesa (y). Para medir la preferencia por uno y otro tipo de salsa picante, utiliza una muestra de 10 amas de casa, quienes manifiestan sus preferencias, por dichos tipos de salsa picante, con los siguientes resultados (se utilizó una escala de 1 a 10) en puntos.

Ama de casa: 1 2 3 4 5 6 7 8 9 10 Salsa (x) : 3 1 5 2 0 4 3 3 2 5 Salsa (y) : 2 4 4 7 3 4 6 5 5 8

Al nivel de significación del 5%, se podría concluir que el tipo de salsa menos espesa(y) tiene mayores oportunidades de ser aceptada en el mercado, que el tipo más espeso (x)?

26.A 10 atletas se les sometió a un programa de entrenamiento físico intensivo por parte del preparador físico. Se anotaron sus pesos (en libras) antes y después de dicho entrenamiento con los resultados siguientes:

Atleta: 1 2 3 4 5 6 7 8 9 10 Peso antes: 127 195 162 170 143 205 168 175 197 136 Peso después: 135 200 160 182 147 200 172 186 194 141

¿Afecta el programa el peso medio de los atletas?

27.Una manzana recién descubierta tiene un sabor delicioso. Se ha decidido docimar (someter a prueba) su rendimiento, plantando este tipo de manzanas junto a otras corrientes, en 8 huertos

Niño Nº 1 2 3 4 5 6 7 8 9 10

(23)

diseminados en una región apropiada para la producción de ambas variedades. Cuando los árboles empiezan a rendir frutos, se mide su producción en cajas. Los datos obtenidos son los siguientes:

Huerto: 1 2 3 4 5 6 7 8

Nueva manzana. 13 14 19 10 15 14 12 11 Manzana corriente 12 16 17 9 16 12 10 8

¿Señalan estos datos una mayor producción para la nueva manzana que para la corriente?

28.Un gimnasio recién inaugurado en la capital, invita a su afiliación argumentando una reducción de peso, al menos de 4.6 kilos. Una muestra aleatoria de 34 personas, revela que el promedio de reducción de peso es de 4.1 kilos, con desviación típica de 1.8 kilos. A un nivel del 1 % ¿ Se puede creer lo tan anunciado por el gimnasio?

29.Una compañía desea estudiar el efecto que tiene la pausa para el café, sobre la productividad de sus obreros. Selecciona 6 obreros y mide su productividad en un día corriente, y luego mide la productividad de los mismos 6 obreros en un día en que se concede la pausa para el café. Las cifras que miden la productividad son las siguientes:

Trabajador: 1 2 3 4 5 6

Sin pausa: 23 35 29 33 43 32 Con pausa: 28 38 29 37 42 30

¿Indican estos resultados que la pausa para el café aumentan la productividad?

30.Una empresa necesita un químico, los aspirantes son sometidos a diferentes pruebas psicotécnicas, de las cuales una es un test de análisis de un producto. Los dos mejores candidatos A y B , han obtenido los resultados en la prueba de análisis químico:

Nº de prueba: 1 2 3 4 5 6 7 8 9 10

Candidato A: 20 17 18 20 19 18 19 20 19 20 Candidato B: 19 18 20 17 18 17 19 19 20 19

Puede considerarse que el químico A ha realizado mejores análisis que B o viceversa?

31.En una conferencia de prensa, una alta autoridad anuncia que el 90% de los habitantes adultos del país están a favor de cierto proyecto del gobierno. Una muestra aleatoria de 625 adultos indica que 550 están a favor del proyecto. Si Ud. desea rechazar una hipótesis verdadera no más de una vez en 100, ¿concluiría que la popularidad del proyecto ha sido exa gerada por la autoridad?

32.La oficina de relaciones familiares informa que el 50% de los matrimonios que viven en la ciudad A, llegan a la corte de divorcios dentro de su primer año de casados. ¿Qué conclusión puede sacarse acerca de la validez de este informe si de una muestra aleatoria de 400 matrimonios, solo 193 fueron a la corte de divorcios dentro de su primer año de casados? Utilice un nivel de significancia  = 0.01.

33.El gerente de personal de una empresa querría determinar la cantidad de tiempo que necesitan los empleados para llegar a su trabajo. Se selecciona una m.a. de 12 empleados y se registra el tiempo en minutos para llegar al trabajo, con los siguientes resultados:

(24)

Con un nivel de significancia del 5%, ¿Hay pruebas de que el tiempo promedio de viaje de los empleados es menos de 60 minutos?

34.Un terapeuta ocupacional realizó un estudio para evaluar los méritos relativos de dos aparatos prostéticos ideados para facilitar la destreza manual. El terapeuta le entrego a 21 pacientes con idénticas dificultades uno de los dos aparatos para que lo usaran mientras realizaban determinada tarea. 11 pacientes llevaron el aparato A y 10 el B. El investigador registró el tiempo que gasto cada paciente en realizar la tarea y obtuvo los siguientes resultados:

segundos

X_A 65 , SA = 81

segundos

X_B 75 , SB = 64

¿Darán estos datos evidencia suficiente como para concluir que el aparato A es más efectivo que el aparato B? sea  = 0.05.

Nota: En las preguntas donde sea necesario encontrar medias, una de las formas es usando: (analizar<comparación de medias<medias<pasar a var. Dependiente la variable que se quiere compar y las otras a variables independientes). También puede usar algún método aprendido en estadística descriptiva.

35.Con la base de datos del archivo trabajo.sav. (esta data proviene de una encuesta tomada en España el año 1994 y entre otras cuestiones se preguntaba a los individuos que evaluaran cómo veían que marchaban las cosas en España en ese momento (a13), un año atrás (a14) y cómo preveían que irían un año después (a15), todo ello en una escala de 0 (muy mal) a 10 (Muy bien). Calcular las medias y desviación típica de estas tres variables para cada una de las comunidade s autónomas (c15) y responder las siguientes cuestiones:

a. La comunidad autónoma que parece más pesimista respecto a la situación de España es __________________ya que, en promedio los encuestados de esta comunidad evalúan la situación de España en el presente, pasado y futuro con tan sólo_____, _____ y _____

b. Las dos comunidades que se muestran más optimistas con respecto al futuro de España son ____________________y__________________, con medias de _____ y _____ puntos respectivamente.

36.Si calculamos la media de la variable EDAD (C2) de los encuestados en función de su práctica religiosa (C8) vemos que la edad de la edad va aumentando desde <no practicante=1> a <Muy practicante=5>:

Los que se declaran muy practicantes (categoría 5), tiene la media de edad más alta, con ______años (desviación típica _______, mientras que en el otro extremo de la escala, los que declaran no ser nada practicantes (categoría 1) tiene una media de edad de _____años (desviación típica ______)

37.Contrastar las siguientes hipótesis:

a. La muestra trabaja un promedio de 40 horas semanales (b3) b. La muestra se declara satisfecha con su trabajo (b36)

(25)

a. Por sexo (c1):

40 horas de trabajo/semana___________________________________________________ Satisfacción en el trabajo____________________________________________________ b. Por habitad (c16)

40 horas de trabajo/semana___________________________________________________ Satisfacción en el trabajo____________________________________________________

39.Los hombres en activo de la muestra, ¿trabajan el mismo promedio de horas semanales (b3) que las mujeres en activo?. Las personas en activo son aquellas que han respondido 1 en la variable b1:situación laboral.

________(SI/NO). Los ______hombres en activo de la muestra trabajan un promedio de _______ horas/semana, mientras que las ____mujeres trabajan un promedio de _______ horas/semana. La diferencia es por tanto de _____ horas/semana. Con un riesgo 5% las varianzas de ambos grupos son ________(homogéneas/heterogeneas) por lo que una t=_______, con grado de significación de ________, es signo inequívoco de que el promedio de horas/semanales que trabajan los hombres y las mujeres en activo de la muestra______(Si/No) difiere significativamente.