UNIVERSIDAD
UNIVERSIDAD PEDAGÓGICA
PEDAGÓGICA YY TECNOLÓGICA
TECNOLÓGICA DE
DE COLOMBIA
COLOMBIA
LICENCIATURA
LICENCIATURA EN
EN MATEMÁTICAS
MATEMÁTICAS YY ESTADÍSTICA
ESTADÍSTICA
‐‐ INFERENCIA
INFERENCIA ESTADÍSTICA
ESTADÍSTICA
TAREA
TAREA SOBRE
SOBRE JUZGAMIENTO
JUZGAMIENTO DE
DE HIPÓTESIS
HIPÓTESIS EE INTERVALOS
INTERVALOS DE
DE CONFIANZA
CONFIANZA
SEÑORES
SEÑORES ESTUDIANTES
ESTUDIANTES DE
DE INFERENCIA
INFERENCIA
Las
Las dos
dos primeras
primeras hojas
hojas hablan
hablan sobre
sobre el
el p
p
‐‐
valor
valor yy cómo
cómo usar
usar el
el intervalo
intervalo de
de
Confianza
Confianza como
como proceso
proceso para
para juzgar
juzgar hipótesis,
hipótesis, por
por favor
favor leer
leer lo
lo relacionado.
relacionado.
Luego
Luego aparecen
aparecen tres
tres bloques
bloques de
de ejercicios,
ejercicios, distribuidos
distribuidos así:
así:
El
El bloque
bloque uno
uno con
con ejercicios
ejercicios numerados
numerados del
del 18
18 al
al 36,
36, en
en la
la parte
parte izquierda
izquierda de
de cada
cada
ejercicio
ejercicio aparece
aparece el
el nombre
nombre del
del estudiante,
estudiante, es
es decir,
decir, indica
indica el
el ejercicio
ejercicio que
que debe
debe
entregar.
entregar.
El
El bloque
bloque dos,
dos, contiene
contiene ejercicios
ejercicios en
en inglés
inglés (páginas
(páginas 393,
393, 405
405 YY 459),
459), se
se desarrollan
desarrollan
de
de la
la siguiente
siguiente manera:
manera:
Estudiante
Estudiante cuyo
cuyo último
último dígito
dígito de
de su
su código
código sea
sea par
par hace
hace los
los ejercicios
ejercicios pares
pares
Estudiante
Estudiante cuyo
cuyo último
último dígito
dígito de
de su
su código
código sea
sea impar
impar hace
hace los
los ejercicios
ejercicios impares
impares
El
El bloque
bloque tres,
tres, son
son ejercicios
ejercicios para
para estudiar
estudiar más
más no
no para
para entregar.
entregar.
La
La tarea
tarea se
se entrega
entrega en
en hojas
hojas de
de examen
examen con
con el
el procedimiento,
procedimiento, aa su
su vez
vez deben
deben usar
usar
el
el paquete
paquete R
R como
como soporte,
soporte, luego
luego construyen
construyen un
un archivo
archivo con
con la
la sintaxis
sintaxis que
que
necesiten
'RUEBA DE
'RUEBA DE
HIPÓTESISHIPÓTESISPARA LA MEDIA DE UNA SOLA POBLACIÓN
PARA LA MEDIA DE UNA SOLA POBLACIÓN
215
215
Decis
Decisión
ión estadís
estadística.
tica.
base
base
la regla
la regla
decisión, se
decisión, se
puede
puede
rechazar la hip
rechazar la hipótesis nula porq
ótesis nula porque
ue
-2.12
-2.12
está
está
la región
la región
rechazo.
rechazo.
Se
Se
puede
puede
decir
decir que
que el valor calc
el valor calculad
ulad
la
la
prueba
prueba
estadíst
estadística tien
ica tien
nivel
nivel
significación
significación
.Op.
.Op.
9.
9. Co
Conc
nclu
lusisión
ón.
. Se
Se concluye
concluye qu
qu
JlJles igual que
es igual que 30 y
30 y
las accio
las accio
nes del administrador o médico
nes del administrador o médico
deberán
deberán
estar
estar
acuerdo con esta
acuerdo con esta
conclusión.
conclusión.
10.
10. Valor
Valor
dep.
dep.
En
En lugar
lugar
decir que
decir que
a l o ~a l o ~observado
observado
la estadís
la estadís
tica
tica
prueba
prueba
es
es
significativo, muchos autores
significativo, muchos autores
obras
obras
inve
investi
stigaci
gación prefieren
ón prefieren info
informar
rmar la probabilid
la probabilidad exacta
ad exacta
obtener
obtener
u:t;l
u:t;l
valor ta
valor tanto
nto o más ex
o más extremo
tremo que el obs
que el observ
ervado
ado
sisila hipótesis
la hipótesis
nula
nula
es verdadera.
es verdadera.
En
En
el presente caso, estos investigadores
el presente caso, estos investigadores
darían
darían
el va
el va
calculado
calculado
la estadística
la estadística
prueba
prueba
junto
junto
proposición
proposición
=.0340. Dicha proposición significa que la probabilidad
=.0340. Dicha proposición significa que la probabilidad
obte
obte
1,l,n
1,l,n
valor
valor
extremo como
extremo como 2.
2.12
12
cualq
cualquier dirección
uier dirección
cuando
cuando
la hipótesis
la hipótesis
nula
nula
es
es
verdadera,
verdadera,
es
es
.0340. Este
.0340. Este
valor
valor
se
se
obtiene
obtiene
tt:lb1att:lb1a
D
D y e
y es la proba
s la probabilid
bilidad
ad
observar
observar
12
12
2.12
2.12
cuand
cuando la hipótesis nula e
o la hipótesis nula es verdadera.
s verdadera.
EsEsdecir,
decir,
cuando
cuando
Ro
Ro
es verda
es verda
dera, la probabilidad
dera, la probabilidad
obtener
obtener
valor
valor
mayor o igual
mayor o igual
2.12
2.12
.0170, y la probabilidad
.0170, y la probabilidad
observar
observar
valor
valor
menor
menor
igua
igual que
l que 2.12
2.12 s de .01
s de .0170
70. La proba
. La probabilidad
bilidad
qu
qu
ocurra
ocurra
cual
cual
quiera
quiera
de
de
estos cas
estos c
asos, cua
os, cuand
nd
Ro
Ro
es
es verda
verdadera,
dera, es igual a
es igual a la suma
la suma
la
las dos prob
s dos probabilida
abilidades individuales
des individuales, y
, y
consecuencia,
consecuencia,
este ejem
este ejem
plo, se dice
plo, se dice
q u ~ pq u ~ p=.0170
=.0170
.0170 = .0340.
.0170 = .0340.
LaLacantidadp
cantidadp
se
se cono
conoce
ce
como el
como el
valor
valor
para
para
la prueba.
la prueba.
DEFINICIÓN
DEFINICIÓN
El valor
El valor
p ' p a r a
p ' p a r a
la prueba
la prueba
hipótesis es
hipótesis es
probabilidad
probabilidad
obtener,
obtener,
cuando
cuando
verdadera,
verdadera,
valor
valor
estadística
estadística
prueba
prueba
tan extremo
tan extremo más (en
más (en
dirección
dirección
adecuada
adecuada
para
para
el valor calculado
el valor calculado
realidad.
realidad.
El
El
valor
valor
para
para
una
una
prueba puede
prueba puede
definirse
definirse ta
tamb,
mb,ié
ién co
n como e
mo el valor
l valor
más
CAPÍTULO 7 PRUEBA DE HIPÓTESIS
El informe
valores como
parte
los resultados
de una
inves
tigación proporciona más información al lector que afirmaciones como
"la hipótesis
nula
se rechaza
nivel
significación
.05" o "los
resultados
fueron significativos
el nivel.05".
Al
informar
el valor
asociado
una prueba
se
permite
al lector saber con exactitud
ué
tan extraño
o qué
común
es el valor calculado
la estadística
prueba dado
qu
Ro
es verdadera.
Prueba
H o p o r m e d i o
intervalo
confianza
Anteriormente
e estableció que es posible utilizar intervalos
de
confianza
para probar
hipótesis.
En el ejemplo 7.2.1 se utilizó
procedimiento
prueba
hipótesis
para probar
Jl
contra
la hipótesis alternativa
HA:
Jl30. Fue posible rechazar la hipó
tesis
nula
Ro
porque
el valor calculado
la estadística
de prueba
cayó
la región
rechazo.
A continuación se
muestra
cómo se
hubiera podido
llegar a esta misma con
clusión
mediante
el uso
de
intervalo
confianza
OO
ex.)
ciento. El
intervalo
confianza
de
95
ciento
para
tL
es
27
1.96VezO/10
27
1.96(1.4142)
27 2.7718
24.2282,
2 ~ . 7 7 1 8Dado
qu
este intervalo
incluye a 30, se dice que 30
es
candidato
para
media
que se está estimando
y,
lo tanto,
f..les igual a 30 se
e c ~ a z a O'Ésta
es la misma conclusión a la
se llegó
mediante
el procedimiento
prueba de
hipótesis.
Si
el
parámetro
supuesto, 30, se
hubiera
incluido
el intervalo
confianza
95
ciento, se habría dicho
que.R
se rechaza
el nivel .05
significa
ción.
general,
cuando
se
prueba una hipótesis nula por medio
de
un intervalo
de
con-fianza bilateral,
se
rechaza
Ro
en
el
nivel
de
significación
si el
parámetro supuesto no
está
contenido dentro del
intervalo
de
confianza
de
00(1
po
ciento.
Si
el
parámetro
supuesto
está
contenido dentro
de dicho
intervalo, no
es
posible
rechazar
Ro
en
el
nivel
ex. de
significación.
Prueba
hipótesis unilateral
El intervalo
hipótesis ilustradq
el
EJERCICIOS
BLOQUE
18.- Una prueba de detección de la hepatitis vírica produce un2% de falsos positivos (prueba positiva en
una persona sana) y un 5% de falsos negativos (prueba negativa en una persona enferma). Se aplica
esta prueba a800personas independientes tomadas al azar en una población.
a) Hallar la relación entre p="probabilidad de dar positivo en la prueba" y q="probabilidad de padecer hepatitis vírica" .
b) ¿Cuál es el máximo número de pruebas positivas que podríamos obtener, entre las800, para
considerar probado que la enfermedad afecta a menos del8% de la población?. Tomar α =0.01.
sol.: a) p=0.02+0.93q; b) A lo sumo 46.
19.- El Verapamil y el Nitroprusside son dos productos utilizados para reducir la hipertensión. Para compararlos, unos pacientes son tratados con Verapamil y otros con Nitroprusside. Los resultados obtenidos se muestran en la siguiente tabla, donde X="reducción (en mm.) de la presión arterial de un paciente tratado con Verapamil" e Y="reducción (en mm.) de la presión arterial de un paciente
tratado con Nitroprusside" :
X 10 15 18 23 12 16 15 Y 15 10 19 9 14 12 18
a) Admitiendo normalidad, ¿se puede aceptar la igualdad de varianzas a un nivel de significación de
0.1?.
b) ¿Proporcionan estos datos suficiente evidencia estadística, a un nivel de significación de0.1, para
concluir que el Verapamil es más efectivo que el Nitroprusside para reducir la presión arterial?.
sol.: a) Sí; b) no, de modo que mantendremos la hipótesis de que ambos productos son igualmente efectivos para reducir la presión arterial.
20.- Se tienen indicios de que el consumo de tabaco tiende a provocar problemas de trombosis debidos a un aumento en la capacidad de coagulación. Para estudiar estas hipótesis, Levine (1973) extrajo muestras de sangre de 11 individuos antes y después de que fumasen un cigarrillo, y midió la
capacidad de agregación de las plaquetas, obteniendo los datos siguientes (correspondientes al máximo porcentaje de plaquetas que se agregaron después de haber sido sometidas a un estímulo adecuado):
Antes de fumar (X) 25 25 27 44 30 67 53 53 52 60 28 Después de fumar (Y) 27 29 37 56 46 82 57 80 61 59 43
¿Hay suficiente evidencia estadística, a un nivel de significación de0.01, a favor de la hipótesis de
que los fumadores presentan una mayor tendencia a la formación de coágulos?. Suponer normalidad en los datos.
sol.: Sí
21.- Es generalmente aceptado que existen diferencias ligadas al sexo relacionadas con la respuesta a la tensión producida por el calor. Se sometió aun grupo de10 hombres y 8 mujeres a un programa de
ejercicios duros que implicaban el empleo de aparatos de rueda. La variable de interés es el porcentaje de peso corporal perdido. Se obtuvieron los datos siguientes:
varones 2.9 3.5 3.9 3.8 3.6 3.7 3.8 4.0 3.6 3.7 mujeres 3.0 2.5 3.7 3.3 3.8 4.1 3.6 4.0
a) Establecer una estimación puntual para la diferencia de porcentaje medio de peso corporal perdido entre hombres y mujeres que hacen ejercicio en estas condiciones.
b) Supuesta normalidad y varianzas iguales, hallar un intervalo de confianza al95%para la diferencia
de medias poblacionales.
sol.: a) 0.15; b)[-0.276 , 0.576].
22.- Se lleva a cabo un estudio para comparar algunos de los atributos físicos de las nadadoras olímpicas con los de las corredoras olímpicas. Una variable de interés es la grasa corporal total en kilogramos. Se han obtenido muestras de12corredoras y10nadadoras. Los valores observados son:
corredoras 11.2 10.1 9.4 9.2 8.3 8.2 7.6 7.3 6.9 5.5 5.0 3.7 nadadoras 14.1 15.1 11.4 14.3 9.2 12.7 13.7 11.9 10.7 8.7 YOBANI LIZETH ZARABANDA RAMIRO A.
Supuesta normalidad, hallar un intervalo de confianza del98% para la diferencia de grasa corporal
total media entre corredoras y nadadoras olímpicas. En base a este intervalo, ¿piensas que existe diferencia entre la cantidad media de grasa total de corredoras y nadadoras olímpicas?. Razonar la respuesta.
sol.: Como podemos suponer varianzas iguales, el intervalo de confianza de nivel 0.98 para la diferencia de medias es [-6.848, -2.112]. El intervalo indica, claramente, que las corredoras tienen menor cantidad media de grasa corporal que las nadadoras.
23.- Se lleva a cabo un estudio de dos tipos de tratamiento por fármacos para su utilización potencial en transplantes de corazón. El fin de los fármacos es actuar como inmunosupresores: reprimir la tendencia natural del cuerpo a rechazar el transplante. Las ratas ACI machos sirven como donantes, y las ratas Lewis Brown Norway machos como receptoras. Estas ratas son conocidas por su defectuosa compatibilidad. La variable de interés es X , tiempo de supervivencia de días. Se han obtenido los
siguientes resultados estadísticos:
Salicilato sódico solo Salicilato sódico y azatioprina
n=9 m=9
x =16 días y =15 días
s X =10.1 días sY =10 días
Hallar un intervalo de confianza del 90% para la diferencia entre los tiempos medios de supervivencia de los dos tratamientos. Suponer que las variables de interés son normales.
sol.: [-7.77 , 9.77] .
24.- Se han utilizado23 vegetarianos en un estudio de enfermedad diverticular y dieta. Una variable de
interés es el total de fibra dietética. Se ha obtenido la siguiente información para los dos grupos, los que no tenían la enfermedad y los que sí la tenían:
Sin Con
n=18 m=5
x =42.7 g y =27.7 g
s
ˆ
X =9.9 g sˆ
Y =9.5 gSuponiendo normalidad,
a) Contrastar la igualdad de varianzas iguales.
b) ¿Hay razón suficiente para afirmar que la media total de contenido de fibra dietética, en las dietas de los que no tienen la enfermedad, es más alta que en la de aquellos que la tienen?. Explicar la respuesta en base al p-valor del contraste.
sol.: a) S e aceptan varianzas iguales. b) Si, ya que el p-valor es inferior a 0.005.
25.- En un estudio de características corporales de las gaviotas de pico anillado, la variable considerada es la longitud del pico. Se dispone de los siguientes datos:
Hembras Machos
n=51 m=41
x =59.1mm y =65.2 mm
s
ˆ
X =1.9 mm sˆ
Y =2.0 mmNo se han detectado diferencias en las varianzas poblacionales. ¿Hay razón para sostener el argumento de que la longitud media del pico en los machos es mayor que en las hembras?. Explicar la respuesta en base al p-valor. (suponer que la distribución de las variables es normal).
sol.: Si, el p-valor es inferior a 0.0025.
26.- Se cree que los jóvenes adolescentes que fuman comienzan a hacerlo a una edad más temprana que las chicas adolescentes fumadoras. ¿Los siguientes datos apoyan esta suposición?. (Suponer que la distribución de la variable edad a la que empiezan a fumar hombres y mujeres, es normal).
YURY PAOLA
RAFAEL C.
Hombres Mujeres
n=33 m=14
x =11.3 años y =12.6 años
s
ˆ
2X =4 s
ˆ
2Y =3.5sol.: Si, el p-valor del contraste es inferior a 0.025.
27.- Se realiza un estudio para comparar las tortugas en Malabar con las de Grande-Terre, islas del atolón Aldabra en el Océano Índico. Una variable de interés es X , el peso de un huevo en el momento de la
puesta. Muestras aleatoriamente seleccionadas de las dos islas proporcionan los siguientes resultados (supóngase normalidad):
Grande-Terre Malabar
n=31 m=148
x =64.0 g y =82.7 g
s
ˆ
X =6.5 g sˆ
Y =3.6 gA la vista de estos datos, ¿se puede afirmar que el peso medio de un huevo en el momento de la puesta en tortugas de Malabar es mayor que en tortugas de Grande-Terre?. Razonar la respuesta.
sol.: Si, el p-valor es inferior a 0.0025. Además también se comprueba que las varianzas son distintas.
28.- Se realiza un estudio de velocidad de vuelo de diversas especies de pájaros. Se va a comparar el pelícano pardo con el ostrero americano. Se cronometra a los pájaros volando con el viento de costado
con una velocidad de viento de5a8mph. Los resultados obtenidos son los siguientes: Pelícano pardo Ostrero
n=9 m=12
x =26.05 mi/h y =30.19 mi/h
s
ˆ
X =6.34 mi/h sˆ
Y =3.2 mi/hSuponiendo normalidad, hallar un intervalo de confianza del 90% para la diferencia en la velocidad de vuelo media de los pelícanos pardos y los ostreros americanos cuando vuelan con el viento de costado. Basándose en este intervalo, ¿hay evidencias de que exista una diferencia en las medias poblacionales? Razonar la respuesta.
sol.: [-8.29 , 0.006], no.
29.- Para estudiar el efecto del ejercicio físico sobre el nivel de triglicérido, se ha realizado el siguiente experimento con11individuos: previo al ejercicio, se tomaron muestras de sangre para determinar el
nivel de triglicérido por 100 mililitros de sangre, de cada sujeto. Después los individuos fueron
sometidos a un programa de ejercicios que se centraba diariamente en carreras y marchas. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de triglicérido. De este modo, se dispone de dos conjuntos de observaciones del nivel de triglicérido por 100mililitros de sangre de los sujetos: (suponer normalidad)
Sujeto 1 2 3 4 5 6 7 8 9 10 11 Previo 68 77 94 73 37 131 77 24 99 629 116 Posterior 95 90 86 58 47 121 136 65 131 630 104
a) Hallar un intervalo de confianza del90%para el cambio medio en el nivel de triglicérido.
b) ¿Hay pruebas suficientes para afirmar que el ejercicio físico produce cambios en el nivel de triglicérido?.
sol.: a) [-25.91 , 0.83]; b) No, el p-valor es superior a 0.1.
30.- Se ha realizado un estudio para comparar el contenido de sodio en el plasma de la piel de las focas australes jóvenes, con el nivel de sodio de la leche de las focas. Los resultados obtenidos, sobre el contenido de sodio en la piel y en la leche, de10focas aleatoriamente seleccionadas son:
YAQUELIN C.
YENNY BRIGGITT
Sujeto 1 2 3 4 5 6 7 8 9 10 Leche 93 104 95 81.5 95 95 76.5 80.5 79.5 87.0 Plasma 147 157 142 141 142 147 148 144 144 146
Suponiendo normalidad, hallar un intervalo de confianza del 95% para la diferencia media de niveles de sodio en los dos fluidos corporales. ¿Hay pruebas suficientes para afirmar que existe alguna diferencia?.
sol.: [-62.78 , -51.41]; Si, el p-valor es mucho más pequeño que 0.0025.
31.- Se intenta estudiar la influencia de la hipertensión en los padres sobre la presión sanguínea de los hijos. Pare ello se seleccionan dos grupos de niños, unos con padres de presión sanguínea normal (grupo 1) y otros con uno de sus padres hipertenso (grupo 2), obteniéndose las siguientes presiones sistólicas:
Grupo 1 104 88 100 98 102 92 96 100 96 96 Grupo 2 100 102 96 106 110 110 120 112 112 90
Hallar un intervalo de confianza para la diferencia de medias, suponiendo normalidad y que las varianzas en las dos poblaciones de niños son iguales.
sol.: A un nivel de confianza del 95%, [-15.2776 , -1.9224]
32.- En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones (A1 y A2)
aisladas se obtuvieron los siguientes datos:
1 1 1 2 2 2 ˆ 13 4 3 ˆ 11 5 2.2 n x s n x s = = = = = =
Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N
(
µ σ i, i)
, parai=1,2, se pide:
a) Hallar un intervalo de confianza para el cociente de varianzas al nivel0.9.
b) Obtener un intervalo de confianza para µ 1−µ 2, con nivel de confianza0.95(suponiendo varianzas
iguales).
c) ¿Cuántos individuos habría que observar para estimar µ 1 con un error máximo de0.2y un nivel de
confianza de0.95?.
sol.: a) [0.6383 , 5.1198]; b) [-7.0407 , -5.0407]; c) al menos 865
33.- Se efectúa un estudio sobre el color de los escarabajos tigre para conseguir pruebas que apoyen el argumento de que la proporción de escarabajos negros puede variar de un lugar a otro. En una muestra de500escarabajos capturados en una extensión próxima a Providence, Rhode Island,95 eran negros.
Una captura de112escarabajos en Aqueduct, Nueva York, contenía17 individuos negros.
a) Hallar una estimación puntual para la diferencia entre las proporciones de escarabajos negros en las dos regiones. En base a esa estimación, ¿crees que hay diferencia entre las proporciones poblacionales?.
b) Construir un intervalo de confianza, de nivel de confianza0.95, para la diferencia de proporciones
poblacionales desconocida. En base a esa estimación, ¿crees que hay diferencia entre las proporciones poblacionales?.
c) Responder a la pregunta de los apartados a) y b) efectuando un contraste de hipótesis. ¿Cuál es su p-valor?.
sol.: a) 0.0382; b) [-0.0409 , 0.1173]; c) A un nivel de significación de 0.05 no podemos afirmar que exista diferencia entre las proporciones de escarabajos negros en las regiones estudiadas. El p-valor del contraste es 0.3472.
34.- Uno de los ejemplos de selección natural estudiados es el de la polilla moteada. Hasta 1845, todas las especies conocidas presentaban colores claros, pero ese año fue capturada en Manchester una polilla negra. A causa de la industrialización en la zona, los troncos de los árboles, las rocas, e incluso la tierra, se habían ennegrecido por el hollín. Esta forma mutante negra se extendió rápidamente. H.B.D. Kettlewell creyó que la expansión era debida, en parte, a que el color negro protege a la polilla de sus depredadores naturales, en particular de los pájaros. Los entomólogos de la época declararon que ellos nunca habían visto a un pájaro comerse una polilla moteada de color alguno y desecharon la idea. En
YEISON D. DIEGO O. YENIFER G. JEFERSON ALEXANDER
un experimento para estudiar la teoría, Kettlewell marcó una muestra de100polillas de cada color y
las liberó después. Volvió por la noche con trampas de luz y recobró el40% de las polillas negras y
solamente el 19% de las de color claro. Supóngase que las polillas no recobradas fueron presas de
algún depredador.
a) Encontrar una estimación puntual para la diferencia en las tasas de supervivencia de las polillas negras y las de color claro, en la región de Manchester. ¿Crees que esa estimación apoya la teoría de que el color negro contribuye a proteger a estas polillas de los depredadores?.
b) Construir un intervalo de confianza del98% para la diferencia entre las tasas de supervivencia de
las polillas negras y las de color claro, en la región de Manchester. ¿Crees que esa estimación apoya la teoría de que el color negro contribuye a proteger a estas polillas de los depredadores?.
c) Responder a la pregunta de los apartados a) y b) efectuando un contraste de hipótesis. ¿Cuál es su p-valor?.
sol.: a) 0.21; b) [0.0597 , 0.3603]; c) A un nivel de significación de 0.02 podemos afirmar que las polillas de color negro están mejor protegidas contra los depredadores que las de color claro. El p-valor del contraste es 6*10 -4 .
35.- Se han realizado diversos estudios analizando la incidencia de la malaria en niños africanos heterocigóticos respecto al gen asociado a la anemia falciforme, y en niños homocigóticos normales. En un estudio realizado por ALLC se obtuvieron los siguientes datos: de 136 niños heterocigóticos, 36 sufrieron la malaria, mientras que, de 407 homocigóticos, la sufrieron 152. ¿Hay evidencia estadística (al nivel 0.05) de que los heterocigóticos están mejor protegidos frente a la malaria que los homocigóticos normales?.
sol.: Sí.
36.- En una granja experimental se intenta comparar la virulencia de dos organismos patógenos causantes de epidemias en los pollos. De 200 pollos inoculados con el organismo 1, 137 manifestaron síntomas durante los 14 primeros días. De 150 pollos inoculados con el organismo 2, 98 manifestaron síntomas durante los 14 primeros días. ¿Existe diferencia entre la virulencia de los dos organismos?. Razonar en base al p-valor.
sol.: No, pues el p-valor es 0.5352, aproximadamente.
CARLOS A.
SANDRA M.
EJERCICIOS
BLOQUE
fe TI HYPOTHE515 TE5TING fO THE MEAN (LARGE 5AMPLE5) 393
41. Light Bulbs A light bulb manufacturer guarantees that the mean life of a certain type of light bulb is at least 750 hours. A random sample of 36 light bulbs has a mean life of 745 hours with a standard deviation of 60 hours.
Q' 0.02, do you have enough evidence to reject the manufacturer's claim?
42. Sodium Content in Cereal In your work for a national health organization,
you are asked to monitor the amount of sodiu in a certain brand of cereal. You find that a random sample of 52 cereal servings has a mean sodium content of 232 milligrams with a standard deviation of 10 milligrams.
Q' 0.04, can you conclude that the mean sodium content pe serving of
cerealis greater than 230 milligrams?
43. Nitrogen Dioxide Levels A scientist estimates that the mean nit rogen dioxide level in Calgary is greater than 32 partspe billion. You want to test this estimate.To do so, you determine the nitrogen dioxide levels for
34 randomly selected days. The results (in parts per billion) are listed below. At Q' 0.06, can you support the scientist's estimate? IAdapted
fíDiIl C1ean ir Strategic/l/lilll/ce)
24 36 44 35 44 34 29 40 39 43 41 32 33 29 29 43 25 39 25 42 29 22 22 25 14 15 14 29 25 27 22 24 18 17
44. Fluorescent Lamps A fluorescent lamp manufacturer guarantees that the mean life of a certain type of lamp isat least 10,000 hours. You want to test this guarantee.To do so, you record the life of a random sample of
32 fluorescent lamps. The results (in hours) are shown below.At 0.09, do you have enough evidence to reject the manufacturer's claim?
8,800 9,155 13,001 10,250 10,002 11,413 8,234 10,402 10,016 8,015 6,110 11,005 11,555 9,254 6,991 12,006 10,420 8,302 8,151 10,980 10,186 10,003 8,814 11,445 6,277 8,632 7,265 10,584 9,397 11,987 7,556 10,380
• 45. Weight Loss A weight loss program claims thatprogram participants
have a mean weight loss of at least 10 pounds after month. You work for a medical association and are asked to test this claim. A random sample of 30 program participants and their weight losses (in pounds) after 1 month is listed in the stem-and-Ieaf plot below. At Q' 0.03, do
you have enough evidence to reject the program's claim?
Weight Loss (in pounds) after One Month
5 7 Key:517 5.7 01 9 22 79 0 3 5 6 8 10 2 5 6 6 1] 2 5 7 8 12 0 7 8 13 14 15 O
SEC f l O N 7 HYPOTHESIS TESTlNG FOR THE MEAN (SMAll SAMPlES) 405
27.Annual Pay An employment information service claims the mean annual
pay for full-time male workers over age 25 an without a high school diplomais $25,000. The annualpa for arandom sample f] full-time mate workers without a high schooJ diploma is ]isted. 0.05, test the claÍm lhat the mean saJaryÍs $25,000. 'JrliIj>/i't/¡ / f W I .. / l l l / m l lrI/'I{/!J(Jf'. 5 r / ! { I . I ! k l j
26,185 23,814 22,374 25,189 26,318 20,767 30,782 29,541 24,597 28,955
28.Annnal Pay An employment information service claims the mean annual
pay for fu U-time female workers over age 25 an without a high school diploma is $19,100. The annual pay for a random sample of 12 full-time
female workers without a high school diploma is listed. 0.05, test the
c1aim that the mean salary is $19,100. I/Ii/u/JI<,ri ¡i'/I/Ij l1ure{{/I (JI' f.{{;',,/
S(l/llllln;
18,165 16,012 18,794 18,803 19,864 19,177 17,328 21,445 20,354 19,143 18,316 19,237
Testing Claims Using P·values In Exercises 29-34, (a) write the claim mathematieally and identify H and Ha> (h) use teehnology to find the P-value,
(e) decide whether to rejeet or fail to rejeet the null hypothesis, and (d) interpret the decision in the eontext the original claim. Assume the population is normally distributed.
29. Soda Consumption For your study on the food consumption habits oí
teenage males, you randomly select 20 teenage males an ask each how
many 12-ounce servings oí soda he drinks each day. Th results are
listed below. At 0.05, is there enough evidence to support the claim that teenage males drink fewer than three12-ounce servings of soda per
day? Adaplerlli'o/ll Cenrerl(JrSelel/C!'111 rlw I'/lb/ic Il1lere.ll)
2.1 2.3 2.4 1.2 0.8 2.] 2.0 2.2 2.5 2.1
1.6 2.1 1.8 2.2 2.0 2.8 3.2 0.5 1.4 1.2
30. School Snpplies A company that manufactures school supplies says that teachers spend a mean of more than $550 of their own money on
school supplies in a year. A random sample of the amounts (in dollars) that24 teachers spent onschool supplies in a recent year is listed below
At 0.05, is there enough evidence to support the company's claim?
(Ada/)/n//io/1l :Vallol1a/ ) ' c / I O { ) / S/lP/,!I' Ul/tI D¡uifJl//I'/1/ Á.llociuri/JI/
715 623 582 72] 602 62] 462 320 532 566 686 532 603 420 684 713 531 888 482 361 560 910 546 860
31. Class Size You receive a brochure from a large university. The brochure indicates that the mean class size for full-time faculty is fewer than 32 students. You want to test thisc1aim. You randomly select 18 c1asses taught
by fun-time faculty and determine the class size of each. Th results ar
listed below. At 0.01, can you support th university's c1aim? (!\dafJIl'tI
.li'Oll/ :V{{liO/lu/Centerlin- t;r!/lclIliOf/ SllItisliCl
35 33 32 40 26 33 29 27 25
32. Faculty Classroom Hours The dean ofa university estimates thatthe mean number of classroom hours pe week for full-time facu1ty is 11.0. As a
member ofthe studentcouncil, you want to test this c1aim. A randomsample
of the number ofc1assroom hours for eight full-time faculty for on week is
listed below. At 0,01, can you reject th dean's claim? (/lr!ap/ed li-"1I1
VlItiO//I/!(,'nI('/' tú E<I/lClftl(l1l Sll/tI'lin)
5f:C110N TESTING TH DIFFERENCE BETWEEN MEANS (SM LL INDEPENDENT SAMPLES) 459
, 23. Teaching Methods A new method ofteac' readingis being tested on
third grade students. A group ofrandomly selected third grade students is taught using the new curriculum. A control group ofrandomly selected third grade students is taught using the old curriculum. The reading test
scores of the two groups ar shown in the stem-and-Ieaf plot.
Ol Curriculum New Curriculum
9 3 Key:
3 914 49 (old curriculum)
9 8 8 4 3 3 2 1 413 43 (new curriculum)
7 6 4 2 2 1 0 0 0 1 1 4 7 7 7 7 7 8 9 9 0 1 1 2 3 3 4 9
0.10, is thereenough evidence to conclude that the new method of teaching reading produces higher reading test scores than the old
method does? Would you recommend changing to the new method
does? Assume the population variances are equal.
.. 24. Teaching Methods Two teaching methods and their effects on science test scores ar being reviewed. A randomly selected group ofstudentsis
taught in traditionallab sessions. A second randomly selected group of
students is taught using interactive simulation software. The science test
scores of the two groups are shown in the stem-and-Ieaf plot
Traditional La Interactive Simulation Software
4 Key:
9 9 8 8 7 6 6 3 2 1 0 0 4 5 5 7 7 8 019 90 (traditional) 9 8 5 1 1 1 0 0 0 0 3 4 7 8 8 9 9 911 91 (interactive)
At 0.05, can yousupport the claim that the mean science test score
is10wer for students taught usingthe traditionallab method thanit is for students taught using th interactive simulation software? Assume the population variances ar equal.
Extending
Concepts
Constructing Confidence Intervals #L1 #L2 the sampling
distribution for Xl X2 is approximated by a t-distribution and the populations
have equal variances, you can construct a confidence interval for ¡.ti ¡.t2 by using
the following.
1)s7 (n2 i)sj
where (T an ni n2
ni n2
in Exercises 25 and 26, construct a confidence inlerval for ¡.tI ¡.t2' Assume lhe
EJERCICIOS
BLOQUE
22 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
7.2.6 Nueve animalesdelaboratorio fueron infectados con cierta bacteria yluegoinmunosuprimi
dos. Elnúmero medio de organismos aislados posteriormente de los tejidos de dichos ani
males fue de 6.5 (datos codificados)co un desviaciónestándarde .6. ¿Es posible concluir
partir de estos datos qu la media de la población es mayor qu 6? Sea .05. ¿Qué
supuestos sedeben cumplir?
7.2.7 Un muestra de 25 estudiantesde enfermería de primer añ tuvoun calificación media de
77en una prueba para medirsu actitud hacia el paciente moribundo. La desviaciónestándar
de la muestrafue de 10. ¿Proporcionan estos datos evidencia suficiente como para indicar,
en un nivel de significación de .05, qu la media de la población es menor qu 80? ¿Qué
supuestos sedeben cumplir?
7.2.8 é desea sabe sies posible concluirqu el consumomediodiariode caloríasdela población
rural deun paísendesarrollo esde menosde 2000. Un muestrade 500 individuos prodttio
un consumomedio de 1985 yun desviación estándar de210. Sea .05.
7.2.9 Un encuestade 100 hospitales de tamañosimilar reveló un censomediodiarioen el servi
cio de pediatría de 27 con un desviación estándar de 6.5. ¿Proporcionan estos datos sufi
ciente evidencia paraindicarqu la mediade la población esmayor que 25? Sea .05.
7.2.10 sp ésde seguirun programa decapacitación en supervisión de hospitales durante un se
mana, 16 administradoresde hospital obtuvieronun calificaciónmedia de 74en una prueba
llevada a cabo como parte de la evaluación del programa de capacitación. La desviación
estándarde lamuestrafuede 12.¿Es posible concluir apartir deestos datosqu lamedia de
la población es mayorqu 70? Sea .05. ¿Cuáles son los supuestos que se debencumplir?
7.2.11 e extraj un muestraaleatoriade 16 informes de urgenciasde los archivos de un servicio deambulancias. Eltiempo medio(calculado apartir de los datosdela muestra)para qu las
ambulancias llegaran a sus destinos fu de 13 minutos.Suponga que lapoblaciónde tiempos
sigueun distribución normal co un variancia de 9. ¿Es posible concluir, en un nivel de
significación de .05,qu la mediade la población es mayor qu 10 minutos?
@
Los siguientes datos son los consumos de oxígeno (en mI) durante la incubación de unamuestraaleatoriade 15 suspensiones celulares:
14.0,14.1,14.5,13.2,11.2,14.0,14.1,12.2, 11.1,13.7,13.2,16.0,12.8,14.4,12.9
¿Proporcionan estos datos suficiente evidencia, en un nivelde significaciónde .05,de qu la
mediade la población no es igual a 12 mI? ¿Qué supuestos se deben cumplir?
Un muestraaleatoriade 20 profesores universitariosaparentementesanosproporcionólos
siguientes valoresdecapacidad respiratoria máxima.¿Esposible concluir que la media máxima
de respiración no es de 110 litrospo minuto?
132,33,91,108,67,169,54,203,190,133, 96,30,187,21,63,166,84,110,157,138
I
I
I
I
I
-
I
EJERCICIOS 227Los siguientes datos son las presiones sistólicas sanguíneas (en mm Hg de 12 pacientes sometidos a terapiacon medicamentos contrala hipertensión:
183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158
Es posible concluir con base en 'estos datos qu lamediade la población es menor que 165? Sea .05. ¿Qué supuestos se debencumplir?
¿Es posible concluir que laedad media dedefunciónpo laenfermedad decélulas falciformes homocigótica es menor que30 años? Una muestra de50 pacientes proporcionalas
siguien-tesedades en años:
15.5 2.0 45.1 1.7 .8 1.1 18.2 9.7 28.1 18.2 27.6 45.0 1.0 66.4 2.0 67.4 2.5 61.7 16.2 31.7 6.9 13.5 1.9 31.2 9.0 2.6 29.7 13.5 2.6 14.4 20.7 30.9 36.6 1.1 23.6 .9 7.6 23.5 6.3 40.2 23.7 4.8 33.2 27.1 36.7 3.2 38.0 3.5 21.8 2.4
SeaC!- =.05. ¿Qué supuestos debencumplirse?
Los siguientes datos se ref ieren a los nivele de presión intraocular (enmm Hg registrados
en un muestra de 21 individuos de edadavanzada:
14.5 12.9 14.0 16.1 12.0 17.5 14.1 12.9 17.9 12.0 16.4 24.2 12.2 14.4 17.0 10.0 18.5 20.8 16.2 14.9 19.6
¿Es posible concluir a partirde estos datos que la mediade la poblaciónde la cual se extrajo
lamuestra es mayorqu 14? Sea .05. ¿ Qué supuestos se debencumplir?
7.2.17 Supongaque las calificaciones para el IQ (coeficiente de inteligencia) de un población
adulta siguenun distribución aproximadamente normal,con un desviación estándar de
15. Un muestraaleatoria simple de 25 adultos procedentes de esta población tiene un IQ
medio de 105. Co baseen estos datos, ¿es posible concluir que el IQ medio parala
pobla-ción es diferente de lOO?La probabilidad de cometer un error de tipo 1 e de .05.
7.2.18 Un equipo de investigación se inclina a suponer que la presión sistólica sanguínea en una
población de hombres sigue un distribución aproximadamente normal con un
desvia-ción estándar de 16. Una muestraaleatoria simple de 64 hombres presentó un media de
presión sistólicasanguíneade 133. ¿P roporcionan estos dato s suficiente evidenciapara con-cluir,con unnivelde significación de ,05, que la media dela población es mayor qu 130?
-r
23 CAPÍTULO 7 PRUEBADE HIPÓTESIS
Sepretendesabersies posible concluir, con base en los datos, que, en promedio, los pacien
tes diabéticos tienen reflejos tendinosos profundos reducidosen comparación con pacientes
sin diabetesde lamismaedad. Sea l.
7.3.2 Un estudiode los investigadoresHommeselal. (A-9) tiene dos propósitos: 1)investigar si el
gastode energíaen reposoaumenta en la etapa primaria,sin síntomas de infeccióndeVIH,
y 2) estudiar las contribuciones relativasde la oxidaciónde carbohidratosde grasasdurante
el gasto de energía en reposoen los pacientes. Los individuos estudiadoseran 11 pacientes
externos varones infectadosdeVIH, queno presentaban síntomas y cuya edades eran entre
23 y 50 años. El grupo de control estaba formado po 11 voluntarios varones sanos, co
edades entre25 y51 años,qu resultaron físicamente normalesen sus exámenes y expedien
tes médicos. Entrelos hallazgos setienenlas estadísticas respecto a la medició de gastode
energíaen reposo.
Muestra Media Error estándar de la media
Individuos con VIH 7116 173 Individuos de control 7058 205
FUENTE: Mirjam]. T. Hommes, JohannesA. Romijn, Erik Endert Hans P.
Sauerwein, "Resting EnergyExpenditurean SubstrateOxidation in Human
Imunodeficieney Virus (HIV)-InfectedAsymptomatic Men: HIV Affect Host
Metabolism in the Early Asymptomatic Stage",Americanjoumal 01Clinical
Nutrition, 54 311-315.
¿Ofrecen estos datos suficiente evidencia qu permita concluir qu el gasto de energía en
reposoaumenta durantelaprimera etapa, cuando no hay síntomas presentesde la infección deVIH? Sea .05.
.3.3 ri er elal. (A-lO)midieron la energía consumidaen 32 mujeresde Cambia. Dieciséi de los
individuos estudiados eran mujeres en periodo de lactancia (L) y el resto eran mujeres no
embarazadas quenoestabanen etapa delactancia (NENL). Sereportaronlos siguientes datos:
Muestra Consumode energía(kJ/d)
5289,6209,6054,6665,6343,7699,5678,6954,6916, 4770,5979,6305,6502,6113,6347,5657
NENL 9920,8581,9305,10765,8079,9046,7134,
8736,10230,7121,8665,5167,8527,7791,8782,6883
FUENTE:Chistian Frigerio, Yves Schutz, Roge Whiteheady EricJ équier,"A ewProcedure
to Assessth EnergyRequirements Lactation inGambianWomen",Americanjoumal01
Clinical Nutrition, 54, 526-533. American Society for Clinical Nutrition.
¿Proveen estos datos suficiente evidenciaque permitaconcluir que las poblaciones muestreadas
difieren respecto a la media de consumode energía? Sea .05.
7.3.4 s posible conclui qu los niños crónicamente enfermos tienden, en promedio, tener
EJERCICIOS 23
estimarla confianzaen sí mismos en 16niños crónicamente enfermos 21 niñossanos. Las
calificacionesmedias desviacionesestándar fueron las siguientes:
Grupo enfermo 22.5 4.1
Grupo sano 26.9 3.2
Sea .05.
7.3.5 Un investigador de enfermería desea sabersi losgraduadosde losprogramasde enfermería
a nivelbachillerato losgraduadosen programasasociadosde enfermeríadifierenen cuan-to a las calificaciones medias obtenidas en estudio de personalidad. Un muestra de 50
graduadosde programasasociados (grupoA) un muestra de 60 graduados de
bachillera-to (grupoB) proporcionaronlas siguientesmedias desviacionesestándar:
Muestra
52.5 10.5 49.6 11.2
Co baseen estos datos, ¿qué puede concluir el investigador? Sea .05.
7.3.6 Una prueba diseñada para medirlas actitudesde lasmadresen cuanto al trabajo de parto
elperiodo de expulsiónse aplicó a dosgrupos de madresprimerizas.La muestra 1
(asisten-tes) acudierona clasesde instrucciónprenatal impartidas en el departamento de salud. La
muestra2 (ausentes)noasistiero n a clases. Eltamaño de las muestras,medias desviaciones
estándar de las calificacionesparalas pruebas sonlas siguientes:
Muestra
15 4.75 1.0 22 3.00 1.5
¿Proporcionanestosdatosla evidencia suficientepara indicar qu las asistentes, en
prome-dio, tienencalificacionesmá altasqu las ausentes? Sea .05.
midieronlas concentraciones de cortisolen dos grupos de mujeresalmomento de da
luz. Al grupo 1 se le practicó un operación cesárea de urgencia después de inducido el
parto. Las de grupo dierona luz mediante operación cesárea o vía vaginal después de
presentarse el trabajo de parto espontáneamente. El tamaño de las muestras, los niveles
medios del cortisol las desviacionesestándar fueron los siguientes:
Muestra
10 43 65 12 645 80
24 CAPÍTULO 7 PRUEBADE HIPÓTESIS
¿Proporcionan estos datos la evidencia suficiente para indicar qu existeun diferenciaen
las concentraciones mediasde cortisolen las dos poblaciones? Sea .05.
midieron las concentracionesde protoporfrrinaen dos muestrasde individuos. La
mues-tr 1 consistió en 50 varones adultos alcohólicos co sideroblastos anulares en la médula
ósea. La muestra 2 consistióen10varones adultos no alcohólicosaparentementesanos. Los
niveles medios de protoporfirina las desviaciones estándar de las dos muestras son los
si-guientes:
Muestra
340 250 45 25
posible concluir co base en estos datos que los niveles de protoporfirinason más altos en la poblaciónde alcohólicos queen la poblaciónno alcohólica? Seaa. .01.
7.3.9 Un investigador está interesado en sabersi los niños nacidos prematuramente con acidosis
metabólica tardía los niños prematuros que no tienen dicha enfermedad, difieren en lo que
respecta a las concentraciones en la orina de cierta sustancia química. Las concentraciones
medias, desviaciones estándar eltamaño dela muestraparaambos grupos son los siguientes: Muestra
Co acidosis 35 8.5 5.5
Sin acidosis 40 4. 3.6
¿Quépuedeconcluirel investigador con base en estos resultados? Sea ..05.
7.3.10 Varios investigadore desean saber si es posible concluirqu dos poblaciones de niños difie-re respecto a laedad promedio en la ma pueden caminar po sí solos. Los investigadores
obtuvieron los siguientes datos (edades en meses).
Muestrade la población A: 9.5, 10.5,9.0,9.75, 10.0, 13.0,
10.0, 13.5, 10.0,9.5, 10.0,9.75
Muestrade la población B: 12.5,9.5,13.5,13.75,12.0,13.75,
12.5,9.5, 12.0, 13.5, 12.0, r ~ . o
¿Quépueden concluir los investigadores? Sea .05.
7.3.11 ¿La privación sensorial tien algúnefecto sobre la frecuenciade las ondas alfade las
perso-nas? Se divide aleatoriamenteendosgruposa veinte voluntarios. Los individuosenelgrupo
indi-1
7.4 CPMPARACIÓN POR PAREJAS 241
viduos delgrupo B sirvieron comogrupo decontrol.Alterminarelperiodo
experimen-tal,se midió la frecuenciade las ondas alfa apartir delos electroencefalograma deestas
personas. Los.resultados son los siguientes:
GrupoA: 10.2,9.5,10.1,10.0,9.8,10.9,11.4,10.8,9.7,10.4
Grupo B: 11.0,11.2,10.1,11.4,11.7,11.2,10.8,11.6,10.9,10.9
Sea =.05.
7.3.12 ¿Es posible concluir que,en promedio, los linfocito las células tumorales difiere en
tamaño? Los siguientes datos son el diámetro celular (en de 40 linfocitos 50
célu-las tumorales obtenidas apartir de la biopsia del tejidode pacientescon melanoma.
Linfocitos 9.0 9.4 4.7 4.8 8.9 4.9 8.4 5.9 8.0 8.6 7.0 6.8 7.1 5.7 7.6 6.2 7.1 7.4 8.7 4.9 7.4 6.4 7. 6.3 8.8 8.8 5.2 7.1 5.3 4.7 8.4 6.4 8.3 Células tumorales 12.6 14.6 16.2 23.9 23.3 17.1 20.0 21. 19.1 19.4 16.7 15.9 15.8 16.0 17.9 3.4 19.1 16.6 18.9 18.7 20.0 17.8 13.9 22.1 13.9 18.3 22.8 13.0 17.9 15.2 1 9 16 22.8 19.4 19.6 18.4 18.2 20.7 7 24.3 11.2 19.5 18.6 16.4 16.1 21.5 Sea =.05.
7.4 COMPARACIÓN
PO PARIlJASEn el análisis referente a la diferencia entre las medias de dos poblaciones, se supone que las muestras son independientes. Un método que se utiliza co
frecuencia paraaveriguar la eficaci de un tratamiento procedimiento experi-mental es aquel qu hace uso de observaciones relacionadas qu resultan de
muestrasno independientes. Un prueba hipótesis que se basa en este tipo de datos se conocecomo prueba decomparaciones porparejas.