Estad´ıstica II
Examen Final - 18 de Enero de 2010
Contesta a los siguientes ejercicios en las hojas de examen de la Universidad. No olvides poner tu nombre y tu grupo reducido en todas las hojas. Emplea hojas distintas para los diferentes ejercicios.
1. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una distribuci´on normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes tiempos (en minutos):
5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9 5,1 6 4,9 5 a) (0,5 puntos) Calcula estimaciones insesgadas para la media y varianza.
b) (1 punto) Halla un intervalo de confianza al 95 % para el tiempo medio que se tarda en cobrar a los clientes.
c) (1 punto) ¿Podr´ıamos rechazar la hip´otesis de que el tiempo medio que se tarda en cobrar a los clientes es de 5,4 minutos, a un nivel de significaci´on del 5 %? Razona tu respuesta.
d ) (0,5 puntos) ¿Cu´al ser´ıa la respuesta a la pregunta del apartado anterior si cambiamos el nivel de significaci´on del 5 % al 1 %?
Soluci´on.
a) Las estimaciones son
¯ x = 79,1 15 = 5,2733 s2x = 4,9693 14 = 0,35495 b) El intervalo de confianza es ¯ x ∓ tα/2,n−1√sx n ≡ 5,2733 ∓ 2,1450,59578√ 15 ≡ (4,9434; 5,6033)
c) No podr´ıamos rechazar H0 : µ = 5,4, porque 5,4 est´a contenido en el intervalo ante-rior, a un nivel de confianza del 95 %.
d ) Al aumentar el nivel de confianza, si mantenemos todo lo dem´as igual, aumenta la amplitud del intervalo, luego si 5,4 est´a contenido en el intervalo a un 95 %, tambi´en lo estar´a a un 99 %. Por tanto no podemos rechazar H0 : µ = 5,4 a un nivel de significaci´on de 1 %.
2. Un anuncio televisivo de una compa˜n´ıa de seguros fue emitido en dos versiones: una de duraci´on normal (30 segundos) y otra de duraci´on reducida (24 segundos). En una muestra aleatoria simple de 60 personas que vieron la versi´on normal, 15 de ellas recordaban la marca de la compa˜n´ıa aseguradora 2 d´ıas despu´es. En otra muestra aleatoria simple de 75 personas que vieron la versi´on reducida, independiente de la anterior, 30 de ellas recordaban la marca 2 d´ıas despu´es.
Para un nivel de significaci´on del 5 %, contrasta la hip´otesis de que la proporci´on verda-dera de recuerdo entre espectadores de la versi´on normal, pn, es menor que la proporci´on verdadera de recuerdo entre los espectadores de la versi´on reducida, pc.
a) (0,5 puntos) La especificaci´on de las hip´otesis nula y alternativa para este contraste. b) (1 punto) La expresi´on de la regi´on cr´ıtica o del p-valor en funci´on del estad´ıstico del
contraste.
c) (1 punto) Los c´alculos necesarios para evaluar si los datos pertenecen a la regi´on cr´ıtica, o para obtener el p-valor.
d ) (0,5 puntos) Tu conclusi´on sobre el contraste. Soluci´on.
a) H0: pn≥ pc⇔ pn− pc≥ 0 vs. H1 : pn< pc⇔ pn− pc< 0 b) Estad´ıstico del contraste (aproximado):
ˆ Pn− ˆPc− (pn− pc) q ˆ P0(1 − ˆP0) q1 n1 + 1 n2 ∼ N (0, 1)
La regi´on cr´ıtica corresponde a:
R = {z : z < zα} = {z : z < −1,645}
El p-valor se obtiene del valor del estad´ıstico para los valores muestrales, bajo la hip´otesis nula,
z = pˆn− ˆpc p ˆ p0(1 − ˆp0) q 1 n1 + 1 n2 calculando para Z ∼ N (0, 1), p-valor = P(Z ≤ z) c) Valor del estad´ıstico:
ˆ pn = 15/60 = 0,25 ˆ pc = 30/75 = 0,4 ˆ p0 = (15 + 30)/(60 + 75) = 45/135 = 0,33 z = p pˆn− ˆpc ˆ p0(1 − ˆp0) p 1/n1+ 1/n2 = p 0,25 − 0,4 0,33(0,67)p 1/60 + 1/75 = −1,8371 Para la regi´on cr´ıtica
R = {z : z < −1,645},
el valor z = −1,84 pertenece a R, y por tanto rechazamos la hip´otesis nula al 5 % de significaci´on.
Equivalentemente,
p-valor = P(Z ≤ −1,84) = P(Z > 1,84) = 0,0331
Como el p-valor es menor que α = 0,05, rechazamos la hip´otesis nula a este nivel. d ) Conclusi´on: Para el nivel de significaci´on indicado, disponemos de evidencia suficiente
para concluir que la tasa de recuerdo de la marca es mayor entre los espectadores de la versi´on reducida.
3. Una empresa de comida r´apida est´a interesada en conocer la relaci´on existente entre el n´umero de folletos publicitarios repartidos semanalmente (x) y el beneficio en euros por las ventas a domicilio (y). Los resultados de ajustar un modelo de regresi´on lineal entre ambas variables observadas durante 20 semanas se muestran a continuaci´on:
Regression Analysis - Linear model: Y = a + b*X
---Dependent variable: Ventas
Independent variable: No. folletos
Standard T
Parameter Estimate Error Statistic P-Value ---Intercept 1083,83 42,0395 25,7812 0,0000 Slope 1,0584 0,0644815 16,414 0,0000 Analysis of Variance ---Source Sum of Squares Df Mean Square F-Ratio P-Value ---Model 446354,0 1 446354,0 269,42 0,0000 Residual 29821,0 18 1656,72 ---Total (Corr.) 476175,0 19
Para los datos observados se tiene la informaci´on siguiente: ¯
x = 636,5, y = 1757,502,¯ s2X = 20971,3, cov(x, y) = 22196,02 Adem´as, si ˆyi= ˆβ0+ ˆβ1xi y ei= yi− ˆyi, se tiene que
20 X i=1 (ˆyi− ¯y)2 = 446354, 20 X i=1 e2i = 29821
a) (0,5 puntos) Determinar la recta de regresi´on de las ventas sobre el n´umero de folletos. b) (1 punto) Calcular un intervalo de confianza al 95 % para la pendiente de la recta de
regresi´on.
c) (1 punto) Contrastar la hip´otesis de que la pendiente de dicha recta es distinta de cero con un nivel de significaci´on del 5 %. ¿Podr´ıa afirmarse que la venta del producto depende linealmente del n´umero de folletos publicitarios repartidos?
d ) (1 punto) Estimar el valor del beneficio promedio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios. Calcular un intervalo de confianza al 95 % para dicha estimaci´on.
e) (0,5 puntos) Calcular e interpretar el valor del coeficiente de determinaci´on R2. Soluci´on.
a) Consideramos las variables
X = N´umero de folletos repartidos semanalmente Y = Ventas semanales en euros
Estimamos un modelo de regresi´on simple:
yi = β0+ β1xi+ ui,
donde yi son las ventas de la semana i-´esima y xi representa el n´umero de folletos repartidos esa semana. En la tabla de resultados podemos observar que la estimaci´on del intercepto (intercept) es ˆβ0 = 1083,83 y la estimaci´on de la pendiente (slope) es
ˆ
β1 = 1,0584. Luego la recta de regresi´on es: ˆ
yi= 1083,83 + 1,0584xi b) El intervalo de confianza para β1 tiene la forma,
ˆ β1± tn−2,α/2 s s2 R (n − 1)s2X
Si observamos la tabla de resultados obtenemos la estimaci´on de la pendiente y su error est´andar:
ˆ β1 = 1,0584 s s2 R (n − 1)s2X = 0,06448
Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza para β1 al 95 % es:
ˆ β1± tn−1,α/2 s s2 R (n − 1)s2X = 1,0584 ± 2,101 × 0,06448 = [0,9229; 1,1939] c) Por el apartado anterior, sabemos que al no contener al cero el intervalo de confianza
al 95 % para la pendiente, β1, podemos rechazar la hip´otesis nula del contraste: H0 : β1= 0
H1 : β16= 0
con un nivel de significaci´on del 5 %. Alternativamente, podr´ıamos haber observado el p-valor de dicho contraste, basado en el estad´ıstico t, que seg´un la tabla de resultados es pr´acticamente cero y por tanto, rechazamos la hip´otesis nula ya que α = 0,05 es mayor que el p-valor. Por ´ultimo, otra alternativa habr´ıa sido observar el p-valor de dicho contraste en la tabla ANOVA, basado en el estad´ıstico F, que al ser un contraste equivalente da lugar al mismo p-valor, que es pr´acticamente cero. En cualquier caso, concluimos que la venta del producto depende linealmente del n´umero de folletos publicitarios repartido.
d ) Seg´un la ecuaci´on de la recta de regresi´on obtenida en el apartado a), el valor del beneficio medio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios ser´a:
ˆ
El intervalo de nivel α para dicha recaudaci´on promedio viene dado por: ˆ y0± tn−2,α/2 v u u ts2 R 1 n + (x0− ¯x)2 (n − 1)s2X ! La varianza residual, s2
R, la obtenemos de la tabla ANOVA: s2R= SCR
n − 2 = 29821
18 = 1656,72
Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza al 95 % para el beneficio medio es: ˆ y0± tn−2,α/2 v u u ts2R 1 n+ (x0− ¯x)2 (n − 1)s2X ! = 1665,95 ± 2,101 s 1656,72 1 20 + (550 − 636,5)2 19 × 20971,3 = [1643,5; 1688,4]
e) A partir de la tabla ANOVA obtenemos que: SCM
SCT =
446354
476175 = 0,93737
Luego, el coeficiente de determinaci´on es R2 = 93,737 %, lo cual significa que el modelo de regresi´on explica el 93,737 % de la variaci´on de las ventas.