• No se han encontrado resultados

examen final estadística uc3m

N/A
N/A
Protected

Academic year: 2021

Share "examen final estadística uc3m"

Copied!
5
0
0

Texto completo

(1)

Estad´ıstica II

Examen Final - 18 de Enero de 2010

Contesta a los siguientes ejercicios en las hojas de examen de la Universidad. No olvides poner tu nombre y tu grupo reducido en todas las hojas. Emplea hojas distintas para los diferentes ejercicios.

1. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una distribuci´on normal. Para una muestra aleatoria de 15 clientes se obtuvieron los siguientes tiempos (en minutos):

5 6,2 4,8 5,2 5,2 6,4 4,9 5,3 4,2 5 5,9 5,1 6 4,9 5 a) (0,5 puntos) Calcula estimaciones insesgadas para la media y varianza.

b) (1 punto) Halla un intervalo de confianza al 95 % para el tiempo medio que se tarda en cobrar a los clientes.

c) (1 punto) ¿Podr´ıamos rechazar la hip´otesis de que el tiempo medio que se tarda en cobrar a los clientes es de 5,4 minutos, a un nivel de significaci´on del 5 %? Razona tu respuesta.

d ) (0,5 puntos) ¿Cu´al ser´ıa la respuesta a la pregunta del apartado anterior si cambiamos el nivel de significaci´on del 5 % al 1 %?

Soluci´on.

a) Las estimaciones son

¯ x = 79,1 15 = 5,2733 s2x = 4,9693 14 = 0,35495 b) El intervalo de confianza es  ¯ x ∓ tα/2,n−1√sx n  ≡  5,2733 ∓ 2,1450,59578√ 15  ≡ (4,9434; 5,6033)

c) No podr´ıamos rechazar H0 : µ = 5,4, porque 5,4 est´a contenido en el intervalo ante-rior, a un nivel de confianza del 95 %.

d ) Al aumentar el nivel de confianza, si mantenemos todo lo dem´as igual, aumenta la amplitud del intervalo, luego si 5,4 est´a contenido en el intervalo a un 95 %, tambi´en lo estar´a a un 99 %. Por tanto no podemos rechazar H0 : µ = 5,4 a un nivel de significaci´on de 1 %.

2. Un anuncio televisivo de una compa˜n´ıa de seguros fue emitido en dos versiones: una de duraci´on normal (30 segundos) y otra de duraci´on reducida (24 segundos). En una muestra aleatoria simple de 60 personas que vieron la versi´on normal, 15 de ellas recordaban la marca de la compa˜n´ıa aseguradora 2 d´ıas despu´es. En otra muestra aleatoria simple de 75 personas que vieron la versi´on reducida, independiente de la anterior, 30 de ellas recordaban la marca 2 d´ıas despu´es.

Para un nivel de significaci´on del 5 %, contrasta la hip´otesis de que la proporci´on verda-dera de recuerdo entre espectadores de la versi´on normal, pn, es menor que la proporci´on verdadera de recuerdo entre los espectadores de la versi´on reducida, pc.

(2)

a) (0,5 puntos) La especificaci´on de las hip´otesis nula y alternativa para este contraste. b) (1 punto) La expresi´on de la regi´on cr´ıtica o del p-valor en funci´on del estad´ıstico del

contraste.

c) (1 punto) Los c´alculos necesarios para evaluar si los datos pertenecen a la regi´on cr´ıtica, o para obtener el p-valor.

d ) (0,5 puntos) Tu conclusi´on sobre el contraste. Soluci´on.

a) H0: pn≥ pc⇔ pn− pc≥ 0 vs. H1 : pn< pc⇔ pn− pc< 0 b) Estad´ıstico del contraste (aproximado):

ˆ Pn− ˆPc− (pn− pc) q ˆ P0(1 − ˆP0) q1 n1 + 1 n2 ∼ N (0, 1)

La regi´on cr´ıtica corresponde a:

R = {z : z < zα} = {z : z < −1,645}

El p-valor se obtiene del valor del estad´ıstico para los valores muestrales, bajo la hip´otesis nula,

z = pˆn− ˆpc p ˆ p0(1 − ˆp0) q 1 n1 + 1 n2 calculando para Z ∼ N (0, 1), p-valor = P(Z ≤ z) c) Valor del estad´ıstico:

ˆ pn = 15/60 = 0,25 ˆ pc = 30/75 = 0,4 ˆ p0 = (15 + 30)/(60 + 75) = 45/135 = 0,33 z = p pˆn− ˆpc ˆ p0(1 − ˆp0) p 1/n1+ 1/n2 = p 0,25 − 0,4 0,33(0,67)p 1/60 + 1/75 = −1,8371 Para la regi´on cr´ıtica

R = {z : z < −1,645},

el valor z = −1,84 pertenece a R, y por tanto rechazamos la hip´otesis nula al 5 % de significaci´on.

Equivalentemente,

p-valor = P(Z ≤ −1,84) = P(Z > 1,84) = 0,0331

Como el p-valor es menor que α = 0,05, rechazamos la hip´otesis nula a este nivel. d ) Conclusi´on: Para el nivel de significaci´on indicado, disponemos de evidencia suficiente

para concluir que la tasa de recuerdo de la marca es mayor entre los espectadores de la versi´on reducida.

(3)

3. Una empresa de comida r´apida est´a interesada en conocer la relaci´on existente entre el n´umero de folletos publicitarios repartidos semanalmente (x) y el beneficio en euros por las ventas a domicilio (y). Los resultados de ajustar un modelo de regresi´on lineal entre ambas variables observadas durante 20 semanas se muestran a continuaci´on:

Regression Analysis - Linear model: Y = a + b*X

---Dependent variable: Ventas

Independent variable: No. folletos

Standard T

Parameter Estimate Error Statistic P-Value ---Intercept 1083,83 42,0395 25,7812 0,0000 Slope 1,0584 0,0644815 16,414 0,0000 Analysis of Variance ---Source Sum of Squares Df Mean Square F-Ratio P-Value ---Model 446354,0 1 446354,0 269,42 0,0000 Residual 29821,0 18 1656,72 ---Total (Corr.) 476175,0 19                 

Para los datos observados se tiene la informaci´on siguiente: ¯

x = 636,5, y = 1757,502,¯ s2X = 20971,3, cov(x, y) = 22196,02 Adem´as, si ˆyi= ˆβ0+ ˆβ1xi y ei= yi− ˆyi, se tiene que

20 X i=1 (ˆyi− ¯y)2 = 446354, 20 X i=1 e2i = 29821

a) (0,5 puntos) Determinar la recta de regresi´on de las ventas sobre el n´umero de folletos. b) (1 punto) Calcular un intervalo de confianza al 95 % para la pendiente de la recta de

regresi´on.

c) (1 punto) Contrastar la hip´otesis de que la pendiente de dicha recta es distinta de cero con un nivel de significaci´on del 5 %. ¿Podr´ıa afirmarse que la venta del producto depende linealmente del n´umero de folletos publicitarios repartidos?

d ) (1 punto) Estimar el valor del beneficio promedio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios. Calcular un intervalo de confianza al 95 % para dicha estimaci´on.

e) (0,5 puntos) Calcular e interpretar el valor del coeficiente de determinaci´on R2. Soluci´on.

(4)

a) Consideramos las variables

X = N´umero de folletos repartidos semanalmente Y = Ventas semanales en euros

Estimamos un modelo de regresi´on simple:

yi = β0+ β1xi+ ui,

donde yi son las ventas de la semana i-´esima y xi representa el n´umero de folletos repartidos esa semana. En la tabla de resultados podemos observar que la estimaci´on del intercepto (intercept) es ˆβ0 = 1083,83 y la estimaci´on de la pendiente (slope) es

ˆ

β1 = 1,0584. Luego la recta de regresi´on es: ˆ

yi= 1083,83 + 1,0584xi b) El intervalo de confianza para β1 tiene la forma,

ˆ β1± tn−2,α/2 s s2 R (n − 1)s2X

Si observamos la tabla de resultados obtenemos la estimaci´on de la pendiente y su error est´andar:

ˆ β1 = 1,0584 s s2 R (n − 1)s2X = 0,06448

Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza para β1 al 95 % es:

ˆ β1± tn−1,α/2 s s2 R (n − 1)s2X = 1,0584 ± 2,101 × 0,06448 = [0,9229; 1,1939] c) Por el apartado anterior, sabemos que al no contener al cero el intervalo de confianza

al 95 % para la pendiente, β1, podemos rechazar la hip´otesis nula del contraste: H0 : β1= 0

H1 : β16= 0

con un nivel de significaci´on del 5 %. Alternativamente, podr´ıamos haber observado el p-valor de dicho contraste, basado en el estad´ıstico t, que seg´un la tabla de resultados es pr´acticamente cero y por tanto, rechazamos la hip´otesis nula ya que α = 0,05 es mayor que el p-valor. Por ´ultimo, otra alternativa habr´ıa sido observar el p-valor de dicho contraste en la tabla ANOVA, basado en el estad´ıstico F, que al ser un contraste equivalente da lugar al mismo p-valor, que es pr´acticamente cero. En cualquier caso, concluimos que la venta del producto depende linealmente del n´umero de folletos publicitarios repartido.

d ) Seg´un la ecuaci´on de la recta de regresi´on obtenida en el apartado a), el valor del beneficio medio en euros para aquellas semanas en las que se repartan 550 folletos publicitarios ser´a:

ˆ

(5)

El intervalo de nivel α para dicha recaudaci´on promedio viene dado por: ˆ y0± tn−2,α/2 v u u ts2 R 1 n + (x0− ¯x)2 (n − 1)s2X ! La varianza residual, s2

R, la obtenemos de la tabla ANOVA: s2R= SCR

n − 2 = 29821

18 = 1656,72

Como tn−2,α/2 = t18,0,025 = 2,101, el intervalo de confianza al 95 % para el beneficio medio es: ˆ y0± tn−2,α/2 v u u ts2R 1 n+ (x0− ¯x)2 (n − 1)s2X ! = 1665,95 ± 2,101 s 1656,72  1 20 + (550 − 636,5)2 19 × 20971,3  = [1643,5; 1688,4]

e) A partir de la tabla ANOVA obtenemos que: SCM

SCT =

446354

476175 = 0,93737

Luego, el coeficiente de determinaci´on es R2 = 93,737 %, lo cual significa que el modelo de regresi´on explica el 93,737 % de la variaci´on de las ventas.

Referencias

Documento similar

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Esto viene a corroborar el hecho de que perviva aún hoy en el leonés occidental este diptongo, apesardel gran empuje sufrido porparte de /ue/ que empezó a desplazar a /uo/ a

La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar R 2 , a partir de la cual el coeficiente de determinaci

El valor es maximo cuando p = 2/9 (es 38.8), que es el caso en que estaba indiferente entre cosechar en uno o dos d as y es cuando mas util le resultar a la informacion para

Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura

Puesto que la familia es el contexto más influyente y determinante para ellos, se analizará qué consecuencias tiene que la lectura sea valorada y considerada

Hay que tener en cuenta que debido a la evolución tecnológica que se han dado en los últimos años existe una mayor facilidad para todos los ciudadanos para realizar reproducciones