APELLIDOS:
NOMBRE: GRUPO: 2
DEPARTAMENTO DE ESTAD´ISTICA E INVESTIGACI ´ON OPERATIVA 1o. INGENIER´IA INFORM ´ATICA
Estad´ıstica Descriptiva. Curso 2007/2008
Examen Segunda Prueba Ev. Continua. Fecha: 2-6-2008
1. Dada una serie estad´ıstica bidimensional asociada a (X, Y): (a) Demostrarque la siguiente expresi´on:
¯ y= k X i=1 fi· y¯|X=xi
se verifica siY es independiente deX (utiliza en la demostraci´on la definici´on y propiedades de la independencia estad´ıstica de variables). (1 punto)
(b) Demostrarque la expresi´on anterior se verifica siempre. (1 punto) Soluci´on:
Apartado (a)Si son variables independientes se sabe que las frecuencias relativas condicionadas deY|X =xi son id´enticas entre s´ı e iguales a las frecuencias marginales deY, por lo que se tiene:
¯ y|X=xi = p X j=1 yjfiji = ↑ indep. p X j=1 yjf·j = ¯y Luego la expresi´on:
k X i=1 fi· y¯|X=xi = k X i=1 fi· y¯= ¯y k X i=1 fi· | {z } =1 = ¯y
Apartado (b)Hecho en teor´ıa.
2. Para estudiar la jugabilidad de un juego de una conocida consola, se han recogido datos de las siguientes variables estad´ısticas: X =“n´umero de minutos seguidos jugando con el juego” e
Y =“n´umero de puntos alcanzado”, sobre un grupo de 8 personas de diferentes edades: (12, 67), (11, 65), (25, 106), (28, 114), (19, 89), (5, 47), (27, 112), (3, 40)
(a) Calcula la recta de m´ınimos cuadrados de Y sobre X y repres´entala sobre el diagrama de dispersi´on de estos datos. ¿Existe relaci´on lineal entre estas dos variables? Justifica tu respuesta. (1 punto)
(b) Realiza una predicci´on del n´umero de minutos que necesitar´a jugar para alcanzar una pun-tuaci´on de 100 puntos. ¿Es fiable dicha predicci´on? Justifica tu respuesta. (1 punto) Soluci´on:
Num. Observaciones X 8 Num. Observaciones Y 8 Media X 16.25 Media Y 80 Varianza X 85.6875 Varianza Y 752.5 Desv. T´ıpica X 9.25675 Desv. T´ıpica Y 27.43173 Covarianza 253.875
Coef. Correlaci´on Lineal 0.99979
Coef. Correlaci´on Lineal al cuadrado 0.99958 Recta M´ınimos Cuadrados Y sobre X y = 2.96280 x + 31.85449
Varianza Residual de Y sobre X 0.31893
Recta M´ınimos Cuadrados X sobre Y x = 0.33738 y + -10.74003
Varianza Residual de X sobre Y 0.03632
* * * Apartado (a) y=bx+a, b= SXY S2 X , a= ¯y−bx,¯ r = SXY SX SY Recta M´ınimos Cuadrados Y sobre X y= 2.96280x+ 31.85449
Coef. Correlaci´on Lineal, r= 0.99979, r2 =R2 = 0.99958 Ya quer2
= 0.99958≥0.75, se puede considerar que s´ı existe relaci´on lineal fuerte y adem´as es de tipo directo (signo positivo der).
Estad´ıstica B´asica v.3.0h (18-2-2007) b b b b b b b b X Y 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 40 50 60 70 80 90 100 110 Apartado (b)
Para realizar la predicci´on del valor dexa partir de un valoryutilizaremos la recta de m´ınimos cuadrados deX sobre Y:
x=b0y+a0, b0 = SXY
S2
Y
, a0 = ¯x−b0y¯
Recta M´ınimos Cuadrados X sobre Y x= 0.33738y−10.74003 La predicci´on ser´ıa:
ˆ
x(y= 100) = 0.33738×100−10.74003 = 22.99797 Necesitar´ıa aproximadamente unos 23 minutos (22.99797).
Esta predicci´on es fiable ya que r2
=R2
3. Dada la siguiente tabla de frecuencias relativas conjuntas de las variables estad´ısticas (X, Y), para las que se recogieron n= 100 parejas de observaciones:
X/Y 1 3 5
2 0.20 0.10 0.02 3 0.10 0.30 0.05 4 0.08 0.05 0.10
(a) Calcula y representa gr´aficamente la curva de regresi´on de X sobre Y. (1 punto) (b) Determina la raz´on de correlaci´on de X sobre Y e interpr´etala. (1 punto)
(c) ¿Son estas dos variables independientes? Razona la respuesta. (1 punto) Soluci´on:
Apartado (a)
Estad´ıstica B´asica v.3.0h (18-2-2007)
Tabla de frecuencias conjunta y marginales
X/Y 1 3 5 X
2 20 10 2 32
3 10 30 5 45
4 8 5 10 23
Y 38 45 17 100 Funci´on Todas las condicionadas deX|Y =yj:
X/Y 1 3 5 X 2 0.5263 0.2222 0.1176 0.32 3 0.2632 0.6667 0.2941 0.45 4 0.2105 0.1111 0.5882 0.23 T otal 1 1 1 1 ¯ x|Y Y 2.68421 1 2.88889 3 3.47059 5 2.68 2.89 3.47 1 3 5 * * * Apartado (b) η2X|Y = Pp j=1(¯x|yj−x¯) 2 f·j S2 X
Sabemos que:
¯
x= 2.91, S2
X = 0.5419
Y las frecuencias relativas marginales deY y las medias condicionadas son:
Y f·j 1 0.38 3 0.45 5 0.17 1 ¯ x|Y Y 2.68421 1 2.88889 3 3.47059 5 La raz´on de Correlaci´on de X sobre Y es: 0.13471
Se trata de un valor menor o igual que 0.75, por tanto podemos decir que no existe relaci´on entre las dos variables.
Apartado (c)
Las distribuciones de las frecuencias relativas condicionadas deX|Y =yj no son id´enticas entre s´ı, por lo queX e Y no son independientes.
Funci´on Todas las condicionadas deX|Y =yj:
X/Y 1 3 5 X
2 0.5263 0.2222 0.1176 0.32 3 0.2632 0.6667 0.2941 0.45 4 0.2105 0.1111 0.5882 0.23
T otal 1 1 1 1
4. Un joven empresario inform´atico quiere estudiar c´omo ha cambiado su empresa en cuanto a las ventas de discos duros. La siguiente tabla recoge los datos de las ventas (en euros) en el 2006 y en el 2007:
Tipos de discos duros 2006 2007
Precio Unidades vendidas Precio Unidades vendidas
Discos duros internos 3.5 95 220 85 150
Discos duros internos 2.5 115 100 110 125
Discos duros externos 3.5 140 50 120 150
Discos duros externos 2.5 180 25 160 80
(a) Calcula e interpreta el ´ındice de Laspeyres para el precio de los discos duros del 2007 respecto al 2006. (1 punto)
(b) Calcula e interpreta el ´ındice de Paasche para la cantidad de discos duros vendidos del 2007 respecto al 2006.(1 punto)
(c) Calcula e interpreta la media agregativa ponderada de los precios del 2007 respecto al 2006, usando los pesoswi que utiliza el ´ındice de Laspeyres. (1 punto)
Soluci´on:
2006 2007
Variables Precios Cantidades Precios Cantidades
1 95 220 85 150
2 115 100 110 125
3 140 50 120 150
Apartado (a) LP07/06= 4 X i=1 pi,07×qi,06 pi,06×qi,06
Laspeyres Precios 0.9043, es decir una disminuci´on del 9.57%. Apartado (b) P07Q/06= 4 X i=1 pi,07×qi,07 pi,07×qi,06
Paasche Cantidades1.4433, es decir un aumento del 44.33%.
Apartado (c)Los pesos wi =vi0 =pi0qi0 es decir, el valor de cada producto en el periodo base
(a˜no 2006) (wi=vi,2006 =vi,06).
2006
Precios Cantidades Valor
95 220 20900 115 100 11500 140 50 7000 180 25 4500 ¯ IAP = w1p1,07+w2p2,07+w3p3,07+w4p4,07 w1p1,06+w2p2,06+w3p3,06+w4p4,06 = = v1,06p1,07+v2,06p2,07+v3,06p3,07+v4,06p4,07 v1,06p1,06+v2,06p2,06+v3,06p3,06+v4,06p4,06 = = 20900×85 + 11500×110 + 7000×120 + 4500×160 20900×95 + 11500×115 + 7000×140 + 4500×180 = = 4601500 5098000 = 0.90261 Es decir ha habido una disminuci´on del 9.739%.