Litros
Tiempo en segundos 0-10 10-20 20-30 30-40 40-50
50 – 60 2
60 –70 2 2
70 – 80 8 9 7
80 – 90 1 2 8 14
Prueba de Evaluación Continua 5-X-16
1.- En el aeropuerto de Madrid-Barajas se ha recogido una muestra del peso en kilogramos del equipaje de 20 viajeros:
40 20 22 23 22 23 21 26 25 30
23 21 24 23 24 29 22 22 27 39
Construir un diagrama de caja. ¿Hay valores atípicos?
(1 punto)
2.- En una gasolinera se ha medido el tiempo en segundos y la cantidad de litros del repostaje de gasolina.
a) Obtener la mediana del tiempo empleado en repostar.
b) Si se tarda 70 segundos en repostar ¿cuál será su percentil?
c) ¿Qué distribución tiene mayor dispersión relativa?
d) Hallar el sesgo de la distribución del tiempo empleado.
e) Hallar el coeficiente de correlación lineal. Interpretarlo.
f) Si se quiere repostar 50 litros ¿cuánto tiempo se empleará?
g) Calcular la varianza explicada por el ajuste lineal del tiempo sobre los litros.
(7 puntos)
Prueba de Evaluación Continua
1.- En el aeropuerto de Madrid-Barajas se ha recogido una muestra del peso en kilogramos del equipaje de 20 viajeros:
40 20 22 23 22 23 21 26 25 30
23 21 24 23 24 29 22 22 27 39
Construir un diagrama de caja. ¿Hay valores atípicos?
Solución
Primeramente, ordenamos los datos y observamos las frecuencias absolutas xi ni Ni
20 1 1
21 2 3
22 4 7
23 4 11
24 2 13
25 1 14
26 1 15
27 1 16
29 1 17
30 1 18
39 1 19
40 1 20
Cuartiles
¿Q1? N/4 = 20/4=5 ⇒ Q1 = 22;
Mediana ¿Q2 = M? N/2 =20/2=10 ⇒ Q2 =23;
¿Q3? 3N/4 = 15 ⇒ Q3 = (26+27)/2=26,5 El rango intercuartílico IQR=Q3-Q1=4,5 Límite inferior= Q1-1.5*IQR=15,25 Límite superior= Q3+1.5*IQR=33,25
El límite superior es 37 y existen dos valores que lo superan 39 y 40 por lo tanto HAY VALORES ATIPICOS.
Litros
Tiempo en segundos 0-10 10-20 20-30 30-40 40-50
50 – 60 2
60 –70 2 2
70 – 80 8 9 7
80 – 90 1 2 8 14
2.- En una gasolinera se ha medido el tiempo en segundos y la cantidad de litros del repostaje de gasolina.
a) Si se tarda 70 segundos en repostar ¿cuál será su percentil?
b) Si se tarda 70 segundos en repostar ¿cuál será su percentil?
c) ¿Qué distribución tiene mayor dispersión relativa?
d) Hallar el sesgo de la distribución del tiempo empleado.
e) Hallar el coeficiente de correlación lineal. Interpretarlo.
f) Si se quiere repostar 50 litros ¿cuánto tiempo se empleará?
g) Calcular la varianza explicada por el ajuste lineal del tiempo sobre los litros.
Solución
x\y 5 15 25 35 45 ni. xini. xi2ni.
(
xi.−X)
3ni..55 2 2 110 6050 -24623,6875
65 0 2 2 4 260 16900 -8973,6559
75 8 9 7 24 1800 135000 -708,712246
85 1 2 8 14 25 2125 180625 8245,22915
n.j 2 11 13 15 14 55 4295 338575 -26060,8264
yjn.j 10 165 325 525 630 1655 -473,833208
yj2n.j 50 2475 8125 18375 28350 57375 -1,08055581 110 815 975 1205 1190
xiyjnij 550 12225 24375 42175 53550 132875 RESULTADOS:
X Y
m1 78,09091 30,09091
m2 6155,909 1043,182 σ2 57,71901 137,719
CV 0,097288 0,389997
m11 2415,909
σxy 66,08264 r 0,741193
a) Para obtener la mediana de la variable x escribimos la distribución marginal de x:
x ni. Ni.
50 – 60 2 2
60 –70 4 6 70 – 80 24 30
80 – 90 25 55
n/2 = 27,5; M=70+10*21,5/24=78,95833
b) Teniendo en cuenta que existe 6 usuarios que emplean 70 segundos o menos resulta la frecuencia relativa de 6/55 es aproximadamente 0,109; el 10,9%.
Percentil 10,9.
c) Medias
5 . 1
1
=
=
∑
i ii
x x n
n =4295 78, 09091
55 = ;
5 . 1
1
=
=
∑
j jj
y y n
n =1655 30, 09091 55 =
Varianzas
5
2 2 2
. 1
1
=
=
∑
−x i i
i
x n x σ n
338575 4295 2
57, 71901
55 55
= − = ;
5
2 2 2
. 1
1
=
=
∑
−y j j
j
y n y σ n
57375 1655 2
137, 719
55 55
= − = Coeficiente de variación
57, 71901
( ) 0, 097288
78, 09091
= x = ≈
CV x x
σ ; 137, 719
( ) 0, 389997
30, 09091
= y = ≈
CV y y
σ .
Los litros.
d) Sesgo o coeficiente de asimetría g1 µ33
= σ
x ni.
(
xi.−X)
3ni.55 2 -24623,6875
65 4 -8973,6559
75 24 -708,712246
85 25 8245,22915
18 2 -24623,6875
sumatorio -26060,8264
μ3 -473,83321
( )
( )
3
i. i.
1 3 3
1 x X n
473,83321
g n 1, 08055581
57, 71901
− −
= = ≈ −
σ
∑
Asimétrica por la izquierda.e)
i i i i
xy
x y n
132875 4295 1655
XY 66, 08264
n 55 55 55
σ =
∑
− = − ⋅ =xy xy
x y
66, 08264
r 0, 74
57, 71901 137, 719
= σ = ≈
σ σ . El ajuste es “bueno” y directo por ser
un valor superior a 0,7
f) La recta de regresión de x sobre y permite determinar los valores de x para valores conocidos de y: xy2
( )
y
x X σ y Y
− = −
σ 4295 66, 08264 1655
x y
55 137, 519 55
− = − ⇒
y = 0,479837·x + 63,65218 Para x=50 se obtiene un peso de y = 0,479837·50 + 63,65218= 87,64402 segundos
g) 2 xy 2
( )
2x y
66, 08264
R 0, 55
57, 71901 137, 719
σ
=σ σ = ⋅ ≈ y en el ajuste anterior la varianza
explicada es: 2 2 xy 2
( )
2x y
66, 08264
R 31, 70888
137, 719
σ
σ = σ = ≈
Calificaciones
Tiempo 0 1 2 3 4 5
0 – 4 1
4 – 8 2 2 1 8 – 12 7 5 7
12 – 16 2 5 7
16 - 20 1
Prueba de Evaluación Continua Grupo B 3-XI-16
1.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:
4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
b) El Percentil 90.
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
d) La moda.
e) Realizar el diagrama de caja.
f) ¿Hay valores atípicos?
(3 puntos)
2.-Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización del test:
Intervalo ni
400-500 3
500-600 3
600-700 8
700-800 5
800-900 4
900-1000 5
1000-1100 11
Se pide:
a) El tiempo más frecuente.
b) La mediana.
c) Sesgo
(2 puntos)
3.- La siguiente tabla recoge las calificaciones y de la variable tiempo (minutos) utilizado en la realización del test de Estadística
a) Hallar el coeficiente de correlación lineal. Interpretarlo.
b) Si un alumno tiene un 5 ¿cuál será el tiempo estimado?
c) Si un alumno emplea 10 minutos en realizar el test ¿qué calificación se estima que tendrá?
d) Calcular la varianza no explicada o residual por el ajuste lineal de la calificación sobre el tiempo.
(3 puntos)
1.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:
4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
b) El Percentil 90.
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
d) La moda.
e) Realizar el diagrama de caja.
f) ¿Hay valores atípicos?
Solución:
xi ni Ni fi Fi
0 1 1 0,02564103 0,02564103
1 3 4 0,07692308 0,1025641
2 4 8 0,1025641 0,20512821
3 1 9 0,02564103 0,23076923
4 7 16 0,17948718 0,41025641
5 11 27 0,28205128 0,69230769
6 4 31 0,1025641 0,79487179
7 5 36 0,12820513 0,92307692
8 1 37 0,02564103 0,94871795
9 2 39 0,05128205 1
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
4+5+1+2=12 sobre el total de 39, resulta 12/39%
b) El Percentil 90.
El 90% de 39 es igual a 35,1 y en la columna de frecuencias absolutas acumuladas el primer valor que lo excede es 36 que corresponde al 7 = P90
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
La frecuencia relativa correspondiente al valor 8 ó menos es 37/39 aproximadamente 0,94871, luego es el percentil 94,87
d) La moda.
Moda es el valor que más se repite que es la calificación de 5.
e) Primer cuartil igual a 4, el primer valor que excede al 0,25 de frecuencia relativa acumulada.
Segundo cuartil o mediana igual a 5, el primer valor que excede al 0,5 de frecuencia relativa acumulada.
Tercer cuartil igual a 6, el primer valor que excede al 0,75 de frecuencia relativa acumulada.
Realizar el diagrama de caja.
Mínimo=0, Q1=4, M=5, Q3=6, Máximo=9
Observando el rango intercuartílico IQR = Q3-Q1= 6-4=2, tenemos como límites
Q1- 1,5 IQ= 1; siendo el límite inferior y existen valores atípicos.
Q3+ 1,5 IQ= 9 siendo el límite superior y no existen valores atípicos.
f) ¿Hay valores atípicos? El cero.
2.-Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización del test:
Intervalo ni
400-500 3
500-600 3
600-700 8
700-800 5
800-900 4
900-1000 5
1000-1100 11
Se pide: a) El tiempo más frecuente. b) La mediana. c) Sesgo Solución:
Intervalo ni Ni
400-500 3 3
500-600 3 6
600-700 8 14 700-800 5 19 800-900 4 23
0 ,00 2 ,00 4 ,00 6 ,00 8 ,00
notas test
Calificaciones
Tiempo 0 1 2 3 4 5
0 – 4 1
4 – 8 2 2 1 8 – 12 7 5 7
12 – 16 2 5 7
16 - 20 1
900-1000 5 28 1000-1100 11 39 a) El tiempo más frecuente.
La moda está en el intervalo (1000,1100) b) La mediana.
La mediana es el valor que deja a su izquierda el 50% de la población, es decir, n 39
19, 5
2 = 2 = que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (800,900).
Por consiguiente la mediana es:
( )
j 1 j 1
j
n N a
19, 5 19 100
M e 2 800
n 4
−
−
−
−
= + = + = 812,5
c) Sesgo
xi ni xini
(
xi−x)
2ni(
xi−x)
3ni450 3 1350 392130,2 -141770141
550 3 1650 205207,1 -53669549,4
650 8 5200 208757,4 -33722348,7
750 5 3750 18934,91 -1165225,31
850 4 3400 5917,16 227583,068
950 5 4750 95857,99 13272644,5
1050 11 11550 625503 149158398
Sumas 31650 1552308 -67668639,1
Momentos 811,54 39802,76 -1735093,31
Desv. típica 199,5063 -0,2185008
3
3 1
1 3 3 3
67668639,1
( )
39 1552308
39 µ
σ = σ
− −
= = = =
∑
k i ii
x X f
g -0,2185008
3.- La siguiente tabla recoge las calificaciones y de la variable tiempo (minutos) utilizado en la realización del test de Estadística
a) Hallar el coeficiente de correlación lineal. Interpretarlo.
b) Si un alumno tiene un 5 ¿cuál será el tiempo estimado?
c) Si un alumno emplea 10 minutos en realizar el test ¿qué calificación se estima que tendrá?
d) Calcular la varianza no explicada o residual por el ajuste lineal de la calificación sobre el tiempo.
Solución
x\y 0 1 2 3 5 ni. xini. xi2ni.
2 1 1 2 4
6 2 2 1 5 30 180
10 7 5 7 19 190 1900
14 2 5 7 14 196 2744
18 1 1 18 324
n.j 3 9 8 12 8 40 436 5152
yjn.j 0 9 16 36 40 101
yj2n.j 0 9 32 108 200 349
14 82 84 140 116
xiyjnij 0 82 168 420 580 1250
RESULTADOS:
X Y
m1 10,9 2,525
m2 128,8 8,725
σ2 9,99 2,349375
m11 31,25
σxy 3,7275
r 0,769412
a) Medias
5 . 1
1
=
=
∑
i ii
x x n
n =436 10, 9 40 = ;
5 . 1
1
=
=
∑
j jj
y y n
n =101 2,525 40 = Varianzas
5
2 2 2
. 1
1
=
=
∑
−x i i
i
x n x σ n
5152 436 2
9, 99
40 40
= − = ;
5
2 2 2
. 1
1
=
=
∑
−y j j
j
y n y σ n
349 101 2
2, 349
40 40
= − =
i i i i
xy
x y n
1250 436 101
XY 3, 7275
n 40 40 40
σ =
∑
− = − ⋅ =xy xy
x y
3, 7275
r 0, 77
9, 9 2, 349
= σ = ≈
σ σ . El ajuste es “bueno” y directo por ser un valor superior a 0,7
b) La recta de regresión de x sobre y permite determinar los valores de x para valores conocidos de y: x− =X σσxy2
(
y Y−)
436 3, 7275 101
x y
40 2, 349 40
− = − ⇒ x = 1,586845466·y + 6,893215197 Para y=5 se obtiene un tiempo de x = 1,586845466·5 + 6,893215197 = 14,83 c) La recta de regresión de y sobre x permite determinar los valores de y para
valores conocidos de x: xy2
( )
x
y Y σ x X
− = −
σ 101 3, 7275 436
y x
40 9, 99 40
− = − ⇒
y = 0,3731231231·x – 1,5420420422
Para x=10 se obtiene una calificación de y = 0.3731231231·10 - 1.542042042= 2,19 d) La varianza residual es σ = −2r