Estadística Descriptiva
Prueba de evaluación continua Grupo D 7-XI-13
1.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Cálculo:
4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
b) El Percentil 90.
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
d) La moda y los cuartiles.
e) La media, desviación estándar o desviación típica.
f) Realizar el diagrama de cajas.
g) ¿Hay valores atípicos?
(4,5 puntos)
2.- Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización del test:
Intervalo ni
400-500 3 500-600 3 600-700 8 700-800 5 800-900 4 900-1000 5 1000-1100 11 Se pide:
a) El tiempo más frecuente.
b) La mediana.
c) Sesgo d) Curtosis
(4 puntos)
Estadística Descriptiva
Soluciones:
1.-
xi ni Ni fi Fi
0 1 1 0,02564103 0,02564103 1 3 4 0,07692308 0,1025641 2 4 8 0,1025641 0,20512821 3 1 9 0,02564103 0,23076923 4 7 16 0,17948718 0,41025641 5 11 27 0,28205128 0,69230769 6 4 31 0,1025641 0,79487179 7 5 36 0,12820513 0,92307692
8 1 37 0,02564103 0,94871795
9 2 39 0,05128205 1
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
4+5+1+2=12 sobre el total de 39, resulta 12/39%
b) El Percentil 90.
El 90% de 39 es igual a 35,1 y en la columna de frecuencias absolutas acumuladas el primer valor que lo excede es 36 que correspnde al 7 = P90
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
La frecuencia relativa correspondiente al valor 8 ó menos es 37/39 aproximadamente 0,94871, luego es el percentil 94,87
d) La moda y los cuartiles.
Moda es el valor que más se repite que es la calificación de 5.
Primer cuartil igual a 4, el primer valor que excede al 0,25 de frecuencia relativa acumulada.
Segundo cuartil o mediana igual a 5, el primer valor que excede al 0,5 de frecuencia relativa acumulada.
Estadística Descriptiva
e) La media, desviación estándar o desviación típica.
xi ni xini xi2
ni
0 1 0 0
1 3 3 3
2 4 8 16
3 1 3 9
4 7 28 112
5 11 55 275
6 4 24 144
7 5 35 245
8 1 8 64
9 2 18 162
182 1030 4,66666667 26,4102564 4,63247863
Media
k k k
i
i i i i i
i 1 i 1 i 1
n 1 182
X f x x n x
n n 39
4, 67Varianza
k 2
2 i i
i 1
(x X) n
n
2 i i
2 2
i
x n 1030
X 4, 666666667
n 39
4,63247863
Desviación típica
2 4, 63247863
2,15231936 f) Realizar el diagrama de cajas.
Mínimo=0, Q1=4, M=5, Q3=6, Máximo=9
Observando el rango intercuartílico IQ
= Q3-Q1= 6-4=2, tenemos como límites Q1- 1,5 IQ= 1; siendo el límite inferior y existen valores atípicos.
Q3+ 1,5 IQ= 9 siendo el límite superior y no existen valores atípicos.
g) ¿Hay valores atípicos? El cero.
0 ,00 2 ,00 4 ,00 6 ,00 8 ,00
notas test
A
Estadística Descriptiva
2.-
Intervalo ni Ni xi xini
xix
2ni400-500 3 3 450 1350 392130,2 500-600 3 6 550 1650 205207,1 600-700 8 14 650 5200 208757,4
700-800 5 19 750 3750 18934,91
800-900 4 23 850 3400 5917,16
900-1000 5 28 950 4750 95857,99
1000-1100 11 39 1050 11550 625503
31650 1552308 811,54 39802,76
a) El tiempo más frecuente.
La moda está en el intervalo (1000,1100) b) La mediana.
La mediana es el valor que deja a su izquierda el 50% de la población, es decir, n 39
2 2 19,5 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (800,900).
Por consiguiente la mediana es:
j 1 j 1
j
n N a
19, 5 19 100
M e 2 800
n 4
812,5
c) Sesgo
xi
xix
2ni
xix
3ni
xix
4ni450 392130,2 -141770141 5,126E+10 550 205207,1 -53669549,4 1,404E+10 650 208757,4 -33722348,7 5,447E+09 750 18934,91 -1165225,31 71706173 850 5917,16 227583,068 8753194,9 950 95857,99 13272644,5 1,838E+09 1050 625503 149158398 3,557E+10 1552308 -67668639,1 1,082E+11 39802,76 -1735093,31 2,775E+09 199,5063 -0,2185008 -1,2483737
Estadística Descriptiva
3
3 1
1 3 3 3
67668639,1
( )
39 1552308
39
k i ii
x X f
g 0 2185008,
Asimétrica por la izquierda
d) Curtosis
k
4
-11
i i
i 1 4
2 4 4 2
(x X) f
1, 082 10
g 3 3 3
39802, 76
,
1 2483737
Más apuntada que la distribución Normal de la misma media y de la misma desviación típica muestal.
Estadística Descriptiva
Prueba de evaluación continua Tipo I 20-XI-13
1.- La siguiente tabla recoge los salarios anuales en miles de euros de 20 trabajadores:
20 60 19 10 40 16 16 16 10 19 19 20 20 40 19 16 10 16 70 16 Se pide:
a) Polígono de frecuencias absolutas.
b) Proporción de trabajadores que obtiene un salario superior o igual a 19000.
c) ¿Qué percentil le corresponde a un trabajador con un salario de 20000?
d) Coeficiente de Variación.
e) Diagrama de cajas. ¿Hay valores atípicos?
(4,5 puntos)
2.- Dada la distribución de frecuencias:
Intervalo ni
0-500 3 500-1000 3 1000-1500 8 1500-2000 5 2000-2500 4 Se pide:
a) Polígono de frecuencias absolutas acumuladas.
b) El primer cuartil.
c) Coeficiente de apuntamiento o Curtosis. Interpretación (4 puntos)
Estadística Descriptiva
Soluciones:
1.-
xi ni Ni
10 3 3
16 6 9
19 4 13
20 3 16
40 2 18
60 1 19
70 1 20
a)
b) Proporcíon de trabajadores que obtienen un salario superior o igual a 19.
4+3+2+1+1=11 sobre el total de 20, resulta 11/20
c) ¿Qué percentil le corresponde a un trabajador con un salario de 20 mil?
La frecuencia relativa correspondiente al valor 20 ó menos es 16/20 aproximadamente 0,8, luego es el percentil 80
0 1 2 3 4 5 6 7
10 16 19 20 40 60 70
Estadística Descriptiva
d) Media
Xi ni xini
xix
2ni10 3 30 555
16 6 96 347
19 4 76 85
20 3 60 39
40 2 80 538
60 1 60 1325
70 1 70 2153
∑
20 472 5041k k k
i
i i i i i
i 1 i 1 i 1
n 1 472
X f x x n x
n n 20
23, 6Varianza
k 2
2 i i
i 1
(x X) n
n
504120 252,04Desviación típica
2 252, 04
15,8757677 Coeficiente de Variación
15,8757677
CV X 23, 6
0, 672702021
e) Diagrama de cajas.
Mínimo=10, Q1=16, M=19, Q3=20, Máximo=16
Observando el rango intercuartílico IQR = Q3-Q1= 20-16=4, tenemos como límites Q1- 1,5 IQR= 10; siendo el límite inferior y no existen valores atípicos.
Q3+ 1,5 IQR= 26 siendo el límite superior y existen valores atípicos.
Estadística Descriptiva
2.-
Intervalo xi ni Ni xini
xix
2ni
xix
4ni0-500 250 3 3 750 3544423,440454 4187645841745,850000 500-1000 750 3 6 2250 1033553,875236 356077871005,321000 1000-1500 1250 8 14 10000 60491,493384 457402596,474428 1500-2000 1750 5 19 8750 853024,574669 145530184997,909000 2000-2500 2250 4 23 9000 3334593,572779 2779878573904,470000 ∑ 23 30750 8826086,956522 7469589874250,020000 MOMENTOS
Media 1337 383742,9112 3,24765E+11
a) Polígono de frecuencias absolutas acumuladas.
0 5 10 15 20 25
0 500 1000 1500 2000 2500
Estadística Descriptiva
b) El primer cuartil
Es el valor que deja a su izquierda el 25% de la población, es decir, n 23
5, 75 4 4 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (500,1000).
Por consiguiente el primer cuartil es:
j 1 j 1
j
n N a
5, 75 3 500
M e 4 500
n 3
958,3
c) Curtosis
k
4
-11
i i
i 1 4
2 4 4 2
(x X) f
3, 24765 10
g 3 3 3
383742,9112
,7945958410
Es menos apuntada que la distribución Normal de la misma media y la misma desviación típica
Estadística Descriptiva
Prueba de evaluación continua Tipo II 20-XI-13
1.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 seg. En la tabla adjunta se reflejan las medidas de las variables GP:
4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3 Se pide:
a) Polígono de frecuencias absolutas acumuladas.
b) ¿Qué percentil le corresponde a un valor de GP de 5?
d) La moda.
e) La varianza muestral o cuasivarianza.
f) Realizar el diagrama de cajas. ¿Hay valores atípicos?
(4,5 puntos)
2.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:
Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10
ni 10 7 69 41 3
a) Representar el polígono de frecuencias absolutas.
b) ¿Cuál es el valor de la mediana?
c) ¿En qué percentil está situada una persona con una calificación de 5?
d) Interpretar el Coeficiente de asimetria de Fisher.
(4 puntos)
Estadística Descriptiva
Soluciones:
1. a) Polígono de frecuencias absolutas acumuladas.
xi ni Ni
4,7 2 2
4,8 1 3
4,9 1 4
5 4 8
5,1 5 13
5,2 3 16
5,3 4 20
b) La frecuencia relativa correspondiente al valor 5 ó menos es 8/20 aproximadamente 0,4, luego es el percentil 40
c) La moda.
Moda es el valor que más se repite que es la calificación de 5,1.
d) La varianza muestral o cuasivarianza.
xi ni xini
4,7 2 9,4 0,2738
4,8 1 4,8 0,0729
4,9 1 4,9 0,0289
5 4 20 0,0196
5,1 5 25,5 0,0045
5,2 3 15,6 0,0507
5,3 4 21,2 0,2116
∑
20 101,4 0,662Estadística Descriptiva
Media
k k k
i
i i i i i
i 1 i 1 i 1
n 1 101, 4
X f x x n x
n n 20
5, 07Varianza
k 2
2 i i
i 1
(x X) n
S n 1
0, 66219 0,034842105 f) Realizar el diagrama de cajas.Mínimo=4,7, Q1=5, M=5,1, Q3=5,2, Máximo=5,3
Primer cuartil igual a 5, el primer valor que excede al 0,25 de frecuencia relativa acumulada.
Segundo cuartil o mediana igual a 5,1, el primer valor que excede al 0,5 de frecuencia relativa acumulada.
Tercer cuartil igual a 5,2, el primer valor que excede al 0,75 de frecuencia relativa acumulada.
Observando el rango intercuartílico IQR = Q3-Q1= 5,2-5=0,2, tenemos como límites Q1- 1,5 IQ= 4,7; siendo el límite inferior y no existen valores atípicos.
Q3+ 1,5 IQ= 5,5 no existen valores atípicos y siendo el límite superior 5,3
¿Hay valores atípicos? No hay.
4 ,80 5 ,00 5 ,20
GP
Estadística Descriptiva
2.-
Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10
ni 10 7 69 41 3
Ni 10 17 86 127 3
a)
b) La mediana.
La mediana es el valor que deja a su izquierda el 50% de la población, es decir, n 130
2 2 65 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (4,6).
Por consiguiente la mediana es:
j 1 j 1
j
n N a
65 17 2
M e 2 4
n 69
5,391304348
c) La frecuencia relativa correspondiente al valor 5 será (17+69/2)/130 aproximadamente, 0,39615, luego es aproximadamente el percentil 40
0 10 20 30 40 50 60 70 80
‐1 1 3 5 7 9 11
Estadística Descriptiva
xi ni
xini
xix
2ni
xix
3ni1 10 10 186 ‐799
3 7 21 37,27811 ‐86,02640 5 69 345 6,53254 ‐2,01001 7 41 287 117,42012 198,71097 9 3 27 40,89941 151,01320 Sumas 130 690 387,69231 ‐537,65680
Media
k k k
i
i i i i i
i 1 i 1 i 1
n 1 690
X f x x n x
n n 130
5,308Varianza
k 2
2 i i
i 1
(x X) n
n
387, 692308130 2,982248521 Sesgo
3
3 1
1 3 3 3
537, 656805
( )
130 2, 982248521
k i i i
x X f
g
0,803056398
Asimétrica por la izquierda.