GRUPO A: Prueba de Evaluación Continua 16-X-19
1.- Demostrar que la varianza es la media de los cuadrados de la variable, menos el cuadrado de la media de la variable a partir de la definición de varianza.
(1 punto)
2.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:
4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
b) El Percentil 90.
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
d) La moda.
e) Realizar el diagrama de caja.
f) ¿Hay valores atípicos?
(3 puntos)
3.- Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización de un test:
Intervalo ni
400-500 3
500-600 3
600-700 8
700-800 5
800-900 4
900-1000 5
1000-1100 11
Se pide:
a) El tiempo más frecuente.
b) La mediana.
(1 punto)
4.- Se han realizado 10 mediciones de distintas distancias (Y) y se ha estimado el correspondiente error (X), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada:
X\Y 0,1 0,2 0,3 0,4 0,5
0,01 3 0 0 0 0
0,02 1 1 0 0 0
0,03 0 1 2 0 0
0,04 0 0 0 1 1
Se pide:
a) Centro de gravedad de la distribución conjunta.
b) Recta de regresión de y sobre x.
c) El coeficiente de correlación lineal. Interpretarlo.
(3 puntos)
Fecha de publicación de calificaciones: miércoles 30 de OCTUBRE de 2019.
Revisión de la prueba en el horario de tutorías del profesor/a.
GRUPO B: Prueba de Evaluación Continua 16-X-19
1.- Concepto y expresión analítica de “varianza residual” y “varianza no explicada”
(1 punto)
2.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 segundos. En la tabla adjunta se reflejan las medidas de las variables GP:
4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3
Se pide:
a) El Percentil 70 b) La moda.
c) Realizar el diagrama de caja.
d) ¿Hay valores atípicos?
(3 puntos)
3.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:
Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10
ni 10 7 69 41 3
a) ¿Cuál es el valor de la mediana?
b) ¿En qué percentil está situada una persona con una calificación de 5?
(1 punto)
4.- Sea la distribución conjunta de la variable x = “número de habitaciones de un piso” con respecto a la variable y = “precio de alquiler en euros”.
x\y 0-500 500-1000 1000- 1500 2 2 2 0 3 8 12 16 4 4 13 18 Se pide:
a) Centro de gravedad de la distribución conjunta.
b) Recta de regresión de x sobre y.
c) Coeficiente de determinación. Interpretarlo.
(3 puntos)
Fecha de publicación de calificaciones: miércoles 30 de OCTUBRE de 2019.
Revisión de la prueba en el horario de tutorías del profesor/a.
GRUPO A: Prueba de Evaluación Continua 16-X-19
1.- Demostrar que la varianza es la media de los cuadrados de la variable, menos el cuadrado de la media de la variable a partir de la definición de varianza.
Demostración:
( ) ( )
k 2 k 2
2 2
x i i i i i i i
i 1 i 1
x X f x f 2x Xf X f
= =
σ =
∑
− =∑
− + = k i2 i 2i 1
x f X
=
∑
−2.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:
4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
b) El Percentil 90.
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
d) La moda.
e) Realizar el diagrama de caja.
f) ¿Hay valores atípicos?
Solución:
xi ni Ni fi Fi
0 1 1 0,02564103 0,02564103
1 3 4 0,07692308 0,1025641
2 4 8 0,1025641 0,20512821
3 1 9 0,02564103 0,23076923
4 7 16 0,17948718 0,41025641
5 11 27 0,28205128 0,69230769
6 4 31 0,1025641 0,79487179
7 5 36 0,12820513 0,92307692
8 1 37 0,02564103 0,94871795
9 2 39 0,05128205 1
a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.
4+5+1+2=12 sobre el total de 39, resulta 12/39%
b) El Percentil 90.
El 90% de 39 es igual a 35,1 y en la columna de frecuencias absolutas acumuladas el primer valor que lo excede es 36 que corresponde al 7 = P90
c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?
La frecuencia relativa correspondiente al valor 8 ó menos es 37/39 aproximadamente 0,94871, luego es el percentil 94,87
d) Moda es el valor que más se repite que es la calificación de 5.
e) Primer cuartil igual a 4, el primer valor que excede al 0,25 de frecuencia relativa acumulada.
Segundo cuartil o mediana igual a 5, el primer valor que excede al 0,5 de frecuencia relativa acumulada.
Tercer cuartil igual a 6, el primer valor que excede al 0,75 de frecuencia relativa acumulada.
Mínimo=0, Q1=4, M=5, Q3=6, Máximo=9
Observando el rango intercuartílico IQR = Q3-Q1= 6-4=2, tenemos como límites Q1- 1,5 IQR= 1; siendo el límite inferior y existen valores atípicos.
Q3+ 1,5 IQR= 9 siendo el límite superior y no existen valores atípicos.
f) ¿Hay valores atípicos? El cero.
3.- Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización de un test:
Intervalo ni
400-500 3
500-600 3
600-700 8
700-800 5
800-900 4
900-1000 5
1000-1100 11
Se pide: a) El tiempo más frecuente. b) La mediana.
Solución:
Intervalo ni Ni
400-500 3 3
500-600 3 6
600-700 8 14
700-800 5 19
800-900 4 23
900-1000 5 28
1000-1100 11 39
0 ,00 2 ,00 4 ,00 6 ,00 8 ,00
notas test A
a) El tiempo más frecuente.
La moda está en el intervalo (1000, 1100) b) La mediana.
La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 39
19, 5
2 = 2 = que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (800, 900).
Por consiguiente, la mediana es:
( )
j 1
j 1
j
N N a
19, 5 19 100
M e 2 800
n 4
−
−
−
−
= + = + = 812,5
4.- Se han realizado 10 mediciones de distintas distancias (Y) y se ha estimado el correspondiente error (X), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada: a) Centro de gravedad de la distribución conjunta. b) Recta de regresión de y sobre x. c) El coeficiente de correlación lineal.
Interpretarlo.
Solución:
X\Y 0,1 0,2 0,3 0,4 0,5 ni. Xini. Xi2ni.
0,01 3 0 0 0 0 3 0,03 0,0003
0,02 1 1 0 0 0 2 0,04 0,0008
0,03 0 1 2 0 0 3 0,09 0,0027
0,04 0 0 0 1 1 2 0,08 0,0032
n.j 4 2 2 1 1 10 0,24 0,007
Yjn.j 0,4 0,4 0,6 0,4 0,50 2,3
Yj2n.j 0,04 0,08 0,18 0,16 0,25 0,71
0,05 0,05 0,06 0,04 0,04 0,24
0,005 0,01 0,018 0,016 0,02 0,07
RESULTADOS:
X Y
m1 0,024 0,23
m2 0,0007 0,071
0,000124 0,0181
m11 0,0069
0,00138
r 0,92115
a) Error medio Distancia media
i i.
i
x n 0, 24 X=
∑
N = 10 =0, 024 ;
j . j j
y n 2, 3 Y=
∑
N = 10 =0, 23 σ2
σxy
( )
X, Y ≈(
0.024, 0.23)
b) Varianzas:( )
2
i i. 2
2 i 2
x
x n 0, 007
X 0, 024
N 10
σ =
∑
− = − =0, 000124 ;
( )
2 j . j j 2
2 2
y
y n 0, 71
Y 0, 23
N 10
σ =
∑
− = − =0, 0181
Covarianza:
i j ij i, j
xy 11
x y n
0, 069
m XY XY 0, 024 0, 23
N 10
σ = − =
∑
− = − ⋅ =0, 00138
Recta de regresión de y sobre x: xy2
( )
x
y Y σ x X
− = −
σ
(
y 0, 23)
0, 00138(
x 0, 024)
0, 000124
− = − ⇒ y=11,12903225·x 0.03709677419−
c) El coeficiente de correlación lineal:
xy
yx xy
x y
r b b σ
= ± ⋅ = =
σ σ 0,92115 Correlación fuerte y directa
GRUPO B: Prueba de Evaluación Continua 16-X-19
1.- Concepto y expresión analítica de “varianza residual” y “varianza no explicada”
Solución:
La varianza residual se define como la varianza de los errores o residuos
n
2 2
r i i
i 1
1 (y * y ) n =
σ =
∑
−Es lo mismo, la varianza no explicada representa, la parte de la variación de Y que no es capaz de explicar el modelo elegido, puede interpretarse como una medida de la bondad del ajuste.
2.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 segundos. En la tabla adjunta se reflejan las medidas de las variables GP:
4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3
Se pide:
a) ¿Qué percentil le corresponde a un valor de GP de 5?
b) La moda.
c) Realizar el diagrama de caja. ¿Hay valores atípicos?
Solución:
a) Polígono de frecuencias absolutas acumuladas.
x
in
iN
i4,7 2 2
4,8 1 3
4,9 1 4
5 4 8
5,1 5 13
5,2 3 16
5,3 4 20
a) La frecuencia relativa correspondiente al valor 5 o menos es 8/20 aproximadamente 0,4, luego es el percentil 40
b) Moda es el valor que más se repite que es la calificación de 5,1.
c) Realizar el diagrama de caja.
Mínimo=4,7, Q1=5, M=5,1, Q3=5,2, Máximo=5,3
Primer cuartil igual a 5, el primer valor que excede al 0,25 de frecuencia relativa acumulada.
Segundo cuartil o mediana igual a 5,1, el primer valor que excede al 0,5 de frecuencia relativa acumulada.
Tercer cuartil igual a 5,2, el primer valor que excede al 0,75 de frecuencia relativa acumulada.
Observando el rango intercuartílico IQR = Q3-Q1= 5,2-5=0,2, tenemos como límites
Q1- 1,5 IQR= 4,7; siendo el límite inferior y no existen valores atípicos.
Q3+ 1,5 IQR= 5,5 no existen valores atípicos y siendo el límite superior 5,3
¿Hay valores atípicos? No hay.
3.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:
Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10
ni 10 7 69 41 3
a) ¿Cuál es el valor de la mediana?
b) ¿En qué percentil está situada una persona con una calificación de 5?
Solución:
a)
Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10
ni 10 7 69 41 3
Ni 10 17 86 127 3
La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 130
2 = 2 =65 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (4,6).
Por consiguiente, la mediana es:
( )
j 1
j 1
j
N N a
65 17 2
M e 2 4
n 69
−
−
−
−
= + = + = 5,391304348
b) La frecuencia relativa correspondiente al valor 5 será (17+69/2)/130 aproximadamente, 0,39615, luego es aproximadamente el percentil 40
4.- Sea la distribución conjunta de la variable x = “número de habitaciones de un piso” con respecto a la variable y = “precio de alquiler en euros”.
x\y 0-500 500-1000 1000- 1500 2 2 2 0 3 8 12 16 4 4 13 18 Se pide:
a) Centro de gravedad de la distribución conjunta.
b) Recta de regresión de x sobre y.
c) Coeficiente de determinación. Interpretarlo.
4 ,80 5 ,00 5 ,20
GP
x\y 250 750 1250 ni. xini. xi2ni.
2 2 2 0 4 8 16
3 8 12 16 36 108 324
4 4 13 18 35 140 560
n,j 14 27 34 75 256 900
yjn.j 3500 20250 42500 66250 yj2n.j 875000 15187500 53125000 69187500
iij
i
∑x n 44 92 120 256
j iij
i
y∑x n 11000 69000 150000 230000 RESULTADOS:
x y
m1 3,413333333 883,3333333
m2 12,00000 922500
varianzas 0,34916 142222,22222 m11 3066,666667
covarianza 51,55555556
r 0,231356797
a) Centro de gravedad:
( )
X, Y =256 6625075 , 75 = 256 265075 , 3 ≈(
3.41,883.3)
b) Recta de regresión de x sobre y: xy2
( )
y
x X σ y Y
− = −
σ
i j ij i, j
xy
x y n
230000 256 2650
XY 51, 56
N 75 75 3
σ =
∑
− = − ⋅ =( )
2
i i 2 2
2 i
y
y n 691875 2650
Y 142222, 22
N 75 3
σ = − = − =
∑
256 51, 56 2650
x y
75 142222, 22 3
− = − ⇒ =x 0.000036253125y+3, 093125
c)
2 2
2 xy 2
x y
51, 56
R 0, 23 0, 059
0, 3491 142222, 2
σ
=σ σ = ≈ ≈ , El ajuste es “malo”
por ser un valor próximo a cero.