Prueba de Evaluación Continua 13-III-18
1.- Dada la variable x y la nueva variable y=a+bx, indicar (demostrándolo) la expresión existente entre las respectivas medias aritméticas.
(0,5 puntos)
2.- Investigados los precios de ordenadores de 50 marcas distintas se han obtenido los siguientes resultados:
700 300 500 400 500 700 400 750 700 300
500 750 300 700 1000 1250 500 750 500 750
400 500 300 500 1000 300 400 500 400 500
300 400 700 400 700 500 400 700 1000 750
700 800 750 700 750 800 700 700 1200 800
a) Determinar la distribución de precios agrupados en frecuencias absolutas.
b) Representar gráficamente el polígono de frecuencias acumuladas.
c) Calcular el precio medio y el más frecuente.
d) Calcular la varianza y el coeficiente de variación.
e) Obtener el sesgo y la curtosis o apuntamiento.
f) Si queremos un ordenador cuyo precio corresponda como mínimo al 10% de los precios más caros, ¿cuál será el precio correspondiente?
g) ¿Existen precios atípicos según el diagrama de cajas?
(2 puntos)
3.- Dada la gráfica correspondiente a un polígono de frecuencias relativas
acumulativo de una variable estadística agrupada en intervalos de una muestra de tamaño n=20. Se pide: a) Formar la tabla de distribución de frecuencias absolutas.
b) Encontrar la mediana, moda y media.
Fi
(1,5 puntos)
4.- Los siguientes datos representan los resultados, notas, de una determinada asignatura (Y) y el número de horas de estudio semanales (X) de 16 alumnos.
i 96
i
x
i 64i
y
i i 492i
x y
i2 657i
x
i2 526i
y
Se pide:
a) Estimar el modelo de regresión lineal que relaciona los resultados obtenidos con el número de horas dedicadas al estudio.
b) Calcule una medida de la bondad del ajuste e interprete el resultado.
c) Si un alumno ha estudiado 8 horas, ¿qué nota espera obtener en el examen?
(4 puntos) 1
0.85 0.45 0.15
0 20 40 60 80 100
1.- Dada la variable x y la nueva variable y=a+bx, indicar (demostrándolo) la expresión existente entre las respectivas medias aritméticas.
Solución:
k k
i i i i
i 1 i 1
y a bx a bx f a b x f a bx
2.- Investigados los precios de ordenadores de 50 marcas distintas se han obtenido los siguientes resultados:
700 300 500 400 500 700 400 750 700 300
500 750 300 700 1000 1250 500 750 500 750
400 500 300 500 1000 300 400 500 400 500
300 400 700 400 700 500 400 700 1000 750
700 800 750 700 750 800 700 700 1200 800
a) Determinar la distribución de precios agrupados en frecuencias absolutas.
b) Representar gráficamente el polígono de frecuencias acumuladas.
c) Calcular el precio medio y el más frecuente.
d) Calcular la varianza y el coeficiente de variación.
e) Obtener el sesgo y la curtosis o apuntamiento.
f) Si queremos un ordenador cuyo precio corresponda como mínimo al 10% de los precios más caros, ¿cuál será el precio correspondiente?
g) ¿Existen precios atípicos según el diagrama de cajas?
Solución:
a)
xi ni Ni
300 6 6
400 8 14
500 10 24
700 11 35
750 7 42
800 3 45
1000 3 48
1200 1 49
1250 1 50
∑
50b) Polígono de frecuencias absolutas acumuladas
xi ni xini
300 6 1800 599136 -189326976 59827324416
400 8 3200 373248 -80621568 17414258688
500 10 5000 134560 -15608960 1810639360
700 11 7700 77616 6519744 547658496
750 7 5250 125692 16842728 2256925552
800 3 2400 101568 18688512 3438686208
1000 3 3000 442368 169869312 65229815808
1200 1 1200 341056 199176704 1,16319E+11
1250 1 1250 401956 254840104 1,61569E+11
sumas 50 30800 2597200 380379600 4,28413E+11
momentos 616 51944 7607592 8568262592
c) Media
k k k
i
i i i i i
i 1 i 1 i 1
n 1 30800
X f x x n x
N N 50
616Moda
El valor que más repite Mo=700 d) Varianza
k 2
2 i i
i 1
(x X) n
N
259720050 51944Desviación típica
2 51944
227,9123 Coeficiente de variación
227,9123
CV X 616
0,369987 e) Sesgo
k 3
i i
3 i 1
1 3 3 3
(x X) f
7607592
g 227,9123
0, 64260504 Asimétrica por la derecha.Curtosis
k 4
i i
i 1 4
2 4 4 4
(x X) f
8568262592
g 3 3 3
227,9123
0,175572177 Más apuntadaque la distribución Normal de la misma media y misma desviación típica.
f) Percentil 90
El 90% de 50 es 45 que directamente según el polígono de frecuencias acumuladas es corresponde a los valores 800 y 1000 se toma el punto medio 900
g) Diagrama de cajas.
Calculamos los 5 valores: Mínimo, Q1, M, Q3, Máximo
Mínimo = 300
Q1 es el valor que deja a su izquierda el 25% de la población, es decir, N 50 12,5 4 4 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 400.
M 700 es el valor central.
Q3 es el valor que deja a su izquierda el 75% de la población, es decir, 3N 50 37,5 4 4 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto es el siguiente 750.
Máximo = 1250
Observando el rango intercuartílico IQR = Q3-Q1= 350, tenemos como límites Q1- 1,5 IQ= -125; quedando como límite inferior el mínimo 300.
Q3+ 1,5 IQ= 1275 quedando como límite superior el máximo 1250.
No hay valores atípicos.
3.- Dada la gráfica correspondiente a un polígono de frecuencias relativas acumulativo de una variable estadística agrupada en intervalos de una muestra de tamaño n=20. Se pide: a) Formar la tabla de distribución de frecuencias absolutas.
b) Encontrar la mediana, moda y media.
Solución:
a)
CLASE fi Ni ni xi xini
0-20 0,15 3 3 10 30
20-40 0,45 9 6 30 180
40-60 0,85 17 8 50 400
60-80 0,85 17 0 70 0
80-100 1 20 3 90 270
sumas 20 880
momentos mi 44
b) Media
k i i i 1
1 880
X n x =
N 20
44La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 20
2 2 10 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (40, 60).
4 00,0 0 600 ,00 8 00 ,0 0 100 0 ,00 1 20 0 ,00
Precios
Por consiguiente, la mediana es:
j 1 j 1
j
N N a
10 9 20
M e 2 40
n 8
42,5
La moda corresponde al intervalo de mayor frecuencia que es (40, 60).
4.- Los siguientes datos representan los resultados, notas, de una determinada asignatura (Y) y el número de horas de estudio semanales (X) de 16 alumnos.
i i
x 96
ii
y 64
i ii
x y 492
2ii
x 657
i2i
y 526
Se pide:
a) Estimar el modelo de regresión lineal que relaciona los resultados obtenidos con el número de horas dedicadas al estudio.
b) Calcule una medida de la bondad del ajuste e interprete el resultado.
c) Si un alumno ha estudiado 8 horas, ¿qué nota espera obtener en el examen?
d) ¿Cuál es el número de horas mínimo que un alumno debe estudiar para superar la asignatura? Considerad que el 5 es el aprobado.
Solución:
a)
16 16
i i
i 1 i 1
x y
96 64
X 6;Y 4
n 16 n 16
16 2
i 2
2 i 1 2
x
x 657
X -6 5,0625
n 16
16 2
i 2
2 i 1 2
y
y 526
Y 4 16,875
n 16
16 i i i i
xy
x y n
XY 492 6 4 6, 75
n 16
La ecuación de la recta de Y sobre X es:
xy 2 x
y Y x X y 4 6,75 x 6
5,0625
y 4x 4
3 b) xy xy
x y
r 6,75
5,0625 16,875
0,7302967433
por tanto, la relación lineal es directa y buena c) Si x=8 horas, entonces y 4 8 4 6, 6
3
d) Recta de regresión de X sobre Y: xy2
y
x X y Y
e y=5
x-6 6,75 5 4 16,875
x 6, 4 horas