• No se han encontrado resultados

Estadística Descriptiva y Regresión y Correlación

N/A
N/A
Protected

Academic year: 2022

Share "Estadística Descriptiva y Regresión y Correlación"

Copied!
9
0
0

Texto completo

(1)

GRUPO A: Prueba de Evaluación Continua 16-X-19

1.- Demostrar que la varianza es la media de los cuadrados de la variable, menos el cuadrado de la media de la variable a partir de la definición de varianza.

(1 punto)

2.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:

4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.

b) El Percentil 90.

c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?

d) La moda.

e) Realizar el diagrama de caja.

f) ¿Hay valores atípicos?

(3 puntos)

3.- Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización de un test:

Intervalo ni

400-500 3

500-600 3

600-700 8

700-800 5

800-900 4

900-1000 5

1000-1100 11

Se pide:

a) El tiempo más frecuente.

b) La mediana.

(1 punto)

4.- Se han realizado 10 mediciones de distintas distancias (Y) y se ha estimado el correspondiente error (X), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada:

X\Y 0,1 0,2 0,3 0,4 0,5

0,01 3 0 0 0 0

0,02 1 1 0 0 0

0,03 0 1 2 0 0

0,04 0 0 0 1 1

Se pide:

a) Centro de gravedad de la distribución conjunta.

b) Recta de regresión de y sobre x.

c) El coeficiente de correlación lineal. Interpretarlo.

(3 puntos)

Fecha de publicación de calificaciones: miércoles 30 de OCTUBRE de 2019.

Revisión de la prueba en el horario de tutorías del profesor/a.

(2)

GRUPO B: Prueba de Evaluación Continua 16-X-19

1.- Concepto y expresión analítica de “varianza residual” y “varianza no explicada”

(1 punto)

2.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 segundos. En la tabla adjunta se reflejan las medidas de las variables GP:

4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3

Se pide:

a) El Percentil 70 b) La moda.

c) Realizar el diagrama de caja.

d) ¿Hay valores atípicos?

(3 puntos)

3.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:

Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10

ni 10 7 69 41 3

a) ¿Cuál es el valor de la mediana?

b) ¿En qué percentil está situada una persona con una calificación de 5?

(1 punto)

4.- Sea la distribución conjunta de la variable x = “número de habitaciones de un piso” con respecto a la variable y = “precio de alquiler en euros”.

x\y 0-500 500-1000 1000- 1500 2 2 2 0 3 8 12 16 4 4 13 18 Se pide:

a) Centro de gravedad de la distribución conjunta.

b) Recta de regresión de x sobre y.

c) Coeficiente de determinación. Interpretarlo.

(3 puntos)

Fecha de publicación de calificaciones: miércoles 30 de OCTUBRE de 2019.

Revisión de la prueba en el horario de tutorías del profesor/a.

(3)

GRUPO A: Prueba de Evaluación Continua 16-X-19

1.- Demostrar que la varianza es la media de los cuadrados de la variable, menos el cuadrado de la media de la variable a partir de la definición de varianza.

Demostración:

( ) ( )

k 2 k 2

2 2

x i i i i i i i

i 1 i 1

x X f x f 2x Xf X f

= =

σ =

− =

− + = k i2 i 2

i 1

x f X

=

2.- La siguiente tabla recoge las calificaciones de una prueba tipo test de Estadística:

4 2 5 5 7 4 8 4 5 5 6 9 5 2 4 7 7 4 2 7 5 1 6 5 5 3 1 6 4 1 5 0 5 7 5 9 6 2 4 Se pide:

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.

b) El Percentil 90.

c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?

d) La moda.

e) Realizar el diagrama de caja.

f) ¿Hay valores atípicos?

Solución:

xi ni Ni fi Fi

0 1 1 0,02564103 0,02564103

1 3 4 0,07692308 0,1025641

2 4 8 0,1025641 0,20512821

3 1 9 0,02564103 0,23076923

4 7 16 0,17948718 0,41025641

5 11 27 0,28205128 0,69230769

6 4 31 0,1025641 0,79487179

7 5 36 0,12820513 0,92307692

8 1 37 0,02564103 0,94871795

9 2 39 0,05128205 1

a) Porcentaje de alumnos que obtiene una calificación superior o igual a 6.

4+5+1+2=12 sobre el total de 39, resulta 12/39%

b) El Percentil 90.

El 90% de 39 es igual a 35,1 y en la columna de frecuencias absolutas acumuladas el primer valor que lo excede es 36 que corresponde al 7 = P90

c) ¿Qué percentil le corresponde a un alumno que tiene una calificación de 8?

La frecuencia relativa correspondiente al valor 8 ó menos es 37/39 aproximadamente 0,94871, luego es el percentil 94,87

d) Moda es el valor que más se repite que es la calificación de 5.

(4)

e) Primer cuartil igual a 4, el primer valor que excede al 0,25 de frecuencia relativa acumulada.

Segundo cuartil o mediana igual a 5, el primer valor que excede al 0,5 de frecuencia relativa acumulada.

Tercer cuartil igual a 6, el primer valor que excede al 0,75 de frecuencia relativa acumulada.

Mínimo=0, Q1=4, M=5, Q3=6, Máximo=9

Observando el rango intercuartílico IQR = Q3-Q1= 6-4=2, tenemos como límites Q1- 1,5 IQR= 1; siendo el límite inferior y existen valores atípicos.

Q3+ 1,5 IQR= 9 siendo el límite superior y no existen valores atípicos.

f) ¿Hay valores atípicos? El cero.

3.- Dada la distribución de frecuencias de la variable tiempo (segundos) utilizado en la realización de un test:

Intervalo ni

400-500 3

500-600 3

600-700 8

700-800 5

800-900 4

900-1000 5

1000-1100 11

Se pide: a) El tiempo más frecuente. b) La mediana.

Solución:

Intervalo ni Ni

400-500 3 3

500-600 3 6

600-700 8 14

700-800 5 19

800-900 4 23

900-1000 5 28

1000-1100 11 39

0 ,00 2 ,00 4 ,00 6 ,00 8 ,00

notas test A

(5)

a) El tiempo más frecuente.

La moda está en el intervalo (1000, 1100) b) La mediana.

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 39

19, 5

2 = 2 = que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (800, 900).

Por consiguiente, la mediana es:

( )

j 1

j 1

j

N N a

19, 5 19 100

M e 2 800

n 4

 − 

  −

 

= + = + = 812,5

4.- Se han realizado 10 mediciones de distintas distancias (Y) y se ha estimado el correspondiente error (X), cuyos resultados vienen reflejados en la siguiente tabla de doble entrada: a) Centro de gravedad de la distribución conjunta. b) Recta de regresión de y sobre x. c) El coeficiente de correlación lineal.

Interpretarlo.

Solución:

X\Y 0,1 0,2 0,3 0,4 0,5 ni. Xini. Xi2ni.

0,01 3 0 0 0 0 3 0,03 0,0003

0,02 1 1 0 0 0 2 0,04 0,0008

0,03 0 1 2 0 0 3 0,09 0,0027

0,04 0 0 0 1 1 2 0,08 0,0032

n.j 4 2 2 1 1 10 0,24 0,007

Yjn.j 0,4 0,4 0,6 0,4 0,50 2,3

Yj2n.j 0,04 0,08 0,18 0,16 0,25 0,71

0,05 0,05 0,06 0,04 0,04 0,24

0,005 0,01 0,018 0,016 0,02 0,07

RESULTADOS:

X Y

m1 0,024 0,23

m2 0,0007 0,071

0,000124 0,0181

m11 0,0069

0,00138

r 0,92115

a) Error medio Distancia media

i i.

i

x n 0, 24 X=

N = 10 =

0, 024 ;

j . j j

y n 2, 3 Y=

N = 10 =

0, 23 σ2

σxy

(6)

( )

X, Y

(

0.024, 0.23

)

b) Varianzas:

( )

2

i i. 2

2 i 2

x

x n 0, 007

X 0, 024

N 10

σ =

− = − =

0, 000124 ;

( )

2 j . j j 2

2 2

y

y n 0, 71

Y 0, 23

N 10

σ =

− = − =

0, 0181

Covarianza:

i j ij i, j

xy 11

x y n

0, 069

m XY XY 0, 024 0, 23

N 10

σ = − =

− = − ⋅ =

0, 00138

Recta de regresión de y sobre x: xy2

( )

x

y Y σ x X

− = −

σ

(

y 0, 23

)

0, 00138

(

x 0, 024

)

0, 000124

− = − ⇒ y=11,12903225·x 0.03709677419−

c) El coeficiente de correlación lineal:

xy

yx xy

x y

r b b σ

= ± ⋅ = =

σ σ 0,92115 Correlación fuerte y directa

(7)

GRUPO B: Prueba de Evaluación Continua 16-X-19

1.- Concepto y expresión analítica de “varianza residual” y “varianza no explicada”

Solución:

La varianza residual se define como la varianza de los errores o residuos

n

2 2

r i i

i 1

1 (y * y ) n =

σ =

Es lo mismo, la varianza no explicada representa, la parte de la variación de Y que no es capaz de explicar el modelo elegido, puede interpretarse como una medida de la bondad del ajuste.

2.- Se toman 20 medidas a un grupo de 4 o más satélites en intervalos de 15 segundos. En la tabla adjunta se reflejan las medidas de las variables GP:

4,7 4,7 4,8 4,9 5 5 5 5 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,2 5,3 5,3 5,3 5,3

Se pide:

a) ¿Qué percentil le corresponde a un valor de GP de 5?

b) La moda.

c) Realizar el diagrama de caja. ¿Hay valores atípicos?

Solución:

a) Polígono de frecuencias absolutas acumuladas.

x

i

n

i

N

i

4,7 2 2

4,8 1 3

4,9 1 4

5 4 8

5,1 5 13

5,2 3 16

5,3 4 20

a) La frecuencia relativa correspondiente al valor 5 o menos es 8/20 aproximadamente 0,4, luego es el percentil 40

b) Moda es el valor que más se repite que es la calificación de 5,1.

c) Realizar el diagrama de caja.

Mínimo=4,7, Q1=5, M=5,1, Q3=5,2, Máximo=5,3

Primer cuartil igual a 5, el primer valor que excede al 0,25 de frecuencia relativa acumulada.

Segundo cuartil o mediana igual a 5,1, el primer valor que excede al 0,5 de frecuencia relativa acumulada.

Tercer cuartil igual a 5,2, el primer valor que excede al 0,75 de frecuencia relativa acumulada.

Observando el rango intercuartílico IQR = Q3-Q1= 5,2-5=0,2, tenemos como límites

(8)

Q1- 1,5 IQR= 4,7; siendo el límite inferior y no existen valores atípicos.

Q3+ 1,5 IQR= 5,5 no existen valores atípicos y siendo el límite superior 5,3

¿Hay valores atípicos? No hay.

3.- Las calificaciones obtenidas por alumnos de Matemáticas en un examen fueron las siguientes:

Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10

ni 10 7 69 41 3

a) ¿Cuál es el valor de la mediana?

b) ¿En qué percentil está situada una persona con una calificación de 5?

Solución:

a)

Nota 0 – 2 2 – 4 4 – 6 6 – 8 8 – 10

ni 10 7 69 41 3

Ni 10 17 86 127 3

La mediana es el valor que deja a su izquierda el 50% de la población, es decir, N 130

2 = 2 =65 que no se corresponde con un valor de la columna de frecuencias absolutas acumuladas y por tanto hay interpolar en el intervalo (4,6).

Por consiguiente, la mediana es:

( )

j 1

j 1

j

N N a

65 17 2

M e 2 4

n 69

 − 

  −

 

= + = + = 5,391304348

b) La frecuencia relativa correspondiente al valor 5 será (17+69/2)/130 aproximadamente, 0,39615, luego es aproximadamente el percentil 40

4.- Sea la distribución conjunta de la variable x = “número de habitaciones de un piso” con respecto a la variable y = “precio de alquiler en euros”.

x\y 0-500 500-1000 1000- 1500 2 2 2 0 3 8 12 16 4 4 13 18 Se pide:

a) Centro de gravedad de la distribución conjunta.

b) Recta de regresión de x sobre y.

c) Coeficiente de determinación. Interpretarlo.

4 ,80 5 ,00 5 ,20

GP

(9)

x\y 250 750 1250 ni. xini. xi2ni.

2 2 2 0 4 8 16

3 8 12 16 36 108 324

4 4 13 18 35 140 560

n,j 14 27 34 75 256 900

yjn.j 3500 20250 42500 66250 yj2n.j 875000 15187500 53125000 69187500

iij

i

x n 44 92 120 256

j iij

i

yx n 11000 69000 150000 230000 RESULTADOS:

x y

m1 3,413333333 883,3333333

m2 12,00000 922500

varianzas 0,34916 142222,22222 m11 3066,666667

covarianza 51,55555556

r 0,231356797

a) Centro de gravedad:

( )

X, Y =256 6625075 , 75    = 256 265075 , 3 

(

3.41,883.3

)

b) Recta de regresión de x sobre y: xy2

( )

y

x X σ y Y

− = −

σ

i j ij i, j

xy

x y n

230000 256 2650

XY 51, 56

N 75 75 3

σ =

− = − ⋅ =

( )

2

i i 2 2

2 i

y

y n 691875 2650

Y 142222, 22

N 75 3

 

σ = − = −  =

256 51, 56 2650

x y

75 142222, 22 3

 

− =  −  ⇒ =x 0.000036253125y+3, 093125

c)

2 2

2 xy 2

x y

51, 56

R 0, 23 0, 059

0, 3491 142222, 2

 σ   

=σ σ  =  ≈ ≈ , El ajuste es “malo”

por ser un valor próximo a cero.

Referencias

Documento similar

Ahora ve:.. El ayudante de cocina ayudó a la reconocida cocinera con la presentación del plato.. Preparando la presentación del plato, el ayudante de cocina ayudó a la

La variación de la energía térmica en un sistema se produce mediante el trabajo o el calor.. Por ejemplo, cuando usamos una bomba manual para inflar un neumático de

Pero cuando vio a Mar sacar el fuego de bajo su ala, voló de vuelta a su tribu a contarles lo que había visto.... Justo antes de que el sol saliera, Tatkanna se despertó y comenzó

o esperar la resolución expresa" (artículo 94 de la Ley de procedimiento administrativo). Luego si opta por esperar la resolución expresa, todo queda supeditado a que se

En tales circunstancias, una forma de proceder posible sería iniciar una fase preconstitucional de diálogo nacional, como sucedió en Sudáfrica, para reunir a

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

A Carlos Eduardo, Oscar y Gilma, mis colegas de doctorado que ya se graduaron y que fueron mi ejemplo y grupo de apoyo. Por supuesto a todos los Emes, amigos