Si los intervalos son diferentes, es decir, tienen amplitud variable ai:i

22  28  Download (1)

Full text

(1)

ESTADÍSTICA UNIDIMENSIONAL

Población (universo): cualquier conjunto de personas, objetos, animales, plantas, instituciones o entes en general que son portadores de una serie de características que nos interesa estudiar. Puede ser finita o infinita según el número de elementos que la componen.

Muestra: todo subconjunto representativo de la población. Tamaño muestral = N.

Atributo: característica poblacional cualitativa (no puede ser medida numéricamente) y dividida en modalidades. Por ejemplo: sexo (hombre, mujer), color, profesión, estado civil (soltero, casado, viudo), imagen pública (mala, regular, buena), etc.

Variable: característica poblacional cuantitativa (puede tomar valores numéricos). Las variables pueden ser discretas (si toman valores puntuales finitos o infinitos) o continuas (si toman infinitos valores en intervalos). Por ejemplo: salarios, ventas, pesos, edades, etc.

TABLA DE FRECUENCIAS

Ejemplo:

Las edades (X) de los 20 niños de una fiesta se distribuyen de la forma siguiente: 3 niños tienen 1 año, 4 niños tienen 2 años, 1 niño tiene 3 años, etc.

Las 2 primeras columnas resumen los datos y, a partir de ellas, se calculan las siguientes.

X

(edad: variable discreta) (frecuencia absoluta: nº de n veces que aparece cada x en

la muestra)

N

(frecuencia absoluta acumulada)

f = n / N

(frecuencia relativa)

F

(frecuencia relativa acumulada)

1 2 3 4 5 6

3 4 1 6 2 4

3 7 8 14 16 20

3/20 = 0’15 4/20 = 0’20 1/20 = 0’05 6/20 =0’30 2/20 = 0’10 4/20 = 0’20

3/20=0’15 7/20=0’35 8/20=0’40 14/20=0’70 16/20=0’80 20/20=1

N = 20

(tamaño muestral) 1

(2)

MEDIDAS DE POSICIÓN

: son valores importantes de la variable X.

1. Media (aritmética):

N n x

X =

⋅ (es el valor medio de las x de la muestra)

2. Moda = Mo:

a) Variable discreta: La moda es el valor x con mayor frecuencia absoluta (n), es decir, el valor de x que aparece más veces en la muestra.

b) Variable continua:

Si los intervalos son iguales, es decir, tienen amplitud constante a:

a n n

n A Mo

i i

i

+ + =

+ −

+

1 1

1

donde (A,B]es el intervalo modal (el de mayor frecuencia absoluta ni).

Si los intervalos son diferentes, es decir, tienen amplitud variable ai: i

i i

i a

d d

d A

Mo

+ + =

+ −

+

1 1

1

donde (A,B]es el intervalo modal (el de mayor densidad de frecuencia di).

3. Mediana = Me:

Para calcular la mediana los valores de x deben estar ordenados de menor a mayor (o viceversa).

a) Variable discreta: La Mediana es el valor de x que ocupa la posición central, es decir, tiene el 50% (N/2) de los valores a su izquierda y el otro 50% (N/2) a su derecha. Si N es impar, coincidirá con el valor central de las x de la muestra. Si N es par, se calculará la media de los dos valores centrales.

b) Variable continua: tanto en el caso de intervalos iguales como diferentes, se calcula de la misma forma (ver ejemplos).

4. Cuartiles: Q1,Q2 = Me,Q3 (los cálculos siguen el mismo procedimiento que para la

mediana).

a) Variable discreta: Los Cuartiles dividen la muestra en cuatro intervalos que contienen el 25% (N/4) de los valores de x.

(3)

Miden la dispersión de los valores de x de la muestra. Las varianzas y desviaciones pueden usarse para comparar la dispersión de dos variables sólo si éstas tienen la misma media aritmética (o la misma mediana).

min max x x R

RANGO = −

( )

2 2

2 X

N n x X S

VARIANZA = ∑ ⋅ −

VARIANZA x

S STANDARD TÍPICA

DESVIACIÓN ( ) =+

2 1 -N

N 2

1

,N SX

X S CORREGIDA

VARIANZA = ⋅

CORREGIDA VARIANZA

N X S CORREGIDA STANDARD

TÍPICA

DESVIACIÓN ( ) , 1=+

(4)

CÁLCULOS para VARIABLE DISCRETA

X

(DISCRETA) n x . n x

2 . n

1 2 3 4 5 6 3 4 1 6 2 4

1.3 = 3 2.4 = 8 3.1 = 3 4.6 = 24 5.2 = 10 6.4 = 24

12 .3 = 3

22 .4 = 16

32 .1 = 9

42 .6 = 96

52 .2 = 50

62 .4 = 144

N = 20 72 318

(5)

Representaciones gráficas para VARIABLE DISCRETA:

DIAGRAMA DE BARRAS Y POLíGONO DE FRECUENCIAS

(las alturas de las barras pueden ser las frecuencias absolutas n, las relativas f o las acumuladas N o F)

5

X n

2

1 3 4 5 6

(6)

CÁLCULOS para VARIABLE CONTINUA

(intervalos IGUALES)

Marca de clase o punto medio del intervalo (A,B]:

2 B A

x= +

X (CONTINUA: en clases o intervalos

iguales)

x

(marca de clase = punto medio del

intervalo)

n x. n x2 . n

[ 0 , 10 ) [ 10 , 20 ) [ 20 , 30 ) [ 30 , 40 )

5 15 25 35 2 3 1 2

5.2 = 10 15.3 = 45 25.1 = 25 35.2 = 70

52 .2 = 50

152 .3 = 675

252 .1 = 625

352 .2 = 2450

N = 8 150 3800

(7)

Representaciones gráficas para VARIABLE CONTINUA con intervalos IGUALES:

HISTOGRAMA Y POLíGONO DE FRECUENCIAS

(las alturas de las barras pueden ser las frecuencias absolutas n, las relativas f o las acumuladas N o F)

7

X n

10

0 20 30 40

(8)

CÁLCULOS para VARIABLE CONTINUA

(intervalos DIFERENTES)

X (CONTINUA: en clases o intervalos

diferentes)

x (marca de clase

= punto medio del intervalo)

n x . n x2 . n d = n / a

(d = densidad de frecuencia, a = amplitud de cada

intervalo) [ 0 , 10 )

[ 10 , 30 ) [ 30 , 50 ) [ 50 , 60 )

5 20 40 55 4 3 5 2

5.4 = 20 20.3 = 60 40.5 = 200 55.2 = 110

52 .4 = 100

202 .3 = 1200

402 .5 = 8000

552 .2 = 6050

4/10 = 0’4 3/20 = 0’15 5/20 = 0’25 2/10 = 0’2

N = 14 390 15350

(Sólo se usan para calcular la moda y dibujar el histograma)

(9)

Representaciones gráficas para VARIABLE CONTINUA con intervalos DIFERENTES:

HISTOGRAMA Y POLíGONO DE FRECUENCIAS

(las alturas de las barras son las densidades de frecuencia d)

9

d

10

0 30 50 60

0’1 0’2

0’3 0’4

X

(10)

EJERCICIOS PROPUESTOS

1. Un opositor se ha sometido a la realización de varias pruebas. En cuatro pruebas ha obtenido la calificación 7, en tres la nota 8, en tres la nota 9 y en dos un 10. ¿Cuál será su calificación media?

Sol: 8,25

2. Encuentra la media, la moda, la mediana, la desviación típica y la varianza de la siguiente distribución:

x 1 2 3 4 5

frecuencia absoluta 3 4 1 6 2

369 , 1 ;

875 , 1 ;

5 , 3 ;

4 ;

3

: x= Mo= Me= σ 2 = σ =

sol

3. La tabla siguiente indica la edad de 40 socios de un club:

Edad 15 16 17 18 19

Nº socios 5 8 2 20 5

a) Haz el diagrama de barras correspondiente.

b) Calcula la media de las edades y la desviación típica. c) Calcula la moda y la mediana.

d) ¿Cuál es la edad máxima del 25% de los socios más jóvenes? ¿Y la edad mínima del 25% de los socios mayores?

Sol:

18 16

)

18 18

)

27 . 1 61

. 1 3

. 17 )

3 1

2

= =

= =

= =

=

Q Q

d

Me Mo

c x

b σ x σ x

4. Se ha realizado una encuesta sobre opiniones políticas a un colectivo de 88 alumnos universitarios, obteniendo los siguientes resultados (0 = extrema derecha, 100 = extrema izquierda):

Puntuación Nº de universitarios [38-44)

[44-50) [50-56) [56-62) [62-68) [68-74) [74-80)

7 8 15 25 18 9 6

a) Dibuja el correspondiente histograma y el diagrama de frecuencias.

b) Calcula la media, la moda, la mediana, la varianza y la desviación típica de esta variable estadística.

(11)

67 , 65 8

, 52

) Q1 = Q3 =

c

5. Considera la siguiente tabla de frecuencias agrupadas:

Intervalo 3,5-6,5 6,5-9,5 9,5-12,5 12,5-15,5 15,5-18,5

Frecuencia 3 5 9 6 2

Dibuja el correspondiente histograma y el polígono de frecuencias. Calcula la media y la desviación típica.

sol: x= 10 88, ; σ x = 3 339,

6. La distribución de edades del profesorado de una universidad viene dada por la tabla siguiente:

menos de 22 años

entre 22 y 30 años

entre 30 y 40 años

entre 40 y 50 años

entre 50 y 60 años

más de 60 años

4 206 172 110 28 8

Tomamos como marcas de clase las medias de cada intervalo. Para el primer intervalo tomamos como marca de clase 21 años. Para el último intervalo tomamos como marca de clase 64 años.

a) Dibuja el histograma de las edades y, a partir de lo que salga, haz alguna reflexión sobre la edad del profesorado de esta universidad.

b) Calcula la media y la desviación típica de esta distribución. c) Calcula la moda y la mediana.

Sol:

14 , 33 17

, 29 )

36 , 9 97

, 34 )

= =

= =

Me Mo

c x

b σ x

7. Los resultados obtenidos al lanzar un dado de color rojo 200 veces están expresados en la siguiente tabla:

Nº puntos 1 2 3 4 5 6

Repeticiones n1 32 35 33 n5 35

Determina los datos que faltan, sabiendo que la puntuación media es 3,6, y calcula la mediana y la moda.

sol: n1= 29 ; n5 = 36 ; Me = 4 ; Mo = 5

(12)

8. Un profesor ha realizado 2 test a un grupo de 40 alumnos, obteniendo los siguientes resultados: - Para el primer test la media es 6 y la desviación típica es 1,5.

- Para el segundo test la media es 4 y la desviación típica es 0,5.

Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo, ¿en cuál de los dos test ha obtenido mejor puntuación? Justifica la respuesta.

Sol: Mejor en el segundo test.

9. Hemos revisado las notas del examen de Matemáticas de dos clases de 40 alumnos. En grupo A hemos obtenido una media de 5,2 y una desviación típica de 1. En el grupo B la media ha sido 5,4 y la desviación típica nos ha dado 3. En uno de los dos grupos ha habido 13 suspensos y 7 excelentes, mientras que en el otro hemos contado 4 suspensos y 2 excelentes. Razona cuál de estos resultados se corresponde con cada grupo.

A y B : sol

10.Al estudiar los resultados del examen del grupo A hemos comprobado que la media es 6 y la desviación típica es 1. En el examen del grupo B, la media también es 6, pero la desviación típica es 2. Analiza cómo ha ido el examen comparativamente en los grupos A y B.

(13)

ESTADÍSTICA BIDIMENSIONAL (X, Y)

( )

( )

( )

y x xy xy xy Y y X x Y X S S S r PEARSON DE N CORRELACIÓ DE E COEFICIENT Y X N n y x S COVARIANZA S S S S es Desviacion Y N n y S X N n x S Varianzas N n y Y N n x X Medias ⋅ = = ⋅ − ⋅ ⋅ = = = = − ⋅ = − ⋅ = ⋅ = ⋅ =

2 2 2 2 2 2 2 2 : : :

(En la mayoría de ejercicios las frecuencias absolutas valen n = 1)

.

)

(

X)

de

depende

(Y

X

A

RESPECTO

Y

DE

REGRESIÓN

DE

RECTA

2

=

=

+

=

X

b

Y

a

pendiente

S

S

b

a

bx

y

x xy

La recta de regresión sirve para realizar estimaciones de los valores de y dados los valores de x. Dichas estimaciones sólo son fiables si la correlación entre las variables es suficientemente fuerte, de forma que la nube de puntos se ajuste bastante a la recta. Podemos representar gráficamente la recta de regresión en los mismos ejes que la nube de puntos.

(14)

TIPOS DE CORRELACIÓN (DEPENDENCIA LINEAL) ENTRE LAS

VARIABLES:

1

1≤ ≤

r

Si r = 1: correlación directa o positiva perfecta (los puntos de la nube están alineados sobre la recta de regresión, que es creciente).

Si r = -1: correlación inversa o negativa perfecta (los puntos de la nube están alineados sobre la recta de regresión, que es decreciente).

Si r = 0: la correlación entre las variables no existe, pero podría existir algún otro tipo de dependencia parabólica, exponencial, logarítmica, etc.

Consideramos que existe correlación suficientemente fuerte entre las variables cuando:

r > 0’75 ó r < -0’75.

+ fuerte + débil + fuerte

(15)

(representamos cada par de valores (x, y) de la distribución en los ejes de coordenadas)

CORRELACIÓN POSITIVA (DIRECTA):

X ↑⇒ Y ↑ X ↓⇒ Y ↓

Sxy > 0 , r > 0 , b > 0

. .. . .

. . .

. .

. .

. . . .

CORRELACIÓN NEGATIVA (INVERSA):

X ↑⇒ Y ↓ X ↓⇒ Y ↑

Sxy < 0 , r < 0 , b < 0

.

. . . . . .

. . .

. . . .

. .

. .

CORRELACIÓN NULA:

. .

.

. .

. ..

. . .

.

. .

. . . .

. .

. .

(16)

EJEMPLO 1:

La tabla siguiente muestra el peso (en kg) y la estatura (en cm) de 9 personas con sobrepeso.

X Y x2 y2 x . y

72 65 73 62 70 73 68 67 77 154 152 178 137 142 165 176 161 152 5184 4225 5329 3844 4900 5329 4624 4489 5929 23716 23104 31684 18769 20164 27225 30976 25921 23104 11088 9880 12994 8494 9940 12045 11968 10787 11704

627 1417 43853 224663 98900

(Las frecuencias absolutas son todas n = 1)

(

)

(

)

) , ( 35 ' 0 18 ' 13 37 ' 4 04 ' 20 04 ' 20 ) 44 ' 157 67 ' 69 ( 9 98900 18 ' 13 80 ' 173 37 ' 4 11 ' 19 : 80 ' 173 44 ' 157 9 224663 11 ' 19 67 ' 69 9 43853 : 44 ' 157 9 1417 67 ' 69 9 627 : 2 2 2 2 débil positivo r N CORRELACIÓ DE E COEFICIENT S COVARIANZA S S es Desviacion S S Varianzas Y X Medias xy xy y x Y X = ⋅ = = = ⋅ − = = = = = = = − = = − = = = = =

29'

84

05'

1

29'

84

67'

69

05'

1

44'

157

.

05'

1

11'

19

04'

20

:X

A

RESPECTO

Y

DE

REGRESIÓN

DE

RECTA

2

+

=

=

=

=

=

=

=

+

=

y

x

Xb

Y

a

S

S

b

a

bx

y

x xy

¿Cuál sería la estatura estimada de una persona que pesara 71 kg?

(17)

La tabla de frecuencias conjuntas siguiente muestra los ingresos anuales X de una familia (en miles de euros) e Y el número de miembros de la familia aportadores de ingresos. La muestra contiene información de 100 familias.

X \ Y 1 2 3 frecuencia marginal de X

12 18 0 0 18

17 0 25 7 32

25 0 30 16 46

40 3 0 1 4

frecuencia marginal de Y 21 55 24 N = 100

También podría expresarse de la forma:

X

ingresos nº aportadoresY nº familiasn x . n y . n x

2 . n y2 . n x . y . n

12 17 17 25 25 40 40 1 2 3 2 3 1 3 18 25 7 30 16 3 1 216 425 119 750 400 120 40 18 50 21 60 48 3 3 2592 7225 2023 18750 10000 4800 1600 18 100 63 120 144 3 9 216 850 357 1500 1200 120 120

N = 100 2070 203 46990 457 4363

(

)

(

)

) , ( 3731 ' 0 6701 ' 0 4351 ' 6 609 ' 1 609 ' 1 ) 03 ' 2 7 ' 20 ( 100 4363 6701 ' 0 4491 ' 0 4351 ' 6 41 ' 41 : 4491 ' 0 03 ' 2 100 457 41 ' 41 7 ' 20 100 46990 : 03 ' 2 100 203 7 ' 20 100 2070 : 2 2 2 2 débil positivo r N CORRELACIÓ DE E COEFICIENT S COVARIANZA S S es Desviacion S S Varianzas Y X Medias xy xy y x Y X = ⋅ = = = ⋅ − = = = = = = = − = = − = = = = =

2248

'1

0389

'0

2248

'1

7'

20

0389

'0

03'

2

.

0389

'0

41'

41

609

'1

:X

A

RESPECTO

Y

DE

REGRESIÓN

DE

RECTA

2

=

+

=

=

−=

=

=

=

+

=

y

x

(18)
(19)

1. La media de las calificaciones de Lengua de unos estudiantes es 6,5 y la varianza 3, mientras que la media de las calificaciones de Física es 5,5 y la varianza 5. La covarianza de las variables X (notas de Lengua) e Y (notas de física) es 2,4. Calcula la recta de regresión de Y respecto X. ¿Qué nota de Física se esperaría de un estudiante que ha obtenido un 8 de Lengua?

Sol: y= 0,8x+ 0,3 y= 6,7

2. La evolución del IPC y de la tasa de inflación en el primer semestre del año pasado fue:

MES ENERO FEBRERO MARZO ABRIL MAYO JUNIO

IPC 0,7 1,1 1,7 2 1,9 1,9

Inflación 6 6 6,3 6,2 5,8 4,9

Se pide:

a) La media del IPC y de la tasa de inflación.

b) La desviación típica del IPC y de la tasa de inflación.

c) Relaciona el coeficiente de correlación con la nube de puntos.

sol

a x y

b

c r

x y

xy

:

) , ; ,

) , ; ,

) , ; ,

= =

= =

= − = − ≅

1 55 5 87

0 482 0 461

0 0533 0 24 0

σ σ

σ

3. En un experimento para estudiar la relación que hay entre la dosis de un medicamento y el tiempo de reacción de una persona estimulada ante una señal auditiva, se han recogido los siguientes datos:

dosis (mg) 1 3 4 7 9 12 13 14

tiempo (s) 3,5 2,4 2,1 1,3 1,2 2,2 2,6 4,2

a) Haz una nube de puntos en el plano de coordenadas poniendo en las abscisas la dosis, y en las ordenadas, el tiempo. ¿Crees que el tiempo depende de la dosis?

b) ¿Se puede ajustar la nube mediante una recta?

¿Tiene sentido calcular el coeficiente de correlación en este caso? ¿Qué mide el coeficiente de correlación?

4. Unos datos recogidos durante los tres últimos años sobre la pluviosidad y la venta de paraguas en una ciudad indican lo siguiente:

año 1989 1990 1991

lluvia en mm. 830 1050 760

número de paraguas

vendidos 32427 34200 28642

a) Calcula las medias y las desviaciones estándar de las dos variables, y también el coeficiente de correlación. Escribe las fórmulas correspondientes.

(20)

b) ¿Qué signo tiene la pendiente de la recta de regresión? ¿Podemos contestar sin tener que hacer cálculos? ¿Por qué?

sol a x: ) = 880;y= 31756 3, ; σ x = 123 56, ;σ y = 2318 071, ;r= 0 8793,

5. En unas pruebas de rendimiento físico y deportivo de unos estudiantes se observaron las pulsaciones por minuto en reposo y los tiempos invertidos en una carrera. La media de las pulsaciones fue 72 con una desviación estándar de 4, y la media de los tiempos, 14 minutos con una desviación estándar de 5. El coeficiente de correlación fue de 0,4. Estima, mediante una recta de regresión, el tiempo de un estudiante que tiene 76 pulsaciones por minuto.

Sol: y= 0,5x− 22 y=16

6. Cinco niñas de 2, 3, 5, 7 y 8 años pesan respectivamente 14, 20, 30, 42 y 44 Kg. a) Calcula la ecuación de la recta de regresión del peso sobre la edad.

b) ¿Cuál sería el peso estimado de una niña de 6 años?

Sol: a) y= 5,2x+ 4 b) y= 35,2

7. En la tabla siguiente se indica la producción de automóviles de un país en millones de unidades; la variable X corresponde a los años y la variable Y, a la producción:

X 1980 1981 1982 1983 1984

Y 70 74 75 78 85

Sabemos que la media de la variable X es 1982 y que la desviación estándar es 1,41; la media de la variable Y es 76,4 con una desviación estándar 5,00. Encuentra la ecuación de la recta de regresión de Y sobre X y utilízala para predecir la producción de automóviles que se puede esperar para 1993.

Sol: σ xy = 6,8 y = 3,42x− 6702,04 y = 114,02

8. En la tabla siguiente tenemos los porcentajes de población rural de una comunidad:

año 1962 1968 1975 1982 1992

% de pobl. 58 55 51 49 45

Llamamos X a los años e Y al porcentaje de población rural, y encontramos que la media de X vale 1975,8 con una desviación estándar de 10,51, y que la media de Y vale 51,6 con una desviación estándar de 4,54.

a) Calcula la recta de regresión de Y sobre X en esta distribución. ¿Podríamos saber el signo de la pendiente sin hacer cálculos?

b) Estima, con la ayuda de la recta de regresión, el porcentaje de población rural que habrá en el año 2000.

Sol: a) σ xy = −47,48 y= −0,43x+ 901,19 b) y= 41,19

9. Una distribución bidimensional (xi, yi) donde xi corresponde a la altura de las mujeres e yi

corresponde a la altura de sus hijas, todas medidas en cm., tiene como recta de regresión y= 0 72, x+ 43 19, .

a) ¿Qué significa que el coeficiente de correlación sea positivo?

(21)

10.Para estudiar el efecto de un nuevo fertilizante, hemos asignado distintos niveles a cuatro campos similares y hemos recogido los datos de producción siguientes:

X ( fertilizante en Kg. ) 1 2 4 5

Y ( producción en tm. ) 70 70 80 100

Sabemos que la media de X vale 3, con una desviación estándar de 1,58, y que la media de Y vale 80, con una desviación estándar de 12,24.

a) Representa la nube de puntos y calcula el coeficiente de correlación.

b) Utiliza la recta de regresión de Y sobre X para hacer una predicción de la producción en el caso que pongamos 3 Kg. de fertilizante.

80 97

, 58 01 , 7 )

905 , 0 5

, 17

) = r = b y = x+ y =

a σ xy

11.Las alturas de cuatro chicas x i y las de sus respectivas madres yi son las siguientes:

x i 155 160 150 162

yi 150 180 140 160

a) Representa los valores de la tabla con una nube de puntos.

b) Tenemos x = 1 5 6 7 5, ; y = 1 5 7 5, ; σ x = 4 6 5, ; σ y = 1 4 7 9, . Calcula el coeficiente de correlación r y la recta de regresión de Y sobre X.

Sol: b) σ xy = 54,375 r= 0,79 y = 2,51x− 235,94

12.La tabla siguiente indica la evolución de la población con empleo respecto a la población activa de un país en los últimos años:

año 1962 1968 1975 1982 1992

% de población activa 58 55 51 49 45

Si llamamos X a los años e Y al porcentaje de población con empleo, hemos calculado que la media de X vale 1975,8 y su desviación estándar vale 10,51; la media de Y vale 51,6 y su desviación estándar vale 4,54.

a) Antes de hacer ningún cálculo, indica justificadamente lo que se pueda saber sobre el signo de la pendiente de la recta de regresión de esta distribución. Calcula, a continuación, la recta de regresión.

b) ¿Cuál es el porcentaje de población ocupada que podemos prever con la recta de regresión para el año 1996?

Sol: a) σ xy = −47,48 y = −0,43x+ 901,19 b) 42,91%

13.La evolución de la venta de televisores de un país en los últimos años se indica en la tabla siguiente, donde la variable X indica los años y la variable Y la venta de televisores, en miles de unidades:

X 1980 1981 1982 1983 1984

Y 70 74 75 78 85

a) Calcula la media anual de televisores vendidos y su desviación estándar.

(22)

b) Hemos calculado que la desviación estándar de la variable X es 1,41. Calcula la recta de regresión de Y sobre X y la venta de televisores prevista para el año 1993.

Sol: a)Y = 76,4 σ y = 5,004, bxy = 6,8 y= 3,42x− 6702,04

14.Durante su primer año de vida, han pesado a Marta cada mes. La siguiente tabla indica los correspondientes pesos:

Edad xi

(en meses)

1 2 3 4 5 6 7 8 9 10 11 12

peso yi

(en kg)

3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5

a) Calcula la media de los pesos y su desviación típica. b) Determina la ecuación de la recta de regresión de Y en X.

Sol: a) Y = 6,225 σ y =1,72 b) σ xy = 5,8 y= 0,49x+ 3,04

15.Disponemos de la tabla siguiente correspondiente a una distribución bidimensional:

xi 2 3 4 4 5 6 6 7 7 8 10 10

yi 1 3 2 4 4 4 6 4 6 7 9 10

a) Sin hacer cálculos, justifica el signo que tendrá el coeficiente de correlación.

b) Hemos calculado x = 6,y = 5,σxy = 5,92y σx = 2,45. Calcula la recta de regresión de y sobre x.

Sol: a) r> 0 b) y= 0,99x− 0,94

16.La siguiente tabla representa los pesos y las alturas de 20 alumnos de COU:

nº alumnos 4 3 2 5 4 2

peso 73 76 73 78 80 82

altura 1,65 1,68 1,70 1,72 1,76 1,80

Se pide:

a) ¿Cómo están correlacionados estos datos?

b) ¿Cuál será la altura estimada para un alumno de este colectivo que pese 75 Kg?

Sol: ) 0,93 ) 0,014 0636 0,134 2 9,5 2 0,002 1,69

, = = = =

+ =

= b y x y

r

Figure

TABLA DE FRECUENCIAS Ejemplo:

TABLA DE

FRECUENCIAS Ejemplo: p.1

References