24. La altura, en cm, de 8 padres y del mayor de sus hijos va- rones, son:
Padre 170 173 178 167 171 169 184 175
Hijo 172 177 175 170 178 169 180 187
a) Calcula la recta de regresión que permita estimar la altura de los hijos dependiendo de la del padre; y la del padre conociendo la del hijo.
b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un padre, si su hijo mide 190 cm? a) Hijo 5 68,1853 1 0,621859 ? Padre.
Padre 5 77,4406 1 0,545082 ? Hijo.
Si X indica la atura del padre e Y la del hijo, se tendría:
Y 5 68,1853 1 0,621859 ? X;
X 5 77,4406 1 0,545082 ? Y.
b) 176,4 para el hijo; 181 para el padre.
25. Los años de 7 árboles y el diámetro de su tronco, en cm, se dan en la siguiente tabla:
Años 2 4 5 8 10 14 20
Diámetro 10 15 17 20 23 25 27
a) Calcula, utilizando la recta de regresión, el diámetro que se puede predecir para árboles de 10 y 20 años. b) Compara el resultado anterior con los valores observa-
dos en la tabla. Razona el porqué de las diferencias. a) X 5 años; Y 5 diámetro.
x59; sx5 5,83; y519,57; sy5 5,55; r 5 0,93563 y 5 11,55 1 0,89 ? x.
b) Y(10) 5 20,45; Y(20) 5 29,35.
Las diferencias son debidas a que la recta de regresión da
una media del valor esperado.
26. Durante su primer año de vida han pesado a Marta cada mes. En la tabla siguiente se dan sus pesos:
X 1 2 3 4 5 6 7 8 9 10 11 12
Y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5
En esta tabla, x representa la edad en meses e y el peso en kilogramos.
a) Calcula la media y la desviación típica de los pesos. b) Determina la ecuación de la recta de regresión de y so-
bre x, explicando detalladamente los cálculos que haces y las fórmulas que utilizas.
a) y56,225, sy51,7181
b) y 5 0,48706x 1 3,05909
Otros resultados: r 5 0,97861; x56,5; sx53,45205
27. Utilizando la recta de regresión de x sobre y correspon- diente a la distribución siguiente:
X 5altitud (m) 0 184 231 481 911
y 5temperatura (ºC) 20 18 17 12 10
Calcula la altitud de una ciudad en la que la temperatura media es de 15º.
Hay que calcular la recta de regresión de x sobre y:
x2x5ssxy
y2 5(y2y)
Con la calculadora se obtiene: x 5 1 595,7 2 80,2y Para y 5 15º, x 5 392,7 metros.
(Otros parámetros: x5 361,4; y 5 15,4; sx5 314,8; sy5 3,77)
28. Se toman siete individuos al azar y se mide la concentra- ción de una determinada sustancia en sangre venosa (X) y arterial (Y), obteniéndose:
X 2 1 7 5 4 3 6
Y 2 1 10 6 5 3 8
a) ¿Qué ecuación lineal nos permite estimar, para cada in- dividuo, su concentración arterial sabiendo la venosa? b) ¿Qué valor arterial estimaríamos para un individuo con
venosa 5?
a) La recta de regresión de Y sobre X, que es: y 5 1,5x 2 1. b) y(5) 5 6,5
29. La tabla adjunta da los rendimientos (Y, en toneladas) de 10 parcelas han sido tratadas con diversas cantidades de fertilizante (X, en kg):
X 30 40 50 60 70 80 90 100 110 120
Y 2,9 3,2 3,1 3,8 3,5 4,2 5,1 4,8 5,3 5,2
a) Halla la recta que nos permita predecir los rendimien- tos de una parcela en función de los kg de fertilizantes utilizados.
b) ¿Qué rendimiento cabe esperar si se utilizan 95 kg de fertilizante?
a) Y 5 0,02939X 1 1,90545 b) Y(95) 5 4 697,5 kg
30. Se quiere construir una escuela a la que acudan los niños y niñas de 6 pequeños núcleos de población de una comarca.
Distribuciones bidimensionales
18
Fig. 18.15. 4 8 2 4 6 8 2 6 10 1ª Evaluación 10 2ª Evalu aci ón X sobre Y Y sobre XDistribuciones bidimensionales
18
La posición sobre el plano y el número de niños de cada pueblo se dan en la tabla:
Pueblo A B C D E F
Niños 30 15 10 35 8 5
Posición (3, 4) (2, 5) (5, 4) (2, 2) (6, 6) (9, 4) a) Determina el pueblo más adecuado para construir la es-
cuela, sin tener en cuenta el número de niños. b) Haz lo mismo teniendo en cuenta su número. a) Las coordenadas del centro medio son x 5 4,5, y5 4,17. El pueblo más cercano a ese punto es C.
b) Las coordenadas del centro medio ponderado son: xp5 3,23,
yp5 3,62.
El pueblo más cercano a ese punto es A. (Quizá sea esta la mejor solución.)
Véase el gráfico.
10 cuestiones básicas
Estas 10 cuestiones debes contestarlas, aproximadamente, en 15 mi- nutos. Si fallas más de dos te recomendamos que estudies un poco más.
1. ¿Qué tipo de correlación existe entre las siguientes pares de variables?
a) Precipitación mensual/venta de paraguas.
b) Número de habitantes por médico/mortalidad infantil en un país.
c) Número de habitantes por médico/consumo de gasoli- na.
d) Edad/reflejos.
a) Directa; b) Inversa; c) Inversa (Es espuria, pues, aunque a mayor número de personas en un país por cada médico el consumo de gasolina es menor, lo primero no es causa de lo segundo; la causa está en que el país es más pobre y, por tan- to hay menos médicos, menos coches, menos escuelas, etc); d) Inversa.
2. Considera los siguientes diagramas de puntos.
¿En cuál de ellos la correlación lineal es más fuerte? En a), aunque podría dudarse entre a) y c)
3. Indica alguna situación real que se ajuste, aproximada- mente, a cada una de las nubes dadas.
Por ejemplo:
a) Velocidad de un coche y distancia de frenada. b) La descrita en la cuestión anterior, apartado a). c) La descrita en la cuestión anterior, apartado b) d) Edad y simpatía.
4. ¿Qué coeficiente de correlación asignarías a cada una de las nubes de puntos de la cuestión 2?
a) r520,8 b) r520,2 c) r50,7 d) r50,93 a)m b)m d); c)m b); d)m a)
5. Asocia las siguientes rectas de regresión a las nubes de puntos de la cuestión 2: a) y520,5x14 b) y5x 22 c) y52x11 d) y52x15 a)m d); b)m b); c)m a); d)m c)
6. Representa la nube de puntos asociada al siguiente con- junto de datos bidimensionales:
X 1 2 3 4 5 Y 2,1 2,5 3,1 4,2 4,5 Fig. 18.16. 4 8 2 4 6 8 2 6 A B C D E F Pp P Fig. 18.17. 2 2 a b Fig. 18.17. 2 2 c d Fig. 18.16. 2 4 1 2 3 4 1 3 5 5
Distribuciones bidimensionales
18
7. Con los datos anteriores, y sin efectuar cálculos, razona cuál de los siguientes valores es su coeficiente de correla- ción: 0,3,20,9, 20,1, 0,98.
La correlación es directa y fuerte: la única posibilidad es 0,98.
8. Para los mismos datos, sin efectuar cálculos, ¿cuál de las siguientes rectas es la de regresión de Y sobre X?:
y52,114,5x,
y51,3320,37x,
y51,3310,65x,
y5410,65x
La recta de regresión tiene pendiente positiva y corta al eje
OY entre 1 y 2; la única posibilidad es y 5 1,33 1 0,65x.
9. La recta de regresión asociada a un conjunto de datos es
y51,3310,65x. Para el valor x53,5, ¿qué predicción de
la variable Y es razonable efectuar?
y(3,5) 5 1,33 1 0,65 ? 3,5 5 3,605.
10. Las estimaciones hechas a partir de una recta de regresión son más fiables cuando su ecuación se ha obtenido a partir de:
a) 2 pares de datos. b) 20 pares de datos. c) 200 pares de datos
d) Es independiente de los datos considerados.
Toda estimación es más fiable cuando aumenta el tamaño de la muestra, siempre y cuando los elementos se obtengan por algún procedimiento aleatorio.
P(AùB)5 1 2P[(AùB)c] 5 12 0,46 5 0,54 5 P(A) ? P(B), luego
A y B son independientes.
P(B) 5P[(AcùB)ø(AùB)] 5P[(AcùB)]1P[(AùB)] pues los su-
cesos AcùB y AùB son incompatibles y B5 (AcùB)ø(AùB).
Por tanto,
0,9 5 P[(AcùB)] 1 0,54 P[(AcùB)] 5 0,9 2 0,54 5 0,36 5
5 P(Ac) ? P(B), así que Acy B son independientes.
6. La probabilidad de que un conductor bajo los efectos del alcohol tenga un accidente es 0,1. ¿Cuál es la probabilidad de que no tenga accidente si conduce ebrio?:
a) en tres ocasiones; b) en siete ocasiones
Si A es el suceso «tener accidente bajo efectos del alcohol», tenemos:
a) P(Ac>Ac>Ac)50,9350,729, suponiendo que los sucesos A
son independientes y por tanto los Ac.
b) En este caso, la probabilidad de no sufrir accidente en las
7 ocasiones es 0,975 0,478.
7. La población estudiantil de un IES se reparte, entre 3º y 4º de Secundaria y 1º y 2º de Bachillerato, según el 32, 30, 21 y 17 %, respectivamente. Los porcentajes de alumnas en esos cursos son: 52 %, 55 %, 59 % y 64 %. Elegido un alumno al azar, ¿qué probabilidad hay de que sea varón? De acuerdo con el diagrama del árbol y designando por
H 5 {ser varón} y M 5 {ser mujer}, tenemos
P(H) 5 0,32 ? 0,4810,3 ? 0,4510,21 ? 0,4110,17 ? 0,36 5 0,4359
8. Del total de vehículos que circulan por una autovía, un 8 % son motocicletas y el resto, automóviles. La probabi- lidad de que se pare a repostar, en cierta gasolinera, un coche es del 5 %, siendo del 12 % que lo haga una moto. Si en cierto instante está repostando un vehículo, ¿qué probabilidad hay de que sea una moto?
Sean M, A y R los sucesos circular en moto, automóvil y repostar en la gasolinera, entonces la probabilidad pedida se calcula:
P(M/R)5 0,08?0,12 50,173 0,08?0,12 1 0,92?0,05