Curso 2022/2023
Escuela T´ecnica Superior de Ingenier´ıa Agron´omica Departamento de Matem´atica Aplicada I
Tema 1. Estad´ıstica Descriptiva
1.1. Consideremos los siguientes veinte datos:
3 5 3 4 4 7 6 5 2 4 2 5 5 6 4 3 5 4 5 5
(a) Construir la distribuci´on de frecuencia y la distribuci´on acumulada de los datos.
(b) Representar los datos en un diagrama de barras.
1.2. Los siguientes datos se refieren al n´umero de dientes por hoja en bulbos de ajo:
4 2 2 3 3 2 3 3 2 2
3 3 2 1 2 2 2 2 4 2
4 2 3 3 1
(a) Construir la tabla de distribuci´on de frecuencias y representarla gr´aficamente.
(b) Representar los datos en un diagrama de barras y en un pol´ıgono de frecuencia.
(c) ¿Cu´al es el porcentaje de hojas con menos de dos dientes?
(d) ¿Cu´al es el porcentaje de hojas con m´as de dos dientes?
(e) Hallar la media muestral, la mediana, la varianza y la desviaci´on t´ıpica para el n´umero de dientes por hoja.
1.3. En un examen de Estad´ıstica se obtuvieron las siguientes notas:
74 80 65 85 95 72 76 72 93 84 75 75 60 74 75 63 78 87 90 70 (a) Hallar la distribuci´on de frecuencia clasificando los datos en cuatro clases (ce-
rradas a la izquierda y abiertas a la derecha): 60-70, 70-80, 80-90, 90-100, y representar los resultados en un histograma.
1
(b) Hallar la media muestral, la mediana, la varianza y la desviaci´on t´ıpica para los resultados obtenidos en el examen de Estad´ıstica.
1.4. A cada finca de una empresa fresera, asisten 20, 50, 30 y 100 trabajadores, respec- tivamente.
(a) Calcular la media y la desviaci´on t´ıpica del n´umero de trabajadores.
(b) Si un d´ıa fuerte de campa˜na acuden 5 trabajadores m´as a cada finca, ¿qu´e efecto tendr´a sobre la media y la desviaci´on t´ıpica?
1.5. Hallar los percentilesP21, P40 y P75 de los siguientes datos:
5 6 7 7 9 10 12 15 15 20
21 22 25 27 28 32 34 34 35 40 41 48 51 56 57 65 75 76 78 80 81 84 88 88 89 90 91 92 93 97
1.6. La mediana, el primer y el tercer cuartil de una distribuci´on que mide (de 1 a 100 puntos) la aptitud para el desempe˜no de la poda de ´arboles en un grupo de trabajadores son, respectivamente, M e = 46, Q1 = 31 y Q3 = 67. Completar las siguientes afirmaciones, razonando las respuestas:
(a) El 75% tiene un aptitud superior o igual a . (b) El 25% tiene una aptitud superior o igual a .
(c) El % tiene una aptitud igual o menor a 46 puntos.
(d) El % tiene una aptitud superior o igual a 46 e inferior o igual a 67 puntos.
(e) El % tiene una aptitud superior o igual a 31 e inferior o igual a 67 puntos.
1.7. Los di´ametros de los troncos de una tala, medidos en cm, proporcionan la siguiente tabla:
Clases [20,24) [24,28) [28,32) [32,36) [36,40) [40,44) [44,48) [48,52) [52,56) [56,60)
ni 2 2 3 7 9 10 8 6 4 5
(a) Calcular media aritm´etica, los cuartiles, la moda, el percentil 85 y la desviaci´on t´ıpica.
(b) Se ha vendido el 65% de la tala, los de mayor di´ametro, ¿cu´al es el di´ametro m´ınimo de los vendidos?
1.8. La nota media de los aprobados en un examen de Matem´aticas ha sido 6.8 y la de los suspensos 3.5. Calcula la nota media de la clase sabiendo que hubo 35 aprobados y 15 suspensos.
1.9. La estatura media de los 38 setos de hibisco y pac´ıfico de un jard´ın es de 168 cm.
Las de hibisco, que son 17, miden 162 cm de media. Calcula la estatura media de los setos de pac´ıfico.
1.10. Completa la tabla de esta distribuci´on de la que sabemos que su media es 2.7.
xi 1 2 3 4 ni 3 7 5
1.11. Completa la siguiente tabla estad´ıstica donde ni, Ni y fi representan, respecti- vamente, la frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa.
x 1 2 3 4 5 6 7 8
ni 4 4 7 5 7
Ni 16 28 38 45
fi 0.08 0.16 0.14
1.12. Un agricultor observa el n´umero de tomates picados en cada planta de un terreno sembrado con 100 tomateras y obtiene los resultados resumidos en esta tabla:
no picados 0 1 2 3 4
frecuencia absoluta 25 20 y 15 x frecuencia relativa 0.25 0.2 z 0.15 0.05 (a) Completa la tabla obteniendo x,y,z.
(b) Calcula el n´umero medio de tomates picados en cada planta.
1.13. El n´umero medio de a˜nos necesarios para terminar los estudios de Grado en Inge- nier´ıa Agr´ıcola es 5, con una desviaci´on t´ıpica de un a˜no. Por otra parte, los alumnos utilizan una media de 7 a˜nos para concluir los estudios de Arquitectura, con una
desviaci´on t´ıpica de 1.5 a˜nos. Si un alumno ha tardado 6 a˜nos en convertirse en graduado en ingenier´ıa agr´ıcola y otro 8 a˜nos en convertirse en arquitecto, ¿cu´al ha terminado la carrera con mayor rapidez, comparando con los alumnos de su propia titulaci´on?
1.14. El precio medio por kilo de carne en un comercio minorista es de 6.23 euros, con una desviaci´on t´ıpica de 2.3 euros, mientras que en una gran superficie, el kilo cuesta de media 5.2 euros con una desviaci´on t´ıpica de 1.3 euros. Manuel ha comprado hoy un kilo de carne en un comercio minorista por 6.84 euros y su hermana Elena ha pagado 6.31 en una gran superficie. ¿A qui´en le ha salido m´as cara la compra, comparativamente?
1.15. Dos trabajadores del sector del vino ganan 1.220 y 1.325 euros mensuales brutos. El primero pertenece a la bodega A, cuya retribuci´on media y desviaci´on t´ıpica vienen dados por 1.110 y 75 euros, mientras que para la bodega del segundo trabajador se tiene 1.320 y 95 euros. Tanto uno como el otro ganan salarios por encima de la media, pero ¿cu´al de los dos ocupa una mejor posici´on relativa dentro de su empresa?.
1.16. Consideremos la distribuci´on bidimensional:
x 1 2 3 4 5 6 y 10 8 6 4 2 0
a) Representa los puntos de la distribuci´on en el diagrama de dispersi´on.
b) ¿Cu´anto vale el coeficiente de correlaci´on?
c) ¿C´omo son las dos rectas de regresi´on? Escribe su ecuaci´on.
1.17. El coeficiente de correlaci´on de una distribuci´on bidimensional es 0.87. Si los valores de las variables se multiplican por 10, ¿cu´al ser´a el coeficiente de correlaci´on de esta nueva distribuci´on?
1.18. Hemos calculado la covarianza de una cierta distribuci´on y ha resultado negativa.
Justifica por qu´e podemos afirmar que, tanto el coeficiente de correlaci´on como las pendientes de las dos rectas de regresi´on, son n´umeros negativos.
1.19. La altura media los arbustos de un jard´ın es de 155 cm. La recta de regresi´on de la altura respecto a la anchura es y= 80 + 1.5x (x: anchura; y: altura).
(a) ¿Cu´al es la anchura media de esos arbustos?
(b) ¿Cu´al es el signo del coeficiente de correlaci´on entre anchura y altura? ¿C´omo interpretas este resultado?
1.20. Se sabe que las rectas de regresi´on de y sobre x y dex sobre y son 5x+ 3y = 1 yx+ 2y = 3
(a) ¿Es x+ 2y= 3 la recta de regresi´on de y sobre x?
(b) Calcular r.
1.21. En un estudio sobre la relaci´on entre la edad de un ´arbol (X en a˜nos) y el n´umero de anillos (Y) en la secci´on transversal de su tronco, se determina que las dos rectas de regresi´on de estas variables son:
x−0.51y= 5.8, 1.59x−y = 4.78
(a) Determinar razonadamente cu´al de las rectas anteriores es la recta de regresi´on de Y sobre X.
(b) Estimar el n´umero de anillos que tendr´a un ´arbol de 15 a˜nos.
(c) Determinar la edad aproximada de un ´arbol con 24 anillos.
(d) Justificar razonadamente si las estimaciones anteriores son fiables.
1.22. Para una distribuci´on bidimensional (X, Y) se sabe que el coeficiente de correlaci´on lineal es 0.8, la desviaci´on t´ıpica deX es 4, la media deY es 2 y la recta de regresi´on deX sobre Y es y= 4x. Se pide:
(a) Calcular los valores de la covarianza, la media de X y la desviaci´on t´ıpica de Y.
(b) Calcular la recta de regresi´on de Y sobre X.
1.23. En un experimento para evaluar la efectividad de un insecticida sobre dos especies de insectosAyBse obtuvieron las rectas de regresi´on para el porcentaje de mortalidad de cada especie (Y1 eY2 respectivamente) sobre la concentraci´on (X) de insecticida utilizado:
Insecto A y1 = 22150 +10097x Insecto B y2 = 2325 +6150x
Adem´as se sabe que la desviaci´on t´ıpica de la concentraci´on de insecticida usado fue de 10 unidades y las del porcentaje de mortalidad de los insectos A y B fueron 10 y 22 respectivamente. Se pide, razonadamente:
(a) Sabiendo que usando la concentraci´on media de insecticida la eficacia es la misma para ambos insectos, ¿cu´al es dicho valor medio de concentraci´on de insecticida? ¿Cu´ales son los valores medios del porcentaje de mortalidad para cada variedad de insecto?
(b) Estimar el porcentaje de mortalidad en cada especie si se usara una concen- traci´on de insecticida de 30 unidades. ¿Ser´ıan fiables dichas predicciones?
1.24. La siguiente tabla muestra el n´umero de g´ermenes pat´ogenos por cent´ımetro c´ubico de un determinado cultivo seg´un el tiempo transcurrido:
no de horas 0 1 2 3 4 5
no de g´ermenes 20 26 33 41 47 53
(a) Calcula la recta de regresi´on para predecir el n´umero de g´ermenes por cm3 en funci´on del tiempo.
(b) ¿Qu´e cantidad de g´ermenes por cm3 es predecible encontrar cuando hayan transcurrido 6 horas? ¿Es una buena predicci´on?
1.25. En un dep´osito cil´ındrico, la altura del agua que contiene var´ıa conforme pasa el tiempo seg´un la siguiente tabla:
tiempo (h) 8 22 27 33 50 altura (m) 17 14 12 11 6
(a) Halla el coeficiente de correlaci´on lineal entre el tiempo y la altura e in- terpr´etalo.
(b) ¿Cu´al ser´a la altura del agua cuando hayan transcurrido 40 h?
(c) Cuando la altura del agua es de 2 m, suena una alarma. ¿Qu´e tiempo ha de pasar para que avise la alarma?
1.26. Una empresa aceitera tuvo contratado unos consultores durante el per´ıodo 1999- 2003. En la siguiente tabla se recogen los beneficios PREVISTOS (X) por los consultores y los beneficios REALES (Y) expresados en porcentajes:
A˜no X (en %) Y (en %) X2 Y2 X·Y 2008 8.17 −23.1 66.75 533.61 −188.72
2009 20.47 −6.39 419.02 40.83 −130.80
2010 13.03 −12.68 160.78 160.78 −165.22 2011 −10.9 16.22 118.81 263.09 −176.8 2012 29.03 37.19 842.74 1383.1 1079.63 Sumas 59.8 11.24 1617,1 2381.41 418.08
(a) Determinar los beneficios medios previstos y reales. ¿Podr´ıamos haber predicho de manera fiable los resultados reales en funci´on de los previstos? Razona la respuesta.
(b) No contenta la empresa con los resultados para ese quinquenio, decidi´o cambiar de empresa consultora para el per´ıodo 2013-2017. No se disponen de todos los datos de dicho per´ıodo, pero se sabe que la previsi´on media fue de 24 y que la recta de regresi´on que permiti´o estimar los beneficios reales en t´erminos de la previsi´on fue y = 0.68x+ 0.25. Adem´as, las desviaciones t´ıpicas para los beneficios previstos y reales fueron de 13.58 y 9.57 respectivamente. Se pide:
(b.1) Determinar el beneficio medio real obtenido.
(b.2) Ante los beneficios obtenidos, la empresa aceitera decide continuar con los mismos consultores. Si la previsi´on para 2018 es de 4, ¿se podr´ıa estimar el beneficio real para este a˜no de manera fiable? ¿Cu´al ser´ıa dicha estimaci´on?
1.27. Se quiere estudiar la relaci´on entre el rendimiento del trigo respecto de la ferti- lizaci´on utilizada. Para ello, se han medido las toneladas por hect´area de trigo (Y) obtenidas usando determinados niveles de nitr´ogeno (N) y potasio (K).
En la siguiente tabla se recoge los valores obtenidos para las variables N e Y.
N 40 60 80 100 120
Y 9.7 15.6 22.3 26.4 27.1
Por otra parte, se sabe que la variable K tiene una desviaci´on t´ıpica de 30.5 y que la recta de regresi´on lineal de Y sobre K esy= 4.68 + 0.14x.
(a) Obtener la recta de regresi´on que permite estimar el rendimiento de trigo en funci´on del nivel de nitr´ogeno aplicado.
(b) Determinar qu´e tipo de fertilizante tiene una correlaci´on lineal m´as fuerte con el rendimiento del trigo. Estimar de la forma m´as fiable posible el rendimiento de trigo que se obtendr´ıa con un nivel 75 de nitr´ogeno y 70 de potasio.
1.28. El due˜no de una peque˜na empresa decide ampliar su horario comercial y contrata un empleado durante algunas horas al d´ıa para poder atender mejor su negocio. En la siguiente tabla se detallan las ventas diarias (V en miles de euros), el n´umero de horas que atendi´o el due˜no de la empresa (D) y el n´umero de horas que atendi´o el empleado (E).
V 8 4 9 10 8 6 8 3
D 8 6 10 9 9 8 9 5
E 6 7 2 5 4 4 5 7
(a) Hallar el coeficiente de correlaci´on lineal entre las variables Ventas-Due˜no y Ventas-Empleado ¿De qu´e tipo son cada una de estas correlaciones?
(b) Conociendo las ventas de un determinado d´ıa, ¿qu´e puede estimarse con m´as fiabilidad, el n´umero de horas que atendi´o el negocio el due˜no o el empleado?
(c) Estimar con la mayor fiabilidad posible, el volumen de ventas de un d´ıa en el que el due˜no atienda al p´ublico 7 horas y el empleado 6 horas.
(d) Estimar las horas que habr´a trabajado el due˜no un d´ıa que se facturaron 7500 euros.
1.29. Para controlar la eficacia de un cierto pesticida se prueban sus efectos en 6 rosales y para cada uno de ellos, se mide el porcentaje de hojas enfermas antes del tratamiento (X) y el porcentaje de hojas enfermas pasado un periodo despu´es de la aplicaci´on del tratamiento (Y). Los datos obtenidos se recogen en la siguiente tabla:
X 50 40 70 90 40 60
Y 30 10 45 60 5 25
(a) Determinar el porcentaje medio de hojas enfermas antes y despu´es del tratamiento.
(b) Determinar el porcentaje de plantas que presenta m´as del 50% de hojas enfer- mas antes del tratamiento. ¿Y despu´es del tratamiento?
(c) Para una planta tratada que presenta el 15% de hojas enfermas, estimar la mejor´ıa que ha conseguido el tratamiento. Justificar la fiabilidad de esta esti- maci´on.
(d) Predecir c´omo se reducir´ıa el porcentaje de hojas enfermas de una planta con un 80% de hojas afectadas, tras aplicarle el tratamiento.
1.30. Se han cortado treinta ´arboles de la misma especie. Las edades en a˜nos, X, y los di´ametros m´aximos correspondientes,Y en dm, est´an recogidos en la siguiente tabla de frecuencias de la variable bidimensional (X, Y):
X\Y 5 6 10 12 15
20 1 2 1 0 0
30 0 1 4 0 0
40 0 1 6 4 0
50 0 0 2 7 1
Se pide:
(a) Determinar la ecuaci´on de la recta de regresi´on de los di´ametros m´aximos sobre las edades.
(b) ¿Se podr´ıa estimar de manera fiable el di´ametro m´aximo de un tronco cono- ciendo la edad del ´arbol?
1.31. En un curso escolar, se ha realizado un estudio sobre el n´umero de horas diarias que los alumnos dedican a los videojuegos (X) y el n´umero de asignaturas que aprueban por curso (Y), obteniendose los siguientes resultados:
X \ Y 0 1 2 3 4 5
0 0 0 0 0 1 2
1 0 0 2 2 1 0
2 2 8 5 0 1 0
3 1 3 0 0 0 0
4 2 0 0 0 0 0
(a) Determinar el n´umero de horas tal que el 70% de los alumnos dedica menos de este tiempo diario a los videojuegos y el 30% restante le dedica m´as tiempo.
(b) ¿Cu´antas asignaturas se estima que aprobar´a un alumno que juega 2 horas y media diarias? ¿Es fiable esa estimaci´on? Razona tu respuesta.
1.32. Una empresa agr´ıcola ha recopilado la siguiente informaci´on sobre el n´umero de tratamientos que se han realizado en 15 fincas distintas y las ventas que ha generado la producci´on de estas fincas (expresados en miles de euros):
Euros(x)\T ratamientos(y) 10-30 30-40 40-80
1-5 3 0 0
5-10 1 4 1
10-20 0 1 5
(a) Calcula el valor medio de las ventas generadas en cada finca.
(b) ¿Cu´al es el coeficiente de correlaci´on?
(c) Obt´en la recta de regresi´on de Y sobre X.
(d) Si una finca ha generado una venta de 18000 euros, ¿Cu´antos tratamientos se dio a la plantaci´on de dicha finca?
1.33. Para estudiar la relaci´on entre la densidad de siembra de ma´ız y el rendimiento obtenido, se planta ma´ız con distintas densidades de siembra en 32 parcelas de id´enticas caracter´ısticas y se obtienen los datos mostrados en la siguiente tabla para las variablesX=densidad de siembra (en decenas de millar de plantas por hect´area) e Y= rendimiento (en toneladas por hect´area).
Y [130,218) [218,306) [306,394) X
1 3 3 0
2 2 5 0
3 2 5 4
4 0 5 3
(a) Calcular el n´umero de plantas por hect´area m´as habitual y el porcentaje de parcelas que producen menos de 306 toneladas por hect´area.
(b) Calcular el n´umero medio de plantas por hect´area y el rendimiento medio por hect´area.
(c) A partir de los datos, se obtiene la recta de regresi´on deY sobreX de ecuaci´on y = 129.26 + 49.97x y los valores s2x = 1.14 y s2y = 3497.29. Haciendo uso de esta informaci´on, estimar la rentabilidad que se obtendr´ıa con una densidad de siembra de 35000 plantas por hect´area y justificar si esta estimaci´on ser´ıa o no fiable.