• No se han encontrado resultados

Estadística Descriptiva

N/A
N/A
Protected

Academic year: 2020

Share "Estadística Descriptiva"

Copied!
6
0
0

Texto completo

(1)

correo electrónico: [email protected] página web: www.joseluisquintero.com

UNIVERSIDAD CENTRAL DE VENEZUELA

Ciclo Básico

Departamento de Matemática Aplicada Elementos de Estadística (0260)

Junio 2013

FACULTAD DE INGENIERÍA

Estadística Descriptiva

José Luis Quintero

PRIMERA PARTE: RESPUESTA OBJETIVA.

Instrucciones. Coloque al lado de cada proposición la letra V o F según sea verdadera o falsa respectivamente.

1. Cuando una muestra contiene las características importantes de cierta población en las mismas proporciones como se encuentran en ésta, se dice que se trata de una muestra representativa. V

2. Los datos discretos sólo se pueden expresar con números enteros. F

3. Un histograma es una serie de rectángulos, cada uno proporcional en ancho al número de elementos que caen dentro de una clase específica de datos. F

4. Siempre es posible construir un histograma a partir de un polígono de frecuencias. V

5. El valor de cada observación del conjunto de datos se toma en cuenta cuando se calcula su mediana. F

6. La desviación estándar se mide en las mismas unidades que las observaciones del conjunto de datos. V

7. La dispersión de un conjunto de datos da una cierta visión de la confiabilidad de la media como medida de tendencia central. V

Instrucciones. Seleccione la respuesta que considere correcta.

1. Conforme aumenta el número de observaciones y clases, la forma de un polígono de frecuencias a. Tiende a hacerse cada vez más lisa b. Tiende a hacerse en forma de sierra c. Permanece igual

d. Varía solo si los datos son más confiables

2. ¿Cuál de las afirmaciones siguientes acerca de los rectángulos de un histograma es correcta?

a. Los rectángulos tienen una altura proporcional al número de elementos que entran en las clases b. Por lo general existen cinco rectángulos en cada

histograma

c. El área de un rectángulo depende sólo del número de elementos de la clase en comparación con el número de elementos de todas las demás clases d. Todas las anteriores

3. ¿Cuál es la principal suposición que se hace cuando se calcula la media de datos agrupados?

a. Todos los valores son discretos

b. Cada valor de una clase es igual a su punto medio c. Ningún valor se presenta más de una vez

d. Cada clase contiene exactamente el mismo número de valores

4. ¿En cuál de estos casos sería la moda más útil como indicador de la tendencia central?

a. Cada valor de un conjunto de datos se presenta solamente una vez

b. Todos los valores de un conjunto de datos, excepto tres, se presentan sólo una vez. Los tres valores se presentan 100 veces cada uno

c. Todos los valores de un conjunto de datos se presentan 100 veces cada uno

d. Todas las observaciones de un conjunto de datos tienen el mismo valor

5. ¿Por qué es necesario elevar al cuadrado las diferencias con respecto a la media cuando se calcula la varianza de la población?

a. Para que los valores extremos no afecten el cálculo b. Porque es posible que el tamaño de la población

sea pequeño

c. Algunas de las diferencias serán positivas y otras negativas

d. Ninguna de las anteriores

6. El cuadrado de la varianza de un conjunto de datos representa

a. La desviación estándar b. La media

c. El alcance

d. Ninguna de las anteriores

SEGUNDA PARTE: DESARROLLO.

Instrucciones. Conteste, justificando cada uno de sus procedimientos, a los siguientes planteamientos:

1. Los talleres de Transmisiones Caracas registran el número de comprobantes de servicio extendidos el mes anterior por cada una de sus 20 sucursales de la forma siguiente:

823 648 321 634 752 669 427 555 904 586 722 360 468 847 641 217 588 349 308 766

(2)

La compañía tiene la creencia de que una sucursal no puede mantenerse financieramente con menos de 475 servicios mensuales. Es también política de la compañía otorgar una bonificación económica al gerente de sucursal que genere más de 725 servicios mensuales. Ordene los datos de la tabla e indique cuántas sucursales no pueden mantenerse y cuántas recibirán bonificación. La vicepresidente financiera de la compañía ha establecido lo que llama “lista de observación de sucursales”; esta lista contiene las sucursales cuya actividad está entre 550 y 650 servicios mensuales. ¿Cuántos talleres deberán estar en dicha lista si se basa en la actividad del mes anterior?

2. El número de horas que les toma a los mecánicos retirar, reparar y volver a colocar una transmisión en uno de los talleres de Transmisiones Caracas, durante un día de la semana anterior, se registra de la manera siguiente:

4.3 2.7 3.8 2.2 3.4 3.1 4.5 2.6 5.5 3.2 6.6 2.0 4.4 2.1 3.3 6.3 6.7 5.9 4.1 3.7

A partir de estos datos, construya una distribución de frecuencias con intervalos de una hora. ¿A qué conclusiones puede llegar acerca de la productividad de los mecánicos si toma en cuenta la distribución de frecuencias?. Si el gerente de Transmisiones Caracas cree que más de 6 horas es evidencia de un desempeño insatisfactorio, ¿de qué magnitud es el problema del desempeño de los mecánicos en este taller en particular?

3. Se toma una muestra de 60 obreros de una fábrica y se quiere hacer un estudio del salario semanal (en miles de bolívares). Se obtuvo la siguiente información presentada en el cuadro. Calcule

Salario (Bs/sem)

Punto Medio

Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

[20,24] 22 8 8 8/60 8/60

[25,29] 27 11 19 11/60 19/60

[30,34] 32 4 23 4/60 23/60

[35,39] 37 7 30 7/60 30/60

[40,44] 42 12 42 12/60 42/60

[45,49] 47 9 51 9/60 51/60

[50,54] 52 9 60 9/60 60/60

a. El porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero igual o menor a 44.000 Bs.

b. La media aritmética y la moda c. El rango intercuartílico

4. A continuación se presentan las edades de 50 miembros de un programa de servicio social:

83 66 82 54 92 65 68 51 75 74 44 78 98 82 79 38 76 84 60 66 91 83 68 51 73 51 61 65 56 60 87 64 70 66 68 55 69 67 77 62 88 99 47 42 74 71 80 65 56 55

Utilícelos para construir, primero, una distribución de frecuencias mediante siete intervalos iguales y después con trece intervalos iguales. La política del estado Sucre sobre programas de servicio social establece que aproximadamente 50% de los participantes en el programa sean mayores de 50 años.

a. ¿Está el programa de acuerdo con la política del estado?

b. Suponga que el director de servicio social desea saber la proporción de participantes del programa que estén entre 45 y 80 años de edad. Estime la respuesta

5. Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un banco comercial, lleven a cabo una transacción bancaria:

2.3 0.2 2.9 0.4 2.8 2.4 4.4 5.8 2.8 3.3 3.3 9.7 2.5 5.6 9.5 1.8 4.7 0.7 6.2 1.2 7.8 0.8 0.9 0.4 1.3 3.1 3.7 7.2 1.6 1.9 2.4 4.6 3.8 1.5 2.7 0.4 1.3 1.1 5.5 3.4 4.2 1.2 0.5 6.8 5.2 6.3 7.6 1.4 0.5 1.4

a. Construya una distribución de frecuencia (7 clases).

b. Construya una distribución de frecuencia acumulada.

c. Con los resultados de la parte b, determine los recorridos intercuartil e interdecil.

d. Con los datos agrupados, calcule la media, mediana, moda y desviación estándar.

e. Verifique los resultados de la parte d calculando las mismas medidas para los datos no agrupados.

6. El presidente de Avior intenta hacer una estimación de cuánto se tardará el Departamento de Aeronáutica Civil (DAC) en decidir acerca de la solicitud de la compañía sobre una nueva ruta. Los asesores del presidente han conseguido los siguientes tiempos de espera de las solicitudes hechas durante el año anterior. Los datos están dados en días, desde la fecha de la solicitud hasta la respuesta del DAC.

34 23 31 25 47

44 38 33 26 27

29 31 34 38 37

24 37 32 34 41

29 28 51 44 47

40 28 40 33 32

34 31 42 35 31

40 30 31 35 33

44 39 36 36 39

22 44 31 28 31

a. Construya una distribución de frecuencias utilizando diez intervalos cerrados, igualmente espaciados. ¿Qué intervalo ocurre con mayor frecuencia?

b. Construya una distribución de frecuencias utilizando cinco intervalos cerrados, igualmente espaciados. ¿Qué intervalo ocurre con mayor frecuencia?

c. Si el presidente de Avior tiene una distribución de frecuencias ya sea para a o para b, ¿le ayudará ésta para estimar la respuesta que necesita?

(3)

7. Aquí se presentan tres conjuntos de datos:

1, 2, 3, 4, 5, 6; 1, 1, 1, 6, 6, 6; −13, 2, 3, 4, 5, 20.

Calcule la media y la varianza para cada conjunto de datos. ¿Qué se puede concluir?

8. La siguiente tabla muestra las ventas, en miles de dólares, de 20 vendedores de una compañía de computadoras.

40.2 29.3 35.6 88.2 42.9 26.9 28.7 99.8 35.6 37.8 44.2 32.3 55.2 50.6 25.4 31.7 36.8 45.2 25.1 39.7

a. Calcule media, mediana, desviación estándar, recorrido intercuantil y recorrido interdecil.

b. ¿Qué medidas de tendencia central se elegirían y por qué?

9. La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:

38 63 36 42 44

67 25 48 44 59

28 78 58 48 51

49 66 58 53 57

47 76 69 61 52

35 33 32 72 56

a. Construya las distribuciones de frecuencia relativa y de frecuencia relativa acumulada. (5 clases) b. Calcule media, mediana, moda y desviación

estándar, empleando tanto los datos agrupados como los no agrupados, y compare los dos conjuntos de resultados.

10. Considerando los datos del ejercicio anterior, sea x i la demanda del i-ésimo día si i=1,...,30. Transforme los datos por medio de la relación

i i

x 51.5

u .

14.17

= −

a. Construya una distribución de frecuencia para los datos transformados. ¿Ha ocurrido algún cambio en la naturaleza de la distribución de frecuencia cuando ésta se compara con la del ejercicio anterior?

b. Con los datos transformados u , calcule la media y i la desviación estándar y muestre que son iguales a cero y uno respectivamente.

11. Los siguientes datos agrupados representan los pagos por almacenamiento para los 50 más grandes detallistas durante el año 1979:

Límites de estructura de la clase

Frecuencia

1.10 – 1.86 4

1.87 – 2.63 14

2.64 – 3.40 11

3.41 – 4.17 9

4.18 – 4.94 7

4.95 – 5.71 1

5.72 – 6.48 2

6.49 – 7.25 2

a. Grafique la distribución de frecuencia relativa acumulada.

b. Con los resultados de la parte a, determine los recorridos intercuantil e interdecil.

c. Calcule la media, mediana y moda.

d. Calcule la varianza y la desviación estándar.

12. En la redacción de un diario, el tiempo requerido para formar la primera página completa fue registrado durante 50 días. Los datos, redondeados a la décima de minuto más cercana, se dan a continuación:

20.8 21.9 20.7 25.0 22.8 25.3 22.5 23.8 20.9 23.5 23.7 23.6 25.1 19.5 24.2 21.3 23.1 24.2 19.8 22.8 19.7 23.8 23.8 21.1 21.6 22.8 22.0 20.9 22.2 20.1 20.7 21.2 23.3 22.9 19.5 20.3 19.0 25.0 24.1 21.8 21.5 19.9 24.1 23.9 23.9 24.2 20.7 24.3 20.9 22.7

a. Organice los datos en un arreglo ascendente.

b. Construya una distribución de frecuencias absolutas y una distribución de frecuencias acumuladas “menor que” a partir de los datos de la tabla anterior, utilice intervalos de 0.8 minutos.

c. Construya un polígono de frecuencias con base en los datos dados.

d. A partir de los datos, construya una ojiva “menor que”.

e. Tomando en cuenta su ojiva, estime qué porcentaje del tiempo de formación de la primera página puede hacerse en menos de 24 minutos.

13. Un profesor decide utilizar un promedio pesado para obtener las calificaciones finales de los estudiantes que acuden al seminario de Botánica que imparte. El promedio de tareas tendrá un valor de 20% de la calificación del estudiante; el examen semestral, 25%; el examen final, 35%; el artículo de fin de semestre, 10%, y los exámenes parciales, 10%. A partir de los datos siguientes, calcule el promedio final para los cinco estudiantes del seminario.

Alumno Tareas Parciales Artículo Ex.

Semestral Ex.

Final

1 85 89 94 87 90

2 78 84 88 91 92

3 94 88 93 86 89

4 82 79 88 84 93

5 95 90 92 82 88

14. La edad de los estudiantes regulares que acuden a un cierto curso en los turnos matutino y vespertino de la licenciatura en Computación de la Universidad Central de Venezuela se describe en las siguientes dos muestras:

Turno matutino

23 29 27 22 24 21 25 26 27 24

Turno vespertino

27 34 30 29 28 30 34 35 28 29

Si la homogeneidad de la clase es un factor positivo en el aprendizaje, utilice una medida de variabilidad relativa para sugerir cuál de los dos grupos será más fácil de enseñar.

(4)

15. El número de sistemas de calentamiento solar disponibles al público es bastante grande, y su capacidad de almacenamiento de calor diversa. A continuación se presenta una distribución de la capacidad de almacenamiento de calor (en días) de 28 sistemas que fueron probados recientemente por Laboratorios Etifar:

Días Frecuencia

0-0.99 2

1-1.99 4

2-2.99 6

3-3.99 7

4-4.99 5

5-5.99 3

6-6.99 1

En los laboratorios se sabe que su informe sobre las pruebas circulará ampliamente y será utilizado como base para una legislación sobre los impuestos a las concesiones de los sistemas. En consecuencia, se desea que las medidas utilizadas sean reflejo, tanto como sea posible, de lo que los datos aportan.

a. Calcule la media del conjunto de datos.

b. Calcule la moda del conjunto de datos.

c. Calcule la mediana del conjunto de datos.

d. Seleccione la respuesta entre los resultados de los incisos a, b y c que mejor refleje la tendencia central de los datos y justifique.

16. Franklin Ramírez es director de la Oficina de Becas Estudiantiles del Colegio San Agustín. Con los datos disponibles acerca de los ingresos mensuales por todos los estudiantes que han solicitado ayuda económica a la oficina ha construido la distribución de frecuencias siguiente:

Ganancias en el verano Número de estudiantes

Bs. 0 – 49900 231

50000 – 99900 304

100000 – 149900 400

150000 – 199900 296

200000 – 249900 123

250000 – 299900 68

300000 o más 23

a. Encuentre la clase modal del conjunto de datos b. Encuentre la moda para estos datos agrupados c. Si las becas de los estudiantes están restringidas a

aquellos cuyas ganancias mensuales son de al menos 10% menores que la ganancia modal,

¿cuántos solicitantes obtienen la beca?

17. En un torneo de fútbol se conoce que el 15% de los jugadores ha anotado más de 5 goles. Hay dos jugadores que se disputan el liderato del torneo con 8 goles. El 30% de los jugadores ha anotado 4 ó 5 goles, sabiendo además que la cantidad de jugadores es la misma para ambas categorías. La cuarta parte de los jugadores anotó un gol y el número de jugadores que anotó 2 goles es el doble del número que anotó 3 goles. Por otro lado, se sabe que sólo un jugador ha anotado 7 goles. Los datos anteriores son relativos a aquellos jugadores que anotaron al menos un gol y estos representan el 60% del total de 100 jugadores en el torneo. Obtenga la tabla de frecuencias para estos datos.

18. Un complejo Sistema de Telecomunicaciones GSM está formado por 1000 nodos. El Departamento de Estadística Operativa que monitorea al Sistema de Telecomunicaciones se encargó de recopilar las fallas que se presentaron en cada uno de los nodos durante un año. Los datos obtenidos corresponden a aquellos nodos que presentaron al menos una falla, que representan el 90% del total de los nodos. Los resultados fueron los siguientes:

• El número de nodos que presentaron 2 fallas es el mismo que el cuádruple del número de nodos que sufrieron 4 fallas

• Solo el 20% de los nodos han presentado más de 5 fallas

• Una cuarta parte de los nodos han presentado 3 ó 5 fallas

• Solo el 20% de los nodos presentó una falla

• El mismo número de nodos que presentaron 4 fallas también presentaron 7 fallas

• El 70% de los nodos presentaron menos de 5 fallas

• Sólo 30 nodos presentaron un máximo de 8 fallas cada uno

a. Halle la distribución de frecuencias de los datos b. Calcule media, moda y mediana para la

distribución anterior

19. 60 datos han sido agrupados en una distribución de frecuencias de 6 clases de igual amplitud. Se dispone de la siguiente información acerca de esa distribución de frecuencias:

• La mediana es 26

El 20% de los datos es superior a 38

• H3 =0.3

• h3=0.1

• F4 =48

1 5 1 6

f =f =2f

Halle la distribución de frecuencias.

20. Considere un lote de 300 muestras distribuidas en forma simétrica en seis intervalos de igual amplitud.

Se dispone de las siguiente información acerca de esa distribución de frecuencias:

• La mediana es 25

• El percentil 91.667 es 35

• La frecuencia absoluta de la segunda clase es el triple de la frecuencia absoluta de la primera clase

• La frecuencia absoluta de la tercera clase es el doble de la frecuencia absoluta de la primera clase Halle la distribución de frecuencias de los datos.

21. En una liga de béisbol aficionado sólo 30 bateadores batearon por encima de 300 puntos. Los 1200 jugadores con turnos legales para ser tomados en cuenta han sido distribuidos en seis clases de igual ancho donde el percentil 97,5 coincide con el límite superior de la clase cinco. Por otro lado, el tercer cuartil es 270 y coincide con el borde inferior de la clase cuatro. El número de jugadores en la primera clase es el triple del número en la tercera clase mientras que en la segunda clase hay el doble de jugadores que en la tercera. Finalmente, se conoce que el 14,5% de los jugadores pertenece a la cuarta clase. Halle la distribución de frecuencias.

(5)

22. Una prestigiosa compañía ha decidido contratar a una compañía de recursos humanos para que gestione la contratación de varios ingenieros para el próximo proyecto que se va a licitar. Esta compañía de recursos humanos tiene las calificaciones de una prueba técnica presentada por 800 ingenieros logrando distribuir en clases esta información. La información que se tiene es la siguiente:

• Las notas están distribuidas en 7 clases de igual amplitud

• El 10% superior de las notas supera el valor 96

• La mitad de los datos está por debajo de 60

• La clase 4 es una clase modal y contiene el 30% de los datos

• Por encima de esa clase modal esta el 20% de las notas

• La primera y la última clase contienen cada una 80 datos

• La segunda clase contiene la tercera parte de los datos de la tercera clase

• El percentil 85 es 84 puntos

a. Obtenga la tabla de distribución de frecuencias b. Determine el rango intercuartílico

23. Pensando en la selección de estudiantes para su ingreso al Sistema de Educación Superior, se han escogido los 5000 mejores estudiantes de aquellos que solicitan estudiar la carrera de Ingeniería Eléctrica. Para la escogencia de estos 5000 aspirantes se tomó en cuenta el promedio de sus asignaturas cursadas y aprobadas en los primeros cuatro años de estudios de educación media. Se sabe que el promedio de notas de esta muestra de 5000 estudiantes es de 15.94. Los promedios de notas para estos 5000 estudiantes han sido distribuidos en 8 clases de igual amplitud. De esta distribución de frecuencias se conoce además lo siguiente:

• El primer cuartil es 15 y coincide con el borde inferior de la quinta clase

• El percentil 90 es 18 y coincide con el borde superior de la séptima clase

• El número de datos en la clase 4 es igual a la suma de los datos de las clases 2 y 3

• Las clases 5 y 6 tienen cada una 4 veces el contenido de la primera clase

• La séptima clase tiene 1250 datos

Obtenga la tabla de distribución de frecuencias

24. A continuación se presentan unos diagramas de cajas para los datos de precipitación por mes de la estación meteorológica de San Fernando en el estado Apure.

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

0100200300400500

DIAGRAMAS DE CAJA MESES DE SAN FERNANDO

PRECIPITACN (mm)

Analice el siguiente gráfico considerando los siguientes aspectos de interés: media aritmética y mediana por mes, datos atípicos, rango intercuartílico y comportamiento de la precipitación.

RESPUESTAS 17.

18.

MEDIA = 3.31 MEDIANA = 3 MODA = 2

19.

20.

21.

(6)

22.

RANGO INTERCUARTIL = 20

23.

Referencias

Documento similar