TALLER DE ESTADÍSTICA DESCRIPTIVA INTEGRANTES: WALTER BENAVIDES ELIANA GUERRERO FRANCISCO MARCILLO CAMILO PORTILLA
UNIVERSIDAD DE NARIÑO TUQUERRES marzo de 2014
TALLER DE ESTADÍSTICA DESCRIPTIVA
1.) La Tabla siguiente presenta cifras que muestran el número de estudiantes de último semestres de 5 especialidades distintas. Represente los datos mediante un diagrama de sectores.
SOLUCIÓN
CARRERA ESTUDIANTES PORCENTAJE
PORCENTAJE ACUMULADO GRADOS GRADOS ACUMULADOS Ingeniería 440 47,77% 47,77% 172° 172° Humanidades 220 23,89% 71,66% 86° 258,00 Agricultura 120 13,03% 84,69% 47° 305° Economía 80 8,69% 93,38% 31° 336 Bellas Artes 61 6,62% 100,00% 24° 360° TOTAL 921 100,00% 360°
2. ) De las empresas industriales de la Ciudad de Cali, se seleccionaron a 50 obreros para analizar la estatura (con el fin de sacar un promedio y exigir requisitos de admisión en las empresas). Se obtuvieron los siguientes resultados (en cm.)
a.) Cuál es la Población, cuál es la muestra, cuál es la variable y de qué tipo es?.
La población es la empresa, la muestra son los empleados a analizar, la variable es la estatura y es de tipo cuantitativa discreta
b.) Construir una distribución de frecuencias y graficar la ojiva para las frecuencias relativas acumuladas.
SOLUCIÓN Se agrupo los datos en intervalos de la siguiente manera: Se calculó el número de intervalos usando la regla de Sturges:
m=1+3,3*log(n) m=1+3,3*log(50)
m=2,8 Quedando los intervalos así:
1) [153-155,8) II 2) [155,8-158,6) IIII 3) [158,6-161,4) IIII IIII 4) [161,4-164,2)
IIII IIII IIII 5) [164,2-167) IIII IIII 6) [167-169,8) IIII II 7) [169,8-172,6) III DISTRIBUCION DE FRECUENCIAS
ESTATURA Marca de clase
# de obreros Linf. Lsup. Xi fi Fi hi Hi 153 155,8 154,4 2 2 4% 4% 155,8 158,6 157,2 6 8 12% 16% 158,6 161,4 160 9 17 18% 34% 161,4 164,2 162,8 14 31 28% 62% 164,2 167 164,7 9 40 18% 80% 167 169,8 168,4 7 47 14% 94% 169,8 172,6 171,2 3 50 6% 100% TOTAL 50 100%
3.) De acuerdo a los datos anteriores hallar en calculadora la media, la desviación estándar corregida, la desviación estándar sin corregir y el coeficiente de variación. Analizar cada resultado.
SOLUCIÓN MEDIA
Aplicando la fórmula para encontrar la “media aritmética” para datos agrupados obtuvimos que
=
Obteniendo que la media está acorde con los datos que se analizaron.
Para encontrar la desviación estándar corregida se tuvo que calcular en primera instancia la “varianza corregida” la cual la obtuvimos aplicando su fórmula de la siguiente manera: =
Ya obtenido la varianza corregida se prosigue a calcular “La Desviación Estándar Corregida” aplicando su fórmula así:
S = = 4,1144
La “variación Estándar Sin Corregir” se obtuvo calculando en primer lugar la varianza sin corregir aplicando la formula
Ya con la varianza sin corregir proseguimos a obtener la “variación Estándar Sin Corregir” aplicando la formula
= = 4,0731
Obtenido los anteriores datos se prosigue a calcular el “Coeficiente de Variación” el cual está regido por la formula
4.) De un grupo de 7 administradores y 10 de comercio internacional se quiere formar un comité de 5 personas para investigación. ¿Cuántos comités de 5 personas es posible formar si en cada comité debe haber máximo 3 administradores?
SOLUCIÓN
Se organizó las posibilidades con las que se pueden formar los grupos:
Luego se realiza las operaciones: = 35*45 + 21*120 + 7*210 + 252 = 2520+ 1575 + 1470 + 252 = 5565 + 252
= 5817
Se pueden formar 5817 comités.
5.) De las empresas de la ciudad de Pasto se seleccionaron a 50 trabajadores para analizar el peso y si es el caso programar secciones deportivas en horas extras. Se obtuvieron los siguientes resultados (en kilogramos)
65 64 64 63 64 67 66 66 66 66 63 65 65 65 64 53 55 56 57 58 65 64 64 63 63 58 57 59 59 60 63 72 71 70 69 60 60 61 61 61 69 68 68 67 67 61 62 62 62 62
a.) Construir una distribución de frecuencias, utilizando los siguientes intervalos: 53-56; 56-59; 59-62; 62-65; 65-68; 68-71; 71-74. SOLUCIÓN Peso(kg) Marca de clase # empleados Límite inferior Límite superior Xi fi Fi hi Hi 53 56 54.5 2 2 4% 4% 56 59 57.5 5 7 10% 14% 59 62 60,5 9 16 18% 32% 62 65 63.5 15 31 30% 62% 65 68 66.5 12 43 24% 86% 68 71 69.5 5 48 10% 96% 71 74 72.5 2 50 4% 100% 50 100% Peso (Kg.) Conteo 53-56 ll =2 56-59 llll =5 59-62 llll llll =9 62-65 llll llll llll =15 65-68 llll llll ll =12 68-71 llll =5 71-74 ll =2
TOTAL
b.) Graficar el histograma y el polígono de frecuencias. SOLUCIÓN
c.) Calcular y analizar: media aritmética, desviación estándar , Mediana(Me), Moda(Mo), P15, Q3.
SOLUCIÓN Media aritmética:
X ∑(xi*fi)/n 63.68 kg
Este valor de la media aritmética representa el promedio de todos los valores en este caso representada en kilogramos.
Desviación estándar(s):
S Raíz de ∑(Xi- )ẋ ^2fi/(n-1) 4,2170
Esta desviación estándar (s) nos indica que los pesos de los empleados pueden alejarse del peso promedio en 4,21 kg.
Mediana (Me):
L me 25.5 Mediana(me) 63.875
Lme: nos indica que la mediana se encuentra ente los trabajadores # 25 y 26 de la tabla anterior
me: la mediana es 63,875 kg lo que quiere decir que 50% de personas pesan menos de 63.875 y el otro 50% pesa más que este valor.
Moda (Mo):
Clase modal 15 Amplitud modal(c) 3 Moda(mo) 64
La clase modal corresponde al valor que más se repite que en nuestro caso es entre 62 y 65 kg a esta clase modal se le resta la anterior frecuencia y la siguiente para encontrar las dos variaciones también tenemos la amplitud de clase modal que se la obtiene con el límite superior –el límite inferior del intervalo luego tan solo aplicaremos la fórmula para encontrar Mo
Moda: esta nos indica de los datos que el peso que más se repite es 64kg. Percentil (15)
P15: equivale al 15% de los datos.
L p15 7.65 P15 60.031
L p15 quiere decir que el P15 se encuentra entre el dato 7 y el dato 8
P15 esto quiere decir que el 15% de los empleados tienen pesos menores a 60.o31 kg y el 85% tienen pesos superiores a este dato.
Cuartil (3)
Q3: equivale al 75% de los datos.
L Q3 quiere decir que el Q3 se encuentra entre el dato de lugar 38 y el dato de lugar 39 y la
frecuencia acumulada inmediatamente mayor a 38.25 es 43 y corresponde al quinto intervalo.
Q3 esto significa que el 75% de los empleados pesa menos de 66.951 kg y el 25% de los empleados pesa más de 66.961 kg.
d.) Calcular y analizar: Coeficiente da variación, Coeficiente de simetría y coeficiente de curtosis
SOLUCIÓN Coeficiente de variación:
Cv= S/x*100%
Cv= 4,2170/63,68 *100% Cv= 6.6221%
Según la tabla concluimos que el porcentaje es menor de 11% esto quiere decir que los pesos de los empleados son muy homogéneos porque no varían de manera muy
considerable.
Coeficiente de simetría
-COEFICIENTE DE SIMETRIA: a3 = m3 / s3 = -7,796736 / -7,9559 = 0,98
Análisis: Teniendo en cuenta a3 > 0, la distribución es asimétrica a la derecha o de
Coeficiente de curtosis
a4 = m4 / s4 = 820,3247 / 837,0660 = 0,98
Análisis: Teniendo en cuenta a4 > 0, la distribución es apuntada o leptocorticos.
6.) Resuelva y analice.
a.) Sumando 4 a cada uno de los números de la serie: 2, 6, 5, 9, 1, se obtiene la serie: 6, 10, 9, 13 y 5. Calcular las varianzas, media y coeficientes de variación de cada serie.
Compararlas y analizar los resultados obtenidos entre las dos series.
SOLUCIÓN DATOS A= 2, 6, 5, 9, 1 B= 6, 10, 9, 13, 5 VARIANZAS VARIANZA CORREGIDA A= = = 10,3 B= = = 10,3
El valor de las varianzas dio el mismo porque se afecta de igual manera a cada dato, aumentándole 4 a cada uno.
VARIANZA SIN CORREGIR
A= = = 8,24 B= = = 8,24
El valor de las varianzas dio el mismo porque se afecta de igual manera a cada dato, aumentándole 4 a cada uno.
MEDIA ARITMETICA A = = = 4,6 B = = = 8,6
La diferencia entre la media de A y la media de B, es de 4, el mismo valor que se le aumento a cada valor.
COEFICIENTE DE VARIACION = =
= = 3,21
= = 69,78% = = 37,33%
El coeficiente de variación de A es mayor al coeficiente de variación de B, esto significa que entre más alto el valor de las variables, los datos se vuelven más homogéneos.
b.) La media de un centenar de artículos es 50, y la suma de los cuadrados de las desviaciones respecto a la media es de 3600, calcular el coeficiente de variación.
SOLUCIÓN COEFICIENTE DE VARIACION = = = = = = 6 = = 12%
7.) Los siguientes datos corresponden a los salarios diarios, en pesos, pagados por una fábrica a su personal de obreros en un día de trabajo.
Salario diario No. de obreros
150 10
180 16
200 35
230 26
250 13
En la fábrica se presenta un conflicto laboral. El gerente propone un aumento del 10% diario para cada uno de los obreros y la Junta de empleados propone un aumento de $20. Se solicita su asistencia para que discuta qué es más ventajoso para la fábrica y qué para cada grupo de obreros, según su clasificación por niveles de salarios. Cómo actuaría usted?
SOLUCIÓN
Lo que debemos hacer en esta circunstancia es realizar las tablas de aumento de salario para cada uno de los grupos de los trabajadores tanto en la propuesta de los empleados de aumentar en $20 su salario como la de la empresa de aumentar el salario en un 10%. Salario diario No. de obreros Aumento $20 Aumento grupo
150 10 20 200 180 16 20 320 200 35 20 700 230 26 20 520 250 13 20 260 100 2000
Salario diario No. de obreros Aumento 10% Aumento grupo
150 10 15 150 180 16 18 288 200 35 20 700 230 26 23 598 250 13 25 325 101 2061
Tenemos que tener en cuenta cual es el grupo de trabajadores tiene mayoría de trabajadores el cual es el grupo tres con 35 obreros pero a ellos no afecta si el salario es aumentado en cualquiera de las formas propuestas entonces procedemos a tomar el próximo que tenga el
mayor número de trabajadores para poder tomar una decisión con respecto a que si cualquiera de los dos aumentos tiene que favorecer a la mayoría de los trabajadores. De los datos anteriores nos damos cuenta que la mejor opción para la mayoría de los trabajadores es el 10% ya que aumenta en mayor cantidad la cantidad el dinero que la empresa gasta en salarios.
Para la empresa lo más factible es el aumento de 20 pesos porque a la empresa lo que le interesa minimizar al máximo sus salidas.
8.) Calcular analizar la mediana, Q3 y P15 de la siguiente información
Peso de los Pacientes(kg.) Numero de pacientes 20-30 12 30-40 16 40-50 21 50-60 14 60-70 11 70-80 5 TOTAL 80 SOLUCIÓN Peso(kg) Peso(kg) Marca de clase # pacientes Límite inferior Límite superior Xi Fi FI hi Hi 20 30 25 12 12 15.19% 15.19% 30 40 35 16 28 20.25% 35.44% 40 50 45 21 49 26.58% 62.03% 50 60 55 14 63 17.72% 79.75% 60 70 65 11 74 13.92% 93.67% 70 80 75 5 79 6.33% 100.00% 79 100% Mediana: L me 40 Q3 45.48
L me:es el lugar que ocupa la mediana en este caso es 40.
me: La mediana es el valor donde se encuentra el centro del conjunto de datos y esto indica
que la mediana se encuentra en 45.48 kg .
L Q3 60 Q3 57.321428
L Q3: esto nos indica que el Q3 se encuentra en el lugar 60
Q3 : nos indica que el 75% tienen pesos menores a 57.321428 kg y el 25% d ellos es
superior a este valor.
L P15 12 P15 23.46
L P15 : esto indica que el P15 está ubicado en el lugar 12
P15 : esto significa que el 15% de los pacientes tendrían pesos menores a 23.46 kg y el 85%
9.) Según la información del punto anterior, calcular y analizar: la media, la varianza, la desviación estándar y el coeficiente de variación.
SOLUCIÓN Media aritmética:
X ∑(xi*fi)/n 46.39 kg
Este valor de la media aritmética representa el promedio de todos los valores en este caso representada en kilogramos.
Coeficiente de variación (cv)
CV Cv= S/x*100% 31.38 %
Según la tabla concluimos que el porcentaje es mayor de 26% esto quiere decir que los pesos de los pacientes son muy heterogéneos porque varían de manera considerable. Desviación estándar(s):
S Raíz de ∑(Xi- )ẋ ^2fi/(n-1) 14.56 kg
Esta desviación estándar (s) nos indica que los pesos de los empleados pueden alejarse del peso promedio en 14.56 kg.
Varianza
S^2 ∑(Xi- )´2fi/(n-1)ẋ 212.14
Indica que los valores pueden alejarse ciertas unidades de la media
10.) El peso medio de 25 personas es de 50 kg. El peso medio de 20 de ellos des de 45 kg. ¿cuál es el peso medio de las otra cinco personas?.
SOLUCIÓN Utilizamos la fórmula de la media:
∑(xi*fi)/n
x =50 Kg 20 x1 =45Kg =5 x 2 =?Aplicando la formula y despejando x2 que es lo que necesitamos podemos encontrar en peso medio de las 5 personas faltantes, así:
50 = 50*25=
1250 = 900 350 = 70 = x2
11.) Los médicos de un hospital piden $200000 de aumento en sus salarios mensuales. L@s enfermer@s piden el 10% de aumento a sus salarios mensuales. Si los salarios actualmente son:
Profesión Salario actual Médico 1 2500000 Médico 2 2000000 Médico 3 2400000 enfermer@ 1 1700000 enfermer@ 2 1800000 enfermer@ 3 1500000
Si usted es el gerente del hospital que decisión tomaría?. Justifique su respuesta. SOLUCIÓN
200000 10% Aumento 1 Aumento 2 Aumento 3 Aumento 4
medico1 2500000 200000 250000 250000 200000 medico2 2000000 200000 200000 200000 200000 medico3 2400000 200000 240000 240000 200000 enfermera 1 1700000 170000 200000 170000 200000 enfermera 2 1800000 180000 200000 180000 200000 enfermera 3 1500000 150000 200000 150000 200000 sumatoria 1100000 1290000 1190000 1200000
La opción más viable para la empresa y como decisión del gerente seria la primera opción debido a que esta demandaría menos gastos para la empresa al cumplir el aumento del salario.
12.) De los datos de los puntos 2.) y 5.) realizar el gráfico de cajas y bigotes. SOLUCIÓN
PUNTO 2
, el quinto dato es el cuartil, Q1 = 158
, el décimo dato es el cuartil, Q2 = 163
, el décimo dato es el cuartil, Q2 = 168
B1 = 158-[1,5*(168-158)] = 143
B2 = 168+[1,5*(168-158)] = 178
No existen valores atípicos, porque los bigotes sobrepasan el valor mínimo (153) y el valor máximo (172).
153,155, 156,157, 158,159, 160,161,162,163,164,165,166,167,168, 169, 170, 171, 172 PUNTO 5
, el quinto dato es el cuartil, Q1 = 58
, el décimo dato es el cuartil, Q2 = 63
, el décimo dato es el cuartil, Q2 = 68
B1 = 58-[1,5*(68-58)] = 43
B2 = 68+[1,5*(68-58)] = 83
No existen valores atípicos, porque los bigotes sobrepasan el valor mínimo (53) y el valor máximo (72).
53, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72
13.) La siguiente información corresponde a los puntajes de estudiantes de un colegio de la ciudad de Bogotá, en un examen de matemáticas (escala de 1 a 100 puntos)
Puntaje obtenidos por los estudiantes
Número de Estudiantes 40-50 50-60 60-70 70-80 80-90 90-100 25 30 40 50 10 5 Calcular y analizar: Q3, D2,
a
3 ya
4 SOLUCIÓN puntajes por estudiante # de estudiantes Fi Xi Xi*fi xi-media (xi-media)^2 (xi-media)^2*fi (xi-media)^3*fi (xi-media)^4*fi 40 50 25 25 45 1125 -20,3125 412,59766 10314,94141 -209522,25 4255920,649 50 60 30 55 55 1650 -10,3125 106,34766 3190,429688 -32901,306 339294,7197 60 70 40 95 65 2600 -0,3125 0,0976563 3,90625 -1,2207031 0,38146972770 80 50 145 75 3750 9,6875 93,847656 4692,382813 45457,4585 440369,1292 80 90 10 155 85 850 19,6875 387,59766 3875,976563 76308,2886 1502319,431 90 100 5 160 95 475 29,6875 881,34766 4406,738281 130825,043 3883868,456
Total 160 10450 1881,8359 26484,375 10166,0156 10421772,77
media 65,313
según el lugar cuartil 3
Linf 70 Fa 95 fo 50 C 10 Q3 75 Cuartil 3
El 75% de los estudiantes tienen un puntaje inferior a 75 puntos, mientras que el otro 25% de los estudiantes tienen un puntaje superior a 75 puntos
según el lugar del decil 2
Linf 50 Fa 25 fo 30 c 10 D2 52,333 Decil2
Esto significa que el 20% de los estudiantes tienen puntajes inferiores a 52 puntos y el 80% de los estudiantes tienen puntajes superiores a 52 puntos
varianza corregida S^2 11,835 desviación estándar corregida S 3,4403 coeficiente de simetría a3 1,5605 a4 465
a3, siendo mayor que cero hace referencia a que la distribución es simétrica a la derecha o
de sesgo positivo.
a4: siendo mayor que cero se refiere a que la distribución es simétrica a la derecha o de
sesgo positivo
14.) Calcule y analice Me, Q3, P10 y D4 de la siguiente información:
Utilidades Diarios(miles de pesos) Numero de Negocios 10-20 20-30 30-40 40-50 50-60 60-70 70-80 25 40 45 42 38 20 10 Total 220
SOLUCIÓN Límite
inferior Límite superior xi fi FI hi Hi
10 20 15 25 25 11,36% 11,36% 20 30 25 40 65 18,18% 29,55% 30 40 35 45 110 20,45% 50,00% 40 50 45 42 152 19,09% 69,09% 50 60 55 38 190 17,27% 86,36% 60 70 65 20 210 9,09% 95,45% 70 80 75 10 220 4,55% 100,00% 220 1 mediana 40 lugitud mediana 110,5 Q tres 53,42105263 POSICION 165,75 P 15 18,68421053 POSICION 33,15 D 4 33,15789474 POSICION 88,4
15.) Según la información del punto anterior
a.) Qué porcentaje de los negocios tienen utilidades inferiores a 58000 pesos diarios? SOLUCIÓN Pk = 58 Linf = 50 Fa = 152 Fo = 38 C = 10 k = 83%
Por lo que 83% de los negocios tienen utilidades inferiores a 58000 pesos diarios b.) Qué porcentaje de los negocios tienen utilidades superiores a 24000 pesos diarios?
SOLUCIÓN Pk = 24 Linf = 20 Fa = 25 Fo = 40 C = 10 k = 18,6% 100% - 18,6% = 81,4%
Por lo que el 81,4% de los negocios tienen utilidades superiores a 24000 pesos diarios 16.) Según la información del punto 14) calcule y analice x, Mg, 2
s , s, CV. SOLUCIÓN
Media=8980/220= 40,81818182 Mg = 2,5148
S (desviación estándar corregida)= (457370,677)/(n-1) = 457370,677/219 = 2088,45058 = 45,7
S (desviación estándar corregida)= 45,7
C/V= (coeficiente de variación)= S/media*100% = (45,7/40,81818182)*100% C/V= (coeficiente de variación)= 1.11 %
Media=8980/220= 40,81818182 S2=457370,6777/220= 2078,957626
17.) De un grupo de 100 obreros que laboran en una fábrica 40 de ellos trabajan en el día y el resto en la noche. Se sabe que el salario promedio de los 100 obreros es de 12720 pesos diarios y que los del turno de la noche reciben en promedio 800 pesos menos que los trabajadores del día. ¿Cuál es el salario promedio de cada grupo?.
SOLUCIÓN Media= 12720 pesos N1=40 N2= 60x2= X1 – 8000 12720= 40X1+60(X1 - 800)/100 1272000= 100X1 – 48000 1320000/100 = 100X1 13200 = X1
Salario promedio del día =13200 X2= X1 – 800 =
X2= 13200 – 800 X2= 21400
Salario promedio de la noche =21400 18.) Resolver
a.) En un salón de clase de 30 estudiantes, la estatura promedio es de 168 cm. Si ingresa un estudiante el promedio se aumenta en 2cm. ¿cuál es la estatura del nuevo estudiante?.
SOLUCIÓN Media 30 estudiantes = 168cm
30*168 = 5040 estatura acumulada por 30 estudiantes 5040+
x
/31= 170cmx
= (170cm *31)- 5040x
= 230cmPara obtener un promedio de 170 cm, el nuevo estudiante tiene que medir 230 cm. b.) La media de un centenar de artículos es de 5 y la suma de los cuadrados de las desviaciones con respecto a la media es de 400. Calcule el coeficiente de variación.(sug. Utilice la desviación estándar sin corregir).
SOLUCIÓN
=
= = = 2 = = 4%