Explicación de la tarea 2
Felipe GuerraPara los siguientes grupos de datos (1 al 5) calcular: a) la media aritmética. f) el rango.
b) la mediana. g) la varianza muestral y poblacional.
c) la moda. h) la desviación estándar muestral y poblacional. d) el 1er. cuartil. i) indica la medida de tendencia central
e) el 3er. cuartil. más apropiada y decir porque.
1. Los datos son el salario diario (en pesos) de los empleados de una empresa. 170 500 669 83 194 167 861 2196 88 263 378 100 85 95 88 198 378 498 407 100 158 La mayor parte de los resultados se pueden obtener directamente utilizando fórmulas en Excel, como se muestra a continuación.
Nota: En los siguientes ejemplos se debe sustituir el rango “problema_1” por el rango de celdas que ocupe la tabla de datos dentro de la página de Excel. Por ejemplo: B1:L2
Descripción Fórmula Resultado
a) La media aritmética. =PROMEDIO(Problema_1) 365.52 b) La mediana. =MEDIANA(Problema_1) 194
c) La moda. =MODA(Problema_1) 88
d) El 1er. cuartil. =CUARTIL(Problema_1,1) 100 e) El 3er. cuartil. =CUARTIL(Problema_1,3) 407 f) El rango. =MAX(MIN(Problema_1Problema_1) )- 2113 g) La varianza muestral =VAR(Problema_1) 222,067.36 Varianza poblacional. =VARP(Problema_1) 211,492.73 h) La desviación estándar muestral =RAIZ(varianza muestral) 471.24 desviación estándar poblacional. =RAIZ(varianza poblacional) 459.88 Observe lo siguiente:
• Para la función =CUARTIL(MATRIZ, CUARTIL) el número en rojo nos indica el cuartil que estamos buscando.
• La desviación estándar corresponde a la raíz cuadrada de la varianza, por lo que para las respuestas al inciso h) se utiliza ese valor. En la solución en Excel debe colocar el valor obtenido en g) en lugar del texto marcado en verde.
En cuanto a la respuesta al inciso “i) indica la medida de tendencia central más apropiada y decir porque.” No existe una respuesta adecuada para todos los casos. En general la tendencia de medida central más adecuada depende de la información que esta buscando el investigador. Dependiendo del objetivo de la investigación la medida de tendencia central más adecuada podría variar, aun cuando los datos sean los mismos. Los ejercicios 1 a 5 se resuelven de manera similar.
6. Una institución que entrena a deportistas ha decidido calificar el rendimiento deportivo de los atletas a través de un examen de habilidades. La calificación se obtendrá como una media ponderada de los siguientes aspectos con el peso correspondiente: reflejos 25, salto 30, velocidad 15, fuerza 40. Un atleta obtuvo la siguiente puntuación: 88 en reflejos, 100 en salto, 95 en velocidad y 70 en fuerza. Calcular su calificación.
Una media ponderada se utiliza cuando los números que se quieren promediar no tienen la misma importancia (o peso) dentro del promedio final.
En la media ponderada se asocia a los números x1, x2,...,xn que se quieren promediar, ciertos factores o pesos w1, w2,...,wn que dependen de la significación o importancia de cada uno de los números. Entonces se genera una media aritmética ponderada, que también se representa con equis testada, y corresponde a la siguiente fórmula:
Para la solución de este problema se calcula una tabla que incluye los productos de las variables (Xi) multiplicada por su importancia (Wi), como se muestra a continuación:
Aspectos Ponderación (Wi) Evaluación (Xi) Puntaje (WiXi)
Reflejos 25 88 2,200
Salto 30 100 3,000
Velocidad 15 95 1,425
Fuerza 40 70 2,800
Totales (Σ) 110 9,425
Para obtener la calificación se usa la fórmula:
Que puede substituirse por 9,425 / 110 = 85.68
Por lo tanto la calificación ponderada es: 85.68
Nota: Observe que el valor de la ponderación no necesariamente debe sumar 100 como
usualmente sucede cuando se pondera sobre un porcentaje. El problema #7 se resuelve de la misma forma.
Para los siguientes grupos de datos calcular:
a) la media aritmética. d) la varianza muestral y poblacional.
b) la mediana. e) la desviación estándar muestral y poblacional. c) la moda.
8. Los siguientes datos son el área en mPP
2
P de algunas tiendas de autoservicio ubicadas en colonias populares del área metropolitana de una ciudad.
ÁREA FRECUENCIA 949.5--2143.5 20 2143.5--3337.5 15 3337.5--4531.5 8 4531.5--5725.5 8 5725.5--6919.5 5 6919.5--8113.5 3 8113.5--9307.5 3 9307.5--10501.5 1
Para resolver este problema completamos la tabla proporcionada agregando la marca de clase (xi) que corresponde al valor central de la clase, el producto de la frecuencia de la
marca de clase por la frecuencia (xifi), y el cuadrado de la media de clase por la
frecuencia (xi2f) como se muestra a continuación:
LI LS Frec ( f ) (MC x i ) PROD. ( xi fi ) xi 2 f 949.5 2,143.5 20 1,546.5 30,930.0 47,833,245.0 2,143.5 3,337.5 15 2,740.5 41,107.5 112,655,103.8 3,337.5 4,531.5 8 3,934.5 31,476.0 123,842,322.0 4,531.5 5,725.5 8 5,128.5 41,028.0 210,412,098.0 5,725.5 6,919.5 5 6,322.5 31,612.5 199,870,031.3 6,919.5 8,113.5 3 7,516.5 22,549.5 169,493,316.8 8,113.5 9,307.5 3 8,710.5 26,131.5 227,618,430.8 9,307.5 10,501.5 1 9,904.5 9,904.5 98,099,120.3 Total (Σ) 63 234,739.5 1,189,823,667.8
Con esos datos procedemos a resolver lo que nos pide el problema: a) La media aritmética:
Lo que se traduce en: J
234,739.5 / 63 = 3,726.0 b) La mediana;
a. Primero encontramos la suma de las frecuencias de clase hasta encontrar aquella en la que se pasa del 50% de la frecuencia total es decir más de 31.5 elementos (63 / 2). En función de esto encontramos que la segunda clase (marcada en amarillo) tiene una frecuencia acumulada de 35 (superior a 31.5), correspondiente a la mediana.
b. Una vez encontrada la clase correspondiente a la mediana se aplica la siguiente fórmula:
En donde:
L1: Corresponde al límite inferior de la clase, (2,143.5)
(Σf)1: Es la suma de las frecuencias de las clases anteriores a la
mediana, (20)
C: Es la amplitud de la clase, (3,337.5 - 2,143.5) = 1,194.0 fx: Es la frecuencia de la clase mediana, (15)
Sustituyendo: ~
X = 2,143.5 + {[(63 / 2) – 20] * (1,194.0)} / 15 = 3,058.9 c) La moda;
a. Primeramente se localiza aquella clase que tiene mayor frecuencia (marcada en verde)
b. Una vez encontrada la clase correspondiente a la moda se aplica la siguiente fórmula:
En donde:
L2: Corresponde al límite inferior de la clase, (949.5)
Δ1: Es la diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase que le antecede. En este caso no existe clase que la anteceda, por lo que se utiliza cero. (20 – 0 = 20) Δ2: Es la diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase que le precede. (20 – 15 = 5)
C: Es la amplitud de la clase, (2,143.5 – 949.5) = 1,194.0
Sustituyendo:
Mo = 949.5 + [20 / (20 + 5)] * (1,194.0) = 1,904.7
d) La varianza muestral y poblacional.
Comencemos por la varianza poblacional, para ello utilizamos la siguiente fórmula:
Los datos los podemos adquirir de la tabla extendida, complementados con la media aritmética que encontramos en el inciso a).
Sustituyendo tenemos:
La varianza muestral se obtiene con la siguiente fórmula:
Sustituyendo tenemos:
S2 = 5,002,836.5 ( 63 / 62) = 5,083,527.4
e) La desviación estándar muestral y poblacional
Dado que la desviación estándar corresponde a la raíz cuadrada de la varianza obtenemos lo siguiente:
Desviación estándar poblacional (σ) = √ σ2 = √5,002,836.5 = 2,236.7
Desviación estándar muestral (S) = √ S2 = √5,083,527.4 = 2,254.7 El problema 9 se resuelve de forma similar.