Capítulo cuatro
Descripción de los datos: medidas de dispersión
OBJETIVOS
Al terminar este capítulo podrá:
UNO
Calcular e interpretar la amplitud de variación, la
desviación media, la variancia, y la desviación estándar de los datos originales.
DOS
Capítulo cuatro
continuaciónDescripción de datos: medidas de dispersión OBJETIVOS
Al terminar este capítulo podrá:
CUATRO
Entender el problema de Chebyshev y la regla normal o empírica, y su relación con un conjunto de observaciones.
CINCO
Calcular y explicar los cuartiles y la amplitud de variación intercuartílica.
SEIS
Desviación media
• Desviación media: media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.
MD
X
X
n
EJEMPLO 1
• Los pesos de una muestra de cajas con libros en una librería son (en lb) 103, 97, 101, 106 y 103. • X = 510/5 = 102 lb
• = 1 + 5 + 1 + 4 + 1 = 12 • MD = 12/5 = 2.4
• Por lo común los pesos de las cajas están a 2.4 lb del peso medio de 102 lb.
Variancia de la población
• La varianza de la población para datos no agrupados es la media aritmética de las desviaciones cuadráticas respecto a la media de la población.
2
2
(
X
)
EJEMPLO 2
• Las edades de la familia Dunn son 2, 18, 34, y 42 años. ¿Cuál es la variancia de la población?
X N
/
96 4 24
/
2
2944 4
236
Variancia poblacional continuación
• Una fórmula alternativa para la variancia poblacional es:
22
2
X
N
Desviación estándar poblacional
• La desviación estándar poblacional ( ) es la raíz cuadrada de la variancia de la población. • Para el EJEMPLO 2, la desviación estándar
Variancia muestral
EJEMPLO 3
• Una muestra de cinco salarios por hora para varios trabajos en el área es: $7, $5, $11, $8, $6. Encuentre la variancia.
• X = 37/5 = 7.40
Desviación estándar muestral
• La desviación estándar muestral es la raíz cuadrada de la variancia muestral.
Medidas de dispersión: datos no agrupados
• Para datos no agrupados, la amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.
• AMPLITUD = valor mayor - valor menor
• EJEMPLO 4: una muestra de cinco graduados de contaduría indicó los siguientes salarios iniciales:
Variancia muestral para datos agrupados
• La fórmula de la variancia para datos agrupados usada como estimador de la vaiancia poblacional es:
• donde f es la frecuencia de clase y X es el
Interpretación y usos de la desviación estándar
• Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k
Interpretación y usos de la deviación estándar
Dispersión relativa
• El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:
CV
s
X
Asimetría
• Asimetría (sesgo) es la medida de la falta de simetría en una distribución.
• El coeficiente de asimetría se calcula mediante la siguiente fórmula:
Amplitud intercuartílica
• La amplitud intercuartílica es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
• Amplitud intercuartílica
Primer cuartil
• El primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25% de las observaciones en un conjunto ordenado de datos.
• donde L = límite de las clasese que contienen Q1,
CF = frecuencia acumulda que precede a la clase que
Q
L
n
CF
f
i
1
+
4
Tercer cuartil
• El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75% de las observaciones en un conjunto ordenado de datos:
donde L = límite inferior de la clase que contiene a Q3,
CF = frecuencia acumulada precedente a la clase que contiene a Q3, f = frecuencia de la clase que contiene a
Desviación cuartílica
• La desviación cuartílica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1.
EJEMPLO 5
Amplitud cuartílica
• Cada conjunto de datos tiene 99 percentiles, que dividen el conjunto en 100 partes iguales. • La amplitud cuartílica es la distancia entre dos
percentiles establecidos. La amplitud cuartílica
Fórmula para percentiles
100
)
1
+
(
=
n
P
Diagramas de caja
• Un diagrama de caja es una ilustración gráfica, basada en cuartiles, que ayuda a visualizar un conjunto de datos.
EJEMPLO 6
• Con base en una muestra de 20 entregas, Marco’s Pizza determinó la siguiente información:
valor mínimo = 13 minutos,
Q1 = 15 minutos, mediana = 18 minutos,
EJEMPLO 6 continuación