Estadísticas Elemental
Diagramas de caja
Los cuartiles dividen un conjunto de datos en cuartos o 4 partes iguales.
• El 1er cuartil, se denota Q
1, separa el 25% inferior de los
datos del 75% superior. Por lo tanto, el 1er cuartil es
equivalente a 𝑷𝟐𝟓.
• El 2do cuartil, se denota Q
2, separa el 50% inferior de los
datos del 50% superior. Por lo tanto, el 2do cuartil es equivalente a la mediana.
• El 3er cuartil, se denota Q
3, separa el 75% inferior de los
datos del 25% superior. Por lo tanto, el 3er cuartil es
equivalente al 𝑷𝟕𝟓.
Cuartiles - resumen
•Q2 es la mediana del conjunto completo. •Q1 es la mediana de la mitad inferior del conjunto.
•Q3 es la mediana de la mitad superior del conjunto.
Un grupo de estudiantes recolectó datos sobre la velocidad de
vehículos que viajan por una zona de construcción en una carretera estatal, donde la velocidad máxima era 25 mph. La velocidad
registrada de 14 vehículos seleccionados al azar, es la siguiente: 20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
Determinar e interpretar los cuartiles para la velocidad en la zona de construcción.
a) Nota que los datos ya están ordenados.
b) Determinar la mediana del conjunto para n = 14 observaciones, Q2
c) Determinar la mediana de la mitad inferior del conjunto, Q1
d) Determinar la mediana de la mitad superior del conjunto, Q3
e) Interpretación :
El
rango
intercuartil
, se denota IQR, es el
rango del 50% central de los datos. Esto es
la diferencia entre
Q
3y
Q
1.
𝐼𝑄𝑅 = 𝑄
3− 𝑄
120, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40 EJEMPLO Determinar e interpretar el rango intercuartil para los datos sobre velocidad en la zona de construcción
Se toma la velocidad de un 15to auto que atraviesa la zona de
construcción y su velocidad es 100 mi/hr. ¿Qué impacto tiene
sobre la media, mediana, desviación estándar y rango intercuartil?
Con 14 autos Con 15autos
Media 32.1 mph
Mediana 32.5 mph Desviación estándar 6.2 mph
IQR 10 mph
20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40
,
100
EJEMPLO Impacto de observaciones nuevas sobre el
Resumen: ¿Cuál medida debes reportar? Forma de la distribución Medida de tendencia central Medida de dispersión
Simétrica Media Desviación estándar
Sesgado Mediana Rango
intercuartil
𝑥
𝑖se considera un
valor extremo
si:
•
𝑥
𝑖< 𝑄
1− 1.5(𝐼𝑄𝑅)
ó
•
𝑥
𝑖> 𝑄
3+ 1.5(𝐼𝑄𝑅)
donde
𝑄
1− 1.5(𝐼𝑄𝑅)
es el límite inferior del conjunto y
𝑄
3+ 1.5(𝐼𝑄𝑅)
es el límite superior del conjunto
Identificar valores extremos usando
IQR
Paso 1: Determinar Q1 y Q3
Paso 2: Determinar IQR
Paso 3: Calcular los límites
límite inferior= Q1 – 1.5(IQR) límite superior= Q3 + 1.5(IQR)
Paso 4: Determinar valores extremos
EJEMPLO Determinar valores extremos en el conjunto de velocidades en la zona de construcción
Cinco valores que resumen un conjunto de datos son:
Resumen de 5 valores
Mínimo 𝑸𝟏 M 𝑸𝟑 Máximo
Cada seis meses, la Junta de la Reserva Federal
de los Estados Unidos realiza un estudio de los
planes de tarjetas de crédito en los EE.UU. Los
datos siguientes son las tasas de interés cobradas
por los 10 emisores de tarjetas de crédito,
seleccionados al azar para la encuesta de julio de
2005.
Determine el resumen de cinco valores para los
datos que se muestran a continuación.
Institución Taza
Pulaski Bank and Trust Company 6.5% Rainier Pacific Savings Bank 12.0% Wells Fargo Bank NA 14.4% Firstbank of Colorado 14.4% Lafayette Ambassador Bank 14.3%
Infibank 13.0%
United Bank, Inc. 13.3% First National Bank of The Mid-Cities 13.9%
Bank of Louisiana 9.9%
Bar Harbor Bank and Trust Company 14.5%
Resumen de 5 valores: Mínimo:. Máximo: 𝑸𝟏 = 𝑸𝟐 ó M = 𝑸𝟑 =
EJEMPLO Obtener un resumen de cinco valores (cont.)
Diagrama de caja
1. Determinar los extremos inferior y superior del diagrama.
a) 𝑄1 − 1.5(𝐼𝑄𝑅)
b) 𝑄3 + 1.5(𝐼𝑄𝑅)
donde IQR = 𝑄3 − 𝑄1
2. Marcar los extremos encontrados en paso 1.
3. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea vertical dentro de la caja en M.
3. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1 hasta el mínimo.
4. Cualquier valor menor que el extremo inferior o mayor que el extremo superior se marca con *
Institución Taza
Pulaski Bank and Trust Company 6.5% Rainier Pacific Savings Bank 12.0% Wells Fargo Bank NA 14.4% Firstbank of Colorado 14.4% Lafayette Ambassador Bank 14.3%
Infibank 13.0%
United Bank, Inc. 13.3% First National Bank of The Mid-Cities 13.9%
Bank of Louisiana 9.9%
Bar Harbor Bank and Trust Company 14.5%
Usando el resumen de 5 valores: Mínimo: 6.5%. Máximo: 14.5%. 𝑄1 = 12.0%. 𝑄2 ó M = 13.6%. 𝑄3 = 14.4%.
EJEMPLO Construir un diagrama de caja y describir la forma de la distribución de los datos.
Paso 1: IQR
Paso 2: límites inferior y superior: