Tema 2: Distribuciones de
frecuencia y gráficas para datos
categórico y discretos
1. Centro: Un valor representativo o promedio que
indica dónde se encuentra el centro del conjunto de datos.
2. Variación: Una medida de cuánto varían la data.
3. Distribución: La forma de la dispersión de la data sobre el rango de valores de la variable
(acampanada, sesgada o uniforme).
Características importantes de la data
4. Datos extremos:
Valores que son muy distintos a los otros
valores de la variable.
5. Tiempo:
Cuando se obtiene data de una encuesta o de un experimento, ésta se debe organizar en una forma manejable.
Formas de Organizar Data • Tablas
• Gráficas
• Construir un resumen numérico
Una
tabla
o
distribución de
frecuencias
• agrupa la data en
categorías
o
clases
(que no tienen nada en común)
• indica el número de observaciones en
cada categoría.
1.1 - 5
1. Resumir conjuntos de datos grandes.
2. Analizar la naturaleza de los datos
3. Tener una base para la construcción
de gráficas importantes.
Ejemplo 1: Tabla de frecuencia para
data cualitativa o categórica
•
Problema: Un fisioterapeuta quiere
determinar los tipos de rehabilitación
requeridos por sus pacientes. Para ello,
obtiene una muestra aleatoria simple de
36 de sus pacientes y registra la parte del
cuerpo que requieren rehabilitación.
•
Construya una distribución de
EJEMPLO: cont
Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes.
Cadera Espalda Codo Cuello Espalda Espalda Rodilla Mano Espalda
Espalda Cadera Ingle Hombro Espalda Espalda Espalda Espalda Codo
Mano Hombro Espalda Hombro Ingle Mano Hombro Muñeca Rodilla
Muñeca
Rodilla Rodilla Muñeca Rodilla Hombro Rodilla Espalda Rodilla
Región del cuerpo Conteo Frecuencia
Cadera
Codo
Cuello
Espalda
Hombro
Ingle
Mano
Muñeca
Frecuencia absoluta y frecuencia relativa
•
La tabla anterior muestra
frecuencias
absolutas
(número de observaciones
incluidas en cada categoría o clase).
•
La
frecuencia relativa
es la proporción
(o porcentaje) de observaciones dentro
de una categoría.
•
Se encuentra usando la fórmula:
•
Una
distribución de frecuencias
relativas
muestra la frecuencia relativa
de cada categoría
frecuencia relativa = frecuencia absoluta
EJEMPLO: cont
Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes. Construya una distribución de frecuencia relativa de los datos.
Categoría Frecuencia absoluta
Frecuencia relativa
Cadera 2
Codo 2
Cuello 1
Espalda 11
Hombro 5
Ingle 2
Mano 3
Muñeca 3
Una distribución de frecuencias acumuladas
muestra la frecuencia acumulada de cada categoría.
Distribución de frecuencias acumuladas
La frecuencia acumulada correspondiente a una
clase particular es la suma de todas las
frecuencias hasta e incluyendo esa clase.
Una distribución de frecuencias relativas
2-11
Distribución de frecuencias acumuladas
Ejemplo: La siguiente tabla muestra la distribución de
frecuencia absoluta del número de autos vendidos en cierta compañía de autos. Determine la distribución de frecuencias acumuladas y la distribución de frecuencias relativas
• Las gráficas nos permiten resumir la data y nos ayudan a entender lo que la data dice, en general, acerca de los individuos en el estudio.
• Las gráficas para data categórica o
cuantitativa discreta se construyen colocando cada categoría de data en uno de los ejes
(normalmente el eje horizontal) y la frecuencia absoluta o la frecuencia relativa de cada
categoría en el otro eje.
Construcción de una gráfica de
barra de frecuencia
M&M
Cantidad de dulces
Azul 5
Marrón 12
Rojo 9
Anaranjado 6
Amarillo 10
Verde 3
Usaremos data sobre colores de los M&M para construir una gráfica de barra de frecuencia absoluta y relativa
M&M Frecuencias absolutas Frecuencias relativas Azul Marrón Rojo Anaranjado Amarillo Verde
Gráfica de barra de frecuencia
relativa (creada en Excel)
Color de M&M
Frecuencia absoluta
Azul 5
Marron 12
Rojo 9
Anaranjado 6 Amarillo 10
Verde 3
0 2 4 6 8 10 12 14
Azul Marron Rojo Anaranjado Amarillo Verde
F rec u encia A b solu ta
Distribución de frecuencias para M&M's
Características:
• Las barras, que son del mismo ancho, se dibujan por cada categoría.
Gráfica de barra de frecuencia
relativa (creada en Excel)
Color de M&M
Frecuencia absoluta
Azul 5
Marron 12
Rojo 9
Anaranjado 6
Amarillo 10
Verde 3
0 0.05 0.1 0.15 0.2 0.25 0.3
Azul Marron Rojo Anaranjado Amarillo Verde
F rec u encia rela tiv a
• Una gráfica circular es un círculo dividido en sectores. • Cada sector representa una categoría de datos.
• El área de cada sector es proporcional a la frecuencia de la categoría.
• Ejemplo: Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital.
Determine el % del círculo ocupado por cada categoría.
Gráfica circular
Número de sectores en la gráfica circular:
% del círculo que ocupa cada sector:
Asalto:
Caída: Herida de bala:
Gráfica circular (cont.)
Número de sectores en la gráfica circular:
Grados del círculo que ocupa cada sector:
Asalto: 5% de 360 = Caída: 10% de 360= Herida de
bala: 40% de 360= Accidente de
vehículo: 35% de 360=
1.1 - 19
Gráfica circular vs Gráfica de barra
• Las gráficas circulares sólo pueden crearse si todas las categorías de la variable bajo estudio están
representados.
• Las gráficas circulares son útiles para mostrar la
división de todos los valores posibles de una variable cualitativa en sus partes.
• Las gráficas circulares no son tan útiles en la
comparación de dos valores específicos de la variable cualitativa. El énfasis está en la comparación de las partes con el todo.
• Utilice una gráfica de barras cuando se quiere comparar los diferentes valores de la variable entre si y no las
Distribución de frecuencia para data
cuantitativa discreta (muchos valores
posibles)
Características de esta data:
• discreta con muchos valores posibles
Método para crear distribución de frecuencia:
1.1 - 21
4. Elegir un punto de comienzo (el valor mínimo del conjunto de datos o un valor conveniente)
Pasos para construir una
distribución de frecuencias
1. Determinar el número de clases que se va a usar (debe ser entre 5 y 20).
2. Determinar el valor máximo y mínimo del conjunto.
3. Calcular el ancho de la clase (redondear hacia arriba).
ancho de clase (valor máximo) – (valor mínimo)
Ejemplo: Construir una distribución de
frecuencia para el conjunto que contiene
pulsos de 40 féminas
SOLUCION:
• Usaremos 7 clases.
• Identificar el valor mínimo y máximo
• mínimo ___, máximo ____ • Determinar el ancho de las
clases:
• 𝑎𝑛𝑐ℎ𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 −𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝑎𝑛𝑐ℎ𝑜 =
• Decidir punto de comienzo:
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
Ejemplo: (continuación)
SOLUCION (continuación):
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
Ejemplo: (continuación)
SOLUCION (continuación):
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
88 96 104 124 6. Determinar los límites superiores de las clases.
• ¿valor mínimo y valor máximo? 672 y 738
• Usemos como límite inferior de la primera clase 670 • Usemos como ancho de la clase: 10
• Las clases y frecuencias:
Ejemplo 2 : Construir una distribución de
frecuencia absoluta de datos discretos
(muchos valores posibles)
Clases Frecuencia
Los datos dados representan el tiempo entre erupciones (en segundos) de una muestra aleatoria de 45 erupciones del géiser “Old
Ejemplo: Construir una tabla de frecuencias
relativas para los datos del géiser “Old
Faithful”
Tiempo entre Frecuencia Frecuencia
erupciones absoluta relativa