UNIDAD II: DISTRIBUCIÓN DE FRECUENCIAS
ANÁLISIS DE DATOS AGRUPADOS
Hasta ahora, en el desarrollo de los primeros temas hemos asignado apriorísticamente la amplitud de los intervalos de clase de cada uno de los datos que se han ordenado y agrupado. Sin embargo, en ocasiones, es necesario obtener la amplitud del mismo, por cuanto, no se ha establecido anticipadamente la amplitud de los mencionados intervalos. En este caso, acudiremos a un ejemplo práctico donde se realizarán los respectivos cálculos:
1. Supongamos que los siguientes datos muestran los resultados de la aplicación de una prueba de admisión en la carrera de Astronomía:
Observemos que el valor máximo es 123 y el valor mínimo es 98. En este caso, el rango de los datos sería:
R = 123 – 98 = 25
1.1. Ahora bien, completado este paso es necesario determinar el número de clases que debe poseer la tabla. Para ello, comúnmente se emplea la Regla de Sturges que establece:
k = 1 + 3.3log(n) Donde:
k = número de clases y n= número de observaciones De esta manera:
k = 1 + 3.3 log(30) k = 1 + 3.3(1.47712) k = 1 + 4.43
k = 5.43
Por aproximación al entero siguiente:
k = 6
Este es el número de clases
1.2. A partir de los cálculos anteriores, procedemos a obtener la amplitud de la clase:
𝐴 = 𝑅 𝑘 = 25
6 𝐴 = 4.16667
Por aproximación al entero siguiente:
𝐴 = 5
Este será la amplitud de cada una de las clases.
100 104 110 121 101 123
102 114 111 110 98 120
108 115 118 106 103 101
109 116 117 106 119 102
107 112 121 108 122 106
1.3. Teniendo esta información, se procede a diseñar los límites inferior y superior de los intervalos:
Clase Cálculo de Límite Inferior
Límite Inferior
Cálculo de Límite Superior
Límite Superior
1 98 98 (L2 – 1) 102
2 L1 + A 103 (L2 – 1) + A 107
3 L2 + A 108 (L3 – 1) + A 112
4 L3 + A 113 (L4 – 1) + A 117
5 L4 + A 118 (L5 – 1) + A 122
6 L5 + A 123 (L6 – 1) + A 127
1.4. Así pues, construimos la tabla con los datos agrupados y sus respectivas frecuencias absolutas y relativas:
Clase Frecuencia Absoluta (Fa)
Frecuencia Relativa (Fr)
Frecuencia Relativa (%)
98 – 102 6 0.2 20%
103 – 107 6 0.2 20%
108 – 112 7 0.233333 23.33%
113 – 117 4 0.133333 13.33%
118 – 122 6 0.2 20%
123 – 127 1 0.033333 3.33%
Totales 30 1 100%
Después de observar este procedimiento, puede surgir una duda: ¿Y si quiero emplear un número de clases o intervalos distinto, sea menor o mayor?
Esta pregunta puede responderse mediante la sistematización de otro procedimiento, en el cual, se determina cuál sería la amplitud de la cantidad de intervalos que queremos. Para responder a esta interrogante, procederemos a realizar otro sencillo ejemplo donde se muestre el procedimiento que se debe seguir.
2. Supongamos que los siguientes datos representan los resultados de la observación de los kilómetros recorridos semanalmente por treinta (30) atletas en las instalaciones del polideportivo de la zona.
Observemos que el valor máximo es 17 y el valor mínimo es 15.
En este caso, el rango de los datos sería:
R = 17 – 15 = 2
2.1. Ahora, supongamos que se desea establecer una tabla con cuatro (04) intervalos de clase para la respectiva interpretación de los datos. Así, la amplitud de los mismos será:
𝐴 = 𝑅
𝑄𝑖 𝐴 = 2 4 𝐴 = 0.5
2.2. De este modo procedemos a la obtención de la tabla con los intervalos de clase y los respectivos límites:
Clase Cálculo de Límite Inferior
Límite Inferior
Cálculo de Límite Superior
Límite Superior
1 15.0 15.0 (L2 – 0.1) 15.4
2 L1 + A 15.5 (L2 – 0.1) + A 15.9
3 L2 + A 16.0 (L3 – 0.1) + A 16.4
4 L3 + A 16.5 (L4 – 0.1) + A 17.0
2.3. Así pues, construimos la tabla con los datos agrupados y sus respectivas frecuencias absolutas y relativas:
Clase Frecuencia Absoluta (Fa)
Frecuencia Relativa (Fr)
Frecuencia Relativa (%)
15.0 – 15.4 7 0.23333 23.33%
15.5 – 15.9 7 0.23333 23.33%
16.0 – 16.4 11 0.36667 36.67%
16.5 – 17.0 5 0.16667 16.67%
Totales 30 1 100%
16.2 15.0 16.3 15.8 15.7 15.4
15.6 16.7 16.6 16.3 16.2 16.2
15.2 15.4 15.9 15.9 16.4 15.9
16.2 16.8 15.2 15.4 16.1 15.3
17.0 15.8 16.0 16.3 16.2 16.8
USO DE GRÁFICOS PARA LA REPRESENTACIÓN DE LAS DISTRIBUCIONES Representación de frecuencias absolutas del primer ejemplo
Histograma:
Consiste en una serie de rectángulos, cuyo ancho es proporcional al alcance de los datos que caen dentro de una clase o intervalo, y cuya altura es proporcional al número de elementos que
caen dentro de la clase.
Representación de frecuencias relativas
Gráficos circulares:
Son empleados para la representación de frecuencias relativas. Se diseñan considerando que cada sección del círculo (o de la torta) se corresponda con la proporción de cada elemento.
Representación de frecuencias absolutas del segundo ejemplo Histograma:
Gráfico circular