Estadística Descriptiva
SESIÓN 6Contextualización de la sesión 6
Las representaciones graficas tienen una gran importancia para la comprensión de los diferentes tipos de datos utilizados para la creación de tablas ya que facilitan el tratamiento de los datos generados en un estudio estadístico.
Contextualización de la sesión 6
En las sesiones anteriores conociste dos representaciones graficas denominadas histograma y polígono de frecuencias, estas son una excelente herramienta de apoyo en la Estadística Descriptiva.
Al terminar esta sesión deberás conocer
dos representaciones graficas
complementarias que se pueden generar a partir de una tabla de datos agrupados.
Introducción de la sesión 6
Un histograma y un polígono de frecuencias son recursos gráficos que facilitan el análisis sobre la distribución de los elementos de una muestra.
En la presente sesión, se analizaran dos elementos gráficos adicionales para el estudio de la distribución de frecuencias: la ojiva y la ojiva relativa,
los cuales describen el
comportamiento acumulativo de una tabla de datos agrupados.
Explicación:
Una vez consideradas en una tabla de datos agrupados las columnas de intervalos, frecuencias y marcas de clase, se puede añadir una columna adicional que indique las frecuencias acumuladas. La primera frecuencia acumulada se obtiene contando el número de elementos de la muestra que son menores al valor del límite inferior del primer intervalo de clase.
Una vez consideradas en una tabla de datos agrupados las columnas de intervalos, frecuencias y marcas de clase, se puede añadir una columna adicional que indique las frecuencias acumuladas. La primera frecuencia acumulada se obtiene contando el número de elementos de la muestra que son menores al valor del límite inferior del primer intervalo de clase.
La segunda se obtiene al contar el número de elementos de la muestra que son menores al límite inferior del segundo intervalo de clase. Las restantes frecuencias acumuladas se obtienen de manera análoga, de forma tal que la penúltima frecuencia acumulada se obtiene contando el número de elementos de la muestra que son menores al límite inferior del último intervalo y, finalmente, la última frecuencia acumulada se determina contando el número de elementos de la muestra que son menores al límite superior del último intervalo de clase. Nótese que el número de frecuencias de clases es igual al número de intervalos de clase más uno.
Retomando el caso práctico, observemos su tabla de datos agrupados:
Para calcular la primera frecuencia acumulada, se cuenta el número de elementos menores al límite inferior del primer intervalo de clase, es decir, los elementos de la muestra cuya edad es menor a cinco años. En la tabla, se observa que dicho valor es cero.
La segunda frecuencia acumulada se obtiene con el número de elementos de la muestra que son menores al límite inferior del segundo intervalo de clase, es decir, los elementos cuyo valor es menor que diez. En la tabla de datos agrupados hay cinco elementos que cumplen esta condición.
La tercera frecuencia acumulada se determina con los elementos que son menores al límite inferior del tercer intervalo, es decir, los valores menores de 15. La tabla de datos indica que este valor es la frecuencia del primero más el segundo intervalo: 5 + 10 = 15.
La cuarta se obtiene con los elementos cuyo valor es menor al límite inferior del cuarto intervalo de clase, o sea, los valores menores a 20. En la tabla este valor corresponde a la suma de las frecuencias de los tres primeros intervalos de clase: 5 + 10 + 30 = 45.
Para la quinta frecuencia acumulada, se realiza el conteo de los elementos de la muestra cuyo valor es menor al límite del quinto intervalo de clase, esto es, los elementos menores de 25. En la tabla se observa que este valor corresponde a las frecuencias de los cuatro primeros intervalos de clase: 5 + 10 + 30 + 40 = 85.
La sexta y última frecuencia acumulada se obtiene contabilizando los elementos cuyo valor es menor al límite superior del último intervalo de clase, es decir, todos los elementos de la muestra con valor menor a 30. En la tabla de datos este valor corresponde a la suma de las frecuencias de todos los intervalos de clase: 5 + 10 + 30 + 40 + 15 = 100, es decir, al total de elementos de la muestra.
Los cálculos anteriores se incorporan a la tabla en una cuarta columna:
La representación gráfica de las frecuencias acumuladas de una tabla de datos agrupados recibe el nombre de ojiva, esta es un polígono que se traza en un plano en donde el eje de las x contiene los límites de clase y en el eje de las y las respectivas frecuencias acumuladas. Por su naturaleza acumulativa, muestra un comportamiento creciente, lo cual quiere decir que el valor de y aumenta conforme se incrementa el de x.
Para nuestro caso, el siguiente gráfico muestra la ojiva de la distribución de frecuencias:
Al igual que las frecuencias acumuladas, las frecuencias relativas acumuladas –también conocidas como frecuencias porcentuales acumuladas– describen el comportamiento acumulativo de una distribución de frecuencias, pero en términos porcentuales.
Estas frecuencias relativas se obtienen al dividir cada frecuencia acumulada entre el total de elementos de la muestra. Las frecuencias relativas se calculan de la siguiente manera:
Estos cálculos se incorporan a la tabla de datos agrupados en una quinta columna, como se muestra a continuación:
La representación gráfica de las frecuencias relativas acumuladas recibe el nombre de ojiva relativa o porcentual. Al igual que la ojiva, esta manifiesta un comportamiento creciente. El siguiente gráfico muestra la ojiva relativa de la distribución de frecuencias:
Conclusión:
En esta sesión aprendiste a utilizar
dos herramientas graficas
complementarias al histograma y al
polígono de frecuencias,
denominados ojiva y ojiva relativa. Estas herramientas cuentan con una naturaleza acumulativa y muestra un comportamiento creciente del eje de las y respecto del eje de las x.
Conclusión:
Estos gráficos te ofrecen una visión más completa sobre la distribución de los datos de una muestra.
En la siguiente sesión conocerás los temas correspondientes a las
medidas de centralización,
comenzando por la media