Un histograma consiste en una serie de rectángulos, cuyo ancho de clase fue calculado por medio de la ecuación 2.3 y su altura es equivale al número de elementos que están dentro de cada clase.
Como consecuencia, el área contenida en cada rectángulo (base por altura) ocupa un porcentaje del área total de todos los rectángulos la cual es igual a la frecuencia absoluta de esa clase
Clases F.Absoluta F.A.Acumulada F.Relativa F.R.Acumulada
[1e+02,1.2e+02] 6 6 0.200 0.200
(1.2e+02,1.4e+02] 7 13 0.233 0.433
(1.4e+02,1.6e+02] 4 17 0.133 0.567
(1.6e+02,1.7e+02] 8 25 0.267 0.833
(1.7e+02,1.9e+02] 1 26 0.033 0.867
(1.9e+02,2.1e+02] 4 30 0.133 1.000
“ESTADÍSTICA DESCRIPTIVA CON R”
ʹ
correspondiente respecto a todas las observaciones hechas[20]. De acuerdo a [21] un histograma muestra tres tipos de información:
1. Proporciona una indicación visual de dónde está el centro aproximado de los datos. El punto central a lo largo de los ejes horizontales en los histogramas identifica claramente el lugar donde se centran los datos.
2. Se obtiene una comprensión del grado de propagación (o variación) en los datos. Cuanto más se agrupan los datos alrededor del centro, menor es la variación en los datos. Si los datos se extienden desde el centro, los datos exhiben una mayor variación.
3. Podemos observar la forma de la distribución.
Para hacer un histograma de frecuencia (absoluta) con R se usa la función hist(), la figura 2.16 muestra los histogramas de frecuencias absolutas para el peso y la altura del dataframe personas.
Los histogramas mostrados son los más elementales y toman el título que le da R por defecto. Poco a poco iremos mejorando la estética del histograma de frecuencia a medida que incrementemos la configuración de sus parámetros.
par(mfrow=c(1,2), mar=c(3,2,2,2))
hist(personas$peso) # Histograma de la variable peso hist(personas$altura) # Histograma de la variable altura
Figura 2.16 Histograma de frecuencias
En la figura 2.16 no se muestra información sobre lo que representan los dos histogramas. Es necesario personalizar la información sobre los histogramas para que nos oriente sobre su significado. Es momento de agregar, en ambos histogramas, el título principal (main) y los nombres de los ejes x (xlab) y (ylab). Observe en la figura 2.17 como cambia el resultado visual de los histogramas. Sin embargo, a pesar de su mejora, se evidencia que los ejes (x, y) no están
“ESTADÍSTICA DESCRIPTIVA CON R”
ʹ
correspondiente respecto a todas las observaciones hechas[20]. De acuerdo a [21] un histograma muestra tres tipos de información:
1. Proporciona una indicación visual de dónde está el centro aproximado de los datos. El punto central a lo largo de los ejes horizontales en los histogramas identifica claramente el lugar donde se centran los datos.
2. Se obtiene una comprensión del grado de propagación (o variación) en los datos. Cuanto más se agrupan los datos alrededor del centro, menor es la variación en los datos. Si los datos se extienden desde el centro, los datos exhiben una mayor variación.
3. Podemos observar la forma de la distribución.
Para hacer un histograma de frecuencia (absoluta) con R se usa la función hist(), la figura 2.16 muestra los histogramas de frecuencias absolutas para el peso y la altura del dataframe personas.
Los histogramas mostrados son los más elementales y toman el título que le da R por defecto. Poco a poco iremos mejorando la estética del histograma de frecuencia a medida que incrementemos la configuración de sus parámetros.
par(mfrow=c(1,2), mar=c(3,2,2,2))
hist(personas$peso) # Histograma de la variable peso hist(personas$altura) # Histograma de la variable altura
Figura 2.16 Histograma de frecuencias
En la figura 2.16 no se muestra información sobre lo que representan los dos histogramas. Es necesario personalizar la información sobre los histogramas para que nos oriente sobre su significado. Es momento de agregar, en ambos histogramas, el título principal (main) y los nombres de los ejes x (xlab) y (ylab). Observe en la figura 2.17 como cambia el resultado visual de los histogramas. Sin embargo, a pesar de su mejora, se evidencia que los ejes (x, y) no están
ʹ
correspondiente respecto a todas las observaciones hechas[20]. De acuerdo a [21] un histograma muestra tres tipos de información:
1. Proporciona una indicación visual de dónde está el centro aproximado de los datos. El punto central a lo largo de los ejes horizontales en los histogramas identifica claramente el lugar donde se centran los datos.
2. Se obtiene una comprensión del grado de propagación (o variación) en los datos. Cuanto más se agrupan los datos alrededor del centro, menor es la variación en los datos. Si los datos se extienden desde el centro, los datos exhiben una mayor variación.
3. Podemos observar la forma de la distribución.
Para hacer un histograma de frecuencia (absoluta) con R se usa la función hist(), la figura 2.16 muestra los histogramas de frecuencias absolutas para el peso y la altura del dataframe personas.
Los histogramas mostrados son los más elementales y toman el título que le da R por defecto. Poco a poco iremos mejorando la estética del histograma de frecuencia a medida que incrementemos la configuración de sus parámetros.
par(mfrow=c(1,2), mar=c(3,2,2,2))
hist(personas$peso) # Histograma de la variable peso hist(personas$altura) # Histograma de la variable altura
Figura 2.16 Histograma de frecuencias
En la figura 2.16 no se muestra información sobre lo que representan los dos histogramas. Es necesario personalizar la información sobre los histogramas para que nos oriente sobre su significado. Es momento de agregar, en ambos histogramas, el título principal (main) y los nombres de los ejes x (xlab) y (ylab). Observe en la figura 2.17 como cambia el resultado visual de los histogramas. Sin embargo, a pesar de su mejora, se evidencia que los ejes (x, y) no están
͵
correctamente dimensionados. Los parámetros xlim y ylim solucionan este problema ubicando los límites que se consideren convenientes mediante un vector c(límite inicial, límite final).
# PREPARACIÓN DE LA SALIDA GRÁFICA par(mfrow=c(1,2), mar=c(4,4,2,2))
# HISTOGRAMA PARA LA VARIABLE PESO hist(personas$peso # Datos
, main="Personas" # Título principal , cex.main=1 # Tamaño del título , xlab="Peso (libras)" # Título del eje x , ylab = "F. Absoluta") # Título del eje y
# HISTOGRAMA PARA LA VARIABLE ALTURA hist(personas$altura # Datos
, main="Personas" # Título principal , cex.main=1 # Tamaño del título , xlab="Altura (m)" # Título del eje x , ylab = "F. Absoluta") # Título del eje y
Figura 2.17 Histograma de frecuencias
Una vez corregidas las dimensiones de los ejes apreciamos su cambio en la figura 2.18 par(mfrow=c(1,2), mar=c(4,4,2,2))
hist(personas$peso , main="Personas"
, cex.main=1 # Tamaño del título , xlab="Peso (libras)"
, ylab ="F. Absoluta"
, xlim=c(90,230) # Ajuste del eje x , ylim=c(0,10) # Ajuste del eje y ) hist(personas$altura
, main="Personas"
, cex.main=1 # Tamaño del título , xlab="Altura (m)"
, ylab ="F. Absoluta"
, xlim=c(141,189) # Ajuste del eje x , ylim=c(0,10) # Ajuste del eje y )
“ESTADÍSTICA DESCRIPTIVA CON R”
Ͷ
Figura 2.18 Histograma de frecuencias con ajuste de ejes
El lector conoce como crear un histograma de frecuencia y un gráfico de caja y bigote por separado.
Lo siguiente será unir ambos gráficos para obtener una visualización más potente de los datos.
Previamente se usa las funciones layout() y par() para configurar la salida gráfica. La función layout() concibe una división de la salida gráfica mientras que la función par() en unión del parámetro mar pone los límites de la división realizada. También es importante eliminar el eje x del histograma con el parámetro xaxt y su valor en “none”. La función boxplot() se configura ylim y add. El parámetro ylim del boxplot() debe ser igual a xlim de la función hist(), la razón de esta igualdad es que el histograma está en sentido vertical y el boxplot en sentido horizontal y ambos límites deben ser iguales para que se acoplen correctamente. Por último, en la función boxplot() el parámetro add debe tomar el valor de TRUE para que se integre al histograma creado con la función hist(). Vea la figura 2.19.
#PRIMERA FORMA
layout(matrix(c(1,2,1,3), 2, 2, byrow = TRUE) , widths=c(2,2)
, heights=c(3.5,2.2)) # División de la salida gráfica par(mar=c(4.7,3.8,2,2)) # Márgenes
hist(personas$peso # Datos , main="Personas"
, cex.main=1 # Tamaño del título , xlab=""
, ylab = "Frecuencia"
, col="grey90" # Color del histograma , xlim=c(90,230) # Límite del eje x , ylim=c(0,10) # Límite del eje y , border = "darkgrey" # Líneas del histograma ) grid()
boxplot(personas$peso # Gráfico de caja y bigote
, horizontal=TRUE # Caja en el sentido horizontal
“ESTADÍSTICA DESCRIPTIVA CON R”
Ͷ
Figura 2.18 Histograma de frecuencias con ajuste de ejes
El lector conoce como crear un histograma de frecuencia y un gráfico de caja y bigote por separado.
Lo siguiente será unir ambos gráficos para obtener una visualización más potente de los datos.
Previamente se usa las funciones layout() y par() para configurar la salida gráfica. La función layout() concibe una división de la salida gráfica mientras que la función par() en unión del parámetro mar pone los límites de la división realizada. También es importante eliminar el eje x del histograma con el parámetro xaxt y su valor en “none”. La función boxplot() se configura ylim y add. El parámetro ylim del boxplot() debe ser igual a xlim de la función hist(), la razón de esta igualdad es que el histograma está en sentido vertical y el boxplot en sentido horizontal y ambos límites deben ser iguales para que se acoplen correctamente. Por último, en la función boxplot() el parámetro add debe tomar el valor de TRUE para que se integre al histograma creado con la función hist(). Vea la figura 2.19.
#PRIMERA FORMA
layout(matrix(c(1,2,1,3), 2, 2, byrow = TRUE) , widths=c(2,2)
, heights=c(3.5,2.2)) # División de la salida gráfica par(mar=c(4.7,3.8,2,2)) # Márgenes
hist(personas$peso # Datos , main="Personas"
, cex.main=1 # Tamaño del título , xlab=""
, ylab = "Frecuencia"
, col="grey90" # Color del histograma , xlim=c(90,230) # Límite del eje x , ylim=c(0,10) # Límite del eje y , border = "darkgrey" # Líneas del histograma ) grid()
boxplot(personas$peso # Gráfico de caja y bigote
, horizontal=TRUE # Caja en el sentido horizontal
Ͷ
Figura 2.18 Histograma de frecuencias con ajuste de ejes
El lector conoce como crear un histograma de frecuencia y un gráfico de caja y bigote por separado.
Lo siguiente será unir ambos gráficos para obtener una visualización más potente de los datos.
Previamente se usa las funciones layout() y par() para configurar la salida gráfica. La función layout() concibe una división de la salida gráfica mientras que la función par() en unión del parámetro mar pone los límites de la división realizada. También es importante eliminar el eje x del histograma con el parámetro xaxt y su valor en “none”. La función boxplot() se configura ylim y add. El parámetro ylim del boxplot() debe ser igual a xlim de la función hist(), la razón de esta igualdad es que el histograma está en sentido vertical y el boxplot en sentido horizontal y ambos límites deben ser iguales para que se acoplen correctamente. Por último, en la función boxplot() el parámetro add debe tomar el valor de TRUE para que se integre al histograma creado con la función hist(). Vea la figura 2.19.
#PRIMERA FORMA
layout(matrix(c(1,2,1,3), 2, 2, byrow = TRUE) , widths=c(2,2)
, heights=c(3.5,2.2)) # División de la salida gráfica par(mar=c(4.7,3.8,2,2)) # Márgenes
hist(personas$peso # Datos , main="Personas"
, cex.main=1 # Tamaño del título , xlab=""
, ylab = "Frecuencia"
, col="grey90" # Color del histograma , xlim=c(90,230) # Límite del eje x , ylim=c(0,10) # Límite del eje y , border = "darkgrey" # Líneas del histograma ) grid()
boxplot(personas$peso # Gráfico de caja y bigote
, horizontal=TRUE # Caja en el sentido horizontal
ͷ
, ylim=c(90,230) # Límite de y(boxplot)=x(hist) , frame=F # Recuadro
, col = "grey80" # Color de la caja , width = 10 # Ancho de la caja
, add=TRUE) # Habilitado para insertarse # en el histograma
#Texto inferior
mtext(side=1, line=2.1, "Peso (libras)", cex = 0.8)
mtext(side=1, line=3.6, "Histograma con gráfico de caja y bigote integrado")
#SEGUNDA FORMA
par(mar=c(0,3.8,2,2)) # Márgenes hist(personas$peso # Datos , main="Personas"
, cex.main=1 # Tamaño del título , xlab=""
, ylab = "Frecuencia"
, xlim=c(100,220) # Límite del eje x , ylim=c(0,10) # Límite del eje y , col="grey90" # Color del histograma
, border = "darkgrey" # Color del borde del histograma , xaxt="none") # Deshabilitar el eje x
grid()
par(mar=c(4.5,3.8,0,2)) # Márgenes boxplot(personas$peso # Datos
, horizontal=TRUE # Caja en el sentido horizontal , xlab=""
, ylim=c(100,220) # Límite de y(boxplot)=x(hist) , frame=F # Sin marco
, col = "grey80" # Color de la caja , boxwex = 0.8) # Ancho de la caja
#Texto inferior
mtext(side=1, line=2.1, "Peso (libras)", cex = 0.8)
mtext(side=1, line=3.3, "Histograma con gráfico de caja y bigote separado")
Figura 2.19 Gráfico de Caja y Bigote con valores atípicos
ͷ
, ylim=c(90,230) # Límite de y(boxplot)=x(hist) , frame=F # Recuadro
, col = "grey80" # Color de la caja , width = 10 # Ancho de la caja
, add=TRUE) # Habilitado para insertarse # en el histograma
#Texto inferior
mtext(side=1, line=2.1, "Peso (libras)", cex = 0.8)
mtext(side=1, line=3.6, "Histograma con gráfico de caja y bigote integrado")
#SEGUNDA FORMA
par(mar=c(0,3.8,2,2)) # Márgenes hist(personas$peso # Datos , main="Personas"
, cex.main=1 # Tamaño del título , xlab=""
, ylab = "Frecuencia"
, xlim=c(100,220) # Límite del eje x , ylim=c(0,10) # Límite del eje y , col="grey90" # Color del histograma
, border = "darkgrey" # Color del borde del histograma , xaxt="none") # Deshabilitar el eje x
grid()
par(mar=c(4.5,3.8,0,2)) # Márgenes boxplot(personas$peso # Datos
, horizontal=TRUE # Caja en el sentido horizontal , xlab=""
, ylim=c(100,220) # Límite de y(boxplot)=x(hist) , frame=F # Sin marco
, col = "grey80" # Color de la caja , boxwex = 0.8) # Ancho de la caja
#Texto inferior
mtext(side=1, line=2.1, "Peso (libras)", cex = 0.8)
mtext(side=1, line=3.3, "Histograma con gráfico de caja y bigote separado")
Figura 2.19 Gráfico de Caja y Bigote con valores atípicos
“ESTADÍSTICA DESCRIPTIVA CON R”