• No se han encontrado resultados

Tabla de distribución de frecuencias con intervalos

Capítulo 3: Tablas de distribución de frecuencias

3.4. Tabla de distribución de frecuencias con intervalos

En estas tablas se utilizan intervalos debido a que las variables son cuantitativas continuas o existe una variedad muy grande entre los datos recolectados y es necesario agruparlos, pues de otra forma la tabla sería muy extensa.

Se debe recordar que un intervalo es una parte del conjunto de los números reales. Por ejemplo, el intervalo [4; 8⟩ contiene a los números enteros 4, 5, 6 y 7. Pero este intervalo contiene muchos más números como el 4.2 o el 5.56. La notación que se ha utilizado en el ejemplo servirá para el desarrollo de las tablas de distribución con intervalos de clase.

⟨𝟑; 𝟖⟩ Contiene números reales entre 3 y 8. [𝟑; 𝟖] Contiene números reales del 3 al 8.

⟨𝟑; 𝟖] Contiene números reales mayores que 3 y menores o iguales a 8. [𝟑; 𝟖⟩ Contiene números reales mayores o iguales a 3 pero menores que 8. Una tabla de distribución de frecuencias con intervalos de clase tiene la siguiente forma:

I n t e r v a l o d e c l a s e | 73 Consumo de galletas (S/) Frecuencia [2, 4> 8 [4, 6> 6 [6, 8> 7 [8, 10> 7 [10, 12> 5 [12, 14] 3 36

Figura 3.7 Tabla de distribución de frecuencias con intervalos. Procedimiento para la elaboración de los intervalos de clase

Para construir una tabla de distribución de frecuencias con intervalos se deben tener en cuenta los siguientes elementos:

Cantidad de datos o tamaño de la muestra (n): Es el total de unidades estudiadas.

Alcance (A): Es el intervalo cerrado que tiene como extremos el menor y el mayor dato.

𝐴 = [𝑎; 𝑏]

Rango (R): Es la diferencia entre el dato mayor y el menor. 𝑅 = 𝑏 − 𝑎

Intervalo de Clase (Ii): Es un subgrupo de los datos y tiene como extremos

al límite menor y mayor.

Figura 3.8 El intervalo de clase es semiabierto. Intervalos

de clase

[18; 21 >

Número de intervalos (K): Para calcular un valor aproximado del número de clases se utiliza la “Regla de Sturges”.

𝒌 = 𝟏 + 𝟑. 𝟑𝐥𝐨𝐠⁡(𝒏)

Existen otras formas de calcular el número de intervalos. Una forma distinta de calcular k es utilizando el entero más cercano a la raíz del tamaño de la muestra (Gorgas et al., 2011).

𝒌 = √𝒏

Sin embargo, en los ejercicios de este libro su utilizará la regla de Sturges. Hay que tener en cuenta que la elección de la cantidad de intervalos depende del criterio del investigador y los objetivos de la investigación.

Amplitud o ancho de clase (W): Es la diferencia entre el límite superior e inferior de un intervalo de clase. La amplitud de los intervalos de clase es constante. Se obtiene de la siguiente forma:

𝑤 =𝑅 𝑘

Marca de clase (Xi): Es el punto medio de cada intervalo. Se obtiene a

través de la semisuma de los límites en cada intervalo. Por ejemplo: Para el intervalo [12; 18 >

𝑥𝑖 = 12 + 18

2 = 15

Ejemplo: Una empresa de turismo realiza una encuesta online con la finalidad de conocer el gasto (S/) que realizan las personas por un viaje “Full Day” a alguna provincia de Lima. Los datos obtenidos fueron los siguientes

I n t e r v a l o d e c l a s e | 75 150 120 160 140 140 130 200 90 120 150 100 120 100 125 135 100 145 200 155 160 170 150 210 140 165 130 135 120 140 145 160 140 150 155 140 140 155 140 140 150

Para elaborar los intervalos de clase primero debemos determinar todos los elementos.

Tamaño de la muestra: 𝒏 = 𝟒𝟎, pues hay 40 datos.

Alcance: 𝑨 = [𝟗𝟎; ⁡𝟐𝟏𝟎], pues 90 es el menor dato y 210 es el mayor dato. Rango: 𝑹 = 𝟐𝟏𝟎 − 𝟗𝟎 = 𝟏𝟐𝟎

Número de intervalos: 𝒌 = 𝟏 + 𝟑. 𝟑𝒍𝒐𝒈(𝟒𝟎) = 𝟔. 𝟐𝟖𝟕 ≈ 𝟔

Amplitud o ancho de clase: 𝒘 =𝟏𝟐𝟎

𝟔 = 𝟐𝟎

Luego, construimos los 6 intervalos de igual amplitud (20) considerando el 90 como límite inferior del primer intervalo y 210 como el límite superior del último intervalo.

Gasto (S/) [90; > [ ; > [ ; > [ ; > [ ; > [ ;210]

Figura 3.9 Observe que el último intervalo de clase es cerrado. 6

intervalos de clase

Los demás límites de los intervalos se obtienen sumando el ancho de clase 20 al límite anterior. Gasto (S/) [90; 110> [110; 130> [130; 150> [150;170> [170; 190> [190; 210]

Figura 3.10 El límite inferior de cada intervalo es igual al límite superior del intervalo anterior.

La variable gasto es una variable continua y entre un valor y otro siempre existe otro valor, por ello los intervalos son semiabiertos. Por ejemplo, si en el primer intervalo colocamos [90; 109] y en el segundo intervalo [110; 129] no se podría ubicar el valor 109.5. Este último valor no está entre los datos, pero es un posible valor numérico para la variable gasto.

Una vez construidos los intervalos se procede a ubicar los datos en su respectivo intervalo y realizar el conteo respectivo.

150 120 160 140 140 130 200 90

120 150 100 120 100 125 135 100

145 200 155 160 170 150 210 140

165 130 135 120 140 145 160 140

150 155 140 140 155 140 140 150

Figura 3.11 Los datos han sido señalados de un color diferente para hacer más sencillo el conteo.

En el primer intervalo contamos a los números mayores o iguales a 90 pero menores que 110. +20 +20 +20 +20 +20

I n t e r v a l o d e c l a s e | 77

En el segundo intervalo contamos a los números mayores o iguales a 110 pero menores que 130.

En el tercer intervalo contamos a los números mayores o iguales a 130 pero menores que 150.

En el cuarto intervalo contamos a los números mayores o iguales a 150 pero menores que 170.

En el quinto intervalo contamos a los números mayores o iguales a 170 pero menores que 190.

En el sexto intervalo contamos a los números mayores o iguales a 190 hasta el 210.

Tabla 3.9 Frecuencia absoluta por intervalo de clase. Gasto (S/) fi [90; 110> 4 [110; 130> 5 [130; 150> 15 [150;170> 12 [170; 190> 1 [190; 210] 3 Total n=40

Con base en la información de la tabla anterior se puede completar la tabla de distribución de frecuencias.

Tabla 3.10 Distribución de frecuencias del gasto. Gasto (S/) fi Xi Fi hi Hi hi% Hi% [90; 110> 4 100 4 0.100 0.100 10 10 [110; 130> 5 120 9 0.125 0.225 12.5 22.5 [130; 150> 15 140 24 0.375 0.600 37.5 60 [150;170> 12 160 36 0.300 0.900 30 90 [170; 190> 1 180 37 0.025 0.925 2.5 92.5 [190; 210] 3 200 40 0.075 1 7.5 100 Total n=40 1 100

Algunas de las frecuencias de la tabla 3.10 servirán para determinar estadígrafos como las medidas de tendencia central y las medidas de dispersión. Sin embargo, para la presentación inicial de los resultados se puede utilizar una tabla más resumida.

Tabla 3.11 Gasto por viaje turístico “Full Day”. Gasto (S/) fi hi% Hi% [90; 110> 4 10 10 [110; 130> 5 12.5 22.5 [130; 150> 15 37.5 60 [150;170> 12 30 90 [170; 190> 1 2.5 92.5 [190; 210] 3 7.5 100 Total n=40 100

De esta tabla se pueden extraer algunas interpretaciones. Por ejemplo. h3%: El 37.5% de los encuestados gasta como mínimo S/ 130, pero menos

T a b l a s d e c o n t i n g e n c i a | 79

H3%: El 60% de los encuestados gasta menos de S/ 150.

H4%: El 90% de los encuestados gasta menos de S/ 170.

Documento similar