• No se han encontrado resultados

Estadística FORMA DE AGRUPAR DATOS ESTADISTICOS

N/A
N/A
Protected

Academic year: 2021

Share "Estadística FORMA DE AGRUPAR DATOS ESTADISTICOS"

Copied!
9
0
0

Texto completo

(1)

Brigadas de Amor Cristiano

FORMA DE AGRUPAR DATOS ESTADISTICOS

Uno de los primeros problemas que debe resolver un estadístico es la obtención de datos. Los datos no surgen de la nada. Deben ser recopilados ya sean de las fuentes primarias (censos) o de las fuentes secundarias (boletines).

La obtención de datos para el análisis estadístico es un proceso integral que incluye las siguientes etapas:

1) Definición de los objetivos de estudio observacional o experimental. 2) Definición de la variable y de la población de interés.

3) Definición de los métodos para la obtención y la medición de los datos (entrevista directa, encuesta, teléfono, etc.)

4) Determinación de las técnicas descriptivas o inferenciales que sean apropiadas para el análisis de datos.

Con frecuencia un estadístico se desconcierta ante un conjunto de datos recopilados con otros propósitos, lo cual le hace imposible determinar si tales datos son “buenos” para su investigación o no. Es preferible que el interesado mismo, recabe los datos empleando técnicas apropiadas para los diferentes análisis. Sin embargo se deben considerar los problemas que surgen en la recopilación.

Básicamente, las técnicas que permiten organizar los datos, son la tabular y la grafica. La primera es una de las formas más sencillas de presentar datos. Se hace mediante tablas. Generalmente coloca los valores en orden ascendente o descendente de magnitud, lo que ofrece las siguientes ventajas:

1) Se descubren rápidamente los valores máximos y mínimos en los datos. 2) Se pueden dividir los datos fácilmente en secciones.

(2)

Brigadas de Amor Cristiano

1.1 DISTRIBUCION EN SERIE SIMPLE O NO AGRUPADA, RANGO, CONTEO, FRECUENCIA

¿Qué puede hacer el investigador para organizar los números desordenados que recoge en sus entrevistas?

¿Cómo se las arregla para transformar esta masa de datos en un resumen fácil de entender? El primer paso para que todos esos datos tengan sentido, es construir una distribución de frecuencia.

Frecuencia: Es el numero de veces que un mismo valor de la variable aparece dentro de un conjunto de datos dados. Se acostumbra usar la letra ƒ para identificarla.

Ordenación: Es la colección de los datos numéricos tomados en un orden creciente o decreciente de magnitud.

Ejemplo 1: Las edades de 10 estudiantes entrevistados al azar fueron: 17, 14, 13, 16, 17, 18, 15, 14, 12, 18 años. Solución: 12, 13, 14, 14, 15, 16, 17, 17, 18, 18 años … Ordenación creciente 18, 18, 17, 17, 16, 15, 14, 14, 13, 12 años … Ordenación decreciente

1.2 DISTRIBUCION DE DATOS AGRUPADOS EN FRECUENCIA SIMPLE. CONTEO. TABULACION. RANGO

En la distribución de frecuencia simple o no agrupada, los valores de la variable no forman grupos, sino que cada uno de ellos, es en si un grupo. Los valores de las variables x y la frecuencia ƒ se escriben en una tabla y por ello a este proceso se le llama tabulación.

Del ejemplo anterior, se tiene que la frecuencia de 14 años es 2; la frecuencia de 16 años es 1; la frecuencia de 18 años es 2; las que se escriben respectivamente:

ƒ = 2 ƒ = 1 ƒ = 2

Ejemplo 1: Se preguntó la edad de 40 personas de una institución x; los datos fueron los que aparecen en la tabla No. 1 de la izquierda.

(3)

Brigadas de Amor Cristiano

… La variable es la edad. La población son todas las personas de la institución. La toma de datos esta dada por la Tabla 1. La ordenación está dada por la Tabla 2 y la frecuencia por la Tabla 3.

… Ordenación creciente.

… La ordenación es tediosa, pero muy conveniente hacerla (Tabla 2), para luego mas fácilmente obtener la frecuencia ƒ (Tabla 3). Sin embargo si los datos son muchos, se prefiere agruparlos de otra forma. Para realizar la agrupación se van leyendo sucesivamente los valores y se anota una barrita por cada valor leído, dentro del margen (edad) correspondiente. Este proceso se conoce con el nombre de conteo. Véase la Tabla 4.

… La Tabla 3 de la izquierda contiene la misma información que la Tabla 1 y la Tabla 2. A la Tabla 3 se le llama tabulación. Cuando la toma de datos contiene mucha información, no es practico escribirlos todos ellos en una misma columna, como se ha hecho hasta aquí; sino que se emplea un método diferente que se estudiaría mas adelante.

En una valoración hay un valor máximo y un valor mínimo para la variable, esto nos permite calcular lo que llamaremos rango.

20 20 18 17 18 13 19 16 19 19 13 13 14 15 15 15 17 16 16 18 Tabla 1 13 13 13 13 13 13 13 14 14 14 14 14 14 15 15 15 15 15 16 16 16 16 16 17 17 17 17 17 18 18 18 18 18 19 19 19 19 20 20 20 Tabla 2

Valores de la Variable No. De Alumnos

(4)

Brigadas de Amor Cristiano

DEFINICION: Rango: En un serie de datos, la diferencia entre valor máximo (Vmax) y el valor mínimo (Vmin) de la variable se llama Rango (Rg)

Rg. = Vmax - Vmin

Ejemplo 2: Las calificaciones de 50 alumnos de la clase de matemáticas en el Primer Parcial fueron las consignadas en la tabla de trabajo:

a) Ordenar los datos en forma creciente.

b) Encontrar el rango.

c) Hallar las calificaciones de los 6 alumnos de mayor puntuación. d) Hallar las calificaciones de los 5

alumnos de menor puntuación. e) Hallar la calificación del octavo

alumno de mayor puntuación.

f) ¿Cuántos alumnos obtuvieron puntuación de 75 o más?

g) ¿Cuántos alumnos obtuvieron puntuación de 65 o menos?

Solución: a)

Esta ordenación hecha en a)

permitirá contestar más rápidamente las otras preguntas.

(5)

Brigadas de Amor

Cristiano Ejemplo 3: Se tomó una muestra de 40 familias y se les preguntó la cantidad de hijos y sus

respuestas fueron consignadas en la siguiente tabla:

Estos datos como se presentan, no resultan claros entonces conviene presentarlos de otra forma, de tal manera que estén organizados como en la siguiente tabla

Tabla de Frecuencias

No. Hijos Conteo Frecuencia (ƒ)

1 II 2 2 I 1 3 III 3 4 III 3 5 IIII 4 6 IIII 5 7 IIII 5 9 IIII I 6 10 IIII II 7 11 IIII III 8 12 IIII I 6 Total N = 50

Una distribución de frecuencias existe cuando contamos o medimos y encontramos cierto número objetos de una misma clase. La frecuencia ƒ para toda la clase, es el número de objetos que encontramos en cada clase. La suma de ellas debe ser igual al número total de objetos.

a) ¿Cuál fue el numero total de investigado? 50

b) ¿Qué numero de hijos se presenta con mayor frecuencia? 11 c) ¿Cuál es el número de hijos de menor frecuencia? 2 d) ¿Qué porcentaje representa las familias con muchos hijos?

50 : 100% :: (7+8+6) : 50 : 100% :: 21: = 42%

(6)

Brigadas de Amor

Cristiano 1.3 DISTRIBUCION DE DATOS AGRUPADOS. INTERVALOS O CLASES.

ANCHO DE CLASES. MARCA DE CLASE. LIMITES REALES DE CLASE

Cuando la toma de datos contiene mucha información, no es practico escribirlos en una misma columna como que si se tratasen de datos agrupados en frecuencia simple, sino que se emplea la agrupación de valores de la variable en clases o categoría o sean ciertos limites y se determina el numero de valores de la variable que pertenecen a cada clase que se llamará frecuencia de clase. Usaremos el símbolo “X” para las clases o categorías y “ƒ” para las frecuencias de clase. Una ordenación en una tabla de los datos en clases, y con las frecuencias correspondientes se conoce con el nombre de distribución de frecuencias o tabla de frecuencias o tabla de datos agrupados.

El número de clases debe ser suficiente para que no se pierda excesiva información primaria y para que la estadística resultante, sea manejable y útil para expresar las características de la variable. El número de clases más conveniente para efectuar la tabulación debe estar entre 5 y 20; es aconsejable escoger estos intervalos de manera que sus puntos medios sean múltiples de números como 5 o 10.

Para fijar las clases o categorías, llamadas también intervalos de clase, se elige primero el numero de clases que se desea, después se divide el rango por el numero de clases deseado; el cociente obtenido entre esos dos números representa lo que se llama tamaño o anchura de un intervalo de clase. Este cociente no siempre será un numero entero; cuando no lo sea se redondea al entero próximo mayor o menor según sea el caso. Después se forma el primer intervalo teniendo cuidado que el valor mínimo esté incluido en el primer intervalo y por ultimo se forma el numero de clases deseado.

La Tabla 15 de la izquierda corresponde a la toma de datos de las calificaciones finales de 50 alumnos de un instituto HGB en la asignatura de ingles. Se pide:

a) Determinar el rango Rg.

b) Determinar la anchura del intervalo de clase y agruparlos en 10 clases. c) Hacer una tabla que contenga las

clases, (X), los datos ordenados correspondientes y la frecuencia (ƒ). Solución:

a) Rango Rg = Vmax -- Vmin = 98 –51 = 47

(7)

Brigadas de Amor Cristiano

c) Tabla de clases, datos ordenados y frecuencia

Clase X Datos ordenados Frecuencia ƒ

50-54 51 51 53 53 4 55-59 57 58 58 58 58 59 59 59 8 60-64 60 61 61 62 4 65-69 65 66 66 67 67 68 68 69 8 70-74 70 70 71 73 73 5 75-79 75 77 77 78 79 5 80-84 80 80 81 81 82 84 84 7 85-89 86 87 87 88 89 5 90-94 92 94 2 95-99 95 98 2

Total N = 50

Una tabla que contiene las columnas clase y frecuencia se llama tabla de frecuencias o distribución de frecuencias o tabla de datos agrupados.

INTERVALOS. TAMAÑO O ANCHURA DE UN INTERVALO. MARCA DE CLASE Supóngase que en el INTAE-SUR se midió la estatura en pulgadas de 100 estudiantes y se decidió formar una distribución de frecuencias con 5 clases tal como se muestra en la Tabla 16. Clase X (Estaturas) Frecuencias ƒ No. Estudiantes 60-62 5 63-65 18 66-68 42 69-71 27 72-74 8 Total N = 100

Tabla 16

(8)

Brigadas de Amor Cristiano

TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE

El tamaño o anchura de un intervalo de clase es la diferencia entre dos límites sucesivos de clase ya sean inferiores o superiores. Suele representarse por “C”. Lo anterior es valido para datos agrupados como los de la Tabla 16.

Para calcular el tamaño de un intervalo de clase podemos optar por hacerlo con los límites inferiores o los superiores así:

Con Limites Inferiores (Li) Con Limites Superiores

(Ls)

C= 63-60 = 3 C= 65-62 = 3

C= 66-63 = 3 C= 68-65 = 3

MARCAS DE CLASE

La marca de clase, es el punto medio del intervalo de clase y se obtiene sumando los límites inferior y superior de la clase y dividiendo ésta suma por 2. La marca de clase se suele representar por el símbolo “Xm”; también se llama punto medio de la clase. La marca de clase se calcula con la siguiente formula:

Donde: Xm = Marca de clase

Li = Limite inferior de la clase Ls = Limite superior de la clase

Ejemplo:

Dada la distribución de frecuencias de datos agrupados de la Tabla 17, determinar: a) Numero total N de las frecuencias de clase.

(9)

Brigadas de Amor Cristiano

LIMITES REALES DE CLASE

Los Límites reales de clase son números que se emplean para representar las clases. El menor de ellos se llama Límites real inferior (Lri) y el mayor, Limite real superior de la clase (Lrs).

Los límites reales de una clase cualquiera se obtienen prácticamente, sumando al límite superior de una clase, el límite inferior de la clase contigua siguiente y dividiendo este resultado por 2.

De la siguiente Tabla encontrar los límites reales de cada clase:

Referencias

Documento similar

Actividades para el área de Persona, Familia y Relaciones Humanas Los estudiantes pueden encontrar en los mitos actos bondadosos a favor del hombre, la humanidad o una

De non ser así, as facturas non poderán tramitarse para o pago, e a USC, a través do responsable de asuntos económicos do centro da USC que solicitou os seus servicios Rexeitará

Estos planes de recolo- cación deben garantizar a las personas despedi- das un servicio continuado durante un periodo mínimo de seis meses que incluya medidas de formación

•cero que suplo con arreglo á lo que dice el autor en el Prólogo de su obra impresa: «Ya estaba estendida esta Noticia, año de 1750; y pareció forzo- so detener su impresión

Específicamente, estaba interesado en volver a explorar el lenguaje de los memes de internet, que ya había interrogado como parte de mi tesis doctoral [disponible

Principales países colaboradores con España en Materials Science (miscellaneous) (más de 5 documentos entre 2003-2009) .... Posición en el ranking internacional de España en

Del cual se obtiene la siguiente información, aplicando la estadística descriptiva: Análisis de frecuencia de datos a cada uno de los indicadores que integran las variables, tanto

Este apartado se divide en 2 secciones, las reglas específicas y las reglas para el cambio periódico de contraseñas de acceso a la base de datos. La conformación de contraseñas