DISTRIBUCION
DE FRECUENCIAS
DESPUES DE LA RECOPILACION DE LOS DATOS, ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y PRESENTARLOS EN FORMA TAL, QUE FACILITEN SU COMPRENSION Y SU POSTERIOR ANALISIS Y UTILIZACION. PARA ELLO SE ORDENAN EN UNA TABLA DE DISTRIBUCION DE FRECUENCIAS Y LUEGO SE PRESENTARAN EN GRAFICOS.TABLA DE DISTRIBUCION
DE FRECUENCIAS
*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO DE DATOS DE ACUERDO AL TIPO DE VARIABLE QUE SE TENGA. EN ELLA SE OBSERVA LA FRECUENCIA (NUMERO DE DATOS OBSERVADOS EN CADA CLASE
O INTERVALO)DESPUES DE REALIZAR EL PROCESO DE CONTEO O TABULACION.
*UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS ES PARA CALCULAR ALGUNOS INDICADORES DE
RESUMEN, COMO LOS ESTADISTICOS.
EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACION
REALIZADA EN FORMA ALEATORIA A 80 PERSONAS DE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMAS MAS VISTOS EN LA TV.LOS RESULTADOS FUERON:
PROGRAMAS Nº DE TELEVIDENTES NOTICIEROS 17 SERIES 15 18 DIBUJOS 16 CULTURALES 14 TOTAL 80 frecuencias variable NOVELAS
PROGRAMAS Frecuencia Absoluta (fi) (número de televidentes) Frecuencia Relativa (hi) NOTICIEROS 17 0.2125 SERIES 15 0.1875 NOVELAS 18 0.2250 DIBUJOS 16 0.2000 CULTURALES 14 0.1750 TOTAL n=80 1.0000
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
(1)La frecuencia absoluta fi, es el número de datos observados en cada categoria o modalidad. La suma de todas las frecuencias
absolutas es igual al total de datos observados (n=80). (2)La frecuencia relativa hi se define por hi = fi /n
La suma de todas las frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100 (4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS REALIZAR ALGUNAS PREGUNTAS:
1.-¿CUANTAS PERSONAS PREFIEREN VER LOS NOTICIEROS? RPTA. 17
2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL LOS NOTICIEROS? RPTA. 63
3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER LAS SERIES? RPTA. 18.75%
4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DE FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS. DIAGRAMAS DE BARRAS 0 5 10 15 20
NOTICIEROS SERIES NOVELAS DIBUJOS CULTURALES
PROGRAMAS F R E C U E N C IA A B S O L U T A
DIAGRAMA CIRCULAR O TIPO PASTEL
LOS SECTORES CIRCULARES
QUE COMPRENDEN LA GRAFICA CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:
hi x 360º SERIES 19% NOVELAS 22% DIBUJOS 20% NOTICIEROS 21% CULTURAL 18%
TABLA DE FRECUENCIAS SIMPLES
PARA VARIABLES CUANTITATIVAS
DISCRETAS
•SE EMPLEAN PARA DATOS CUANTITATIVOS DISCRETOS(VALORES ENTEROS).
• CUANDO SOLAMENTE SE PRESENTAN POCOS
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20 FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE TIENEN , Y SE HA OBTENIDO EL SIGUIENTE RESULTADO:
3
7
7
6
7
4
5
1
4
5
5
9
4
2
4
6
7
4
7
6
CONSTRUYA UNA TABLA DE DISTRIBUCION DE FRECUENCIAS.
NºDE HIJOS TARJAS O CONTEO fi (NUMERO DE FAMILIAS) hi 1 / 1
0.05
2 / 10.05
3 / 10.05
4 //// 50.25
5 /// 30.15
6 /// 30.15
7 //// 50.25
8 00.00
9 / 10.05
TOTAL n = 201.00
Frecuencia absoluta
0
1
2
3
4
5
6
1
2
3
4
5
6
7
8
9
No de hijos
N o d e f am il iasGRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencias relativas
0
5
10
15
20
25
30
1
2
3
4
5
6
7
8
9
No de hijos
% d e f am il iasTABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS
LA DISTRIBUCION DE FRECUENCIAS POR CLASE O INTERVALOS SE USA CUANDO LA VARIABLE ESTADISTICA ES CUANTITATIVA CONTINUA O CUANDO EL NUMERO DE VALORES DISTINTOS DE UNA VARIABLE DISCRETA ES MUY GRANDE (GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS POR INTERVALOS
[L
i, L
s>
X
if
ih
iF
iH
iTotal
Donde: [Li , Ls> : Intervalos o Clases Xi : Marca de clase
fi : frecuencia absoluta hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada Hi : Frecuencia relativa acumulada
k 1 i if
n
Li : Limite Inferior Ls : Limite Supeior “VARIABLE”CARACTERISTICAS
1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA CANTIDAD DE OBSERVACIONES QUE HAY EN EL i-ESIMO INTERVALO.
2.- LA FRECUENCIA RELATIVA (hi) INDICA LA FRACCION DE LAS OBSERVACIONES QUE ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n
3.-
F
1= f
1H
1= h
1F
2= f
1+ f
2H
2= h
1+ h
24.- EN TODA TABLA DE DISTRIBUCION DE FRECUENCIAS POR INTERVALOS:
n
f
k i i
11
1
k i ih
F
k
n
5.- LA MARCA DE CLASE ES LA SEMISUMA DE LOS LIMITES DE CLASE
2
s i iL
L
X
6.- EL ANCHO DE CLASE “C” REPRESENTA LA
LONGITUD DEL INTERVALO: C = Ls – Li GENERALMENTE ES CONSTANTE.
7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE ENTONCES LA DISTANCIA ENTRE LAS MARCAS
PROCEDIMIENTO PARA LA CONSTRUCION DE TABLAS DE FRECUENCIAS POR INTERVALOS
1) CALCULAR EL RANGO:
R = X
máx–
X
min2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE
LA FORMULA DE “STURGES”: K = 1+3.3 Log(n)
DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE) EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7 3) DETERMINAR EL ANCHO DE CLASE:
C = R /K
DONDE C SE REDONDEA POR EXCESO, DE ACUERDO AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
Ejemplo de dato
original
Ejemplo de
valor de C
calculado
Se
redondea
a:
15
(dato entero)5.75
6
3.2
(dato con 1 decimal)2.33782129
2.4
11.13
(dato con 2 decimales)3.24920976
3.25
5.391
(dato con 3 decimales)1.42135709
1.422
99.3489
(con 4 decimales)9.2876405
9.2877
El valor de C dependerá de la cantidad de lugares decimales de los datos originales, que serán agrupados en la tabla de frecuencias:
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA Se ha aplicado una encuesta a 40 centros educativos con el fin de observar el número de niños que estudian en ellos, obteniendose:
42 58 79 86 98 120 134 120 59 62
85 89 76 110 104 78 84 96 90 75
120 130 122 95 82 94 108 79 105 115
102 80 56 78 84 66 69 78 84 98
Rango: R= 134 - 42 = 92
Número de intervalos: K = 1 + 3.3 log 40 = 6,29 (fórmula de Sturges) redondeo simple a 6 Ancho de clase: C =92 / 6 = 15,33
redondeamos por exceso de decimales a 16
Intervalos Tarjas o conteo Xi fi hi Fi Hi [42-58> 50 2 0.050 2 0.050 [58-74> 66 5 0.125 7 0.175 [74-90> 82 15 0.375 22 0.550 [90-106> 98 9 0.225 31 0.775 [106-122> 114 6 0.150 37 0.925 [122-138> 130 3 0.075 40 1.000 TOTAL n=40 1.000 Centros educativos Número de niños (variable)
EJEMPLO 2: SI LA VARIABLE CUANTITATIVA ES CONTINUA.
En un comercio, se dispone de los datos de la venta semanal (en miles de soles) para las últimas 30 semanas.
Construya una tabla de distribución de frecuencias.
14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5
15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8
PROCEDIMIENTO:
1. R= Xmax – X min = 15,8 – 12,2 = 3,6
2. Hallar K mediante Sturges:
K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)
3. Determinar el ancho de clase C:
C= 3,6 / 6 =0,6
(
no se redondea, porque ya tiene un decimal
como los datos)
Intervalos Tarjas o conteo Xi fi hi Fi Hi [12,2-12,8> // 12,5 2 0,0667 2 0,0667 [12,8-13,4> ///// 13,1 5 0,1667 7 0,2334 [13,4-14,0> ///// 13,7 5 0,1667 12 0,4000 [14,0-14,6> ////// 14,3 6 0,2000 18 0,6000 [14,6-15,2> /// 14,9 3 0,1000 21 0,7000 [15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000 TOTAL n=30 1.0000 Número de semanas Venta miles de soles (variable)
INTERPRETACIONES UTILIZANDO LA TABLA DE FRECUENCIAS
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles? Rpta. f4 = 6 semanas.
2.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles? Rpta. h2 = 0,1667 ó h2 = 16,67%
3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles? Rpta. F4 = 18 semanas
4.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas son menores a 15,2 miles de soles?
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS
Ventas Fr eq ue nc ia A bs ol ut a 15.8 15.2 14.6 14.0 13.4 12.8 12.2 9 8 7 6 5 4 3 2 1 0Ventas Fr e q u e n ci a R e la ti v a % 15.8 15.2 14.6 14.0 13.4 12.8 12.2 30 25 20 15 10 5 0
Ventas nu m er o de s em an as 15.5 14.9 14.3 13.7 13.1 12.5 9 8 7 6 5 4 3 2 1 0
Polígono de frecuencias absolutas
0
2
4
6
8
10
12.5
13.1
13.7
14.3
14.9
15.5
ventas
N u m . d e s e m an asObservación
•Los polígonos de frecuencia son especialmente
útiles para comparar las distribuciones de dos
grupos de datos diferentes, para ello es
conveniente trabajar en un mismo gráfico y
empleando los mismos intervalos.
•Importante
: Si la cantidad de datos es muy
diferente en ambos grupos es preferible trabajar
con polígonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS ACUMULADAS O LAS FRECUENCIAS RELATIVAS
ACUMULADAS.
OJIVA “MENOR QUE” O ASCENDENTE
ES LA REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS ACUMULADAS “MENOR QUE” O LAS FRECUENCIAS RELATIVAS ACUMULADAS “MENOR QUE”.
DEL EJEMPLO1: 0 42 58 74 90 106 122 138 2 7 22 31 37 40 * * * * * * * Fi MENOR QUE Fi Hi 42 58 74 90 106 122 138 0 2 7 22 31 37 40 0 0.05 0.174 0.550 0.775 0.925 1.000
DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZAR LOS DATOS COMO PRIMER PASO EN UN ANALISIS EXPLORATORIO DE DATOS.
OBJETIVOS:
➢REPRESENTACION VISUAL DE LA INFORMACION. ➢DESCRIBIR UN PATRON DE COMPORTAMIENTO
DE LOS DATOS, ES DECIR QUE DISTRIBUCION PUEDEN SEGUIR LOS DATOS.
➢IDENTIFICAR SI HAY VALORES EXTREMOS O
PROCEDIMIENTO:
▪ORDENAR LOS DATOS DE LA VARIABLE EN
FORMA CRECIENTE.
▪TOMAR COMO TALLO LA PRIMERA O LAS DOS
PRIMERAS CIFRAS DEL DATO Y COMO HOJA
LA ULTIMA CIFRA. A CONTINUACION SEPARADOS POR UNA LINEA VERTICAL SE COLOCAN LOS TALLOS A LA IZQUIERDA Y LAS HOJAS A LA DERECHA DEL TALLO CORRESPONDIENTE.
DE ESTA FORMA CADA TALLO SE REPRESENTA UNA SOLA VEZ Y DEFINE UNA CLASE Y EL NUMERO DE HOJAS REPRESENTA LA FRECUENCIA DE LA CADA CLASE.
EJEMPLOS:
. PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA IZQUIERDA DE LA LINEA LA CIFRA DE LAS DECENAS, QUE FORMAN EL TALLO, Y A LA DERECHA LAS UNIDADES QUE SERAN LAS HOJAS. POR EJEMPLO ESCRIBIR 85:
TALLO HOJA
8 5
ESCRIBIR 329 COMO TALLO Y HOJA
TALLO HOJA
Para los siguientes datos, construya un diagrama tallos y hojas: 12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53
3
1
2 5 8
7
2
2 4 6 7
( 5 )
3
1 3 3 5 6
7
4
2 2 5 6
3
5
0 1 3
HOJAS TALLO CENTRO DE LA DISTRIBUCION¡OBSERVE QUE SE PARECE A UN
HISTOGRAMA VOLTEADO!
LEAF UNIT = 1.0 ES LA UNIDAD DE HOJA,DICE DONDE
PONER EL PUNTO DECIMAL, EN EL EJEMPLO LEAF UNIT=1.0 ASI LA
PRIMERA OBSERVACION ES 12 ,SI LEAF UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT FUERA 10 ENTONCES EL VALOR SERIA 120.