CAPÍTULO 2
Organización y
Clasificación de Datos
TABLA
DE
DISTRIBUCIÓN
DE
FRECUENCIAS
i
y
n
i
N
i
h
i
H
i
N
i
*
*
i
H
100
h
i%
100
H
i%
100
*%
i
H
y
y
2
1
n
n
2
1
N
N
2
1
h
h
2
1
H
H
2
1
Total
n
1
100%
TABLA
DE
DISTRIBUCION
DE
FRECUENCIAS
Si los datos que se dispone son numerosos,
es indispensable clasificarlos en un cuadro
o tabla resumen de las observaciones
o tabla resumen de las observaciones
originales, a las que en adelante se llamará:
Tabla de distribución de Frecuencias
o
DATOS
DE
VARIABLES
DISCRETAS
Sean
x
1
, x
2
, x
3
, …, x
n
un conjunto de n
observaciones discretas y sean
y
1
, y
2
,
y , …, y
el conjunto de valores
y
3
, …, y
m
el conjunto de valores
DEFINICIÓN
DE
FRECUENCIA
ABSOLUTA
Se llama
frecuencia absoluta
del
valor
y
i
al número de veces que
EJEMPLO
Se realiza una encuesta a un conjunto de 16 familias
sobre el número de hijos. Los resultados en el orden
obtenidos son:
x
1
=2
x
2
=1
x
3
=3
x
4
=1
Construya una Tabla de distribución de frecuencias
absolutas para estos datos.
x
1
=2
x
2
=1
x
3
=3
x
4
=1
DEFINICIÓN
DE
FRECUENCIA
ABSOLUTA ACUMULADA “MENOR QUE”
Se llama
frecuencia absoluta acumulada
“menos que”
correspondiente al valor
y
i
al
número de observaciones menores o iguales
número de observaciones menores o iguales
a
y
i
(x
i
≤
y
i
).
Si denotamos esta frecuencia
por “
N
i
”, entonces:
∑
=
=
+
+
+
+
=
i
j
j
i
i
n
n
n
n
n
N
1
3
2
DEFINICIÓN
DE
FRECUENCIA
ABSOLUTA ACUMULADA “MAYOR QUE”
Se llama
frecuencia absoluta acumulada
“mayor que”
correspondiente al valor
y
i
al
número de observaciones mayores o iguales
número de observaciones mayores o iguales
a
y
i
(x
i
≥
y
i
).
Si denotamos esta frecuencia
por “
N*
i
”, entonces:
∑
=
+
+
+
+
+
=
+
=
m
i
j
j
m
i
i
i
i
n
n
n
n
n
DEFINICIÓN DE FRECUENCIA RELATIVA
Se llama
frecuencia relativa
del valor
y
i
al
cociente de la frecuencia absoluta de
y
i
y el
número total de observaciones.
número total de observaciones.
n
n
h
i
=
=
i
nes
observacio
de
total
numero
y
de
absulta
DEFINICIÓN DE FRECUENCIA RELATIVA
ACUMULADA “MENOR QUE”
Se llama
frecuencia relativa acumulada
“menor que”
correspondiente al valor
y
i
a
la
frecuencia
relativa
total
de
las
la
frecuencia
relativa
total
de
las
observaciones menores o iguales a
y
i
.
∑
=
=
+
+
+
+
=
i
j
j
i
i
h
h
h
h
h
H
1
3
2
DEFINICIÓN DE FRECUENCIA RELATIVA
ACUMULADA “MAYOR QUE”
Se llama
frecuencia relativa acumulada
“mayor que”
correspondiente al valor
y
i
a
la
frecuencia
relativa
total
de
las
la
frecuencia
relativa
total
de
las
observaciones mayores o iguales a
y
i
.
∑
=
+
+
+
+
+
=
+
=
m
i
j
j
m
i
i
i
i
h
h
h
h
h
PROPIEDADES
DE
LAS
FRECUENCIAS
PROPIEDAD 1
.
,...
2
,
1
,
0
,
0
,
0
N
N
*
i
m
n
i
≥
i
≥
i
≥
∀
=
PROPIEDAD 2
PROPIEDAD 3
n
n
m
i
i
=
∑
=
1
.
,...
2
,
1
,
1
0
,
1
0
,
1
PROPIEDADES
DE
LAS
FRECUENCIAS
PROPIEDAD 4
n
n
N
m
i
i
m
=
∑
=
=
1
PROPIEDAD 5
PROPIEDAD 6
n
n
N
m
i
i
=
=
∑
=
1
*
1
1
1
=
=
∑
=
m
i
i
m
h
PROPIEDADES
DE
LAS
FRECUENCIAS
PROPIEDAD 7
1
1
*
1
=
∑
=
=
m
i
i
h
H
PROPIEDAD 8
PROPIEDAD 9
1
1
1
1
n
n
N
i
i
=
=
∑
=
m
m
m
i
i
m
n
n
N
=
∑
=
PROPIEDADES
DE
LAS
FRECUENCIAS
PROPIEDAD 10
PROPIEDAD 11
1
1
1
1
h
h
H
i
i
=
=
∑
=
m
m
i
m
h
h
H
*
=
∑
=
PROPIEDAD 11
PROPIEDAD 12
m
m
i
i
m
h
h
H
=
∑
=
=
0
,....
3
,
2
,
1
,
....
0
1
3
2
1
1
=
=
∀
+
=
=
≤
≤
≤
=
−
n
i
m
y
N
PROPIEDADES
DE
LAS
FRECUENCIAS
PROPIEDAD 13
m
i
n
N
N
n
N
N
N
N
n
i
i
i
m
m
,....
3
,
2
,
....
1
*
1
*
*
*
3
*
2
*
1
=
∀
−
=
=
≥
≥
≥
=
−
−
PROPIEDAD 13
0
,....
3
,
2
,
1
,
1
....
0
1
3
2
1
1
=
=
∀
+
=
=
≤
≤
≤
=
−
h
i
m
y
H
3. Datos de Variables Continuas
DEFINICIÓN 1
Se llama
CLASES
a cada uno de los grupos en que
se divide el conjunto de datos
se divide el conjunto de datos
Estos valores extremos definen el recorrido o rango
del conjunto de observaciones, el cual está dado
por el intervalo:
{
}
{
x
i
n
}
mín
x
n
i
x
máx
x
i
mín
i
máx
,...,
3
,
2
,
1
/
,...,
3
,
2
,
1
/
=
=
=
=
DEFINCIÓN 2
Amplitud de Recorrido
,
es la longitud
del recorrido del conjunto de datos.
( )
l
del recorrido del conjunto de datos.
En la práctica:
mín
máx
x
x
−
=
l
NOTACIÓN
Sea “m” el número de clases y y’
1
, y’
2
, y’
3
, …, y’
m
los
extremos ó límites de los intervalos de clase,
entonces:
entonces:
Denota el i-ésimo intervalo de clase.
Un intervalo de clase, que al menos teóricamente no
tiene límite inferior ó superior se llama
intervalo de
clase abierto
m
i
y
DEFINICIÓN 3
Amplitud de clase es la longitud del intervalo que
define la clase
m
i
y
y
c
=
'
−
'
−
,
=
1
,
2
,
3
,...,
Así:
m
i
y
y
c
i
=
'
i
−
'
i
−
1
,
=
1
,
2
,
3
,...,
Si los intervalos tienen igual longitud digamos “c”, es
decir:
Entonces:
m
i
y
y
c
=
'
i
−
'
i
−
1
,
=
1
,
2
,
3
,...,
Entonces:
CONSTRUCCIÓN
DE
LOS
INTERVALOS DE CLASE
Los intervalos de clase se construyen partiendo de x
1
,
(ó x’
1
) de la siguiente manera:
Límite inferior
Límite Superior
Primer intervalo de clase
y
'
=
x
y
'
=
x
+
c
=
y
'
+
c
Primer intervalo de clase
Segundo intervalo de clase
……
……
…………
m-ésimo intervalo de clase
mín
x
y
'
0=
y
'
1=
x
mín+
c
=
y
'
0+
c
c
y
c
x
y
'
1=
mín+
=
'
0+
y
'
2=
x
mín+
2
c
=
y
'
1+
c
(
m
)
c
x
DEFINICIÓN 4
La
marca de clase
es el punto medio del intervalo
que representa a dicha clase. Se denota por “y
i
” ,
i=1,2,3,…,m. Es decir:
i=1,2,3,…,m. Es decir:
m
i
y
y
y
i
i
i
,
1
,
2
,
3
,...,
2
'
'
1
=
+
DEFINCIÓN 5
La
frecuencia absoluta (n
i
)
de la clase i-ésima, es el
número de observaciones del conjunto original que
pertenecen a dicha clase. Entonces, la tabla de
distribución de frecuencias tendrá la forma:
Intervalo de clase
Marca de clase
Frecuencia absoluta de
clase
i i
y
y
'
−1−
'
y
ii
n
y
y
y
y
'
'
'
'
0 1−
−
y
y
1n
n
1Totales
n
m my
y
y
y
'
'
.
.
.
'
'
1 2 1−
−
−
y
mOBSERVACIONES
1) En general se tendrán intervalos de clase
de amplitudes diferentes, sin embargo la
teoría de tablas con amplitudes de clase
teoría de tablas con amplitudes de clase
diferentes es la misma que la teoría con
amplitudes iguales.
OBSERVACIONES
Resulte un número “manejable” en cálculos
futuros, ésta ampliación en lo posible debe
hacerse en forma simétrica, es decir a la
hacerse en forma simétrica, es decir a la
izquierda de x
mín
y a la derecha de x
máx
.
OBSERVACIONES
REGLAS UTILIZADAS
A) Tomar el número de clases (m) igual al
entero más próximo a
, siendo “n” el
número de datos.
n
2
número de datos.
B)
, donde “n” es el número de
observaciones.
C) Regla de Sturges:
, con
“n” el número de observaciones.
n
m
≥
En general se recomienda:
4) Como el límite superior de una clase coincide
20
5
≤
m
≤
ALTERNATIVAS DE SELECCIÓN
A) Definir los extremos de clase con un cifra
decimal mas que las que contengan las
observaciones.
observaciones.
B) Considerar los intervalos de clase como:
B) Considerar los intervalos de clase como:
]
i
i
i
i
y
y
y
y
'
−
1
−
'
≡
'
−
1
,
'
[
i
i
i
i
y
y
y
REGLAS
GENERALES
PARA
LA
DISTRIBUCIÓN DE FRECUENCIAS
1) Decidir el número “m” de clases.
2) Determinar el recorrido o rango de los datos y
la amplitud ( ) del recorrido.
l
3) Determinar la amplitud o longitud de los
intervalos de clase.
4) Determinar los límites de clase.
m
REGLAS
GENERALES
PARA
LA
DISTRIBUCIÓN DE FRECUENCIAS
5) Determinarlas marcas de clases.
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 1.
Frecuencia absoluta acumulada
“Menor que”
(
N
i
) de la clase i-ésima, es el
número
de
observaciones
menores
que
el
extremo superior del intervalo de clase i-ésimo, o
extremo superior del intervalo de clase i-ésimo, o
sea menores a
y
i
’ . Entonces:
∑
=
=
+
+
+
+
=
i
j
j
i
i
n
n
n
n
n
N
1
3
2
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 2.
Frecuencia absoluta acumulada
“Mayor o igual que”
(
N
i
*) de la clase i-ésima, es
el número de observaciones mayores o iguales
que el extremo inferior del intervalo de clase
que el extremo inferior del intervalo de clase
i-ésimo, es decir mayor o igual a
y
i-1
’ . Entonces:
∑
=
+
+
+
+
+
=
+
=
m
i
j
j
m
i
i
i
i
n
n
n
n
n
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 3.
Frecuencia relativa
(h
i
) del
i-ésimo intervalo de clase, es el cociente:
m
i
n
h
=
i
,
=
1
,
2
,
3
,...,
DEFINICIÓN 4. Se llama
Frecuencia relativa
porcentual
a la frecuencia relativa (h
i
) multiplicada
por 100% (100h
i
%) y representa el porcentaje de
observaciones que pertenecen a la clase i-ésima.
m
i
n
n
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 5.
Frecuencia relativa acumulada
“Menor que”
(H
i
) de la clase i-ésima, es la
frecuencia realtiva total correspondiente a los
valores observados menores que
y
’ , es decir
valores observados menores que
y
i
’ , es decir
menores que el extremo superior del intervalo de
clase i-ésimo. Entonces:
∑
=
=
+
+
+
+
=
i
j
j
i
i
h
h
h
h
h
H
1
3
2
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 6.
Frecuencia relativa acumulada
“Mayor o igual que”
(H*
i
) de la clase i-ésima, es
la frecuencia relativa total correspondiente a los
valores observados mayores o iguales al extremo
valores observados mayores o iguales al extremo
inferior del intervalo de clase i-ésimo, es decir
mayores o iguales que
y
i-1
’ .Entonces:
∑
=
+
+
+
+
+
=
+
=
m
i
j
j
m
i
i
i
i
h
h
h
h
h
ALGUNAS
DEFINICIONES
PARA
DATOS DE VARIABLES CONTINUAS
DEFINICIÓN 7. Se llama
Frecuencia relativa
acumulada porcentual
a la frecuencia relativa
acumulada H
i
(o H*
i
) multiplicada por 100%. Es
decir 100H % (o 100H* %) y representa el
decir 100H
i
% (o 100H*
i
%) y representa el
porcentaje de observaciones menores que y
i
’(o
TABLA
DE
DISTRIBUCIÓN
DE
FRECUENCIAS
PARA
DATOS
CONTINUOS
i
y
n
i
N
i
h
i
H
i
*i