• No se han encontrado resultados

Organización y Clasificación de Datos

N/A
N/A
Protected

Academic year: 2019

Share "Organización y Clasificación de Datos"

Copied!
40
0
0

Texto completo

(1)

CAPÍTULO 2

Organización y

Clasificación de Datos

(2)

TABLA

DE

DISTRIBUCIÓN

DE

FRECUENCIAS

i

y

n

i

N

i

h

i

H

i

N

i

*

*

i

H

100

h

i

%

100

H

i

%

100

*

%

i

H

y

y

2

1

n

n

2

1

N

N

2

1

h

h

2

1

H

H

2

1

Total

n

1

100%

(3)

TABLA

DE

DISTRIBUCION

DE

FRECUENCIAS

Si los datos que se dispone son numerosos,

es indispensable clasificarlos en un cuadro

o tabla resumen de las observaciones

o tabla resumen de las observaciones

originales, a las que en adelante se llamará:

Tabla de distribución de Frecuencias

o

(4)

DATOS

DE

VARIABLES

DISCRETAS

Sean

x

1

, x

2

, x

3

, …, x

n

un conjunto de n

observaciones discretas y sean

y

1

, y

2

,

y , …, y

el conjunto de valores

y

3

, …, y

m

el conjunto de valores

(5)

DEFINICIÓN

DE

FRECUENCIA

ABSOLUTA

Se llama

frecuencia absoluta

del

valor

y

i

al número de veces que

(6)

EJEMPLO

Se realiza una encuesta a un conjunto de 16 familias

sobre el número de hijos. Los resultados en el orden

obtenidos son:

x

1

=2

x

2

=1

x

3

=3

x

4

=1

Construya una Tabla de distribución de frecuencias

absolutas para estos datos.

x

1

=2

x

2

=1

x

3

=3

x

4

=1

(7)

DEFINICIÓN

DE

FRECUENCIA

ABSOLUTA ACUMULADA “MENOR QUE”

Se llama

frecuencia absoluta acumulada

“menos que”

correspondiente al valor

y

i

al

número de observaciones menores o iguales

número de observaciones menores o iguales

a

y

i

(x

i

y

i

).

Si denotamos esta frecuencia

por “

N

i

”, entonces:

=

=

+

+

+

+

=

i

j

j

i

i

n

n

n

n

n

N

1

3

2

(8)

DEFINICIÓN

DE

FRECUENCIA

ABSOLUTA ACUMULADA “MAYOR QUE”

Se llama

frecuencia absoluta acumulada

“mayor que”

correspondiente al valor

y

i

al

número de observaciones mayores o iguales

número de observaciones mayores o iguales

a

y

i

(x

i

y

i

).

Si denotamos esta frecuencia

por “

N*

i

”, entonces:

=

+

+

+

+

+

=

+

=

m

i

j

j

m

i

i

i

i

n

n

n

n

n

(9)

DEFINICIÓN DE FRECUENCIA RELATIVA

Se llama

frecuencia relativa

del valor

y

i

al

cociente de la frecuencia absoluta de

y

i

y el

número total de observaciones.

número total de observaciones.

n

n

h

i

=

=

i

nes

observacio

de

total

numero

y

de

absulta

(10)

DEFINICIÓN DE FRECUENCIA RELATIVA

ACUMULADA “MENOR QUE”

Se llama

frecuencia relativa acumulada

“menor que”

correspondiente al valor

y

i

a

la

frecuencia

relativa

total

de

las

la

frecuencia

relativa

total

de

las

observaciones menores o iguales a

y

i

.

=

=

+

+

+

+

=

i

j

j

i

i

h

h

h

h

h

H

1

3

2

(11)

DEFINICIÓN DE FRECUENCIA RELATIVA

ACUMULADA “MAYOR QUE”

Se llama

frecuencia relativa acumulada

“mayor que”

correspondiente al valor

y

i

a

la

frecuencia

relativa

total

de

las

la

frecuencia

relativa

total

de

las

observaciones mayores o iguales a

y

i

.

=

+

+

+

+

+

=

+

=

m

i

j

j

m

i

i

i

i

h

h

h

h

h

(12)

PROPIEDADES

DE

LAS

FRECUENCIAS

PROPIEDAD 1

.

,...

2

,

1

,

0

,

0

,

0

N

N

*

i

m

n

i

i

i

=

PROPIEDAD 2

PROPIEDAD 3

n

n

m

i

i

=

=

1

.

,...

2

,

1

,

1

0

,

1

0

,

1

(13)

PROPIEDADES

DE

LAS

FRECUENCIAS

PROPIEDAD 4

n

n

N

m

i

i

m

=

=

=

1

PROPIEDAD 5

PROPIEDAD 6

n

n

N

m

i

i

=

=

=

1

*

1

1

1

=

=

=

m

i

i

m

h

(14)

PROPIEDADES

DE

LAS

FRECUENCIAS

PROPIEDAD 7

1

1

*

1

=

=

=

m

i

i

h

H

PROPIEDAD 8

PROPIEDAD 9

1

1

1

1

n

n

N

i

i

=

=

=

m

m

m

i

i

m

n

n

N

=

=

(15)

PROPIEDADES

DE

LAS

FRECUENCIAS

PROPIEDAD 10

PROPIEDAD 11

1

1

1

1

h

h

H

i

i

=

=

=

m

m

i

m

h

h

H

*

=

=

PROPIEDAD 11

PROPIEDAD 12

m

m

i

i

m

h

h

H

=

=

=

0

,....

3

,

2

,

1

,

....

0

1

3

2

1

1

=

=

+

=

=

=

n

i

m

y

N

(16)

PROPIEDADES

DE

LAS

FRECUENCIAS

PROPIEDAD 13

m

i

n

N

N

n

N

N

N

N

n

i

i

i

m

m

,....

3

,

2

,

....

1

*

1

*

*

*

3

*

2

*

1

=

=

=

=

PROPIEDAD 13

0

,....

3

,

2

,

1

,

1

....

0

1

3

2

1

1

=

=

+

=

=

=

h

i

m

y

H

(17)

3. Datos de Variables Continuas

DEFINICIÓN 1

Se llama

CLASES

a cada uno de los grupos en que

se divide el conjunto de datos

se divide el conjunto de datos

Estos valores extremos definen el recorrido o rango

del conjunto de observaciones, el cual está dado

por el intervalo:

{

}

{

x

i

n

}

mín

x

n

i

x

máx

x

i

mín

i

máx

,...,

3

,

2

,

1

/

,...,

3

,

2

,

1

/

=

=

=

=

(18)

DEFINCIÓN 2

Amplitud de Recorrido

,

es la longitud

del recorrido del conjunto de datos.

( )

l

del recorrido del conjunto de datos.

En la práctica:

mín

máx

x

x

=

l

(19)

NOTACIÓN

Sea “m” el número de clases y y’

1

, y’

2

, y’

3

, …, y’

m

los

extremos ó límites de los intervalos de clase,

entonces:

entonces:

Denota el i-ésimo intervalo de clase.

Un intervalo de clase, que al menos teóricamente no

tiene límite inferior ó superior se llama

intervalo de

clase abierto

m

i

y

(20)

DEFINICIÓN 3

Amplitud de clase es la longitud del intervalo que

define la clase

m

i

y

y

c

=

'

'

,

=

1

,

2

,

3

,...,

Así:

m

i

y

y

c

i

=

'

i

'

i

1

,

=

1

,

2

,

3

,...,

(21)

Si los intervalos tienen igual longitud digamos “c”, es

decir:

Entonces:

m

i

y

y

c

=

'

i

'

i

1

,

=

1

,

2

,

3

,...,

Entonces:

(22)

CONSTRUCCIÓN

DE

LOS

INTERVALOS DE CLASE

Los intervalos de clase se construyen partiendo de x

1

,

(ó x’

1

) de la siguiente manera:

Límite inferior

Límite Superior

Primer intervalo de clase

y

'

=

x

y

'

=

x

+

c

=

y

'

+

c

Primer intervalo de clase

Segundo intervalo de clase

……

……

…………

m-ésimo intervalo de clase

mín

x

y

'

0

=

y

'

1

=

x

mín

+

c

=

y

'

0

+

c

c

y

c

x

y

'

1

=

mín

+

=

'

0

+

y

'

2

=

x

mín

+

2

c

=

y

'

1

+

c

(

m

)

c

x

(23)

DEFINICIÓN 4

La

marca de clase

es el punto medio del intervalo

que representa a dicha clase. Se denota por “y

i

” ,

i=1,2,3,…,m. Es decir:

i=1,2,3,…,m. Es decir:

m

i

y

y

y

i

i

i

,

1

,

2

,

3

,...,

2

'

'

1

=

+

(24)

DEFINCIÓN 5

La

frecuencia absoluta (n

i

)

de la clase i-ésima, es el

número de observaciones del conjunto original que

pertenecen a dicha clase. Entonces, la tabla de

distribución de frecuencias tendrá la forma:

(25)

Intervalo de clase

Marca de clase

Frecuencia absoluta de

clase

i i

y

y

'

1

'

y

i

i

n

y

y

y

y

'

'

'

'

0 1

y

y

1

n

n

1

Totales

n

m m

y

y

y

y

'

'

.

.

.

'

'

1 2 1

y

m

(26)

OBSERVACIONES

1) En general se tendrán intervalos de clase

de amplitudes diferentes, sin embargo la

teoría de tablas con amplitudes de clase

teoría de tablas con amplitudes de clase

diferentes es la misma que la teoría con

amplitudes iguales.

(27)

OBSERVACIONES

Resulte un número “manejable” en cálculos

futuros, ésta ampliación en lo posible debe

hacerse en forma simétrica, es decir a la

hacerse en forma simétrica, es decir a la

izquierda de x

mín

y a la derecha de x

máx

.

(28)

OBSERVACIONES

(29)

REGLAS UTILIZADAS

A) Tomar el número de clases (m) igual al

entero más próximo a

, siendo “n” el

número de datos.

n

2

número de datos.

B)

, donde “n” es el número de

observaciones.

C) Regla de Sturges:

, con

“n” el número de observaciones.

n

m

(30)

En general se recomienda:

4) Como el límite superior de una clase coincide

20

5

m

(31)

ALTERNATIVAS DE SELECCIÓN

A) Definir los extremos de clase con un cifra

decimal mas que las que contengan las

observaciones.

observaciones.

B) Considerar los intervalos de clase como:

B) Considerar los intervalos de clase como:

]

i

i

i

i

y

y

y

y

'

1

'

'

1

,

'

[

i

i

i

i

y

y

y

(32)

REGLAS

GENERALES

PARA

LA

DISTRIBUCIÓN DE FRECUENCIAS

1) Decidir el número “m” de clases.

2) Determinar el recorrido o rango de los datos y

la amplitud ( ) del recorrido.

l

3) Determinar la amplitud o longitud de los

intervalos de clase.

4) Determinar los límites de clase.

m

(33)

REGLAS

GENERALES

PARA

LA

DISTRIBUCIÓN DE FRECUENCIAS

5) Determinarlas marcas de clases.

(34)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 1.

Frecuencia absoluta acumulada

“Menor que”

(

N

i

) de la clase i-ésima, es el

número

de

observaciones

menores

que

el

extremo superior del intervalo de clase i-ésimo, o

extremo superior del intervalo de clase i-ésimo, o

sea menores a

y

i

’ . Entonces:

=

=

+

+

+

+

=

i

j

j

i

i

n

n

n

n

n

N

1

3

2

(35)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 2.

Frecuencia absoluta acumulada

“Mayor o igual que”

(

N

i

*) de la clase i-ésima, es

el número de observaciones mayores o iguales

que el extremo inferior del intervalo de clase

que el extremo inferior del intervalo de clase

i-ésimo, es decir mayor o igual a

y

i-1

’ . Entonces:

=

+

+

+

+

+

=

+

=

m

i

j

j

m

i

i

i

i

n

n

n

n

n

(36)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 3.

Frecuencia relativa

(h

i

) del

i-ésimo intervalo de clase, es el cociente:

m

i

n

h

=

i

,

=

1

,

2

,

3

,...,

DEFINICIÓN 4. Se llama

Frecuencia relativa

porcentual

a la frecuencia relativa (h

i

) multiplicada

por 100% (100h

i

%) y representa el porcentaje de

observaciones que pertenecen a la clase i-ésima.

m

i

n

n

(37)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 5.

Frecuencia relativa acumulada

“Menor que”

(H

i

) de la clase i-ésima, es la

frecuencia realtiva total correspondiente a los

valores observados menores que

y

’ , es decir

valores observados menores que

y

i

’ , es decir

menores que el extremo superior del intervalo de

clase i-ésimo. Entonces:

=

=

+

+

+

+

=

i

j

j

i

i

h

h

h

h

h

H

1

3

2

(38)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 6.

Frecuencia relativa acumulada

“Mayor o igual que”

(H*

i

) de la clase i-ésima, es

la frecuencia relativa total correspondiente a los

valores observados mayores o iguales al extremo

valores observados mayores o iguales al extremo

inferior del intervalo de clase i-ésimo, es decir

mayores o iguales que

y

i-1

’ .Entonces:

=

+

+

+

+

+

=

+

=

m

i

j

j

m

i

i

i

i

h

h

h

h

h

(39)

ALGUNAS

DEFINICIONES

PARA

DATOS DE VARIABLES CONTINUAS

DEFINICIÓN 7. Se llama

Frecuencia relativa

acumulada porcentual

a la frecuencia relativa

acumulada H

i

(o H*

i

) multiplicada por 100%. Es

decir 100H % (o 100H* %) y representa el

decir 100H

i

% (o 100H*

i

%) y representa el

porcentaje de observaciones menores que y

i

’(o

(40)

TABLA

DE

DISTRIBUCIÓN

DE

FRECUENCIAS

PARA

DATOS

CONTINUOS

i

y

n

i

N

i

h

i

H

i

*

i

N

*

i

H

100

h

i

%

100Hi% 100Hi*%

y

y

2

1

n

n

2

1

N

N

2

1

h

h

2

1

2

1

H

H

,

,

1

i

i

y

y

,

2

,

1

,

1

,

0

y

y

y

y

Total

n

1

100

Figure

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS iy n i N i h i H i N i * * iH 100 h i % 100 H i % 100 * %iH yy 21 nn 21 NN 21 hh 21 HH 21 Total n 1 100%myy...2mnn...2mNN...2mhh...2mHH...2
TABLA DE DISTRIBUCION DE FRECUENCIAS
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTINUOS iy n i N i h i H i *iN * iH 100 h i % 100 H i % 100 H i * % yy 21 nn 21 NN 21 hh 21 21HH,,1iiyy−−, 2,1, 1,0yyyy−− Total n 1 100 %myy...2mnn...2nN...2mhh...21...2H,,121...mmyyyy−−−

Referencias

Documento similar