Estadística 1
Raz. verbal
Blademir González Parián
Estadística I
Es el método para organizar y resumir datos. Los datos se clasifican y ordenan para facilitar su interpretación. Cuando se dispone de numerosos datos conviene agruparlos en clases o intervalos e indicar cuantos elementos hay en cada intervalo;
éste número se llama frecuencia.
1. FRECUENCIA
Es el número de veces que ocurrió un valor.
Agrupación de datos por su frecuencia:
i. Se ordenan los datos en orden creciente.
2. ALCANCE O RECORRIDO (A)
Es el intervalo definido por el menor y mayor de los datos.
3. RANGO (R)
Viene a ser la diferencia entre los extremos del alcance.
4. INTERVALOS DE CLASE (k)
Son grupos que resultan de particionar el alcance o recorrido; es decir, consiste en dividir el rango en un número conveniente de intervalos de clase.
El número de intervalos (k) se determina por la regla propuesta por STURGES.
k 1 3,32Log n
donde n = número total de datos
Observación
Tambien se puede usar la regla de JOULE para determinar k.
k n
El valor de «k» se redondea al entero superior o inferior según convenga.
5. ANCHO DE CLASE (C)
Viene a ser la diferencia que existe entre los extremos de cada intervalo.
Se puede calcular por la siguiente relación:
C R
k Ejemplo:
Sea el intervalo
i
i s
i
L Limite inf erior
L L
L Limite sup erior
Entonces
s i
C L L 6. MARCA DE CLASE ( y i )
Son los puntos medios de los intervalos de clase.
Ejemplo:
Sea el intervalo L i L s
i s
i
L L
y 2
7. FRECUENCIA ABSOLUTA ( f i )
Es el número de datos que cae dentro de cada intervalo.
0 f i n
donde n = número total de datos
Distribución de frecuencias
8. FRECUENCIA RELATIVA ( h i )
Es el cociente entre la frecuencia absoluta y el número total de datos.
i i
h f
n ;
0 h i 1 donde n = número total de datos 9. FRECUENCIA ABSOLUTA ACUMULADA ( F i )
Es aquella que resulta de sumar sucesivamente las frecuen- cias absolutas.
Ejemplos:
Suponiendo «k» intervalos:
1 1
2 1 2
3 1 2 3
k 1 2 3 k
F f
F f f
F f f f
F f f f f n
n = número total de datos
i 1
i j
j 1
F f
10. FRECUENCIA RELATIVA ACUMULADA ( H i )
Es aquella que resulta de sumar sucesivamente las frecuen- cias relativas.
Ejemplos:
Suponiendo «k» intervalos:
1 1
2 1 2
3 1 2 3
k 1 2 3 k
H h
H h h
H h h h
H h h h h 1
n = número total de datos
i
i j
j 1
H h
Problema Aplicativo 1
Distribución de frecuencias o tabla de frecuencias de una variable discreta.
1. Considermos los siguientes datos correspondientes al número de hijos de 20 familias
8 7 2 1 4 2 7 2 4 1 2 7 4 6 4 1 2 4 0 4 (n < 25)
Nº de hijos
( x
i) Conteo Frecuencias absolutas Frecuencias relativas Frec. relativas porcentuales Simple ( f
i) Acum. (F
i) Simple ( h
i) Acum. ( H
i) Simple ( h% ) Acum. ( H% ) 0 1
2 4 6 7 8
III I IIIII IIIII I
III I I
1 3 5 6 1 3 1
1 4 15 9 16 19 20
0,05 0,15 0,25 0,30 0,05 0,15 0,05
0,05 0,20 0,45 0,75 0,80 0,95 1,00
15% 5%
25% 30%
15% 5%
5%
20% 5%
45% 75%
80% 95%
100%
TOTAL n = 20 1,00 100%
Raz. verbal
Blademir González Parián Problema Aplicativo 2
Distribución de frecuencias o tabla de frecuencias de una variable de datos agrupados en intervalos de clase.
1. Considermos los siguientes datos correspondientes a los pesos de 40 niños de los Planteles de Aplicación «Guamán Poma de Ayala»
31 38 57 29 60 68 51 59 20 50 36 65 76 42
53 52 34 88 89 54 40 43 46 63 45 51 50 62
49 48 67 71 45 39 44 58 44 72 56 53
Regla para construir la distribución de frecuencias o tabla de frecuencias de una variable agrupada en intervalos.
1º Determinación del rango (R) X max 89
X min 20 Entonces:
max min
R X X 89 2 R 0 69
2º Determinación del número de intrervalos de clase (k) Usamos la fórmula de STURGES:
k 1 3,2 log n
k 1 3,2 log 40 k 6 ,12 7
Si el valor de «k» resulta decimal, se redondea al número inmediato superior
3º Determinación del tamaño de los intrervalos de clase (C)
R 69
C C 10
k 7
4º Límites de clase
Se toma el menor valor de los datos como el límite inferior del primer intervalo de clase; se agrega C para obtener el límite superior de dicha clase. Entonces los intervalos de clase son:
20;30 30;40 40;50 50;60 60;70 70;80 80;90
5º Determinación de la marca de clase y i
Se desarrolla para cada intervalo de clase.
6º Determinación de la frecuencia de clase x i
Se determina el número de datos que caen en cada intervalo de clase.
Construyendo la tabla de frecuencias
( x
i) ( y
i) Conteo Frecuencias absolutas Frecuencias relativas Frec. relativas porcentuales Simple ( f
i) Acum. (F
i) Simple ( h
i) Acum. ( H
i) Simple ( h% ) Acum. ( H% )
20; 30
25 II 2 2 0,050 0,050 5 % 5 %
30;40
35 IIIII 5 7 0,125 0,175 12,5 % 17,5 %
40;50
45 IIIII IIIII 10 17 0,250 0,425 25 % 42,5 %
50;60
55 IIIII IIIII II 12 29 0,300 0,725 30 % 72,5 %
60;70
65 IIIII I 6 35 0,150 0,875 15 % 87,5 %
70;80
75 III 3 38 0,075 0,950 7,5 % 95 %
80;90
85 II 2 40 0,050 1,000 5 % 100 %
TOTAL n = 40 1,00 100 %
INTERPRETACIÓN
• La frecuencia absoluta simple nos indica las veces que se repite un dato.
f 1 = 2 Hay 2 alumnos con pesos entre 20 y 30 kg.
f 3 = 10 Hay 10 alumnos con pesos entre 40 y 50 kg.
• La frecuencia absoluta acumulada
F 3 17 Hay 17 alumnos con pesos entre 20 y 50 kg.
F 5 35 Hay 17 alumnos con pesos entre 20 y 70 kg.
• La frecuencia relativa simple nos indica la razón en que se encuentra la frecuencia de un dato (f) y el número total de datos (n).
3
h 1 0,250
4 1 de cada 4 alumnos tienen sus pesos entre 40 y 50 kg.
4
h 3 0,300
10 3 de cada 10 alumnos tienen sus pesos entre 50 y 60 kg.
• La frecuencia relativa acumulada
3
H 42,5 0,425
100 42,5 de cada 100 alumnos tienen sus pesos entre 20 y 50 kg.
6
H 95 0,950
100 95 de cada 100 alumnos tienen sus pesos entre 20 y 80 kg.
• La frecuencia relativa porcentual simple nos indica el porcentaje que representa la frecuencia de un dato, repecto al total de datos.
h 3 100 25% El 25% de los alumnos tienen sus pesos entre 40 y 50 kg.
h 4 100 30 % El 25% de los alumnos tienen sus pesos entre 50 y 60 kg.
• La frecuencia relativa porcentual acumulada
H 4 100 72,5% El 72,5% de los alumnos tienen
sus pesos entre 20 y 60 kg.
Raz. verbal
Blademir González Parián
A) PRESENTACIÓN GRÁFICA DE VARIABLES CUANTITATIVAS.
Tomaremos la tabla de frecuencias del Problama Aplicativo Nº 02 del capítulo que precede a éste, para efectuar las diferentes gráficas:-
1. DIAGRAMA DE BARRAS.
En el eje de las abscisas con centro en las marcas de clase se levantan perpendicularmente barras de longitud igual a la frecuencia absoluta o relativa.
10 2 4 6 8 10 12
20 30 40 50 60 70 80 90
x
if
iPesos en Kg.
Númerodeniños
10 0,050 0,100 0,150 0,200 0,250 0,300
20 30 40 50 60 70 80 90
x
ih
i0 0
2. HISTOGRAMAS.
Es una representación para datos agrupados en intervalos de clase.
Sobre el eje de las abscisas, se levanta perpendicularmente rectángulos con centro en la marca de clase, de ancho igual tamaño del intervalo de clase y una altura igual a la frecuencia absoluta o relativa.
10 2 4 6 8 10 12
20 30 40 50 60 70 80 90
x
if
iPesos en Kg.
Númerodeniños
10 0,050 0,100 0,150 0,200 0,250 0,300
20 30 40 50 60 70 80 90
x
ih
i0 0
3. POLÍGONO DE FRECUENCIAS
El polígono de frecuencias se obtiene uniendo los extremos superiores de las barras o los puntos medios de las bases superiores de los rectángulos del histograma.
10 2 4 6 8 10 12
20 30 40 50 60 70 80 90
x
if
iPesos en Kg.
Númerodeniños
10 20 30 40 50 60 70 80 90
x
ih
i0 0
2 4 6 8 10 12
Representación gráfica de variables
4. POLÍGONO DE FRECUENCIA ACUMULADA U OJIVA.
Se utiliza para representar variables agrupadas de intervalos de clase. En el eje de abscisas se representa los intervalos de clase y sobre ellas se levanta rectángulos igual que los histogramas, solo que la altura de los rectángulos corresponde a la frecuencia acumulada; la ojiva se obtiene uniendo los puntos medios de las bases superiores de los rectángulos.
40 1,000
29 0,725
35 0,875
17 0,425
7 0,175
2 0,050
38 0,950
F
i29
H
iB) PRESENTACIÓN DE VARIABLES CUALITATIVAS.
La tabla muestra el número de pacientes internados en un hospital durante el año 2010 y 2011.
Enfermedad Número de pacientes
2010 2011
Hepatitis (H) 100 120
Tifoidea (T) 200 150
Sida (S) 50 80
Neumonía (N) 180 150
Gastritis (T) 320 300
Diabetes (D) 150 200
Total 1000 1000
1. DIAGRAMA DE RECTÁNGULOS O BARRAS.
0 50 150 100 200 250 300 350
2010
F
iHEPATITIS TIFOIDEA SIDA NEUMONIA GASTRITIS DIABETES
0 50 150 100 200 250 300 350
F
iHEPATITIS TIFOIDEA SIDA NEUMONIA GASTRITIS DIABETES
2011
AÑO 2010 AÑO 2010 y 2011
0 50 150 100 200 250 300 350
2010
F
iHEPATITIS TIFOIDEA SIDA NEUMONIA GASTRITIS DIABETES
0 50 150 100 200 250 300 350
F
iHEPATITIS TIFOIDEA SIDA NEUMONIA GASTRITIS DIABETES
2011
AÑO 2010 AÑO 2010 y 2011
2. DIAGRAMA DE SECTORES.
Ampliando los datos de la tabla de frecuencias ante- rior, tenemos:
Enfermedad fi hi h
i360º
Hepatitis (H) 100 0,10 0,10 36 0º 3 º 6 Tifoidea (T) 200 0,20 0,20 36 0º 7 º 2 Sida (S) 50 0,05 0,05 36 0º 1 º 8 Neumonía (N) 180 0,18 0,18 360 º 64, º 8
Gastritis (T) 320 0,32 0,32 360º 115,2º Diabetes (D) 150 0,15 0,15 36 0º 5 º 4
Total n = 1000 1,00 = 360º
HEPATITIS 10%
TIFOIDEA 20%
SIDA5% NEUMONIA
18% GASTRITIS
32%
DIABETES 15%
HEPATITIS TIFOIDEA SIDA NEUMONIA GASTRITIS DIABETES
HEPATITIS 10%
TIFOIDEA SIDA 20%
5%
NEUMONIA 18%
GASTRITIS 32%
DIABETES 15%