ESTADÍSTICA
ESTADÍSTICA
ESTADÍSTICA
ESTADÍSTICA
DESCRIPTIVA
DESCRIPTIVA
INFERENCIA
INFERENCIA
ESTADÍSTICA
ESTADÍSTICA
Ciencia que se encarga de la
recolección, estudio e
interpretación de los datos
obtenidos en un estudio
Se dedica a los métodos
de recolección,
descripción, visualización
y resumen de datos
originados a partir de los
fenómenos en estudio
Se dedica a la generación
de los modelos,
inferencias y
predicciones asociadas a
los fenómenos en
cuestión teniendo en
cuenta lo aleatorio e
incertidumbre en las
n
h
f
i
%
100
x
n
h
f
i
Población: conjunto de
personas, cosas o
situaciones, que tienen
alguna característica
común que las permite
agrupar.
Muestra:
subconjunto
representativo de
una población.
Variable: Es la
característica
observable de una
población.
Variable cualitativa:
Cuando es un
atributo o cualidad.
Deporte preferido,
sexo, lugar de
nacimiento, etc.
Variable Cuantitativa:
Son aquellas que pueden
medirse. Discretas: Nº
de estudiantes, nº de
personas, etc.
(cantidades enteras).
Continuas: Edad, peso,
talla, etc.(cantidades
racionales)
Frecuencia Absoluta (fi ):
nº de veces que se repite
un dato. La suma de
frecuencias es igual a
número de muestras
(n N)
Frecuencia relativa
(h): Se obtiene
dividiendo la
Medidas de estadística
Centralización
–
Indican valores con respecto a los que los datos
parecen agruparse.
Media, mediana y moda
Posición
–
Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de individuos.
Cuartiles, deciles y percentiles
.
Dispersión
–
Indican la mayor o menor concentración de los
datos con respecto a las medidas de centralización.
Desviación típica o estándar, coeficiente de variación,
Es una de las medidas de tendencia central de mayor
uso. Es el valor que representa mejor el conjunto de
datos, es la medida de tendencia central mas estable y
confiable
La media muestral se simboliza por y la
media poblacional de denota por
.
X
MEDIA ARITMETICA PARA DATOS NO AGRUPADOS
Sea X una variable cuantitativa y x
1
, x
2
,…, x
n
una
muestra de tamaño "n" de valores de la variable, se
define la media aritmética de X como:
n
x
x
x
x
X
1
2
3
...
n
Esta expresión se puede escribir también , como
:
n
x
X
n
i
i
Ejemplo N°1
Consideremos la edad en años de ocho
personas
10
18
25
32
12
5
7
7
En este ejemplo el promedio , media o media
aritmética de la edad de estas personas está
dada por:
8
7
7
5
12
32
25
18
10
x
MEDIA ARITMETICA PARA DATOS AGRUPADOS
Sea X una variable cuantitativa y x
1, x
2,…, x
nuna muestra de
tamaño "n" de valores de la variable, y f
ila frecuencia de cada
variable. Se define la media aritmética para datos tabulados
como:
n
f
x
f
x
f
x
f
x
X
1
1
2
2
3
3
...
n
n
Esta expresión se puede escribir también , como
:
n
f
x
X
i
n
i
i
1
f
i= frecuencia
Ejemplo: Datos sobre los puntajes obtenidos en un concurso de
lógico matemática.
Peso
[40 ; 50[
[50 ; 60[
[ 60 ; 70[
[ 70 ; 80[
[ 80 ; 90[
[ 90 ; 100[
[100 ; 110[
58
79
,
68
58
3
105
10
55
5
45
N
f
x
x
i imin
max
:
R
x
x
Rango
n
K
ervalos
de
Número
int
:
k
R
C
ervalo
del
Amplitud
int
:
40-46-49-42-40-50-54-55-52-53-55-54-54-56-57-60-65-66-
66-64-63-63-62-68-69-67-65-65-64-67-69-68-61-61-62-66-
76-78-78-75-71-71-75-74-78-78-79-80-82-82-85-85-90-99-91-100-109-110
70
40
110
:
R
Rango
616
,
7
58
:
int
ervalos
K
de
Número
19
,
9
616
,
7
70
:
Ejemplo: Datos sobre los puntajes obtenidos en un concurso de
lógico matemática.
Peso
[40 ; 50[
[50 ; 60[
[ 60 ; 70[
[ 70 ; 80[
[ 80 ; 90[
[ 90 ; 100[
[100 ; 110[
58
79
,
68
58
3
105
10
55
5
45
N
f
x
x
i
i
40-46-49-42-40-50-54-55-52-53-55-54-54-56-57-60-65-66-
66-64-63-63-62-68-69-67-65-65-64-67-69-68-61-61-62-66-
76-78-78-75-71-71-75-74-78-78-79-80-82-82-85-85-90-99-91-100-109-110
X
i45
55
65
75
85
95
105
f
i5
10
21
11
5
3
3
F
i5
15
36
47
52
55
58
h
i0,09
0,17
0,36
0,19
0,09
0,05
0,05
1
H
i0,09
0,26
0,62
0,81
0,90
0,95
1,00
hi%
9
17
36
19
9
5
5
100
MEDIANA PARA DATOS NO
AGRUPADOS
Ejemplo 1:
Consideremos la edad en años de ocho personas
10
18
25
32
12
5
7
7
Para calcular la mediana , previamente se deben
ordenar las observaciones. En este caso lo haremos
en forma creciente:
5 7 7
10 12
18 25 32
Ejemplo N°2
Consideremos el peso en kilogramos de una muestra de
11 personas
65 76 48 48 68 78 90 87 67 72 78
Recordemos que para calcular la mediana debemos ordenar los
datos:
48 48 65 67 68
72
76 78 78 87 90
MEDIANA PARA DATOS AGRUPADOS
Si se tiene una distribución de frecuencias, la mediana es igualmente
ese valor que tiene 50% de las observaciones por debajo y 50 % por
encima. Geométricamente, la mediana es el valor de X sobre el eje de las
abscisas correspondiente a la ordenada que divide un histograma en
dos partes de igual área.
donde:
Li = límite inferior de la clase mediana.
N = frecuencia total o Σf
i.
Faa = frecuencia absoluta acumulada hasta la clase
premediana
fm = frecuencia absoluta de la clase mediana
Ic= amplitud de la clase mediana.
Ejemplo
Peso
xi
fi
Fi
40 < 50
45
5
5
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
5
52
90 < 100
95
3
55
100 < 110
115
3
58
58
6
,
66
21
15
58
2
1
10
60
2
1
1
i i if
F
N
Ic
L
Mediana
Moda o Modo (Mo)
Como su nombre lo indica es aquel valor de la variable que tiene
una mayor frecuencia.
Si consideramos el ejemplo N°2 del peso de una
muestra de personas:
65 76
48 48
68
78
90 87
67 72
78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas
pesa 48 kilos y 78 kilos.
•
La Moda puede deducirse de una distribución de
frecuencia o de un histograma a partir de la fórmula.
Moda para datos agrupados
Ic
Li
Mo
.
2
1
1
Donde;
Li = límite inferior de la clase modal (clase
de mayor frecuencia absoluta (fa)
∆1 = diferencia de las frecuencias absolutas
de la clase modal y pre-modal.
∆2 = diferencia de las frecuencias absolutas
de la clase modal y post-modal
La moda: se define como el valor que tiene una mayor
frecuencia en un conjunto de datos (es decir, aquel que más se
repite).
Para datos agrupados en intervalos
Mo= Li + c. D1
D1+D2
D1: f
i– f
i -1D2: f
i– f
i +1Peso
M. Clase
f
iF
i.
40 < 50
45
5
5
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
5
52
90 < 100
95
3
55
100 < 110
115
3
58
58
Intervalo modal
24
,
65
10
11
11
10
60
Gráficas estadísticas
1. INTRODUCCION
Gráficas estadísticas, representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y
revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de
frecuencias son algunas de ellas
2. DIAGRAMA DE BARRAS
En este tipo de gráfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar variables cuantitativas discretas.
El diagrama de barras siguiente representa la distribución del número de hijos de 43 familias:
3. HISTOGRAMA Y POLÏGONO DE FRECUENCIAS
Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un
Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.
4. HISTOGRAMA Y POLINOMIOS DE FRECUENCIAS ACUMULADAS
Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polinomio. He aquí los que se obtienen de la tabla de 1.200 calificaciones:
5. DIAGRAMA DE SECTORES
=Md=Mo
x
Simétrica
Mo Md
x
x
Md Mo
Asimétrica:
Sesgada a la
izquierda,
negativa
Asimétrica:
Sesgada a la
derecha,
Dividen un conjunto ordenado de datos en grupos con
la misma cantidad de individuos.
PERCENTILES
:
son
99 valores
que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en
cien
tramos iguales
, en los que cada uno de ellos concentra el 1%
de los resultados
CUARTILES
:son
3 valores
que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en
cuatro
tramos iguales, en los que cada uno de ellos concentra el 25%
de los resultados.
DECILES:
son
9 valores
que distribuyen la serie de datos,
ordenada de forma creciente o decreciente, en
diez tramos
iguales, en los que cada uno de ellos concentra el 10% de los
resultados.
Medida de localización que divide la población o
muestra en cuatro partes iguales.
Q1= Valor de la variable que deja a la izquierda el
25% de la distribución.
Q2= Valor de la variable que deja a la izquierda el
50% de la distribución
= mediana
.
Q3= Valor de la variable que deja a la izquierda el
75% de la distribución.
CUARTILES
.
.
4
Ic
fm
Faa
aN
Li
Q
a
4
aN
Medida de localización que divide la población o
muestra en 10 partes iguales
No tiene mucho sentido calcularlas para variables
cualitativas discretas. Por lo que lo vamos a ver
sólo para las variables continuas
.
DECILES
10
aN
P
Da
fm
Ic
Faa
aN
Li
D
a
10
.
Medida de localización que divide la población o
muestra en 100 partes iguales
No tiene mucho sentido calcularlas para variables
cualitativas discretas. Por lo que lo vamos a ver sólo
para las variables continuas.
PERCENTILES
100
aN
P
Pa
Ic
fm
Faa
aN
Li
P
a
100
.
EJEMPLO
Los siguientes son los resultados de la prueba de aptitud
académica tomada a 50 alumnos de la Facultad de Educación,
con esos datos calcular Q1,Q3, D3, y P45
I
MC
FA
FAA
FR
FRA
FR%
45-55
06
55-65
10
65-75
19
75-85
11
85-95
04
EJEMPLO
Los siguientes son los resultados de la prueba de aptitud
académica tomada a 50 alumnos de la Facultad de Educación,
con esos datos calcular Q1,Q3, D3, y P45
I
MC
FA
FAA
FR
FRA
FR%
45-55
50
06
06
0,12
0,12
12
55-65
60
10
16
0,20
0,32
20
65-75
70
19
35
0,38
0,70
38
75-85
80
11
46
0,22
0,92
22
85-95
90
04
50
0,08
1,00
08
50
1,000
100
Cálculo de Q1
EJEMPLO
Los siguientes son los resultados de la prueba de aptitud
académica tomada a 50 alumnos de la Facultad de Educación,
con esos datos calcular Q1,Q3, D3, y P45
I
MC
FA
FAA
FR
FRA
FR%
45-55
50
06
06
0,12
0,12
12
55-65
60
10
16
0,20
0,32
20
65-75
70
19
35
0,38
0,70
38
75-85
80
11
46
0,22
0,92
22
85-95
90
04
50
0,08
1,00
08
50
1,000
100
Cálculo de Q3
Buscamos ahora en la misma columna el correspondiente al 75 %de N que en
este caso es el 4º intervalo (3.50/4=37.5)
EJEMPLO
Los siguientes son los resultados de la prueba de aptitud
académica tomada a 50 alumnos de la Facultad de Educación,
con esos datos calcular Q1,Q3, D3, y P45
I
MC
FA
FAA
FR
FRA
FR%
45-55
50
06
06
0,12
0,12
12
55-65
60
10
16
0,20
0,32
20
65-75
70
19
35
0,38
0,70
38
75-85
80
11
46
0,22
0,92
22
85-95
90
04
50
0,08
1,00
08
50
1,000
100
Cálculo de D3
(corresponde al 30 % 3 · 50 / 10 = 15) sería
el 2º intervalo.
10
aN
P
Da
Ic
fm
Faa
aN
Li
D
a10
.
EJEMPLO
Los siguientes son los resultados de la prueba de aptitud
académica tomada a 50 alumnos de la Facultad de Educación,
con esos datos calcular Q1,Q3, D3, y P45
I
MC
FA
FAA
FR
FRA
FR%
45-55
50
06
06
0,12
0,12
12
55-65
60
10
16
0,20
0,32
20
65-75
70
19
35
0,38
0,70
38
75-85
80
11
46
0,22
0,92
22
85-95
90
04
50
0,08
1,00
08
50
1,000
100
Cálculo de P45
Ubicamos el percentil 45 (45·50/100 =
22.5) Corresponde al intervalo 3º
100
aN
P
Pa
Ic
fm
Faa
aN
Li
P
a100
.
Las
MEDIDAS DE DISPERSIÓN
cuantifican la
separación, la dispersión, la variabilidad de los valores
de la distribución respecto al valor central.
Peso recién nacidos en partos gemelares
50
40
30
20
10
0
•
RANGO
•
DESVIACION MEDIA
•
VARIANZA
•
DESVIACIÓN TÍPICA (S) O ESTÁNDAR
•
COEFICIENTE DE VARIACIÓN
AMPLITUD O RANGO
Es la diferencia entre el valor de las observaciones mayor y
el menor. Re = xmax - xmin
2,
1
,4,3,
8
,
4.
El rango es 8-1=7
150 160 170 180 190
0
.0
0
0
.0
1
0
.0
2
0
.0
3
0
.0
4
0
.0
5
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico