1 Ejemplo
Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar.
La ley que asocia a cada hombre con su talla es una variable aleatoria (continua).
184.2
191.8 188.0
196.2 178.4 .... etc
A esta función que
asocia a cada deportista con su talla la
llamaremos variable aleatoria y la
denotaremos por X.
X: Talla
Ejemplo
184.2
191.8
188.0
196.2
178.4
184.2
195.4
189.2
186.0
194.3
190.5
190.5
198.1
188.0
184.2
176.5
184.2
193.5
195.6
186.3
3
Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (nº de veces que aparece cada valor de la variable en la muestra).
Cómo ordenamos los datos???????????
En una: Tabla de Distribución de Frecuencia
4
Distribución de frecuencia de ejemplo
(TALLA)
Talla
173.5-179.5
179.5-185.5
185.5-191.5
191.5-197.5
197.5-203.5
f
2
4
7
6
1
20
F
2
6
13
19
20
=
=
Tabla de frecuencias5
1 7 3 . 5 1 7 9 . 5 1 8 5 . 5 1 9 1 . 5 1 9 7 . 5 2 0 3 . 5
T a l l a
0 1 2 3 4 5 6 7 8
f
Distribución de frecuencia de ejemplo (TALLA)
Histograma
Medidas de Resumen
Los fenómenos biológicos no suelen ser constantes
•La tendencia central de los datos
Necesitamos conocer:
• La dispersión o variación respecto de este centro
•Los datos que ocupan ciertas posiciones
•La simetría de los datos
7
Medidas de Tendencia Central
Son medidas alrededor de las cuales se concentran los datos
Las tres medidas más usuales de tendencia central son:
9
Es la suma de todos sus posibles valores dividida por el n° total de datos (n)
188.75 188.820 3 . 186 6 . 195 5 . 193 ... 0 . 188 8 . 191 2 . 184 _ X
(Ejemplo: TALLA)
1.-Media Aritmética (
X) de una variable
aleatoria (o Promedio)
Datos:
Datos:
a) n impar: mediana es el único valor central
b) n par: mediana es el promedio de los dos valores centrales
Primero !!!!! Ordenamos los valores de menor a mayor
Si n es el número de observaciones:
Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 % de las observaciones.
11
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1
(Ejemplo: TALLA)
datos
de
10
2
20
100
20
*
50
20
%
50
Datos ordenados:
Datos ordenados:
n= 20
n= 20 parpar MedianaMediana
• Promedio de 2 valores Promedio de 2 valores centrales
centrales
• Dejan aproximadamente Dejan aproximadamente 50% de los datos bajo y
50% de los datos bajo y
sobre sí (aprox. 10 datos)
sobre sí (aprox. 10 datos)
10 datos 10 datos
6
.
188
2
2
.
189
0
.
188
13
39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72
(Ejemplo: PESO)
datos
de
10
.
5
10
2
21
100
21
*
50
21
%
50
Datos ordenados:
Datos ordenados:
n= 21
n= 21 imparimpar
Mediana
Mediana
• valor central únicovalor central único
• Deja aproximadamente Deja aproximadamente
50% de los datos bajo y
50% de los datos bajo y
sobre sí (aprox. 10 datos)
sobre sí (aprox. 10 datos)
14
Mediana=
Si cambiamos la última observación por otra
extrañamente grande
X: 2, 5, 7, 125
Sea
X
una variable discreta con los siguientes valores:
X: 2, 5, 7, 12
Media= (2+5+7+12)/4=6.5(2+5+7+12)/4=6.5 (5+7)/2= 6
Media=(2+5+7+125)/4=34.75(2+5+7+125)/4=34.75 Mediana=(5+7)/2= 6
Conclusión:
15
Cuál de los dos valores es más adecuado para la distribución de los datos, la Media o la Mediana???
16
La medida de tendencia central más adecuada para describir estos
La medida de tendencia central más adecuada para describir estos
datos es la MEDIANA
17
Es aquel valor de la variable con mayor frecuencia
absoluta.
3.- Moda de una variable aleatoria
(Ejemplo: TALLA)
Moda= 184.2
19
Medidas de Posición
Dividen el conjunto de datos ordenados en partes iguales
Las dos medidas de posición más usuales son:
Es la observación, Pk, que deja por debajo de sí el k% de la población.
1.-Percentiles
PERCENTIL DE ORDEN k:
Deja debajo de sí el 50% de los datos ordenados
Deja debajo de sí el 50% de los datos ordenados
P
P2525 Deja debajo de sí el 25% de los datos ordenadosDeja debajo de sí el 25% de los datos ordenados
P
P == Deja debajo de sí el 75% de los datos ordenadosDeja debajo de sí el 75% de los datos ordenados Son 99 valores que dividen en 100 partes iguales el conjunto de
datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de sí el 67% de las observaciones, y por encima queda el 33%
21
Si n es el número de observaciones:
1º) Primero ordenamos las observaciones de menor a mayor
1º) Primero ordenamos las observaciones de menor a mayor
2º) Calculamos el k% de n
2º) Calculamos el k% de n
100
*
%
de
n
k
n
k
3º)Contando los datos desde el valor menor al mayor,
3º)Contando los datos desde el valor menor al mayor, el percentil deel percentil de orden k será aquel valor de la variable ubicado en la posición número:
orden k será aquel valor de la variable ubicado en la posición número:
22
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0,
188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6,
196.2, 198.1
(Ejemplo: TALLA)
datos
de
13
.
4
13
100
20
*
67
20
%
67
Datos ordenados:
Datos ordenados:
n= 20
n= 20
P
P6767
• Deja aproximadamente Deja aproximadamente
67% de los datos bajo de sí
67% de los datos bajo de sí
(aprox. 13 datos), y el 33%
(aprox. 13 datos), y el 33%
sobre sí
sobre sí
Calculemos el percentil de orden 67%
Calculemos el percentil de orden 67%
8
.
191
67
23
2.-Cuartiles
Segundo cuartil (Q2)
Segundo cuartil (Q2) PP5050=Mediana=Mediana
Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales
Primer cuartil (Q1)
Primer cuartil (Q1) PP2525
Tercer cuartil (Q3)
Medidas de Dispersión
• Nos dicen hasta qué punto las medidas de tendencia central son representativas como síntesis de la información.
• Cuantifican la separación o la variabilidad de los valores de la distribución respecto al valor central.
Las más usadas son:
Las más usadas son:
Rango(Recorrido)
Rango(Recorrido)
Desviación Estándard
25
1.-Rango o Recorrido
RANGO (RECORRIDO) = Valor Máximo - Valor Mínimo.
Inconvenientes del RANGO (RECORRIDO):
• No utiliza todas las observaciones (sólo dos de ellas).
• Se puede ver muy afectado por alguna observación extrema.
(Ejemplo: TALLA)
Valor Máximo=
Valor Máximo=
Valor Mínimo=
Valor Mínimo= 176.5176.5 198.1198.1
Rango o Recorrido=
Rango o Recorrido= 198.1 – 176.5=198.1 – 176.5= 21.621.6
Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)
Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0,
188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6,
27
(Ejercicio: Concentración urinaria de plomo en niños
Concentración de
plomo (µmol/24hr)
0.2
1.5
0.6
2.0
0.8
2.1
2
.
1
x
(x-promedio)
0.2 - 1.2= -1
1.5 - 1.2=0.3
0.6 - 1.2= -0.6
2.0 - 1.2=0.8
0.8 - 1.2=-0.4
2.1 - 1.2=0.9
1
0
.
3
0
.
6
0
.
8
0
.
4
0
.
9
0
1
n i ix
x
1
1 2
n
x
x
n i i
n i i x x 1 2 SS22=
solución
29
1
1
2 2
n
x
x
S
n
i
i
Es
la media de las diferencias cuadrática de
n
puntua-ciones con respecto a su media aritmética.
Desviación Estándar (S):
(Ejemplo: TALLA)
Datos:
Datos:
20 1
34.58 . 188 3 . 186 8 . 188 6 . 195 ... 8 . 188 0 . 188 8 . 188 8 . 191 ) 8 . 188 2 . 184
( 2 2 2 2 2
2 s
8
,
188
20
_
X
n
9
.
5
5
.
34
s
31
32
Medidas de Forma
1.- Asimetría
Coef. de Coef. de Asimetría <0 Asimetría <0
Coef. de Coef. de
Asimetría =0 Asimetría =0
Coef. de Coef. de
33
Ejemplo
34
En SPSS
Moda <Mediana
Moda <MedianaMediaMedia Si bien se nota una leve cola hacia laSi bien se nota una leve cola hacia la
izquierda, la asimetría es sutil por ello que izquierda, la asimetría es sutil por ello que
35
2.- Apuntamiento o curtosis
Curtosis >0
Curtosis >0 Curtosis =0Curtosis =0 Curtosis <0Curtosis <0
Distribución mesocúrtica : presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
Distribución leptocúrtica : presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
37
38
Ejercicio
Datos I:
Datos I:
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5
Datos II:
Datos II:
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6
Datos III:
Datos III:
2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6
2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6
Datos IV:
Datos IV:
3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5
3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5
39
Datos x Med Moda Rango P25 P75 P75-P25 S
I 4 4 5 3 3 5 2 1
II 4 4 3 3 3 5 2 1
III 4 4 4 4 4 4 0 1
IV 4 4 3 y 5 2 3 5 2 1
D i s t r i b u c i ó n I
2 3 4 5
0 1 2 3 4 5 6 N o of o b s
D i s t r i b u c i ó n I I
3 4 5 6
0 1 2 3 4 5 6 N o of o b s
D i s t r i b u c i ó n I I I
2 3 4 5 6 0 1 2 3 4 5 6 7 8 N o o f ob s
D i s t r i b u c i ó n I V
3 4 5
40
Importante para describir los datos!!!!!!!!!!!!...
Importante para describir los datos!!!!!!!!!!!!...
Medidas de Dispersión
Medidas de Dispersión
Medidas de Tendencia Central
Medidas de Tendencia Central
Medidas de posición
Medidas de posición
+
+
+
+
Gráficos:Histograma, BoxPlot
Gráficos:Histograma, BoxPlot
+
41
RESUMEN : Medidas descriptivas
RESUMEN : Medidas descriptivas
PosiciónPosición
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos . Percentiles, cuartiles
. Percentiles, cuartiles
CentralizaciónCentralización
Indican valores respecto alos cuales los datos parecen agrupares
Indican valores respecto alos cuales los datos parecen agrupares . Media, mediana y moda
. Media, mediana y moda
DispersiónDispersión
Indican la mayor o menor concentración de los datos con respecto a las medidas de
Indican la mayor o menor concentración de los datos con respecto a las medidas de
centralización
centralización
. Varianza, desviación estándar, rango o recorrido
. Varianza, desviación estándar, rango o recorrido
FormaForma
Asimetría y apuntamiento
42
Elección de medidas de tendencia central y de
dispersión
Variable Nominal
Variable Ordinal
Moda
• Mediana
• Moda
• Percentiles
Variable Contínua:
• ConCon distribución desconocida o asimétrica distribución desconocida o asimétrica
• ConCon distribución simétrica y unimodal (Ej: Normal) distribución simétrica y unimodal (Ej: Normal)
• Mediana
• Percentiles
• Media