Ejemplos solo con datos cuantitativos o numéricos
:Medidas de centralización Para datos a granel
:
Considere una muestra de notas de un alumno en la asignatura de matemática:
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
Calculo de la media aritmética
:4 . 5 10 6 . 4 7 4 . 6 2 . 6 8 . 4 3 . 5 6 . 4 7 . 6 5 . 3 5 . 4 = + + + + + + + + + = X
También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos:
Ejemplo: supongamos que la media es Xs= 50
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 -0.4 Suma de desvíos = 3.6 n d s X X = +
∑
=5.0+ 5.0 0.36 5.36 5.4 10 6 . 3 = + = =Media geométrica
Para el ejemplo: : G=10 6 . 4 7 . 4 . 6 2 . 6 8 . 4 3 . 5 6 . 4 7 . 6 5 . 3 5 . 4 x x x x x x x x x =5.3Media armónica:
Para el ejemplo: H= 0.51 6 . 4 1 7 1 4 . 6 1 2 . 6 1 8 . 4 1 3 . 5 1 6 . 4 1 7 . 6 1 5 . 3 1 5 . 4 1 1 = + + + + + + + + +Para el ejemplo:
RMS= 4,52 +3.52 +6.72 +4.62 +5.32 +4.82 +6.22 +6.42 +72 +4.62 =17.3
Caso especial de la media aritmética
:La moda para datos a granel (Mo)
: Es el dato que más se repite, puede haber más de una moda o ninguna, siempre es un dato de la muestra.Para el ejemplo:
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Mo= 4,6
La mediana para datos a granel (Md)
: Corresponde al valor central de los datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n: par).No siempre es un dato de la muestra:Para el ejemplo
Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Ordenando los datos:
Notas 3.5 4.5 4.6 4.6 4.8 5.3 6.2 6.4 6.7 7 Md= 5.1 2 3 . 5 8 . 4 + =
Medidas de dispersión para datos a granel
:El más elemental es el rango de variación
:Rg= mayor valor observado o medido- menor valor observado o medido Para el ejemplo: Rg= 7-3.5= 3.5
Desviación media: DM=
n x xi∑
− Para el ejemplo Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Con: X =5.4 Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 desvíos -0.9 -1.9 1.3 -0.8 -0.1 -0.6 0.8 1.0 1.6 -0.8∑
=0 desvíos 0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8∑
=17 DM= 1.7 10 17 =Desviación estándar:
( )
1 2 − − =∑
n x x Spara la muestra
Para el ejemplo: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 desvíos -0.9 -1.9 1.3 -0.8 -0.1 -0.6 0.8 1.0 1.6 -0.8∑
=0 desvíos 0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8∑
=17 desvíos 2 0.81 3.61 1.69 0.64 0.01 0.36 0.64 1.0 2.56 0.64∑
=11.96 S= 1.15 1 10 96 . 11 = −Desviación estándar para la población: (es solo un estimativo
)
( )
n x x S =∑
− 2 Para el ejemplo: S= 1.09 10 96 . 11 =Nota: existen otras medidas de dispersión que se estudiaran con datos intercalares.
clases Xi f fr. f% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 clases Xi f Xi*f 485.55 – 535.50 510.53 4 2042.12 535.51 – 585.46 560.49 9 5044.41 585.47 – 635.42 611.45 10 6114.50 635.43 – 685.38 660.41 7 4622.87 685.39 – 735.34 710.37 8 5682.96 735.35 – 785.30 760.33 2 1520.66 40 25027.52 69 . 625 40 52 . 25027 = = X Para el ejemplo:
Supongamos como media supuesta la marca de clase de la segunda clase, esto es: 560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma
simplificada como se indica:
Xi Desviación :Xi - Xs f (Xi-Xs)*f
510.53 510.53-560.49=-49.96 4 -199.84 560.49 560.49-560.49=0 9 0 611.45 611.45-560.49=50.96 10 509.60 660.41 660.41-560.49=99.92 7 699.44 710.37 710.37-560.49=149.88 8 1199.04 760.33 760.33-560.49=199.84 2 399.68
∑
=2607.9269 . 625 40 92 . 2607 49 . 560 + = = X
Valor que coincide con el calculado anteriormente.
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00
Luego la abscisa que deja la mitad de la superficie total a cada lado es: 586.465+34.965=621.43
CRITERIO TABULAR O INTERVALAR:
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 Md= 587.465+33.922=621.39
EN GENRAL: clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00
Parámetros de dispersión:
Desviación media: DM=
n f x xi∑
− Para el ejemplo:Se sabe que la media es: 625.69 40 52 . 25027 = = X clases Xi (Xi - X ) Xi−X f Fa Xi−X 485.55 – 535.50 510.53 -115.16 115.16 4 460.64 535.51 – 585.46 560.49 -65.20 65.20 9 586.80 587.47 – 635.42 611.45 -14.24 14.24 10 142.40 635.43 – 685.38 660.41 34.72 34.72 7 243.04 685.39 – 735.34 710.37 84.68 84.68 8 677.44 735.35 – 785.30 760.33 134.64 134.64 2 269.28
∑
=0 40∑
=2379.60 DM= 59.49 40 60 . 2379 =Desviación estándar:
( )
1 2 − − =∑
n f x x Spara la muestra
clases Xi (Xi - X ) (Xi - X )2 f
(Xi - X )2f 485.55 – 535.50 510.53 -115.16 13261.83 4 53047.32 535.51 – 585.46 560.49 -65.20 4251.04 9 38259.36 587.47 – 635.42 611.45 -14.24 202.78 10 2027.80 635.43 – 685.38 660.41 34.72 1205.48 7 8438.36 685.39 – 735.34 710.37 84.68 7170.70 8 57365.60 735.35 – 785.30 760.33 134.64 18127.93 2 36255.86
∑
=0∑
=44219.76 40∑
=195394.30 S= 70.78 1 40 30 . 195394 = −Desviación estándar:
( )
n x x S =∑
− 2para la población.
Para el ejemplo: 69.89 40 30 . 195394 =Rango intercuartílico: Datos que se ubican entre el 25% y el 75%
Para el ejemplo: El 25% de los datos: 25% de 40 = 10 De acuerdo a la tabla: clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda clase:
Datos del primer cuartel:
535,505+
(
585.455 535.505)
535,505 33.3 568.81 9 6 = + = −Datos del tercer cuartel:
75% de los datos: 75% de 40 = 30
Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite inmediatamente superior de la cuarta clase, esto es: 685.38.
Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran entre 568,81 y 685,38 (este criterio permite eliminar los outlier)
Nota: el segundo intercuartílico corresponde a la mediana: En efecto: el 50% de los dados es 50% de 40 = 20
Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7 restante de los 10 de la tercera clase, esto es:
587.465+ (635.415 587.465) 587.465 33.565 621.03 10 7 = + = − (que corresponde al
valor calculado anteriormente)
Nota: cualquier otro intercuartílico se calcula de la misma
manera:
Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil?
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 Tercer decil: 30% de 40 = 12 535.505+ (585.455 535.505) 9 8 − =579.905 Sexto decil: 60% de 40 = 24 635.425+ (685.375 635.425) 642.56 7 1 = − El rango es entonces: 579.91 y 642.56
También se puede calcular parámetros como porcentajes de
alumnos que se ubican en determinado rango de puntajes.
Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos?
Se procede como se indica
clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00
De acuerdo a la tabla el menor puntaje: 548.34 puntos se ubica en la segunda clase, por lo que habrá que tomar parte de los 9 alumnos, el mayor puntaje 694.15 puntos se ubica en la quinta clase y toma parte de los 8 alumnos.
En resumen: 95 . 49 9 (585.46-548.34)+10+7+ (694.15 685.39) 95 . 49 8 − =6.69+10+7+1.40=25.09=25 alumnos .Que corresponde al 62.5% del total .Es decir el 62.5% de la muestra se ubica en ese rango de notas.