Medidas de
Variación o
Dispersión
Dra. Noemí L. Ruiz © 2007
Derechos de Autor Reservados
Objetivos de la lección
Conocer cuáles son las medidas de
variación y cómo se calculan o se
determinan
Conocer el significado o interpretación
de cada una de las medidas
Aplicar las medidas de variación en un
conjunto de datos
Son medidas que indican cuánto varía o cuánto se dispersa un grupo de datos.
Algunas de estas medidas son: rango, rango
intercuartil, desviación intercuartil,
desviación promedio, varianza, desviación
estándar y coeficiente de variación.
Estas medidas miden el grado de dispersión, desviación, o variación, que tienen las
puntuaciones, entre sí , o en relación al centro de una distribución.
Ayudan a determinar cuán homogéneo es un grupo de datos.
Las puntuaciones que están relativamente juntas tienen una medida de variación más
pequeña.
Las puntuaciones que están más dispersas tienen una medida de variación más grande.
Menos dispersión significa que el grupo de datos es más homogéneo.
Más dispersión implica mayor
heterogeneidad.
Los valores en la muestra C son iguales, por lo tanto, no existe variabilidad entre ellos.
Al calcular cualquier medida que
cuantifique la variabilidad de esta muestra, el resultado sería igual a cero.
Medidas de Variación
Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
Si se comparan los valores de la muestra A con los de la muestra B se puede observar que en la Muestra A los valores están más lejanos unos de otros.
Medidas de Variación
Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
Si se fuese a calcular cualquier medida que cuantifique la variabilidad en cada una de estas muestras, el resultado sería mayor para la muestra A que para la muestra B.
En general, mientras mayor es la
variabilidad entre los datos, mayor será la medida de dispersión
Medidas de Variación
Muestras Valor 1 Valor 2 Valor 3 Valor 4 Valor 5
Muestra A 5 15 25 25 58
Muestra B 15 16 16 17 19
El rango es la medida que indica
cuánto se dispersa un grupo de datos.
Se le conoce también, como:
alcance
,
amplitud
,
recorrido,
o
campo de valores
Es la medida más sencilla pero menos
confiable.
Se determina restando el valor mayor
menos el valor menor.
Rango = (Valor mayor) – (Valor menor)
Rango
Dice cuál es la
dispersión total del grupo de
Aunque la mayoría de las veces se
determina con la fórmula:
Rango = (Valor mayor) – (Valor menor)
Para propósitos del libro de Hinkle se
utilizará la siguiente fórmula que
ajusta la inclusión de ambos
extremos:
Rango =[ (Valor mayor) – (Valor menor) ] + 1
Si el valor mayor es 5 y el menor es 3,
al restar 5 – 3 se obtiene 2.
5 – 3 = 2 indica que hay dos
unidades de diferencia entre estos
valores.
Si se suma 1, (5-3) + 1, tenemos el total
de valores que hay en ese intervalo de
5 a 3.
(5-3) + 1 = 2 + 1 = 3
Hay 3 valores: 5, 4, 3
Las medianas de ambos grupos es 23,
pero los rangos varían.
El rango del grupo 1 es 27 (37 – 11 +1 = 27)
El rango del grupo 2 es 12 (29 – 18 + 1 = 12)
El grupo 1 es más variado que el grupo 2.
Rango
Grupo Valor
1
Valor 2
Valor 3
Valor 4
Valor 5
Valor 6
Valor 7
Grupo 1 11 16 18 23 29 31 37
Se afecta por valores extremos.
Si el último valor del grupo 1
hubiera sido 64 en vez de 37, el
rango se duplacaría.
Se afecta por el tamaño de n, o sea, la
cantidad de sujetos en la muestra.
Los rangos de dos grupos que tienen diferente número de sujetos (n) no se pueden comparar.
Indica cuánto se dispersan los valores que están en el centro de un grupo de datos.
Se considera el centro como los valores que se concentran entre el primer y tercer
cuartil.
El rango intercuartil no es afectado por valores extremos.
Se determina usando la siguiente fórmula:
Rango Intercuartil= Q3 – Q1
Rango Intercuartil
Dice cuál es la
dispersión de los valores que
Es la distancia promedio que existe entre el primer y tercer cuartil.
Esta medida nos dice, en promedio, cuán amplio o dispersos están los datos que se concentran en el centro (de Q3 a Q1).
El centro se concentra entre el primer y tercer cuartil.
La fórmula para hallarlo es: Q3 - Q1 2
Desviación Intercuartil
Representa el punto medio del
Es una representación visual simple pero que brinda gran información sobre la
dispersión de un grupo de datos.
Utiliza la mediana y el rango intercuartil (Q3 – Q1) para el análisis.
Lo desarrolló el prominente estadístico llamado Tuckey.
Se puede usar para determinar valores que representan valores inusuales llamados “outliers” que requieren consideración especial.
Para trazar el diagrama se necesitan 5 números o valores.
Por eso a veces se le conoce como el análisis de los 5 números.
Estos 5 valores son:
Valor mayor (puntuación máxima) Q3
Mediana Q1
Valor menor (puntuación mínima)
Ejemplo:
Traza el diagrama de caja y bigotes usando los siguientes valores:
Valor mayor = 69 Q3 = 56.26
Mediana = 49.26 Q1 = 43.36
Valor menor = 24
Diagramas de Caja y Bigotes
Son valores inusuales que podrían considerarse extremos y que requieren consideración especial. Para determinar estos valores se utiliza el rango intercuartil: (Q3 – Q1) .
El límite superior razonable de una distribución está dado por la fórmula:
Límite Superior Razonable (LSR) = Q3 + 1.5 (Q3 – Q1) El límite inferior razonable de una distribución está dado por la fórmula:
Límite Inferior Razonable (LIR) = Q1 - 1.5 (Q3 – Q1)
Si un valor dado cae fuera de estos límites
razonables , el valor se considera un extremo y habría que considerarlo cuando se tomen
decisiones sobre el grupo.
Determine si los valores a continuación son razonables:
68 , 75 , 32, 21
“Outliers”
20 30 40 50 60 70 80
Es la suma de los valores absolutos de las desviaciones de los valores respecto a la media aritmética de la muestra.
La fórmula para hallarlo es:
Desviación Media
Representa el
promedio de las
desviacio-nes de todos los
valores respecto a
la media
n
x
x
n
i
i
1
Desviación Media
n x x n i i 1 86 . 2 7 2 3 4 1 1 6 3 7 2 3 4 1 1 6 39 3 3
12 6 6
7 1 1
5 -1 1
2 -4 4
3 -3 3
4 -2 2
Totales = 42 = 0 = 20
i
x x x
i xi x
Se puede usar la desviación media para comparar la variación de distintas
distribuciones.
Las distribuciones con mayor desviación media serán las que tengan la variación mayor.
Sin embargo, la utilidad de esta medida es
limitada debido a que se usa el valor absoluto como medio para hallarla.
Los análisis estadísticos más avanzados
requieren manejo algebraico más complejo, como la varianza.
Es una medida que representa una unidad cuadrada.
Esta medida promedia los cuadrados de las
desviaciones de los valores respecto a la media aritmética.
La varianza toma en consideración cada valor de la muestra.
La fórmula para hallar la varianza de una población es:
Varianza
2
2 xi
n
La varianza no se interpreta por ser una
unidad cuadrada
Fórmula 1
La fórmula para hallar la varianza de
una muestra es:
La fórmula anterior es equivalente
también a la siguiente fórmula:
Varianza
2 2 1 i x x s n 2 2 2 1 i i x x n s n Fórmula 2 Fórmula 3 Ver cuando se usa cadaSe usa la fórmula 1 cuando se va a
determinar la varianza de una población.
Se usa la fórmula 2 y fórmula 3 cuando se va a determinar la varianza de una muestra.
Se usa la fórmula 2 cuando se tiene una muestra pequeña y la media aritmética es un número entero, ya que se torna más
compleja y difícil de utilizar cuando hay muchos valores o cuando la media
representa un valor decimal.
En este caso, se usa mejor la fórmula 3.
Más adelante se presentarán ejemplos de cómo se utilizan estas fórmulas.
El elevar al cuadrado las desviaciones de las puntuaciones respecto a la media
aritmética, es un método alterno al uso del valor absoluto para eliminar los signos
negativos antes de sumar las desviaciones. Cuando se utilizan los cuadrados en vez de los valores absolutos de las desviaciones se facilita el manejo algebraico y se elimina la restricción que tiene la desviación media.
Desviación Media
9 3 9 1
12 6 36 16
7 1 1 1
5 -1 1 9
2 -4 16 36
3 -3 9 25
4 -2 4 16
Totales = 42 = 0 = 76 = 104
i
x
xi x xi x 2 xi 8 26
Es una medida que representa una
unidad lineal.
Se halla extrayendo la raíz cuadrada
de la varianza.
La fórmula para hallar la desviación
estándar es:
Para hallar la desviación estándar de
una población se usa la última fórmula.
Desviación Estándar
2 2
ó
s
s
Es un promedio
que mide cuánto se
desvían todos los
datos en relación a
Cuando los datos están agrupados se
utiliza la siguiente fórmula:
Varianza y Desviación Estándar
para datos agrupados
Ver las columnas que se necesitarían añadir en una tabla de distribución de
frecuencias para poder aplicar la fórmula 4.
Varianza y Desviación Estándar
para datos agrupados
Representa una medida relativa (por ciento) que permite comparar grupos distintos.
Relaciona la desviación estándar con la media aritmética.
Nos dice cuál es el por ciento de variación de un grupo respecto a la media aritmética.
La fórmula es:
desviación estándar media aritmética
Coeficiente de Variación
Halla el rango, varianza y desviación estándar usando fórmula 2.
Rango = 10-6 = 4
Ejemplo 1: Datos Crudos
Segundos de reacción antes de consumir un gramo de droga THC
X (segundos) (x – ) (x - )2
10 10-8= 2 4
10 10-8 = 2 4
10 10-8 = 2 4
9 9-8 = 1 1
9 9-8 = 1 1
8 8- 8 = 0 0
7 7 – 8 = -1 1
7 7 – 8 = -1 1
6 6 - 8 = -2 4
6 6 – 8 = -2 4
6 6 – 8 = -2 4
El mismo ejercicio anterior pero
usando la
fórmula 3
para calcular
s
.
Ejemplo 2: Datos Crudos
Segundos de reacción antes de consumir un gramo de droa THC
X (segundos) x2
10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36 88 732 2 2 2 2 2 2 1 88 7744 732 732 11 11 10 10
732 704 28
Halla la desviación intercuartil Q3 = 3(n+1) = 36 = 9 ó 9na posición
4 4 Q3 = 10
Q1 = n+1 = 12 = 3 ó 3era pos. 4 4
Q1 = 6
= = 2
Interpreta este resultado
Ejemplo 3
Segundos de reacción antes de consumir un gramo de droa THC
X (segundos) x2
10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36
Q
3- Q
12
Q3 - Q1 2
10 - 6 2
Halla el coeficiente de variación
Coeficiente de Variación =
Desviación estándar =
Media aritmética
Interpreta este
resultado
Ejemplo 4
Segundos de reacción antes de consumir un gramo de droa THC
X (segundos) x2
10 100 10 100 10 100 9 81 9 81 8 64 7 49 7 49 6 36 6 36 6 36
1.67 = 0.20875 = 0.21=21%
8
Halla la varianza y desviación estándar del grupo de datos a continuación (Completar Tabla)
Ejemplo 5: Datos en Clases
Resultados de examen de estadística
Clases f x x. f x2 . f
35-41 1 38 38 1444
42-48 2 45 90 4050
49-55 2 52 104 5408
56-62 3 59 177 10443
63-69 7 66 462 30492
70-76 11 73 803 58619
77-83 9 80 720 57600
84-90 8 87 696 60552
91-97 6 94 564 53016
98-104 1 101 101 10201
50 3755 291825
Ver qué columnas
se
Halla la varianza y desviación estándar del grupo de datos a continuación (Clic para ver proceso)
Ejemplo 5: Datos en Clases
Resultados de examen de estadística
Clases f x x. f x2 . f
35-41 1 38 38 1444
42-48 2 45 90 4050
49-55 2 52 104 5408
56-62 3 59 177 10443
63-69 7 66 462 30492
70-76 11 73 803 58619
77-83 9 80 720 57600
84-90 8 87 696 60552
91-97 6 94 564 53016
98-104 1 101 101 10201